
Instructor para curso PRESENCIAL de Apache Hadoop en Madrid
N/A
Pago na entrega
Buscamos un profesional con conocimiento y experiencia en Apache Hadoop para impartir una sesión de formación de 25horas repartidos en 5 días por zona central de Madrid. Las fechas previstas son: la semana del 23 de noviembre o la semana del 30 de noviembre. El horario será de 9h a 14h<br /><br />El profesional debe tener experiencia hablando en público. Deberá crear su material de apoyo en formato powerpoint y un script de instalación de cada una de las herramientas a utilizar en el curso. El material de apoyo deberá entregarse totalmente terminado una semana antes del curso, pero se harán revisiones de avances desde que inicie la contratación<br /><br />Cada punto del temario debe tener sesión práctica asociada<br /><br />El temario a impartir es el siguiente:<br /><br /><strong>Historia de Apache Hadoop</strong><br />¿Porqué Hadoop?<br />Componentes principales de Hadoop<br />Conceptos fundamentales<br /><br /><strong>HDFS</strong><br />Características de HDFS<br />Lectura y escritura de archivos<br />Consideraciones acerca de memoria de NameNode<br />Aspectos generales de seguridad en HDFS<br />Empleo del Namenode Web UI<br />Empleo del File Shell de Hadoop<br /><br /><strong>Obtención de datos en HDFS</strong><br />Ingestinón de datos desde recursos externos con Flume<br />Ingestinón de datos desde bases de datos relacionales con Sqoop<br />REST Interfaces<br />Buenas prácticas para la importación de datos<br /><br /><strong>MapReduce</strong><br />¿Qué es MapReduce?<br />Conceptos básicos de MapReduce<br />Arquitectura del clúster YARN<br />Asignación de Recursos<br />Recuperación ante fallos<br />Empleo de YARN Web UI<br />MapReduce Versión 1<br /><br /><strong>Planificación de un cluster Hadoop</strong><br />Consideraciones generales de planificación<br />Elección correcta de Hardware<br />Consideraciones de red<br />Configuración de nodos<br />Planificación de la administración del clúster<br /><br /><strong>Installación y configuración inicial</strong><br />Tipos de desarrollo<br />Instalación de Hadoop<br />Especificaciones en la configuración de Hadoop<br />Realizar la configuración inicial HDFS<br />>Realizar la configuración inicial de YARN y MapReduce<br />Hadoop Logging<br /><br /><strong>Instalación y configuración de Hive, Pig e Impala</strong><br />Hive<br />Impala<br />Pig<br /><br /><strong>Clientes Hadoop</strong><br />¿Qué es un cliente de Hadoop?<br />Instalación y configuración de clientes Hadoop<br />Instalación y configuración de Hue<br />Autorizaciones y autenticación Hue<br /><br /><strong>Cloudera Manager</strong><br />Objetivos de Cloudera Manager<br />Características de Cloudera Manager<br />Versiones Express y Enterprise<br />Topología de Cloudera Manager<br />Instalación de Cloudera Manager<br />Instalación de Hadoop empleando Cloudera Manager<br />Realización de tareas de administración básicas empleando Cloudera Manager<br /><br /><strong>Configuración avanzada de un cluster</strong><br />Parámetros avanzados de configuración<br />Configuración de puertos Hadoop<br />Inclusión y exlusión explícitas de hosts<br />Configuración de HDFS para la organización en rack<br />Configuración de HDFS para obtención de alta disponibilidad<br /><br /><strong>Seguridad Hadoop</strong><br />¿Porqué es importante la seguridad en Hadoop?<br />Conceptos del sistema de seguridad de Hadoop<br />Qué es Kerberos y cómo trabaja<br />Protección de un clúster Hadoop Cluster con Kerberos<br /><br /><strong>Gestión y planificación de tareas o trabajos</strong><br />Administración de trabajos activos<br />Organización de trabajos Hadoop<br />Configuración del FairScheduler<br />Organización de consultas Impala<br /><br /><strong>Mantenimiento de un cluster</strong><br />Chequeo de estatus de HDFS<br />Copia de datos entre clústers<br />Eliminación y añadido de nodos en el clúster<br />Rebalanceo del Cluster<br />Actualización del clúster<br /><br /><strong>Solución de problemas y monitorización de un cluster</strong><br />Sistema general de monitorización<br />Monitorización de clústers Hadoop<br />Solución de problemas habituales en el clúster de Hadoop<br />Errores habituales en la configuración<br /><br />Esperamos sus candidaturas<br /><br />Saludos
ID do Projeto: #12408365