Currículum
- 3 Sections
- 10 Lessons
- 10 semanas
Expanse all sectionsCollapse all sections
- CAPÍTULO 1: PIPELINE DE DATOS EN TIEMPO REAL
- 1.1Presenta lo que es un realtime data y las partes que conforman un realtime en toda regla, como: procesadores, análisis, ingesta y almacenamiento.
- 1.2Muestra las tecnologías que se usan comúnmente en los pipelines de data in realtime.
- 1.3Recomienda las formas en que un equipo puede dividr una línea de realtime en piezas más pequeñas y más realizables.
- 1.4Considera los pros y los contras importantes para realtime.
- CAPÍTULO 2: INGESTA DE DATOS
- 2.1Presenta los problemas asociados con la ingestión de Big Data en tiempo real con dos conceptos que comúnmente se llama los problemas de First Mile y Last Mile.
- 2.2Muestra cómo funciona el ecosistema de tecnologías de ingestión en tiempo real para resolver los problemas del First Mile y Last Mile.
- 2.3Considera los beneficios de hacer ETL en tiempo real y contrasta eso con los sistemas ETL por lotes.
- CAPÍTULO 3: SPARK STREAMING
- 3.1Profundiza en Spark Streaming, cómo funciona en tiempo real y su arquitectura.
- 3.2Enseña cómo escribir su propio código Spark Streaming que recibe datos en tiempo real de Sockets y Kafka.
- 3.3Muestra las consideraciones que debe tener al utilizar Spark Streaming, como: tamaños de micropaquetes, fallas de controladores, fallas de los workers y cómo tratar las fallas en Spark Streaming.
Instructor
