Curso Big Data Técnico para responsables de Sistemas

Duración: 32 Horas

Objetivos:

Comprender fundamentos de sistemas distributivos en operaciones de un proyecto Big Data.
Adquirir los conocimientos básicos  y las implicaciones en el proceso de diseño e implementación de una solución Big Data.
Adquirir los conocimientos necesarios para evaluar los distintos tipos de almacenamiento, aplicables a una solución big data, ya sea mediante el uso de sistemas de ficheros distribuidos, o mediante el uso de bases de datos NoSQL.
Adquirir los conocimientos teóricos básicos necesarios para el análisis de datos
Afrontar proyectos de visualización interactiva de grandes volúmenes de datos.
Desarrollar soluciones de analítica Big Data para problemas comunes: recomendación, clasificación, etc.
Diseño, desarrollo e implantación de soluciones Big Data completas incluyendo almacenamiento, procesamiento y análisis de datos así como su visualización.
Métodos de integración de soluciones Big Data con el Data Warehouse de una empresa.
Inteligencia de negocio en grandes conjuntos de datos.
Integración de Big Data con el Data Warehouse de una empresa.

Temario:

1. Introducción a Big Data

Big Data... ¿y esto qué es?
Los problemas actuales
Las soluciones y Bases de datos propuestas
Bases de datos Big Data
Sistema de archivos distribuido para garantizar escalabilidad
Big Data... ¿y esto qué es?: Conclusión mundo BI

2. Parametrización de una solución Big Data Opensource

Creando flujos de datos BigData con Kettle
Imaginando una situación que se puede dar
Flujos de datos BigData: Hadoop, Hive y Kettle
Alcance
Trabajando con Kettle
Conclusiones

3. BBDD No Relacionales

Bases de datos para proyectos BigData
¿Por qué NoSQL?
BD Key-Value
BD orientados a documentos
BD orientadas a grafos
BD orientadas a objetos
Not only noSQL: BD Columnares
Introducción a MongoDB
Desde el punto de vista de la analítica de datos

4. Métricas y calidad de los datos

Trabajando con Kettle y MongoDb
Alcance
Trabajando
ETL para insertar datos en MongoDB
ETL para extraer datos de MongoDB

5. Cloud Computing y Analítica
Amazon S3 y Analítica de datos
Cómo funciona S3
Casos de analítica de datos

6. Sistemas de Almacenamiento
Introducción a Amazon Elastic MapReduce
Amazon Elastic Map Reduce
Cómo Funciona
Conclusión

7. Sistemas de procesamiento
Kettle BigData: Amazon EMR y S3
Alcance
Trabajando con Amazon S3
Trabajando con Amazon EMR
Conclusión