- ¿Qué es Big Data?
- ¿Y Thick Data? ¿Cuál es el matiz para diferenciar ambos términos?
- El gran auge del big data
- La importancia de almacenar y extraer información
- ¿Cuál es el papel de las fuentes de datos?
- Soluciones novedosas gracias a la selección de datos
- Naturaleza de las fuentes de datos Big Data
- Proceso KDD
- Modelos y Técnicas de Data Mining
- Algunas técnicas estadísticas utilizadas en data mining
- Áreas de aplicación
- Minería de Textos y Web Mining
- Data mining y marketing
- Arquitectura general de Apache Spark
- Componentes principales de Apache Spark
- RDDs (Resilient Distributed Datasets): API básico, operaciones y persistencia
- Transformaciones y acciones en RDDs
- Programación funcional en Spark: Scala y Python
- Entornos de desarrollo para Spark: Spark Standalone, YARN, Kubernetes
- Servicios de Big Data en la nube: EMR, Dataproc, BigQuery
- Implementación de Spark en la nube
- Seguridad y escalabilidad en la nube
- Fundamentos del análisis de datos
- Servicios de AWS para análisis de datos
- Planificación de proyectos de análisis de datos en AWS
- Amazon S3
- Amazon RDS
- Amazon DynamoDB
- Amazon Redshift
- Amazon EMR
- Amazon Kinesis
- Amazon Glue
- Amazon Lambda
- Amazon SageMaker
- Amazon Athena
- Amazon QuickSight
- Amazon Lex
