1. ¿Qué es Big Data?
  2. ¿Y Thick Data? ¿Cuál es el matiz para diferenciar ambos términos?
  3. El gran auge del big data
  4. La importancia de almacenar y extraer información
  5. ¿Cuál es el papel de las fuentes de datos?
  6. Soluciones novedosas gracias a la selección de datos
  7. Naturaleza de las fuentes de datos Big Data

  1. Proceso KDD
  2. Modelos y Técnicas de Data Mining
  3. Algunas técnicas estadísticas utilizadas en data mining
  4. Áreas de aplicación
  5. Minería de Textos y Web Mining
  6. Data mining y marketing

  1. Arquitectura general de Apache Spark
  2. Componentes principales de Apache Spark
  3. RDDs (Resilient Distributed Datasets): API básico, operaciones y persistencia
  4. Transformaciones y acciones en RDDs
  5. Programación funcional en Spark: Scala y Python
  6. Entornos de desarrollo para Spark: Spark Standalone, YARN, Kubernetes

  1. Servicios de Big Data en la nube: EMR, Dataproc, BigQuery
  2. Implementación de Spark en la nube
  3. Seguridad y escalabilidad en la nube

  1. Fundamentos del análisis de datos
  2. Servicios de AWS para análisis de datos
  3. Planificación de proyectos de análisis de datos en AWS

  1. Amazon S3
  2. Amazon RDS
  3. Amazon DynamoDB
  4. Amazon Redshift
  5. Amazon EMR

  1. Amazon Kinesis
  2. Amazon Glue
  3. Amazon Lambda
  4. Amazon SageMaker

  1. Amazon Athena
  2. Amazon QuickSight
  3. Amazon Lex