1. ¿Qué es Big Data?
  2. La era de las grandes cantidades de información: historia del big data
  3. La importancia de almacenar y extraer información
  4. Big Data enfocado a los negocios
  5. Open data
  6. Información pública
  7. IoT (Internet of Things-Internet de las cosas)

  1. Conceptos básicos de las bases de datos
  2. Ventajas de utilizar bases de datos en aplicaciones
  3. Breve historia de los Sistemas de Gestión de Bases de Datos (SGBD)
  4. Tipos de bases de datos: SQL y NoSQL

  1. Introducción al lenguaje SQL
  2. Creación de bases de datos y tablas
  3. Inserción y consulta de datos
  4. Modificación y eliminación de datos
  5. Consultas avanzadas: operaciones JOIN
  6. Funciones de agregación y agrupación de datos

  1. Consultas básicas: SELECT, FROM y WHERE
  2. Ordenamiento de resultados: cláusula ORDER BY
  3. Filtrado de datos: cláusulas LIKE e IN
  4. Uso de subconsultas en SQL
  5. Operadores lógicos y combinación de condiciones
  6. Optimización de consultas

  1. ¿Qué es Google BigQuery?
  2. Ventajas y beneficios de Google BigQuery
  3. Arquitectura y funcionamiento de Google BigQuery
  4. Creación de proyectos y conjuntos de datos en BigQuery

  1. Consultas SQL con subconsultas y agregaciones
  2. Ventanas y funciones de análisis de ventanas
  3. Uniones de tablas y conjuntos de datos
  4. Funciones personalizadas y User-Defined Functions (UDFs)

  1. Detección y tratamiento de valores atípicos y errores
  2. Técnicas de normalización y transformación de datos
  3. Muestreo y segmentación de conjuntos de datos

  1. Medidas de tendencia central y dispersión
  2. Distribuciones de frecuencia y representaciones gráficas
  3. Análisis de correlación y relación entre variables
  4. Visualizaciones interactivas con Data Studio y herramientas BI

  1. Conceptos básicos de machine learning
  2. Tipos de algoritmos de machine learning: supervisado, no supervisado y aprendizaje por refuerzo
  3. Evaluación del rendimiento de modelos ML
  4. Regresión lineal y logística para pronósticos y clasificación
  5. Árboles de decisión y conjuntos aleatorios (Random Forests)
  6. K-Nearest Neighbors (KNN) y algoritmos basados en distancia
  7. Validación cruzada y selección de modelos

  1. Preprocesamiento y análisis de datos de series temporales
  2. Pronósticos y modelado de tendencias con ARIMA y Prophet
  3. Detección de anomalías y eventos en series temporales

  1. Preprocesamiento y limpieza de datos de texto
  2. Análisis de sentimiento y opinión con técnicas de NLP
  3. Extracción de información y temas clave en documentos

  1. Introducción a datos geoespaciales y georreferenciación
  2. Análisis de datos geoespaciales con BigQuery Geospatial
  3. Visualización de datos geoespaciales en mapas y cuadros de mando