- ¿Qué es Big Data?
- La era de las grandes cantidades de información: historia del big data
- La importancia de almacenar y extraer información
- Big Data enfocado a los negocios
- Open data
- Información pública
- IoT (Internet of Things-Internet de las cosas)
- Conceptos básicos de las bases de datos
- Ventajas de utilizar bases de datos en aplicaciones
- Breve historia de los Sistemas de Gestión de Bases de Datos (SGBD)
- Tipos de bases de datos: SQL y NoSQL
- Introducción al lenguaje SQL
- Creación de bases de datos y tablas
- Inserción y consulta de datos
- Modificación y eliminación de datos
- Consultas avanzadas: operaciones JOIN
- Funciones de agregación y agrupación de datos
- Consultas básicas: SELECT, FROM y WHERE
- Ordenamiento de resultados: cláusula ORDER BY
- Filtrado de datos: cláusulas LIKE e IN
- Uso de subconsultas en SQL
- Operadores lógicos y combinación de condiciones
- Optimización de consultas
- ¿Qué es Google BigQuery?
- Ventajas y beneficios de Google BigQuery
- Arquitectura y funcionamiento de Google BigQuery
- Creación de proyectos y conjuntos de datos en BigQuery
- Consultas SQL con subconsultas y agregaciones
- Ventanas y funciones de análisis de ventanas
- Uniones de tablas y conjuntos de datos
- Funciones personalizadas y User-Defined Functions (UDFs)
- Detección y tratamiento de valores atípicos y errores
- Técnicas de normalización y transformación de datos
- Muestreo y segmentación de conjuntos de datos
- Medidas de tendencia central y dispersión
- Distribuciones de frecuencia y representaciones gráficas
- Análisis de correlación y relación entre variables
- Visualizaciones interactivas con Data Studio y herramientas BI
- Conceptos básicos de machine learning
- Tipos de algoritmos de machine learning: supervisado, no supervisado y aprendizaje por refuerzo
- Evaluación del rendimiento de modelos ML
- Regresión lineal y logística para pronósticos y clasificación
- Árboles de decisión y conjuntos aleatorios (Random Forests)
- K-Nearest Neighbors (KNN) y algoritmos basados en distancia
- Validación cruzada y selección de modelos
- Preprocesamiento y análisis de datos de series temporales
- Pronósticos y modelado de tendencias con ARIMA y Prophet
- Detección de anomalías y eventos en series temporales
- Preprocesamiento y limpieza de datos de texto
- Análisis de sentimiento y opinión con técnicas de NLP
- Extracción de información y temas clave en documentos
- Introducción a datos geoespaciales y georreferenciación
- Análisis de datos geoespaciales con BigQuery Geospatial
- Visualización de datos geoespaciales en mapas y cuadros de mando
