En este programa conocerás el ciclo de vida completo de los datos; desde la obtención y limpieza, hasta su visualización y análisis
Objetivos de aprendizaje
- Vas a desarrollar habilidades profesionales para desempeñarte como científico de datos.
- Vas a entrenar habilidades para la creación de un proyecto de ciencia de datos.
- Construirás una comunidad de práctica profesional con otras personas que se están formando como científicas/os de datos.
- Aplicarás herramientas específicas y concretas para llevar adelante los diferentes roles de la persona científica de datos: analista, ingeniera y científica.
- Vas a desarrollar prácticas que integren conocimientos de diferentes campos matemática, programación, comunicación y estadística).
- Fomentaremos buenas prácticas desde el rol de científico de datos.
Temario
UNIDAD 1: PROGRAMACIÓN PARA LA CIENCIA DE DATOS
- La sociedad de la información. Datos, información, conocimiento, ¿Sabiduría?
- ¿Qué es un dato? Ciclo de vida de los datos. Gobernanza sobre los datos.
- ¿Qué es la ciencia de datos?
- Diseño de un proyecto de ciencia de datos. Roles.
UNIDAD 2: PROGRAMACIÓN PARA LA CIENCIA DE DATOS I
- Conceptos básicos de programación: comandos, funciones y objetos
- Objetos en R: Vectores, Matrices y Data Frames
- Estructuras de Control
UNIDAD 3: MANIPULACIÓN DE DATOS EN R
- El proceso ETL (extracción, transformación y limpieza de datos)
- Importar y exportar datos desde diferentes formatos en R
- Manejo de fechas en R (Date, POSIXlt, POSIXct)
- Manipulación de datos con R
UNIDAD 4: ANÁLISIS DE DATOS I
- Población y muestra. Parámetros y estimadores.
- Estadísticos descriptivos para el análisis exploratorio de datos.
- Variables aleatorias y distribuciones de probabilidad.
UNIDAD 5: ANÁLISIS DE DATOS II
- Contrastes de hipótesis. Errores Tipo I y Tipo II
- P-valor y el test de hipótesis para la media
- Contraste de hipótesis para la varianza
UNIDAD 6: CORRELACIÓN Y CAUSALIDAD DE DATOS
- Correlación simple: paramétrica y no paramétrica
- Pruebas de hipótesis de correlación
- Diferencias entre la correlación y la causalidad.
UNIDAD 7: VISUALIZACIÓN DE DATOS I
- Tipos de gráficos y su correcto uso
- Creación de gráficos unidimensionales y bidimensionales con R
- Creación de gráficos con ggplot
UNIDAD 8: VISUALIZACIÓN DE DATOS II
- Construcción de un tablero de visualización
- Storytelling: Contar historias con datos
- Buenas prácticas para la confección de visualizaciones