DATA SCIENCE

En este programa conocerás el ciclo de vida completo de los datos; desde la obtención y limpieza, hasta su visualización y análisis

Objetivos de aprendizaje

  • Vas a desarrollar habilidades profesionales para desempeñarte como científico de datos.
  • Vas a entrenar habilidades para la creación de un proyecto de ciencia de datos.
  • Construirás una comunidad de práctica profesional con otras personas que se están formando como científicas/os de datos.
  • Aplicarás herramientas específicas y concretas para llevar adelante los diferentes roles de la persona científica de datos: analista, ingeniera y científica.
  • Vas a desarrollar prácticas que integren conocimientos de diferentes campos matemática, programación, comunicación y estadística).
  • Fomentaremos buenas prácticas desde el rol de científico de datos.

Temario

UNIDAD 1: PROGRAMACIÓN PARA LA CIENCIA DE DATOS

  •  La sociedad de la información. Datos, información, conocimiento, ¿Sabiduría?
  • ¿Qué es un dato? Ciclo de vida de los datos.  Gobernanza sobre los datos. 
  • ¿Qué es la ciencia de datos?  
  • Diseño de un proyecto de ciencia de datos. Roles. 

UNIDAD 2: PROGRAMACIÓN PARA LA CIENCIA DE DATOS I

  • Conceptos básicos de programación: comandos, funciones y objetos
  • Objetos en R: Vectores, Matrices y Data Frames
  • Estructuras de Control

UNIDAD 3: MANIPULACIÓN DE DATOS EN R

  • El proceso ETL (extracción, transformación y limpieza de datos)
  • Importar y exportar datos desde diferentes formatos en R
  • Manejo de fechas en R (Date, POSIXlt, POSIXct)
  • Manipulación de datos con R

UNIDAD 4: ANÁLISIS DE DATOS I

  • Población y muestra. Parámetros y estimadores.
  • Estadísticos descriptivos para el análisis exploratorio de datos.
  • Variables aleatorias y distribuciones de probabilidad.

UNIDAD 5: ANÁLISIS DE DATOS II

  • Contrastes de hipótesis. Errores Tipo I y Tipo II
  • P-valor y el test de hipótesis para la media
  • Contraste de hipótesis para la varianza

UNIDAD 6: CORRELACIÓN Y CAUSALIDAD DE DATOS

  • Correlación simple: paramétrica y no paramétrica
  • Pruebas de hipótesis de correlación
  • Diferencias entre la correlación y la causalidad.

UNIDAD 7: VISUALIZACIÓN DE DATOS I

  • Tipos de gráficos y su correcto uso
  • Creación de gráficos unidimensionales y bidimensionales con R
  • Creación de gráficos con ggplot

UNIDAD 8: VISUALIZACIÓN DE DATOS II

  • Construcción de un tablero de visualización
  • Storytelling: Contar historias con datos
  • Buenas prácticas para la confección de visualizaciones

Tags: