Este documento presenta el sílabo de un curso sobre fundamentos de estadística descriptiva e inferencial. El curso se divide en dos bloques, el primero cubre estadística descriptiva e incluye temas como organización de datos y medidas de tendencia central y dispersión. El segundo bloque cubre estadística inferencial e incluye probabilidad, variables aleatorias, modelos econométricos, regresión lineal y pruebas de hipótesis. El documento también presenta información sobre el docente.
Fundamentos Estadística Descriptiva e Inferencial Módulo 1
1. Módulo 1:
Fundamentos de Estadística
Descriptiva e Inferencial
Programa Especializado de Econometría Aplicada
Econ. Luis W. Espejo Cespedes
Escuela Global
2. Índice
1. Sílabo del curso
2. Introducción a la ciencia de datos
3. Organización y estructura de datos
3. Sobre el docente
Economista por la Universidad Nacional Mayor de San Marcos, especializado en
ciencia de datos y economía conductual:
⬩ Curso de programación en VBA Avanzado - UNI
⬩ Curso de análisis de datos con Python - Universidad de Michigan
⬩ Programa Especializado en Ciencia de Datos usando R - Johns Hopkins
⬩ Programa Especializado en Análisis de Datos para Científicos Sociales - MIT
Primer puesto del Curso de Extensión Universitaria en Fiscalización Ambiental 2020 y
se desempeñó como especialista del equipo de innovación del OEFA.
Actualmente, lidera el equipo de innovación de la Secretaría Técnica Regional de
Eliminación de Barreras Burocráticas del INDECOPI.
5. Bloque I: Estadística Descriptiva
Bloque Sesión Contenido Objetivo y estrategia didáctica
Bloque I:
Fundamentos de
Estadística
Descriptiva
1
Principios de ciencia de
datos
Temas:
● Importancia de la estadística en el análisis empírico
● Organización y estructura de datos
2
Conceptos de estadística
descriptiva
Temas:
● Población, muestra y tipos variables estadísticas
● Medidas de tendencia central y dispersión
6. Bloque II: Estadística Inferencial
Bloque Sesión Contenido Objetivo y estrategia didáctica
Bloque II:
Fundamentos de
Estadística
Inferencial
3 Conceptos de estadística
inferencial
Temas:
● Probabilidad e inferencia estadística
● Variable aleatoria y distribución de probabilidad
4
Introducción a modelos
econométricos
Temas:
● Interpolación y extrapolación
● Análisis de correlación
5 Modelos econométricos
Temas:
● Regresión lineal
● Estimación de parámetros, pruebas de hipótesis
6 Taller práctico: Aplicaciones
Temas:
● Aplicaciones
8. ¿Qué es la ciencia de datos?
Campo de estudio dedicado al procesamiento y análisis de datos a través
de herramientas tecnológicas, a fin de obtener hallazgos relevantes para la
toma de decisiones (Dhar, 2013).
Dhar, V. (2013). Data Science and Prediction. Communications of the ACM, Vol. 56 No. 12, 64-73.
10. Inteligencia de negocios
Business Intelligence (BI)
El Business Intelligence (BI) o Inteligencia de Negocios combina análisis de datos,
visualización de datos, herramientas e infraestructura de datos y mejores prácticas para
ayudar a las organizaciones a tomar más decisiones basadas en datos.
Tableau (Web). Business Intelligence: What It Is, How It Works, Its Importance, Examples, & Tools. Disponible en línea en:
https://www.tableau.com/learn/articles/business-intelligence#:~:text=Business%20intelligence%20(BI)%20combines%20business,make%20more%20data%2Ddriven%20decision
11. Entonces…
¿Intuición o inteligencia de negocios?
Intuición
Usar la intuición significa
arriesgarnos a tomar
decisiones que no sean
acertadas
Inteligencia de negocios
Recolectar datos y analizarlos
implica detectar patrones y
obtener conclusiones que
guíen a soluciones en caso de
detectar problemas, o
conservar estrategias si los
resultados han sido exitosos.
12. Cultura Data-driven
● Elegir métricas con cuidado y astucia
○ Qué medimos, para qué lo medimos y cómo lo
mostramos
● Corregir problemas de acceso de información
○ Información a tiempo y oportuna
○ Información de dominio público dentro de la
organización
● Fundamentar el enfoque de los análisis realizados
○ Evaluar las diferentes alternativas y explicar la razón de
las elegidas
Waller, David (2020). 10 Steps to Creating a Data-Driven Culture.
Disponible en línea en:https://hbr.org/2020/02/10-steps-to-creating-a-data-driven-culture
14. 3 principios de la ciencia de datos
Los datos ordenados (tidy data) se caracterizan por 3
aspectos clave:
1. Cada observación forma una fila. Una observación es
lo que buscamos describir con la matriz.
2. Cada variable es una columna. Una variable es una
característica de la observación.
3. Cada unidad de observación diferente forma una
tabla distinta. Por cada tipo de observación hay una
tabla.
Wickham, Hadley (2014). Tidy data. Journal of Statistics Software (Volume VV, Issue II).
Disponible en línea en: https://vita.had.co.nz/papers/tidy-data.pdf
16. Los 5 problemas más comunes en la
organización y estructura de datos
1. Los encabezados de columna son valores,
no nombres de variables.
2. Distintas variables se almacenan en una
columna.
3. Las variables se almacenan tanto en filas
como en columnas.
4. Varios tipos de unidades de observación se
almacenan en la misma tabla.
5. Una sola unidad de observación se
almacena en varias tablas.
17. Los 5 problemas más comunes en la
organización y estructura de datos
1. Los encabezados de columna son valores, no nombres de variables.
Desordenado Ordenado
18. Los 5 problemas más comunes en la
organización y estructura de datos
2. Distintas variables se almacenan en una columna.
Desordenado Ordenado
19. Los 5 problemas más comunes en la
organización y estructura de datos
3. Las variables se almacenan tanto en filas como en columnas.
20. Los 5 problemas más comunes en la
organización y estructura de datos
4. Varios tipos de unidades de observación se almacenan en la misma
tabla.
Id Nombre Ingresos
1 Familia Gomez 1670
2 Familia Perez 2200
3 Jose Bendezú 980
4 Familia Contreras 1200
5 Familia García 1135
21. Los 5 problemas más comunes en la
organización y estructura de datos
5. Una sola unidad de observación se almacena en varias tablas.
Id Nombre Ingresos
3 Jose Bendezú 980
Tabla 1
Familias
Tabla 2
Personas