1. TEMA 1TEMA 1
El análisis estadístico de datosEl análisis estadístico de datos
Probabilidades y Estadística I
2. Esquema inicial
1 Introducción1. Introducción.
2. Variables y datos. Tipos de datos.y p
3. Descripción de datos mediante tablas.
4. Descripción de datos mediante gráficos.
5. Introducción al análisis exploratorio de datos.
Probabilidades y Estadística I
3. Esquema inicial
1 Introducción1. Introducción.
2. Variables y datos. Tipos de datos.2. Variables y datos. Tipos de datos.2. Variables y datos. Tipos de datos.y py py p
3. Descripción de datos mediante tablas.3. Descripción de datos mediante tablas.3. Descripción de datos mediante tablas.
4. Descripción de datos mediante gráficos.4. Descripción de datos mediante gráficos.4. Descripción de datos mediante gráficos.
5. Introducción al análisis exploratorio de datos.5. Introducción al análisis exploratorio de datos.5. Introducción al análisis exploratorio de datos.
Probabilidades y Estadística I
4. 1. Introducción (1/6)
Seis objetivos de la Estadística Descriptiva
A. Recoger y organizar datos (observaciones)
Calificaciones de “Probabilidades y Estadística” en 20 alumnos
x1, x2,..., xn
5.12, 7, 8.62, 6, 2.88, 7.33, 2.08, 2.75, 5.25, 5,
6.88, 5.83, 5, 3.38, 6.25, 6.12, 6, 4.62, 6.62, 8.5
(x y ) (x y ) (x y )
Calificaciones de “Probabilidades y Estadística” y nº de
convocatorias utilizadas hasta ahora
(x1, y1), (x2, y2),…,(xn,, yn)
(5.12, 2), (7, 1), (8.62, 2), (6, 3), (2.88, 2),(7.33, 2), (6, 3),
(2.75, 4) (5.25, 2), (5, 1),(6.88, 5) (5.83, 1), (5, 4), (3.38,4),
(6.25, 3), (6.12, 1), (6, 2), (4.62, 3), (6.62, 2), (8.5, 1)
Probabilidades y Estadística I
5. 1. Introducción (2/6)
Seis objetivos de la Estadística Descriptiva
B. Técnicas de visualización para datos multivariantes (visualización)
Probabilidades y Estadística I
6. 1. Introducción (3/6)
Seis objetivos de la Estadística Descriptiva
C. Esquematizar el comportamiento de los datos mediante tablas,
áfi dib j ( t )gráficos o dibujos (patrones)
Probabilidades y Estadística I
7. 1. Introducción (4/6)
Seis objetivos de la Estadística Descriptiva
D. Resumir la información en unos pocos datos representativos
( í t i )(síntesis)
Probabilidades y Estadística I
8. 1. Introducción (5/6)
Seis objetivos de la Estadística Descriptiva
E. Analizar la relación de dependencia entre las componentes de
d t ltidi i l ( l ió )datos multidimensionales (correlación)
Probabilidades y Estadística I
9. 1. Introducción (6/6)
Seis objetivos de la Estadística Descriptiva
F. Interpretar la información obtenida (aprendizaje)
Probabilidades y Estadística I
10. Esquema inicial
111 IntroducciónIntroducciónIntroducción1.1.1. Introducción.Introducción.Introducción.
2. Variables y datos. Tipos de datos.y p
3. Descripción de datos mediante tablas.3. Descripción de datos mediante tablas.3. Descripción de datos mediante tablas.
4. Descripción de datos mediante gráficos.4. Descripción de datos mediante gráficos.4. Descripción de datos mediante gráficos.
5. Introducción al análisis exploratorio de datos.5. Introducción al análisis exploratorio de datos.5. Introducción al análisis exploratorio de datos.
Probabilidades y Estadística I
11. 2. Variables y datos. Tipos de datos (1/12)
Enunciados genéricosEnunciados genéricos
Sea x1, x2,….., xn un conjunto de n valores numéricos
Sea (x1, y1), (x2, y2),….., (xn, yn)
Sea 1 1 1 2 2 2
1 2 1 2 1 2( , ,..., ),( , ,..., ),......,( , ,..., )n n n
m m mx x x x x x x x x
Probabilidades y Estadística I
12. 2. Variables y datos. Tipos de datos (2/12)
Enunciado académico 1
CASO
UNIDIMENSIONAL
Enunciado académico 1
Se seleccionan 20 alumnos de la Facultad de Informática con la asignatura
“Probabilidad y Estadística” aprobada. Se recoge información sobre el número de
convocatorias que necesitaron para aprobar dicha asignatura.
2, 3, 2, 1, 1, 3, 4, 3, 1, 1, 2, 1, 2, 1, 3, 1, 3, 2, 1, 5
x1, x2, x3, x4, x5, x6, x7, x8, x9, x10, x11, x12, x13, x14, x15, x16, x17, x18, x19, x20
X “ ú d t i b P b bilid d E t dí ti ”X “número de convocatorias para aprobar Probabilidad y Estadística”
Probabilidades y Estadística I
13. 2. Variables y datos. Tipos de datos (3/12)
Enunciado académico 1’
CASO
BIDIMENSIONAL
Enunciado académico 1
Se seleccionan 20 alumnos de la Facultad de Informática con la asignatura
“Probabilidad y Estadística” aprobada. Se recoge información sobre el número de
convocatorias que necesitaron para aprobar dicha asignatura y su calificación
(2,5.0),(3,6.3),(2,5.2),(1,7.0),(1,8.2),(3,5.4),(4,5.0),(3,6.8),(1,5.0),(1,7.3)
(2,6.0),(1,7.5),(2,5.0),(1,7.8),(3,6.2),(1,6.0),(3,8.0),(2,6.6),(1,5.0),(5,5.0)
(x1,y1), (x2,y2),….., (x20,y20)
(X,Y)
Probabilidades y Estadística I
14. 2. Variables y datos. Tipos de datos (4/12)
Enunciado académico 2
DATOS
CUALITATIVOS
Enunciado académico 2
Se lanza 20 veces una moneda y se observan los resultados.
cara, cruz, cruz, cruz, cara, cruz, cruz, cara, cara, cruz
cara, cara, cruz, cruz, cruz, cruz, cara, cara, cruz, cruz
C
0, 1, 1, 1, 0, 1, 1, 0, 0, 1, , , , , , , , ,
0, 0, 1, 1, 1, 1, 0, 0, 1, 1
X Probabilidades y Estadística I
X
15. 2. Variables y datos. Tipos de datos (5/12)
Glosario de términosGlosario de términos
1. Población (universo, colectivo)
2. Muestra
3 C á t
4. Modalidades
3. Carácter
5. Variables estadísticas
Probabilidades y Estadística I
17. 2. Variables y datos. Tipos de datos (6/12)
Enunciado académico 1a
VARIABLE
ESTADÍSTICA
DISCRETAEnunciado académico 1a
Se seleccionan 20 alumnos de la Facultad de Informática con la asignatura
DISCRETA
“Probabilidad y Estadística” aprobada. Se recoge información sobre el número de
convocatorias que necesitaron para aprobar dicha asignatura
Población
Muestra
Carácter a estudio
MODALIDADES: {1,2,3,......} (carácter cuantitativo)
Probabilidades y Estadística I
18. 2. Variables y datos. Tipos de datos (7/12)
Enunciado académico 1b
VARIABLE
ESTADÍSTICA
CONTINUAEnunciado académico 1b
Se seleccionan 20 alumnos de la Facultad de Informática con la asignatura
CONTINUA
“Probabilidad y Estadística” aprobada. Se recoge información sobre su nota en la
Asignatura.
Carácter a estudio
MODALIDADES: [5,10] (carácter cuantitativo)
Probabilidades y Estadística I
19. 2. Variables y datos. Tipos de datos (8/12)
Enunciado académico 1c
MEDIDA
NOMINAL
Enunciado académico 1c
Se seleccionan 20 alumnos de la Facultad de Informática con la asignatura
“Probabilidad y Estadística” aprobada. Se recoge información sobre su color de
ojos.
Carácter a estudio
MODALIDADES: {negros, marrones, azules, otros} (carácter cualitativo)
1 2 3 4
Probabilidades y Estadística I
20. 2. Variables y datos. Tipos de datos (9/12)
Tipos de caracteres
MEDIDA
ORDINAL
Enunciado académico 1dTipos de caracteres
Se seleccionan 20 alumnos de la Facultad de Informática con la asignatura
Enunciado académico 1d
“Probabilidad y Estadística” aprobada. Se recoge información sobre el nivel
de estudio de su padre .
Carácter a estudio
MODALIDADES: {SE, EGB, BUP, Universitario} (carácter cualitativo)
1 2 3 4
Probabilidades y Estadística I
21. 2. Variables y datos. Tipos de datos (10/12)
Enunciado académico 2
MEDIDA
NOMINAL
Enunciado académico 2
Se lanza 20 veces una moneda y se observan los resultados.
Población: Lanzar una moneda (experimento aleatorio)Población: Lanzar una moneda (experimento aleatorio)
Muestra: 20 lanzamientos
MODALIDADES: {C, X} (carácter cualitativo)
Probabilidades y Estadística I
22. 2. Variables y datos. Tipos de datos (11/12)
NOTACIÓNNOTACIÓN
1. Población (universo, colectivo) P
2. Muestra
3 C á t
M P
C
4. Modalidades
3. Carácter C
C1, C2,…., Ck
5. Variables estadísticas X
x’1, x’2,…., x’k
k valores
dif1, 2, , k
diferentes
Probabilidades y Estadística I
24. Ejemplo de lego
NOTACIÓNNOTACIÓN
1. Población (universo, colectivo) Piezas del lego
2. Muestra
3 C á t
Subconjunto de 10 piezas
C l
4. Modalidades
3. Carácter Color
rojo, azul, verde
5. Variables estadísticas X
1, 2, 3 3 valores
dif
, ,
diferentes
Probabilidades y Estadística I
25. 2. Variables y datos. Tipos de datos
Glosario de términosGlosario de términos
1. Población (universo, colectivo)
2. Muestra
3 C á t
Cualitativo
4. Modalidades
3. Carácter
Cuantitativo
Di t
5. Variables estadísticas
Discreta
Continua
Modalidades = Rango
Probabilidades y Estadística I
26. 2. Variables y datos. Tipos de datos
Glosario de términosGlosario de términos
1. Población (universo, colectivo)1. Población (universo, colectivo)1. Población (universo, colectivo)
2. Muestra2. Muestra2. Muestra
3 C á t
Cualitativo
Cuantificación Medida nominal
Medida ordinal
4. Modalidades4. Modalidades4. Modalidades
3. Carácter
CuantitativoCuantitativoCuantitativo
Di tDi tDi t
Medida ordinal
5. Variables estadísticas5. Variables estadísticas5. Variables estadísticas
DiscretaDiscretaDiscreta
ContinuaContinuaContinua
Modalidades = RangoModalidades = RangoModalidades = Rango
Probabilidades y Estadística I
27. 2. Variables y datos. Tipos de datos
Glosario de términosGlosario de términos
1. Población (universo, colectivo)1. Población (universo, colectivo)1. Población (universo, colectivo)
2. Muestra2. Muestra2. Muestra
3 C á t3 C á t3 C á t
CualitativoCualitativoCualitativo
Medida de intervalo
4. Modalidades4. Modalidades4. Modalidades
3. Carácter3. Carácter3. Carácter
Cuantitativo
Di tDi tDi t
Medida de intervalo
Medida de razón
5. Variables estadísticas5. Variables estadísticas5. Variables estadísticas
DiscretaDiscretaDiscreta
ContinuaContinuaContinua
Modalidades = RangoModalidades = RangoModalidades = Rango
Probabilidades y Estadística I
28. 2. Variables y datos. Tipos de datos
Medida Operaciones
posibles
Requisitos Ejemplo.
Nominal Verificar la igualdad Posibilidad de Estado civil SexoNominal Verificar la igualdad
de dos modalidades.
Posibilidad de
permutar
modalidades
Estado civil, Sexo,
nacionalidad.
O di l
Verificar si una Mantenimiento del Gravedad de una
Caracteres
cualitativos
Ordinal modalidad es mayor
que otra.
Mantenimiento del
orden
Gravedad de una
lesión.
De intervalo Comparar las
dif i d
Unidad constante Temperatura.De intervalo diferencias entre dos
modalidades.
Unidad constante Temperatura.
De razón
Establecer razones
d lid d
Existencia de cero Peso, altura...
Caracteres
cuantitativos
De razón entre modalidades absoluto
,
Probabilidades y Estadística I
29. 2. Variables y datos. Tipos de datos
Relaciones entre medidasRelaciones entre medidas
MEDIDA MEDIDA MEDIDA MEDIDA
NOMINAL ORDINAL DE INTERVALO DE RAZÓN
Probabilidades y Estadística I
31. Esquema inicial
111 IntroducciónIntroducciónIntroducción1.1.1. Introducción.Introducción.Introducción.
2. Variables y datos. Tipos de datos.2. Variables y datos. Tipos de datos.2. Variables y datos. Tipos de datos.y py py p
3. Descripción de datos mediante tablas (caso unidimensional)
4. Descripción de datos mediante gráficos.4. Descripción de datos mediante gráficos.4. Descripción de datos mediante gráficos.
5. Introducción al análisis exploratorio de datos.5. Introducción al análisis exploratorio de datos.5. Introducción al análisis exploratorio de datos.
Probabilidades y Estadística I
32. 3. Descripción de datos mediante tablas (1/8)
PATRONES NUMÉRICOS
SERIE 1 3 3 3 3 3 3 3 3 3 3
PATRONES NUMÉRICOS
Ct 3SERIE 1 3, 3, 3, 3, 3, 3, 3, 3, 3, 3
SERIE 2 2 4 6 8 10 12
Cte = 3
Xn = 2n n = 1,2,3....SERIE 2 2, 4, 6, 8, 10, 12
SERIE 3 1, 2, 2, 3, 3, 3, 4, 4, 4, 4
n , ,
n veces el número “n”
SERIE 4 1, 2, 1, 1, 2, 3, 2, 1, 1, 1
Probabilidades y Estadística I
33. 3. Descripción de datos mediante tablas (2/8)
PATRONES NUMÉRICOSPATRONES NUMÉRICOS
SERIE 4 Seis “1”
Tres “2”
U “3”
REPETICIONES
(Tablas)
Un “3”
REPETICIONES
(Gráficos)
Probabilidades y Estadística I
34. 3. Descripción de datos mediante tablas (3/8)
DATOS UNIDIMENSIONALES
Modalidad
Frecuencia
absoluta
Frecuencia absoluta
acumulada
Frecuencia
relativa
Frecuencia relativa
acumulada
DATOS UNIDIMENSIONALES
absoluta acumulada relativa acumulada
x’1 n1 N1=n1 f1 = n1/n F1 = f1
x’2 n2 N2=n1 + n2 f2 = n2/n F2= f1 + f2
... ... ... ... ...
x’i ni Ni = nj
j
i
1
f1 = ni/n Fi= f j
j
i
1
... ... ... ... ...
x’ n N =
k
n f / F = f j
n
= 1x k nk Nk = j
jn
1
fk = nk/n Fk= f j
j
1
= 1
TOTALES n 1
Probabilidades y Estadística I
43. Esquema inicial
111 IntroducciónIntroducciónIntroducción1.1.1. Introducción.Introducción.Introducción.
2. Variables y datos. Tipos de datos.2. Variables y datos. Tipos de datos.2. Variables y datos. Tipos de datos.y py py p
3. Descripción de datos mediante tablas.3. Descripción de datos mediante tablas.3. Descripción de datos mediante tablas.
4. Descripción de datos mediante gráficos (caso unidimensional)
5. Introducción al análisis exploratorio de datos.5. Introducción al análisis exploratorio de datos.5. Introducción al análisis exploratorio de datos.
Probabilidades y Estadística I
44. 4. Descripción de datos mediante gráficos (1/13)
Medidas nominales. Datos categóricos
VARIABLE
ESTADÍSTICA
DISCRETA
1. Diagrama de sectores
DISCRETA
17,05%
No presentados
34,09%
No presentados
Aprobados
Suspensos
48 86%48,86%
Probabilidades y Estadística I
45. 4. Descripción de datos mediante gráficos (2/13)
Medidas nominales. Datos categóricos
VARIABLE
ESTADÍSTICA
DISCRETA
2. Diagrama de rectángulos
DISCRETA
olutas
40
50
uenciasAbso
20
30
Frecu
0
10
Europa América Asia Africa Oceanía
Continentes
p
Probabilidades y Estadística I
46. 4. Descripción de datos mediante gráficos (3/13)
3 Pictogramas
Medidas nominales. Datos categóricos
VARIABLE
ESTADÍSTICA
DISCRETA3. Pictogramas
3. Pictogramas
DISCRETA
Bélgica
Italia
Francia
España
Probabilidades y Estadística I
0 10 20 30 40 50
47. 4. Descripción de datos mediante gráficos (4/13)
Medidas ordinales e intervalar/razón
VARIABLE
ESTADÍSTICA
DISCRETA
1. Diagrama de barras
DISCRETA
Representación
diferencial
Probabilidades y Estadística I
48. 4. Descripción de datos mediante gráficos (5/13)
Medidas ordinales e intervalar/razón
VARIABLE
ESTADÍSTICA
DISCRETA
2. Función de distribución escalonada
DISCRETA
Representación
integral
Probabilidades y Estadística I
49. 4. Descripción de datos mediante gráficos (6/13)
Medidas intervalar/razón
VARIABLE
ESTADÍSTICA
CONTÍNUA
1. Histogramas (polígono de frecuencias)
CONTÍNUA
Representación
diferencial
Probabilidades y Estadística I
53. 4. Descripción de datos mediante gráficos (9/13)
Histograma vs. Tallo-hoja
bsol
8
10
Frec.Ab
2
4
6
IPC
0 4 8 12 16
0
2
IPC
Probabilidades y Estadística I
54. 4. Descripción de datos mediante gráficos (10/13)
Catálogo de perfiles
1,2
0,8
1
,
0 2
0,4
0,6
0 1 2 3 4
0
0,2
Perfil de datos sin tratar
Probabilidades y Estadística I
55. 4. Descripción de datos mediante gráficos (11/13)
Catálogo de perfiles
0 4
0,3
0,4
0,1
0,2
-5 -3 -1 1 3 5
0
Forma de campana
Probabilidades y Estadística I
56. 4. Descripción de datos mediante gráficos (12/13)
Catálogo de perfiles
0,1
1,2
0 04
0,06
0,08
0 6
0,8
1
0
0,02
0,04
0
0,2
0,4
0,6
0 10 20 30 40 50 60
0
0 1 2 3 4
0
Asimétrico desplazado a la dcha
Probabilidades y Estadística I
57. 4. Descripción de datos mediante gráficos (13/13)
Medidas intervalar/razón
VARIABLE
ESTADÍSTICA
CONTÍNUA
3. Función de distribución (polígono acumulativo)
CONTÍNUA
Probabilidades y Estadística I