2. Probabilidades y Estadística I
Esquema inicial
1. Introducción.
2. Variables y datos. Tipos de datos.
3. Descripción de datos mediante tablas
4. Descripción de datos mediante gráficos.
5. Introducción al análisis exploratorio de datos.
3. Probabilidades y Estadística I
Esquema inicial
1. Introducción.
2. Variables y datos. Tipos de datos.
3. Descripción de datos mediante tablas.
4. Descripción de datos mediante gráficos.
5. Introducción al análisis exploratorio de datos.
4. Probabilidades y Estadística I
1. Introducción
Seis objetivos de la Estadística Descriptiva
A. Recoger y organizar datos (observaciones)
(1/2)
B. Esquematizar el comportamiento de los datos mediante tablas,
gráficos o dibujos (patrones)
C. Resumir la información en unos pocos datos representativos
(síntesis)
5. Probabilidades y Estadística I
1. Introducción
Seis objetivos de la Estadística Descriptiva
(2/2)
D. Analizar la relación de dependencia entre las componentes de
datos multidimensionales (causalidad)
E. Interpretar la información obtenida (aprendizaje)
F. Técnicas de visualización para datos multivariantes (visualización)
6. Probabilidades y Estadística I
Esquema inicial
1. Introducción.
2. Variables y datos. Tipos de datos.
3. Descripción de datos mediante tablas.
4. Descripción de datos mediante gráficos.
5. Introducción al análisis exploratorio de datos.
7. Probabilidades y Estadística I
2. Variables y datos. Tipos de datos
Enunciados genéricos
(1/7)
Sea x1, x2,….., xn un conjunto de n valores numéricos
Sea (x1, y1), (x2, y2),….., (xn, yn)
Sea 1 1 1 2 2 2
1 2 1 2 1 2( , ,..., ),( , ,..., ),......,( , ,..., )n n n
m m mx x x x x x x x x
8. Probabilidades y Estadística I
2. Variables y datos. Tipos de datos
Glosario de términos
(2/7)
1. Población (universo, colectivo)
2. Muestra
4. Modalidades
5. Variables estadísticas
3. Carácter
Cualitativo
Cuantitativo
Discreta
Continua
Modalidades = Rango
9. Probabilidades y Estadística I
2. Variables y datos. Tipos de datos
Glosario de términos
(3/7)
1. Población (universo, colectivo)
2. Muestra
4. Modalidades
5. Variables estadísticas
3. Carácter
Cualitativo
Cuantitativo
Discreta
Continua
Modalidades = Rango
Cuantificación Medida nominal
Medida ordinal
10. Probabilidades y Estadística I
2. Variables y datos. Tipos de datos
Glosario de términos
(4/7)
1. Población (universo, colectivo)
2. Muestra
4. Modalidades
5. Variables estadísticas
3. Carácter
Cualitativo
Cuantitativo
Discreta
Continua
Modalidades = Rango
Medida de intervalo
Medida de razón
11. Probabilidades y Estadística I
Medida Operaciones
posibles
Requisitos Ejemplo.
Nominal Verificar la igualdad
de dos modalidades.
Posibilidad de
permutar
modalidades
Estado civil, Sexo,
nacionalidad.
Ordinal
Verificar si una
modalidad es mayor
que otra.
Mantenimiento del
orden
Gravedad de una
lesión.
De intervalo Comparar las
diferencias entre dos
modalidades.
Unidad constante Temperatura.
De razón
Establecer razones
entre modalidades
Existencia de cero
absoluto
Peso, altura...
2. Variables y datos. Tipos de datos (5/7)
Caracteres
cualitativos
Caracteres
cuantitativos
12. Probabilidades y Estadística I
2. Variables y datos. Tipos de datos (6/7)
MEDIDA
NOMINAL
Relaciones entre medidas
MEDIDA
ORDINAL
MEDIDA
DE INTERVALO
MEDIDA
DE RAZÓN
⊃ ⊃ ⊃
13. Probabilidades y Estadística I
2. Variables y datos. Tipos de datos
NOTACIÓN
(7/7)
1. Población (universo, colectivo)
2. Muestra
4. Modalidades
5. Variables estadísticas
3. Carácter
P
M ⊆ P
C
C1, C2,…., Ck
X
x’1, x’2,…., x’k
k valores
diferentes
14. Probabilidades y Estadística I
Esquema inicial
1. Introducción.
2. Variables y datos. Tipos de datos.
3. Descripción de datos mediante tablas (caso unidimensional)
4. Descripción de datos mediante gráficos.
5. Introducción al análisis exploratorio de datos.
15. Probabilidades y Estadística I
3. Descripción de datos mediante tablas (1/8)
SERIE 1 3, 3, 3, 3, 3, 3, 3, 3, 3, 3
SERIE 2 2, 4, 6, 8, 10, 12
SERIE 3 1, 2, 2, 3, 3, 3, 4, 4, 4, 4
PATRONES NUMÉRICOS
SERIE 4 1, 2, 1, 1, 2, 3, 2, 1, 1, 1
Cte = 3
Xn = 2n n = 1,2,3....
n veces el número “n”
16. Probabilidades y Estadística I
3. Descripción de datos mediante tablas (2/8)
PATRONES NUMÉRICOS
SERIE 4 Seis “1”
Tres “2”
Un “3”
REPETICIONES
(Tablas)
REPETICIONES
(Gráficos)
17. Probabilidades y Estadística I
Modalidad
Frecuencia
absoluta
Frecuencia absoluta
acumulada
Frecuencia
relativa
Frecuencia relativa
acumulada
x’1 n1 N1=n1 f1 = n1/n F1 = f1
x’2 n2 N2=n1 + n2 f2 = n2/n F2= f1 + f2
... ... ... ... ...
x’i ni Ni = nj
j
i
=
∑
1
f1 = ni/n Fi= f j
j
i
=
∑
1
... ... ... ... ...
x’k nk Nk = ∑=
k
j
jn
1
fk = nk/n Fk= f j
j
n
=
∑
1
= 1
TOTALES n 1
3. Descripción de datos mediante tablas (3/8)
DATOS UNIDIMENSIONALES
18. Probabilidades y Estadística I
MUESTRA: 20 Alumnos con la asignatura “Probabilidad y Estadística”
aprobada
POBLACIÓN: Alumnos de la Facultad de Informática
VARIABLE ESTADÍSTICA: X ≡ nº de convocatorias
RANGO: Rg X = {1,2,3,......}
SERIE: 5, 3, 1, 2, 1, 3, 1, 3, 5, 1, 2, 1, 1, 1, 2, 4, 5, 1, 2, 1
SERIE ORDENADA: 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 4, 5, 5, 5
3. Descripción de datos mediante tablas (4/8)
EJEMPLO 1
19. Probabilidades y Estadística I
Nº de
convocatorias
Frecuencia
absoluta
Frecuencia absoluta
acumulada
Frecuencia
relativa
Frecuencia relativa
acumulada
1 9 9 9/20 = 0.45 0.45
2 4 13 0.20 0.65
3 3 16 0.15 0.80
4 1 17 0.05 0.85
5 3 20 0.15 1
TOTALES 20 1
3. Descripción de datos mediante tablas (5/8)
EJEMPLO 1
20. Probabilidades y Estadística I
MUESTRA: 20 Alumnos presentados a una convocatoria de la asignatura
“Probabilidades y Estadística”
POBLACIÓN: Alumnos de la Facultad de Informática
VARIABLE ESTADÍSTICA: X ≡ calificación en “P y E”
RANGO: Rg X = [0,10]
SERIE: 5.12, 7, 8.62, 6, 2.88, 7.33, 2.08, 2.75, 5.25, 5, 6.88, 5.83, 5, 3.38,
6.25, 6.12, 6, 4.62, 6.62, 8.5
SERIE ORDENADA: 2.08, 2.75, 2.88, 3.88, 4.62, 5, 5, 5.12, 5.25, 5.83, 6,
6, 6.12, 6.25, 6.62, 6.88, 7, 7.33, 8.5, 8.62
3. Descripción de datos mediante tablas (6/8)
EJEMPLO 2
23. Probabilidades y Estadística I
Esquema inicial
1. Introducción.
2. Variables y datos. Tipos de datos.
3. Descripción de datos mediante tablas.
4. Descripción de datos mediante gráficos (caso unidimensional)
5. Introducción al análisis exploratorio de datos.
24. Probabilidades y Estadística I
No presentados
Aprobados
Suspensos
34,09%
48,86%
17,05%
4. Descripción de datos mediante gráficos (1/13)
Medidas nominales. Datos categóricos
1. Diagrama de sectores
VARIABLE
ESTADÍSTICA
DISCRETA
25. Probabilidades y Estadística I
FrecuenciasAbsolutas
Continentes
0
10
20
30
40
50
Europa América Asia Africa Oceanía
4. Descripción de datos mediante gráficos (2/13)
Medidas nominales. Datos categóricos
2. Diagrama de rectángulos
VARIABLE
ESTADÍSTICA
DISCRETA
26. Probabilidades y Estadística I
0 10 20 30 40 50
España
Francia
Italia
Bélgica
3. Pictogramas
4. Descripción de datos mediante gráficos (3/13)
Medidas nominales. Datos categóricos
3. Pictogramas
VARIABLE
ESTADÍSTICA
DISCRETA
27. Probabilidades y Estadística I
Medidas ordinales e intervalar/razón
1. Diagrama de barras
4. Descripción de datos mediante gráficos (4/13)
Representación
diferencial
VARIABLE
ESTADÍSTICA
DISCRETA
28. Probabilidades y Estadística I
Medidas ordinales e intervalar/razón
2. Función de distribución escalonada
4. Descripción de datos mediante gráficos (5/13)
Representación
integral
VARIABLE
ESTADÍSTICA
DISCRETA
29. Probabilidades y Estadística I
4. Descripción de datos mediante gráficos (6/13)
Medidas intervalar/razón
1. Histogramas (polígono de frecuencias)
VARIABLE
ESTADÍSTICA
CONTÍNUA
Representación
diferencial
31. Probabilidades y Estadística I
Stem-and-Leaf Display for IPC: unit = 1,0 1|2 represents 12,0
10 0|1222333344
(9) 0|555556779
5 1|
5 1|5
HI|16,3 20,1 32,7 40,5 4 [3’5,4’5)
VALORES ATÍPICOS POR EXCESO
FRECUENCIAS ABSOLUTAS ACUMULADAS
4. Descripción de datos mediante gráficos (8/13)
32. Probabilidades y Estadística I
IPC
Frec.Absol
0 4 8 12 16
0
2
4
6
8
10
4. Descripción de datos mediante gráficos (9/13)
Histograma vs. Tallo-hoja
33. Probabilidades y Estadística I
0 1 2 3 4
0
0,2
0,4
0,6
0,8
1
1,2
4. Descripción de datos mediante gráficos (10/13)
Catálogo de perfiles
Perfil de datos sin tratar
34. Probabilidades y Estadística I
-5 -3 -1 1 3 5
0
0,1
0,2
0,3
0,4
Forma de campana
4. Descripción de datos mediante gráficos (11/13)
Catálogo de perfiles
35. Probabilidades y Estadística I
0 10 20 30 40 50 60
0
0,02
0,04
0,06
0,08
0,1
Asimétrico desplazado a la dcha
0 1 2 3 4
0
0,2
0,4
0,6
0,8
1
1,2
4. Descripción de datos mediante gráficos (12/13)
Catálogo de perfiles
36. Probabilidades y Estadística I
4. Descripción de datos mediante gráficos (13/13)
Medidas intervalar/razón
3. Función de distribución (polígono acumulativo)
VARIABLE
ESTADÍSTICA
CONTÍNUA