ESTADÍSTICA
2
Introducción
¿Qué es la estadística?
Ciencia de los datos, implica la colección, clasificación, síntesis, organización, análisis e
interpretación de los datos
¿En qué áreas se aplica la estadística?
Actualmente se aplica en todas las áreas del saber, por ejemplo en Sociología, Educación,
Psicología, Administración, Economía, Medicina, Ciencias Políticas, entre otras.
Ejemplos de su aplicación son:
1) En Administración de Empresas: la estadística se utiliza para evaluar un producto antes
de comercializarlo.
2) En Economía: para medir la evolución de los precios mediante números índice o para
estudiar los hábitos de los consumidores a través de encuestas de presupuestos
familiares.
3
4
Probabilidad: Estudio de los fenómenos aleatorios.
5
•¿QUIÉNES VAN A SER MEDIDOS?: Los sujetos u objetos o Unidades de Análisis de una
Población o una Muestra
• POBLACIÓN : Es el total de unidades de análisis que son tema de estudio.
Muestra: 10 alumnos de Estadística de la carrera Licenciatura en
Informática de la Universidad x
Unidad de análisis: cada alumnos que compone la muestra
Población:
“Alumnos de
estadística de la
carrera de
Licenciatura en
Informática en la
Universidad x”
• MUESTRA: Es un conjunto de unidades de análisis provenientes de una población.
Muestra
Si queremos estudiar una población ó muestra en particular, se tendrán en
cuenta características de ella que resulten de interés; por ejemplo: género,
edad, año de nacimiento, sueldo, altura, color de cabello, etc. Cada una de estas
características toma distintos valores según cada individuo/objeto que conforma
la población ó muestra. A estas características se las denomina 𝒗𝒂𝒓𝒊𝒂𝒃𝒍𝒆𝒔.
6
TIPOS DE VARIABLES
Variables Cuantitativas
Intervalo
DISCRETA
Variables Cualitativas
CONTINUA
Toma valores enteros
Ejemplos: Número de Hijos, Número de
empleados de una empresa, Número de
asignaturas regularizadas en un
cuatrimestre, etc.
Toma cualquier valor dentro de un intervalo
Ejemplos: Peso; Estatura; Temperatura, etc.
ORDINAL
NOMINAL
Característica o cualidad
cuyas categorías no tienen
un orden preestablecido.
Ejemplos: Genero, Deporte
Favorito, etc.
Característica o cualidad cuyas
categorías tienen un orden
preestablecido.
Ejemplos: Nivel de estudio ,Grado
de Interés por un tema, etc.
VARIABLE: es lo que se va a medir y representa una característica de la UNIDAD DE ANÁLISIS.
7
Clasificar las siguientes variables en Cualitativa, Cuantitativa Discreta o Cuantitativa
Continua.
Género
Conformidad con los contenidos aprendidos en una determinada materia
Materia de preferencia
Cantidad de hermanos
Sueldo mensual en pesos
Cantidad de hijos
Ejemplo
✓ Frecuencias
Absolutas, fi
➢ Variables cuantitativas discretas
xi fi
x1
...
xi
...
xk
n1
...
ni
...
nk
n
Tablas Estadísticas
Frecuencia: desde un conjunto de unidades, corresponde al Número o Porcentaje de veces que se
presenta una característica.
9
DEFINICIONES
fi: Frecuencia absoluta del valor observado. Constituye
la cantidad de veces que se presenta el valor xi de la
variable.
10
Ejemplo: Se consultó a un grupo de 40 niños sobre cuántos hermanos tenían
𝑥𝑖 𝑓𝑖 𝐹𝑖 𝑓𝑟𝑖 𝑓𝑟𝑖% 𝐹𝑟𝑖 𝐹𝑟𝑖%
0 5
1
2
3
4
5
0 , 1 , 3 , 0 , 1 , 2 , 3 , 1 , 0 , 0 , 3 , 0 , 5 , 3 , 1 , 5 , 1 , 3 , 1 , 2 , 1 , 2 ,
2 , 1 , 2 , 4 , 2 , 1 , 3 , 1 , 1 , 3 , 1, 4 , 1, 4 , 2 ,1, 2 , 2
11
Ejemplo: Se consultó a un grupo de 40 niños sobre cuántos hermanos tenían
𝑥𝑖 𝑓𝑖 𝐹𝑖 𝑓𝑟𝑖 𝑓𝑟𝑖% 𝐹𝑟𝑖 𝐹𝑟𝑖%
0 5
1 14
2 9
3 7
4 3
5 2
40
0 , 1 , 3 , 0 , 1 , 2 , 3 , 1 , 0 , 0 , 3 , 0 , 5 , 3 , 1 , 5 , 1 , 3 , 1 , 2 , 1 , 2 ,
2 , 1 , 2 , 4 , 2 , 1 , 3 , 1 , 1 , 3 , 1, 4 , 1, 4 , 2 ,1, 2 , 2
✓ Frecuencias
Absolutas, fi
Absolutas
acumuladas, Fi
➢ Variables cuantitativas discretas
xi fi Fi
x1
...
xi
...
xk
n1
...
ni
...
nk
n1
n1+n2
Ni
...
Nk
n
Tablas Estadísticas
Frecuencia: desde un conjunto de unidades, corresponde al Número o Porcentaje de veces que se
presenta una característica.
13
DEFINICIONES
fi: Frecuencia absoluta del valor observado. Constituye
la cantidad de veces que se presenta el valor xi de la
variable.
Fi: Frecuencia absoluta acumulada. Cantidad de casos
que se tienen hasta el valor xi de la variable
14
Ejemplo: Se consultó a un grupo de 40 niños sobre cuántos hermanos tenían
𝑥𝑖 𝑓𝑖 𝐹𝑖 𝑓𝑟𝑖 𝑓𝑟𝑖% 𝐹𝑟𝑖 𝐹𝑟𝑖%
0 5 5
1 14 5+14=19
2 9 9+14+5=
28
3 7
4 3
5 2
40
0,0,0,0,0,1,1,1,1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,2
0 , 1 , 3 , 0 , 1 , 2 , 3 , 1 , 0 , 0 , 3 , 0 , 5 , 3 , 1 , 5 , 1 , 3 , 1 , 2 , 1 , 2 ,
2 , 1 , 2 , 4 , 2 , 1 , 3 , 1 , 1 , 3 , 1, 4 , 1, 4 , 2 ,1, 2 , 2
15
Ejemplo: Se consultó a un grupo de 40 niños sobre cuántos hermanos tenían
𝑥𝑖 𝑓𝑖 𝐹𝑖 𝑓𝑟𝑖 𝑓𝑟𝑖% 𝐹𝑟𝑖 𝐹𝑟𝑖%
0 5 5
1 14 19
2 9 28
3 7 35
4 3 38
5 2 40
40
0 , 1 , 3 , 0 , 1 , 2 , 3 , 1 , 0 , 0 , 3 , 0 , 5 , 3 , 1 , 5 , 1 , 3 , 1 , 2 , 1 , 2 ,
2 , 1 , 2 , 4 , 2 , 1 , 3 , 1 , 1 , 3 , 1, 4 , 1, 4 , 2 ,1, 2 , 2
16
✓ Frecuencias
Absolutas, fi
Relativas
fri = fi / n
Absolutas
acumuladas, Fi
➢ Variables cuantitativas discretas
xi fi Fi fr Fr
x1
...
xi
...
xk
n1
...
ni
...
nk
n1
n1+n2
Ni
...
Nk
f1
...
fi
...
fk
F1
...
Fi
...
Fk
n 1
Tablas Estadísticas
Frecuencia: desde un conjunto de unidades, corresponde al Número o Porcentaje de veces que se
presenta una característica.
17
DEFINICIONES
fi: Frecuencia absoluta del valor observado. Constituye
la cantidad de veces que se presenta el valor xi de la
variable.
Fi: Frecuencia absoluta acumulada. Cantidad de casos
que se tienen hasta el valor xi de la variable
fr: Frecuencia relativa de un valor observado.
Proporción de veces que se presenta o repite el valor xi
de la variable. (fi / n)
18
Ejemplo: Se consultó a un grupo de 40 niños sobre cuántos hermanos tenían
𝑥𝑖 𝑓𝑖 𝐹𝑖
𝑓𝑟𝑖 =
𝒇𝒊
𝒏
𝑓𝑟 𝒊 %
=
𝒇𝒊
𝒏
∗ 𝟏𝟎𝟎
𝐹𝑟𝑖 𝐹𝑟𝑖%
0 5 5 5/40
=0,125
12,5 %
1 14 19
2 9 28
3 7 35
4 3 38
5 2 40
𝑛 40
0 , 1 , 3 , 0 , 1 , 2 , 3 , 1 , 0 , 0 , 3 , 0 , 5 , 3 , 1 , 5 , 1 , 3 , 1 , 2 , 1 , 2 ,
2 , 1 , 2 , 4 , 2 , 1 , 3 , 1 , 1 , 3 , 1, 4 , 1, 4 , 2 ,1, 2 , 2
19
Ejemplo: Se consultó a un grupo de 40 niños sobre cuántos hermanos tenían
𝑥𝑖 𝑓𝑖 𝐹𝑖 𝑓𝑟𝑖 𝑓𝑟𝑖% 𝐹𝑟𝑖 𝐹𝑟𝑖%
0 5 5 0,125 12,5 %
1 14 19 0,35 35 %
2 9 28 0,225 22,5 %
3 7 35 0,175 17,5 %
4 3 38 0,075 7,5 %
5 2 40 0,05 5 %
𝑛 40 1 100 %
0 , 1 , 3 , 0 , 1 , 2 , 3 , 1 , 0 , 0 , 3 , 0 , 5 , 3 , 1 , 5 , 1 , 3 , 1 , 2 , 1 , 2 ,
2 , 1 , 2 , 4 , 2 , 1 , 3 , 1 , 1 , 3 , 1, 4 , 1, 4 , 2 ,1, 2 , 2
20
✓ Frecuencias
Absolutas, fi
Relativas
fri = fi / n
Relativas
acumuladas
Fri= Fi / n
Absolutas
acumuladas, Fi
➢ Variables cuantitativas discretas
xi fi Fi fr Fr
x1
...
xi
...
xk
n1
...
ni
...
nk
n1
n1+n2
Ni
...
Nk
f1
...
fi
...
fk
F1
...
Fi
...
Fk
n 1
Tablas Estadísticas
Frecuencia: desde un conjunto de unidades, corresponde al Número o Porcentaje de veces que se
presenta una característica.
21
DEFINICIONES
fi: Frecuencia absoluta del valor observado. Constituye
la cantidad de veces que se presenta el valor xi de la
variable.
Fi: Frecuencia absoluta acumulada. Cantidad de casos
que se tienen hasta el valor xi de la variable
fr: Frecuencia relativa de un valor observado.
Proporción de veces que se presenta o repite el valor xi
de la variable. (fi / n)
Fr : Frecuencia relativa acumulada. Contituye la
proporción de casos que se tienen hasta el valor xi de la
variable (Fi / n)
22
Ejemplo: Se consultó a un grupo de 40 niños sobre cuántos hermanos tenían
𝑥𝑖 𝑓𝑖 𝐹𝑖 𝑓𝑟𝑖 𝑓𝑟𝑖% 𝐹𝑟𝑖 𝐹𝑟𝑖%
0 5 5 0,125 12,5 % 0,125 12,5 %
1 14 19 0,35 35 % 0,125+0,35=
0,475
2 9 28 0,225 22,5 %
3 7 35 0,175 17,5 %
4 3 38 0,075 7,5 %
5 2 40 0,05 5 %
𝑛 40 1 100 %
0 , 1 , 3 , 0 , 1 , 2 , 3 , 1 , 0 , 0 , 3 , 0 , 5 , 3 , 1 , 5 , 1 , 3 , 1 , 2 , 1 , 2 ,
2 , 1 , 2 , 4 , 2 , 1 , 3 , 1 , 1 , 3 , 1, 4 , 1, 4 , 2 ,1, 2 , 2
23
Ejemplo: Se consultó a un grupo de 40 niños sobre cuántos hermanos tenían
𝑥𝑖 𝑓𝑖 𝐹𝑖 𝑓𝑟𝑖 𝑓𝑟𝑖% 𝐹𝑟𝑖 𝐹𝑟𝑖%
0 5 5 0,125 12,5 % 0,125 12,5 %
1 14 19 0,35 35 % 0,475 47,5 %
2 9 28 0,225 22,5 % 0,7 70 %
3 7 35 0,175 17,5 % 0,875 87,5
4 3 38 0,075 7,5 % 0,95 95
5 2 40 0,05 5 % 1 100
40 1 100 %
0 , 1 , 3 , 0 , 1 , 2 , 3 , 1 , 0 , 0 , 3 , 0 , 5 , 3 , 1 , 5 , 1 , 3 , 1 , 2 , 1 , 2 ,
2 , 1 , 2 , 4 , 2 , 1 , 3 , 1 , 1 , 3 , 1, 4 , 1, 4 , 2 ,1, 2 , 2
24
Luego de observar la tabla de frecuencias podríamos preguntarnos:
• ¿Qué porcentaje de niños a lo sumo tienen 2 hermanos?
• ¿Cuál es la cantidad de hermanos que predomina?
• ¿Qué porcentaje de niños tienen exactamente 5 hermanos?
25
Luego de observar la tabla de frecuencias podríamos preguntarnos:
• ¿Qué porcentaje de niños a lo sumo tienen 2 hermanos?
“El 70% de los niños consultados tienen a lo sumo 2 hermanos”
• ¿Cuál es la cantidad de hermanos que predomina?
“Predominan los niños que tienen sólo un hermano”
• ¿Qué porcentaje de niños tienen exactamente 5 hermanos?
“Exactamente el 5% de los niños tienen 5 hermanos”
26
Objetivo: Resumir la información más relevante de la muestra o
población en unos pocos números (parámetros).
• Medidas de Centralización y Posición
Las medidas de centralización o de tendencia central expresan
el valor en torno al cual se sitúan los datos de una muestra.
Media, mediana y moda
Dividen un conjunto ordenado de datos en grupos con la
misma cantidad de individuos.
Cuantiles: percentiles, cuartiles, deciles.
• Medidas de Dispersión o Variabilidad
Indican la mayor o menor concentración de los datos con
respecto a las medidas de centralización.
Rango, varianza, desviación típica, rango intercuartílico,
coeficiente de variación
Medidas resumen de las distribuciones de frecuencias
27
• Datos agrupados (pero no en intervalos)
Es el valor de la variable que ocurre con mayor frecuencia absoluta, es el valor más
frecuente.
Puede NO existir o puede no ser única.
En el ejemplo, podemos observar que la moda
𝑀𝑜 = 1, pues es el valor de la variable de mayor
frecuencia absoluta.
repite"
se
más
que
dato
el
"
Mo =
Moda
𝑥𝑖 𝑓𝑖
0 5
1 14
2 9
3 7
4 3
5 2
Medidas de Centralización
28
Ejemplo:
Se consultó a un grupo de 40 niños sobre cuántos hermanos tenían
0 , 1 , 3 , 0 , 1 , 2 , 3 , 1 , 0 , 0 , 3 , 0 , 5 , 3 , 1 , 5 , 1 , 3 , 1 , 2 , 1 ,
2 , 2 , 1 , 2 , 4 , 2 , 1 , 3 , 1 , 1 , 3 , 1, 4 , 1, 4 , 2 ,1, 2 , 2
Mediana
Representa el valor de la variable de posición central en un
conjunto de datos ordenados
29
Los resultados se resumieron en la siguiente tabla de distribución de frecuencias:
𝑥𝑖 𝑓𝑖 𝐹𝑖
0 5 5
1 14 19
2 9 28
3 7 35
4 3 38
5 2 40
40
𝑃𝑜𝑠 𝑀𝑒 =
𝒏 + 1
2
𝑃𝑜𝑠 𝑀𝑒 =
40 + 1
2
= 20,5
0,0,0,0,0,1,1,1,1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,2,…..
𝑀𝑒 =
2 + 2
2
= 2
30
• Datos NO agrupados
La 𝑚𝑒𝑑𝑖𝑎 𝑎𝑟𝑖𝑡𝑚é𝑡𝑖𝑐𝑎, ҧ
𝑥, es el cociente entre la suma de todos
los valores de la muestra y el número total de ellos:
Media Aritmética
ҧ
𝑥 =
𝑥1 + 𝑥2 + ⋯ + 𝑥𝑚
𝑛
=
σ𝑖=1
𝑚
𝑥𝑖
𝑛
Donde 𝑚 es la cantidad de valores distintos que toma la
variable 𝑥𝑖 y 𝑛 es la cantidad total de valores.
31
Se consultó a un grupo de 40 niños sobre cuántos hermanos tenían
0 , 1 , 3 , 0 , 1 , 2 , 3 , 1 , 0 , 0 , 3 , 0 , 5 , 3 , 1 , 5 , 1 , 3 , 1 , 2 , 1 , 2 , 2 , 1
, 2 , 4 , 2 , 1 , 3 , 1 , 1 , 3 , 1, 4 , 1, 4 , 2 ,1, 2 , 2
Si los ordenamos:
0,0,0,0,0,1,1,1,1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,2,…..
𝑥𝑖 𝑓𝑖 𝒙𝒊 ∗ 𝑓𝑖
0 5 0
1 14 14
2 9 18
3 7 21
4 3 12
5 2 10
40 75
ҧ
𝑥 =
𝑥1. 𝑓1 + 𝑥2. 𝑓2 + ⋯ + 𝑥𝑚. 𝑓𝑚
𝒏
=
𝟕𝟓
𝟒𝟎
= 1,875
ҧ
𝑥 =
σ𝑖=1
𝑚
𝑥𝑖. 𝑓𝑖
𝑛
32
Percentiles, Deciles o Cuartiles
-Percentil (ejemplo: 25, 50, 75)
-Decil (ejemplo: 4, 5, 8)
-Cuartil (ejemplo: 1, 2, 3)
El Decil va de 1 a 10
El Decil 4: es el valor de la variable que reúne al menos el 40% de los datos
Percentil, Decil o Cuartil: corresponde al valor que toma la variable (cuantitativa), cuando losn datos
están ordenados de Menor a Mayor
El Percentil va de 1 a 100
El percentil 25 : es el valor de la variable que reúne al menos el 25% de los datos
El Cuartil va de 1 a 4
El Cuartil 3 es el valor de la variable que reúne al menos el 75% de los datos
33
Datos agrupados en no intervalos
CUARTILES
Posición del 𝑄𝑘 =
𝑘.(𝑛+1)
4
DECILES
Posición del 𝐷𝑘 =
𝑘.(𝑛+1)
10
PERCENTILES
Posición del 𝑃𝑘 =
𝑘(.𝑛+1)
100
34
𝑸𝟏 𝑸𝟐 = 𝑴𝒆 𝑸𝟑
35
𝑫𝟏 𝑫𝟐 𝑫𝟑 𝑫𝟒 𝑫𝟓 = 𝑸 𝟐 = 𝑴𝒆
𝑫𝟏 = 𝑷𝟏𝟎
Se consultó a un grupo de 40 niños sobre cuántos hermanos tenían
0 , 1 , 3 , 0 , 1 , 2 , 3 , 1 , 0 , 0 , 3 , 0 , 5 , 3 , 1 , 5 , 1 , 3 , 1 , 2 , 1 , 2 , 2 , 1
, 2 , 4 , 2 , 1 , 3 , 1 , 1 , 3 , 1, 4 , 1, 4 , 2 ,1, 2 , 2
Dada la siguiente tabla, calcular el Q1, Q3 y D3
𝑥𝑖 𝑓𝑖 𝐹𝑖
0 5 5
1 14 19
2 9 28
3 7 35
4 3 38
5 2 40
40
Posición del 𝑄𝑘 =
𝑘.(𝑛+𝟏)
4
Se consultó a un grupo de 40 niños sobre cuántos hermanos tenían
0 , 1 , 3 , 0 , 1 , 2 , 3 , 1 , 0 , 0 , 3 , 0 , 5 , 3 , 1 , 5 , 1 , 3 , 1 , 2 , 1 , 2 , 2 , 1
, 2 , 4 , 2 , 1 , 3 , 1 , 1 , 3 , 1, 4 , 1, 4 , 2 ,1, 2 , 2
Dada la siguiente tabla, calcular el Q1, Q3 y D3
𝑥𝑖 𝑓𝑖 𝐹𝑖
0 5 5
1 14 19
2 9 28
3 7 35
4 3 38
5 2 40
40
Posición del 𝑄𝑘 =
𝑘.(𝑛+𝟏)
4
Posición del 𝑄1 =
1. (𝟒𝟎+𝟏)
4
= 10,25
𝑄1 = 1
38
Se consultó a un grupo de 40 niños sobre cuántos hermanos tenían
0 , 1 , 3 , 0 , 1 , 2 , 3 , 1 , 0 , 0 , 3 , 0 , 5 , 3 , 1 , 5 , 1 , 3 , 1 , 2 , 1 , 2 , 2 , 1
, 2 , 4 , 2 , 1 , 3 , 1 , 1 , 3 , 1, 4 , 1, 4 , 2 ,1, 2 , 2
Dada la siguiente tabla, calcular el Q1, Q3 y D3
𝑥𝑖 𝑓𝑖 𝐹𝑖
0 5 5
1 14 19
2 9 28
3 7 35
4 3 38
5 2 40
40
Posición del 𝑄𝑘 =
𝑘.(𝑛+𝟏)
4
Posición del 𝑄3 =
3. (𝟒𝟎+𝟏)
4
= 30,75
𝑄3 = 3
Se consultó a un grupo de 40 niños sobre cuántos hermanos tenían
0 , 1 , 3 , 0 , 1 , 2 , 3 , 1 , 0 , 0 , 3 , 0 , 5 , 3 , 1 , 5 , 1 , 3 , 1 , 2 , 1 , 2 , 2 , 1
, 2 , 4 , 2 , 1 , 3 , 1 , 1 , 3 , 1, 4 , 1, 4 , 2 ,1, 2 , 2
Dada la siguiente tabla, calcular el Q1, Q3 y D3
𝑥𝑖 𝑓𝑖 𝐹𝑖
0 5 5
1 14 19
2 9 28
3 7 35
4 3 38
5 2 40
40
Posición del 𝐷𝑘 =
𝑘.(𝑛+𝟏)
10
Posición del 𝐷3 =
3.(𝟒𝟎+𝟏)
10
= 12,3
𝐷3 = 1
40
Los estadísticos de tendencia central o posición indican dónde se sitúa un grupo de
puntuaciones. Los de variabilidad o dispersión nos indican si estas puntaciones o
valores están próximos entre sí o si por el contrario están muy dispersos.
Las medidas son:
• 𝑅𝑎𝑛𝑔𝑜
• 𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 (𝑆2
);
• 𝑑𝑒𝑠𝑣í𝑜 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟 o 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑡í𝑝𝑖𝑐𝑎 (𝑆) y
• 𝑐𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 (𝐶𝑣).
Como queremos averiguar qué tan separados están de la media aritmética los
datos de la muestra, debemos medir la diferencia entre cada valor de la muestra y
la media.
Medidas de Dispersión o Variabilidad
41
Rango:
Una medida razonable de la variabilidad podría ser la amplitud o rango.
El mismo se obtiene restando el valor más bajo de un conjunto de observaciones
del valor más alto.
𝑹 = 𝒙𝒎á𝒙 − 𝒙𝒎í𝒏
Si bien es muy sencillo su cálculo posee algunos inconvenientes:
• No utiliza todas las observaciones (sólo dos de ellas)
• Se puede ver muy afectada por alguna observación externa.
Existen medidas de dispersión mejores que ésta y se determinan. Estas permiten
averiguar qué tan separados están de la media aritmética los datos de la
muestra.
42
Varianza:
La varianza de un conjunto de "𝑛" observaciones 𝑥1, 𝑥2, 𝑥3, … 𝑥𝑚, es la suma
de los cuadrados de los 𝑛 desvíos entre cada valor 𝑥𝑖 y su media aritmética,
dividida por 𝑛 − 1.
(Promedio de desvíos cuadráticos)
𝑆2
=
σ𝑖=1
𝑛
𝑥𝑖 − ҧ
𝑥 2
. 𝑓𝑖
𝑛 − 1
(Se divide por "𝑛 − 1" cuando consideramos los datos como MUESTRA.
En el caso de considerar los datos de una POBLACIÓN, se divide por "𝑛".
Luego, la raíz cuadrada de la varianza nos da como resultado lo que
llamaremos 𝑑𝑒𝑠𝑣í𝑜 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟 o 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑡í𝑝𝑖𝑐𝑎:
43
Desvío estándar (desviación típica)
En general, el 𝑑𝑒𝑠𝑣í𝑜 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟 se calcula así:
𝑆 =
σ𝑖=1
𝑛
𝑥𝑖 − ҧ
𝑥 2. 𝑓𝑖
𝑛 − 1
44
Se consultó a un grupo de 40 niños sobre cuántos hermanos tenían
0 , 1 , 3 , 0 , 1 , 2 , 3 , 1 , 0 , 0 , 3 , 0 , 5 , 3 , 1 , 5 , 1 , 3 , 1 , 2 , 1 , 2 , 2 , 1
, 2 , 4 , 2 , 1 , 3 , 1 , 1 , 3 , 1, 4 , 1, 4 , 2 ,1, 2 , 2
𝑥𝑖 𝑓𝑖 𝒙𝒊 ∗ 𝑓𝑖 𝑥𝑖 − ҧ
𝑥 2
0 5 0 3,51
1 14 14 0,76
2 9 18 0,015
3 7 21 1,26
4 3 12 4,51
5 2 10 9,76
40 75
ҧ
𝑥 = 1,875
ҧ
𝑥 =
σ𝑖=1
𝑛
𝑥𝑖. 𝑓𝑖
𝑛
𝑆2 =
σ𝑖=1
𝑛
𝑥𝑖 − ҧ
𝑥 2
. 𝑓𝑖
𝑛 − 1
45
Se consultó a un grupo de 40 niños sobre cuántos hermanos tenían
0 , 1 , 3 , 0 , 1 , 2 , 3 , 1 , 0 , 0 , 3 , 0 , 5 , 3 , 1 , 5 , 1 , 3 , 1 , 2 , 1 , 2 , 2 , 1
, 2 , 4 , 2 , 1 , 3 , 1 , 1 , 3 , 1, 4 , 1, 4 , 2 ,1, 2 , 2
𝑥𝑖 𝑓𝑖 𝒙𝒊 ∗ 𝑓𝑖 𝑥𝑖 − ҧ
𝑥 2
𝑥𝑖 − ҧ
𝑥 2
. 𝑓𝑖
0 5 0 3,51 17,55
1 14 14 0,76 10,64
2 9 18 0,015 0,09
3 7 21 1,26 8,82
4 3 12 4,51 13,53
5 2 10 9,76 19,52
40 75 70,2
𝑆2 =
σ𝑖=1
𝑛
𝑥𝑖 − ҧ
𝑥 2
. 𝑓𝑖
𝑛 − 1
𝑆2 =
σ𝑖=1
𝑛
𝑥𝑖− ҧ
𝑥 2.𝑓𝑖
𝑛−1
=
70,2
40−1
=1,8
46
Coeficiente de variación (𝐶𝑣)
En estadística, cuando se desea hacer referencia a la relación entre el tamaño de la
media y la variabilidad de la variable, se utiliza el coeficiente de variación.
Su fórmula expresa la desviación estándar como porcentaje de la media aritmética,
mostrando una mejor interpretación porcentual del grado de variabilidad que la
desviación típica o estándar.
A mayor valor del 𝐶𝑣, mayor heterogeneidad de los valores de la variable; y a menor
𝐶𝑣, mayor homogeneidad en los valores de la variable, por lo que se recomienda
que no sea mayor a 0,2 (20%).
Entonces, si 𝐶𝑣 ≤ 0,2, los datos son homogéneos.
47
Los datos que se muestran a continuación representan las razones costo-beneficio para 25
distintos tipos de acciones en el mercado de valores.
Aclaración:
El índice beneficio/costo (I B/C), también conocido como relación beneficio/costo compara
directamente, como su nombre lo indica, los beneficios y los costos de un proyecto para
definir su viabilidad. ... Si B/C > 1, esto indica que los beneficios son mayores a los costos.
6, 7.8 , 8.1, 9.15, 10.2, 10.9, 11.2 ,12.5, 13.4, 13.7, 14.1, 14.9, 15.4, 15.8, 16.3, 17.1,
17,6, 18.2, 18,7, 20.4, 20.7, 21, 21.2, 24.9, 25,3
Ejemplo 1
48
Completar la siguiente tabla:
6, 7.8 , 8.1, 9.15, 10.2, 10.9, 11.2 ,12.5, 13.4, 13.7, 14.1, 14.9, 15.4, 15.8,
16.3, 17.1, 17,6, 18.2, 18,7, 20.4, 20.7, 21, 21.2, 24.9, 25,3
𝑥𝑖 𝑓𝑖 𝐹𝑖
ሾ5; 9) 7
ሾ9; 13)
ሾ13; 17)
ሾ17; 21)
ሾ21; 25)
ሾ25; 29)
49
𝑥𝑖 𝑓𝑖 𝐹𝑖
ሾ5; 9) 7 3
ሾ9; 13) 11
ሾ13; 17) 15
ሾ17; 21) 19
ሾ21; 25) 23
ሾ25; 29) 27
6, 7.8 , 8.1, 9.15, 10.2, 10.9, 11.2 ,12.5, 13.4, 13.7, 14.1,
14.9, 15.4, 15.8, 16.3, 17.1, 17,6, 18.2, 18,7, 20.4, 20.7,
21, 21.2, 24.9, 25.3
50
𝑥𝑖 𝑓𝑖 𝐹𝑖
ሾ5; 9) 7 3 3
ሾ9; 13) 11 5 8
ሾ13; 17) 15 7 15
ሾ17; 21) 19 6 21
ሾ21; 25) 23 3 24
ሾ25; 29) 27 1 25
51
𝑥𝑖 𝑓𝑖 𝐹𝑖
𝑓𝐫𝑖 =
𝒇𝒊
𝒏
𝐹𝐫𝑖
ሾ5; 9) 7 3 3 0,12 0,12
ሾ9; 13) 11 5 8 0,2 0,32
ሾ13; 17) 15 7 15 0,28 0,6
ሾ17; 21) 19 6 21 0,24 0,84
ሾ21; 25) 23 3 24 0,12 0,96
ሾ25; 29) 27 1 25 0,04 1
25 1
52
• Medidas de Centralización y Posición
Las medidas de centralización o de tendencia central expresan
el valor en torno al cual se sitúan los datos de una muestra.
Media, mediana y moda
Dividen un conjunto ordenado de datos en grupos con la
misma cantidad de individuos.
Cuantiles: percentiles, cuartiles, deciles.
• Medidas de Dispersión o Variabilidad
Indican la mayor o menor concentración de los datos con
respecto a las medidas de centralización.
Rango, varianza, desviación típica, rango intercuartílico,
coeficiente de variación
53
• Datos agrupados en intervalos
Clase modal: Es el intervalo que posee la mayor frecuencia absoluta simple.
La MODA está localizada en la “clase modal” y se calcula con la siguiente
fórmula:
𝑀𝑜 = 𝐿𝑖 +
𝑓𝑖 − 𝑓𝑖−1
𝑓𝑖 − 𝑓𝑖−1 + 𝑓𝑖 − 𝑓𝑖+1
. 𝑎𝑖𝑛𝑡
Donde
𝐿𝑖 = 𝑙í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟
𝑓𝑖 = 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎 𝑠𝑖𝑚𝑝𝑙𝑒
𝑓𝑖−1 = 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎 𝑠𝑖𝑚𝑝𝑙𝑒 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟
𝑓𝑖+1 = 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎 𝑠𝑖𝑚𝑝𝑙𝑒 𝑝𝑜𝑠𝑡𝑒𝑟𝑖𝑜𝑟
𝑎𝑖𝑛𝑡 = 𝑎𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜
54
Los datos que se muestran a continuación representan las razones costo-
beneficio para 25 distintos tipos de acciones en el mercado de valores.
Calculemos la moda
Primero debemos encontrar el intervalo que posee mayor frecuencia o clase modal:
ሾ13; 17)
Luego: 𝑀𝑜 = 𝐿𝑖 +
𝑓𝑖 − 𝑓𝑖−1
𝑓𝑖 − 𝑓𝑖−1 + 𝑓𝑖 − 𝑓𝑖+1
. 𝑎𝑖𝑛𝑡
= 13 +
7 − 5
7 − 5 + 7 − 6
. 4 =
47
3
= 15, ෠
6
𝑥𝑖 𝑓𝑖 𝐹𝑖
ሾ5; 9) 7 3 3
ሾ9; 13) 11 5 8
ሾ13; 17) 15 7 15
ሾ17; 21) 19 6 21
ሾ21; 25) 23 3 24
ሾ25; 29) 27 1 25
𝒂𝒊𝒏𝒕 = 𝟏𝟕 − 𝟏𝟑 = 𝟒
55
Donde
𝐿𝑖 = 𝑙í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟
𝐹𝑖−1 = 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟 𝑎 𝑙𝑎 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎
𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑑𝑒 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎𝑛𝑎
𝑓𝑚𝑒 = 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑑𝑒 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎𝑛𝑎
𝑎𝑖𝑛𝑡 = 𝑎𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜
𝑀𝑒 = 𝐿𝑖 +
𝑛
2 − 𝐹𝑖−1
𝑓𝒎𝒆
. 𝑎𝑖𝑛𝑡
56
Retomemos el ejemplo:
Los datos que se muestran a continuación representan las razones costo-beneficio
para 25 distintos tipos de acciones en el mercado de valores.
Debemos primero calcular la posición de la mediana 𝑃𝑀𝑒 =
25
2
= 12,5. Buscamos en la
frecuencia acumulada 𝐹𝑖 el intervalo al cual pertenece dicha frecuencia. Luego el intervalo
que contiene a la frecuencia 12,5 es ሾ13; 17)
Calculamos la mediana:
𝑀𝑒 = 𝐿𝑖 +
𝑛
2
− 𝐹𝑖−1
𝑓𝒊
. 𝑎𝑖𝑛𝑡 = 13 +
12,5 − 8
7
. 4 =
109
7
= 15,5714
𝑥𝑖 𝑓𝑖 𝐹𝑖
ሾ5; 9) 7 3 3
ሾ9; 13) 11 5 8
ሾ13; 17) 15 7 15
ሾ17; 21) 19 6 21
ሾ21; 25) 23 3 24
ሾ25; 29) 27 1 25
𝑃𝑀𝑒 =
𝑛
2
57
DATOS AGRUPADOS
Si los valores de la variable 𝑥𝑖 están repetidos, podemos calcular la media
aritmética incluyendo el concepto de frecuencia absoluta simple 𝑓𝑖 ,
utilizando la siguiente fórmula:
ҧ
𝑥 =
𝑥1. 𝑓1 + 𝑥2. 𝑓2 + ⋯ + 𝑥𝑚. 𝑓
𝑚
𝒏
=
σ𝑖=1
𝑚
𝑥𝑖. 𝑓𝑖
σ𝑖=1
𝑚
𝑓𝑖
=
σ𝑖=1
𝑚
𝑥𝑖. 𝑓𝑖
𝑛
Media Aritmética
58
Retomemos el ejemplo:
Los datos que se muestran a continuación representan las razones costo-beneficio
para 25 distintos tipos de acciones en el mercado de valores.
𝑥𝑖 𝑓𝑖 𝒙𝒊 . 𝒇𝒊
ሾ5; 9) 7 3 21
ሾ9; 13) 11 5 55
ሾ13; 17) 15 7
ሾ17; 21) 19 6
ሾ21; 25) 23 3
ሾ25; 29) 27 1
ҧ
𝑥 =
σ𝑖=1
𝑚
𝑥𝑖. 𝑓𝑖
𝑛
59
Retomemos el ejemplo:
Los datos que se muestran a continuación representan las razones costo-beneficio
para 25 distintos tipos de acciones en el mercado de valores.
𝑥𝑖 𝑓𝑖 𝒙𝒊 . 𝒇𝒊
ሾ5; 9) 7 3 21
ሾ9; 13) 11 5 55
ሾ13; 17) 15 7 105
ሾ17; 21) 19 6 114
ሾ21; 25) 23 3 69
ሾ25; 29) 27 1 27
ҧ
𝑥 =
𝑥1. 𝑓1 + 𝑥2. 𝑓2 + ⋯ + 𝑥𝑚. 𝑓𝑚
𝒏
=
𝟑𝟗𝟏
𝟐𝟓
= 𝟏𝟓. 𝟔𝟒
60
Datos agrupados en no intervalos Datos agrupados en intervalos
CUARTILES
Posición del 𝑄𝑘 =
𝑘.(𝑛+𝟏)
4
CUARTILES
Posición del 𝑄𝑘=
𝑘.𝑛
4
𝑄𝑘 = 𝐿𝑖 +
𝑘. 𝑛
4
− 𝐹𝑖−1
𝑓𝑖
𝑎𝑖
DECILES
Posición del 𝐷𝑘 =
𝑘.(𝑛+𝟏)
10
DECILES
Posición del 𝐷𝑘 =
𝑘.𝑛
10
𝐷𝑘 = 𝐿𝑖 +
𝑘. 𝑛
10
− 𝐹𝑖−1
𝑓𝑖
𝑎𝑖
PERCENTILES
Posición del 𝑃𝑘 =
𝑘(.𝑛+1)
100
PERCENTILES
Posición del 𝑃𝑘 =
𝑘.𝑛
100
𝑃𝑘 = 𝐿𝑖 +
𝑘. 𝑛
100
− 𝐹𝑖−1
𝑓𝑖
𝑎𝑖
Retomemos el ejemplo:
Los datos que se muestran a continuación representan las razones costo-beneficio
para 25 distintos tipos de acciones en el mercado de valores.
𝑥𝑖 𝑓𝑖 𝑭𝒊
ሾ5; 9) 7 3 3
ሾ9; 13) 11 5 8
ሾ13; 17) 15 7 15
ሾ17; 21) 19 6 21
ሾ21; 25) 23 3 24
ሾ25; 29) 27 1 25
Posición del 𝑄𝑘 =
𝑘.(𝑛)
4
𝑄𝑘 = 𝐿𝑖 +
𝑘. 𝑛
4
− 𝐹𝑖−1
𝑓𝑖
𝑎𝑖
62
Retomemos el ejemplo:
Los datos que se muestran a continuación representan las razones costo-beneficio
para 25 distintos tipos de acciones en el mercado de valores.
𝑥𝑖 𝑓𝑖 𝑭𝒊
ሾ5; 9) 7 3 3
ሾ9; 13) 11 5 8
ሾ13; 17) 15 7 15
ሾ17; 21) 19 6 21
ሾ21; 25) 23 3 24
ሾ25; 29) 27 1 25
Calcular el Q3
Posición del 𝑄𝑘 =
𝑘.(𝑛)
4
Posición del 𝑄𝟑 =
𝟑.(𝟐𝟓)
4
= 𝟏𝟖, 𝟕𝟓
Definimos el intervalo: [ 17 ; 21)
𝑄𝑘 = 𝐿𝑖 +
𝑘. 𝑛
4
− 𝐹𝑖−1
𝑓𝑖
𝑎𝑖
𝑄𝟑 = 𝟏𝟕 +
𝟑. 𝟐𝟓
4
− 𝟏𝟓
𝟔
. 𝟒 = 𝟏𝟗. 𝟓
63
Calcular el D2
𝑫𝑘 =
𝑘. (𝑛)
𝟏𝟎
𝑥𝑖 𝑓𝑖 𝑭𝒊
ሾ5; 9) 7 3 3
ሾ9; 13) 11 5 8
ሾ13; 17) 15 7 15
ሾ17; 21) 19 6 21
ሾ21; 25) 23 3 24
ሾ25; 29) 27 1 25
𝐷𝑘 = 𝐿𝑖 +
𝑘. 𝑛
10 − 𝐹𝑖−1
𝑓𝑖
𝑎𝑖
64
Calcular el D2
Posición del 𝑫𝟐 = 𝟓
Definimos el intervalo: [ 9;13)
𝑫𝑘 =
𝑘. (𝑛)
𝟏𝟎
𝑥𝑖 𝑓𝑖 𝑭𝒊
ሾ5; 9) 7 3 3
ሾ9; 13) 11 5 8
ሾ13; 17) 15 7 15
ሾ17; 21) 19 6 21
ሾ21; 25) 23 3 24
ሾ25; 29) 27 1 25
𝐷𝟐 = 𝟗 +
(𝟓 − 𝟑)
𝟓
. 𝟒 = 𝟏𝟎, 𝟔
𝐷𝑘 = 𝐿𝑖 +
𝑘. 𝑛
10
− 𝐹𝑖−1
𝑓𝑖
𝑎𝑖
65
MEDIDAS DE DISPERSIÓN
𝐶𝑣 =
𝑆
ҧ
𝑥
Donde:
𝑆: desvío estándar
ത
x: media aritmética
𝑥𝑖 𝑓𝑖 𝐹𝑖
ሾ5; 9) 7 3 3
ሾ9; 13) 11 5 8
ሾ13; 17) 15 7 15
ሾ17; 21) 19 6 21
ሾ21; 25) 23 3 24
ሾ25; 29) 27 1 25
Retomemos el ejemplo:
Los datos que se muestran a
continuación representan las
razones costo-beneficio para 25
distintos tipos de acciones en el
mercado de valores.
66
𝑆2
=
σ𝑖=1
𝑛
𝑥𝑖 − ҧ
𝑥 2
. 𝑓𝑖
𝑛 − 1
𝑥𝑖 𝑓𝑖 𝒙𝒊 . 𝒇𝒊
ሾ5; 9) 7 3 21
ሾ9; 13) 11 5 55
ሾ13; 17) 15 7 105
ሾ17; 21) 19 6 114
ሾ21; 25) 23 3 69
ሾ25; 29) 27 1 27
ҧ
𝑥 =
𝑥1. 𝑓1 + 𝑥2. 𝑓2 + ⋯ + 𝑥𝑚. 𝑓𝑚
𝒏
=
𝟑𝟗𝟏
𝟐𝟓
= 𝟏𝟓. 𝟔𝟒
67
𝑥𝑖 𝑓𝑖 𝒙𝒊 . 𝒇𝒊 (𝒙𝒊 − 𝟏𝟓, 𝟔𝟒)^2 ∗ f_i
ሾ5; 9) 7 3 21 223,9488
[9;13) 11 5 55 107,648
[13;17) 15 7 105 2,8672
[17;21) 19 6 114 67,7376
[21;25) 23 3 69 162,5088
[25;29) 27 1 27 129,0496
𝑆2
=
σ𝑖=1
𝑛
𝑥𝑖 − ҧ
𝑥 2
. 𝑓𝑖
𝑛 − 1
68
Calculamos la Varianza
𝑆2
=
σ𝑖=1
𝑛
𝑥𝑖 − ҧ
𝑥 2
. 𝑓𝑖
𝑛 − 1
=
693,76
24
= 28,90෠
6
Calculamos el Desvío estándar
𝑆 =
σ𝑖=1
𝑛
𝑥𝑖 − ҧ
𝑥 2. 𝑓𝑖
𝑛 − 1
= 28,90෠
6 = 5,38
Finalmente calculamos el coeficiente de variación:
𝐶𝑣 =
𝑆
ҧ
𝑥
=
5,38
15,64
= 0,344 → 𝟎, 𝟑𝟒𝟒 ∗ 𝟏𝟎𝟎% = 34,4%
Podemos interpretar que los valores de la variable son heterogéneos,
pues supera 20% o el promedio no es representativo.
69
Los siguientes datos representan el tiempo (en segundos) que 30 trabajadores
estuvieron al control de la unidad central de procesos (CPU) de una computadora
mainframe grande
0.02 0.75 1.16 1.38 1.94 3.07
0.15 0.82 1.17 1.4 2.01 3.53
0.19 0.84 1.19 1.42 2.16 3.76
0.47 0.92 1.22 1.59 2.41 4.50
0.71 0.96 1.23 1.61 2.59 4.75
Ejemplo 2
70
Para construirlos debemos:
1º) Calcular la 𝑎𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝑡𝑜𝑡𝑎𝑙 (𝑟𝑎𝑛𝑔𝑜 o 𝑟𝑒𝑐𝑜𝑟𝑟𝑖𝑑𝑜) de la muestra. Entonces la
amplitud total (𝑎𝑡) es:
𝑎𝑡 = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛
Donde 𝑥𝑚𝑎𝑥 es el valor máximo y 𝑥𝑚𝑖𝑛 es el mínimo que toma la variable
2º) Decidir la cantidad de intervalos, 𝑘, en que se va a dividir la amplitud total, en
función de la naturaleza de la variable, de las necesidades del investigador y de la
cantidad de datos. Lo recomendable es entre 5 y 10 intervalos.
71
REGLA DE STURGES
Es un criterio utilizado para determinar el número de clases o intervalos que son
necesarios para representar gráficamente un conjunto de datos estadísticos. Es un
método sencillo, basado en el número de muestras que permiten encontrar el
número de clases y su amplitud de rango, utilizando la siguiente fórmula:
𝑘 = 1 + 𝑙𝑜𝑔2(𝑛)
ó bien: 𝑘 = 1 + 3,3. 𝑙𝑜𝑔(𝑛), donde n es el número total de observaciones de la
muestra.
3º) Calcular la amplitud de cada intervalo, 𝑎𝑖𝑛𝑡, o
simplemente 𝑎𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜:
𝑎𝑖𝑛𝑡 =
𝑎𝑡
𝑘
=
𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛
𝑘
En caso que 𝑎𝑡 no fuere divisible por 𝑘, y a los efectos de que lo sea, se reemplaza
por una amplitud total que contenga a la observada (se disminuye el 𝑥𝑚𝑖𝑛 o se
aumenta el 𝑥𝑚𝑎𝑥 )
72
4º) A partir del 𝐿𝑖 considerado, la construcción de los intervalos se realiza de la
siguiente manera:
ൣ𝐿𝑖; 𝐿𝑖 + 𝑎𝑖𝑛𝑡)
ሾ𝐿𝑖 + 𝑎𝑖𝑛𝑡; 𝐿𝑖 + 2. 𝑎𝑖𝑛𝑡)
⋮
ሾ𝐿𝑖 + 𝑘 − 1 . 𝑎𝑖𝑛𝑡; 𝐿𝑖 + 𝑘. 𝑎𝑖𝑛𝑡)
73
Los siguientes datos representan el tiempo (en segundos) que 30 trabajadores
estuvieron al control de la unidad central de procesos (CPU) de una computadora
mainframe grande
0.02 0.75 1.16 1.38 1.94 3.07
0.15 0.82 1.17 1.4 2.01 3.53
0.19 0.84 1.19 1.42 2.16 3.76
0.47 0.92 1.22 1.59 2.41 4.50
0.71 0.96 1.23 1.61 2.59 4.75
Ejemplo
PROCEDIMIENTO
1º Calcule el rango (R) o recorrido
R = 4.75 - 0.02 = 4.73
2º Determine el número de intervalos (K).
K = 1 + 3.3 Log(n) = 1+3.3Log(30)
K =5.875
K = 6 (siempre es un número natural)
3º Determine el Tamaño del Intervalo de Clase (𝑎𝑖𝑛𝑡)
𝑎𝑖𝑛𝑡 = R/K = 4.73 / 6
𝑎𝑖𝑛𝑡 =0.788 = 0.79 (por exceso)
4°Elabore la tabla de frecuencias a partir de la información anterior.
74
R = Obs.máx. - Obs.mín.
𝑘 = 1 + 3,3. 𝑙𝑜𝑔(𝑛),
75
Li Ls xi fi Fi fri fri % Fri
[0.02
0,02+0,79
=0.81)
[0.81 1,6)
76
Li Ls xi fi Fi fri fri % Fri
[0.02 0.81)
[0.81 1.6)
[1.6 2.39)
[2.39 3.18)
[3.18 3.97)
[3.97 4.76)
77
Li Ls xi fi Fi fri fri % Fri
[0.02 0.81)
(0.02+0.81)
/2=0.415
[0.81 1.6)
[1.6 2.39)
[2.39 3.18)
[3.18 3.97)
[3.97 4.76)
78
Li Ls xi fi Fi fri fri % Fri
[0.02 0.81) 0.415
[0.81 1.6) 1.205
[1.6 2.39) 1.995
[2.39 3.18) 2.785
[3.18 3.97) 3.575
[3.97 4.76) 4.365
79
Li Ls xi fi Fi fri fri % Fri
[0.02 0.81) 0.415 6 6 0.20 20 0.2
[0.81 1.6) =1.205
[1.6 2.39) 1.995
[2.39 3.18) 2.785
[3.18 3.97) 3.575
[3.97 4.76) 4.365
80
Li Ls xi fi Fi fri fri % Fri
[0.02 0.81) 0,415 6 6 0.20 20 0.2
[0.81 1.6) 1.205 13 19 0.43 43.33 0.63
[1.6 2.39) 1.995 4 23 0.13 13.33 0.77
[2.39 3.18) 2.785 3 26 0.10 10 0.87
[3.18 3.97) 3.575 2 28 0.07 6.67 0.93
[3.97 4.76) 4.365 2 30 0.07 6.67 1
30 1.00 100
81
Las distribuciones de frecuencias se presentan en tablas como las anteriores, o
bien en gráficas. La representación gráfica se utiliza para facilitar al lector la
comprensión de los resultados, pero no añade ninguna información sobre la que
contendría una tabla de frecuencias; el objetivo de las gráficas es que la
información “impacte” directamente al lector y que se exprese el “perfil” de la
distribución, pero no debe olvidarse el rigor en aras de la estética: las gráficas
deben reflejar fielmente lo que tratan de representar, fundamentalmente las
frecuencias de cada modalidad o valor.
Representación gráfica de la información
Existen diversos tipos de gráficas, cada uno de ellos adecuado a un cierto tipo de
variables, por lo que podemos clasificar las gráficas atendiendo a estos tipos.
82
Gráfico de Barras
𝑥𝑖 𝑓𝑖
0 5
1 14
2 9
3 7
4 3
5 2
40
𝑥𝑖
𝑓𝑖
83
- El eje x se refiere a la variable.
- El eje y se refiere a la frecuencia (Fi).
Gráfico de frecuencias acumulada
𝑥𝑖 𝑓𝑖 𝑭𝑖
0 5 5
1 14 19
2 9 28
3 7 35
4 3 38
5 2 40
40
84
𝑥𝑖
𝐹𝑖
85
Gráfico de Sectores Circulares (de Torta)
Distribución de las unidades de análisis de
acuerdo a variable 1
A
20%
D
10%
C
40%
B
30%
Distribución de las unidades de
análisis de acuerdo a variable 1
B
30%
C
40%
D
10% A
20%
Distribución de las unidades de
análisis de acuerdo a variable 1
B
30%
C
40%
D
10%
A
20%
86
𝑥𝑖 𝑓𝑖 𝐹𝑖
ሾ5; 9) 7 3 3
ሾ9; 13) 11 5 8
ሾ13; 17) 15 7 15
ሾ17; 21) 19 6 21
ሾ21; 25) 23 3 24
ሾ25; 29) 27 1 25
25
𝑥𝑖
𝑓𝑖
Histograma
Histograma
- Permite la representación de la frecuencia de una variable
Cuantitativa.
- El eje x se refiere a la variable.
- El eje y se refiere a la frecuencia (fi ó fa.
- Cada barra representa la frecuencia de la variable en la
población en estudio (o la muestra).
Polígono de Frecuencia
-Esta representación se basa en
el Histograma.
-Sólo es útil para variables
cuantitativas.
-El eje x se refiere a la
variable.
- El eje y se refiere a la
frecuencia (Nº , %).
-Los puntos que permiten la
unión de las líneas representa
el centro de clase (o marca de
clase).
87
𝑥𝑖
𝑓𝑖
88
Histograma de frecuencias acumulada
𝑥𝑖 𝑓𝑖 𝐹𝑖
ሾ5; 9) 7 3 3
ሾ9; 13) 11 5 8
ሾ13; 17) 15 7 15
ሾ17; 21) 19 6 21
ሾ21; 25) 23 3 24
ሾ25; 29) 27 1 25
25
𝑥𝑖
89
Grafico de frecuencias acumulada
𝒙𝒊
90
𝒙𝒊
91
TIPOS DE GRÁFICOS Diagrama de Caja
- Permite identificar gráficamente la
mediana, los cuartiles 1 y 3
(percentiles 25 y 75)
-Sólo es útil para variables
cuantitativas.
92
93
El Diagrama de Caja se representa sobre el eje de la variable en
análisis, construyéndose un rectángulo o “caja” con prolongaciones o
“bigotes” teniendo en cuenta los siguientes valores:
Q1: el Cuartilo de orden 1 marca el límite inferior del rectángulo.
Q3: el Cuartilo de orden 3 marca el límite superior del rectángulo.
Me= Q2 : la Mediana se marca con una línea dentro del rectángulo.
Un valor mínimo: que es el mayor entre el xMín (menor valor de la
variable) y 1,5 veces el Q ( Rango intercuartílico), restado al Q1.
Desde el límite inferior del rectángulo, se extiende una línea o
“bigote” hasta este valor mínimo.
Un valor máximo: que es el menor entre el xMáx (mayor valor de la
variable) y 1,5 veces el Q (Rango intercuartílico), sumado al Q3. Desde
el límite superior del rectángulo, se extiende una línea o
“bigote” hasta este valor máximo.
El xMín y/o el xMáx si es que no quedan comprendidos dentro del
Diagrama del rectángulo con los bigotes, constituyen valores
anómalos.
Ejemplo
Ejemplo: Supongamos que se tienen 30 pequeños pueblos del
Partido de Bragado, para los cuales se ha contabilizado la
cantidad de manzanas que tenían catastradas al 31 de Diciembre
último, resultando las siguientes cifras:
7, 46, 32, 16, 24, 38, 59, 45, 12, 27, 91, 84, 47, 65, 43, 55, 83, 34,
29, 24, 16, 22, 46, 73, 38, 61, 37, 16, 34 y 60.
De los datos se calcula:
94
95
Medidas de Posición del conjunto:
xMín = 7 manzanas
xMáx = 91 manzanas
Me = 38 manzanas
Q1 = 23 manzanas
Q3 = 59,5 manzanas
ҧ
𝑥 = 41,7 manzanas
96
Rango intercuartilico
Q = (Q3 - Q1) = (59.5 - 23) = 36.5 manzanas
xMín = 7 manzanas ó (Q1 – 1,5 Q) = 23 – 1,5 . 36.5 = valor negativo
(imposible en este ejemplo); entre ambos valores, el mayor es 7
quien constituye el extremo inferior del “bigote” izquierdo del
Diagrama de Caja.
xMáx = 91 manzanas ó (Q3 + 1,5 Q) = 59,5 + 1,5 . 36,5 = 114.25
manzanas; entre ambos valores, el menor es 91 quien constituye
el extremo superior del “bigote” derecho del Diagrama de Caja.
97
0 10 20 30 40 50 60 70 80 90 100
Q1 = 23 manzanas Q3 = 59,5 manzanas
Me = 38 manzanas
xMín = 7 manzanas xMáx = 91 manzanas

Presentación Estadística_ Informática.pdf

  • 1.
  • 2.
    2 Introducción ¿Qué es laestadística? Ciencia de los datos, implica la colección, clasificación, síntesis, organización, análisis e interpretación de los datos ¿En qué áreas se aplica la estadística? Actualmente se aplica en todas las áreas del saber, por ejemplo en Sociología, Educación, Psicología, Administración, Economía, Medicina, Ciencias Políticas, entre otras. Ejemplos de su aplicación son: 1) En Administración de Empresas: la estadística se utiliza para evaluar un producto antes de comercializarlo. 2) En Economía: para medir la evolución de los precios mediante números índice o para estudiar los hábitos de los consumidores a través de encuestas de presupuestos familiares.
  • 3.
  • 4.
    4 Probabilidad: Estudio delos fenómenos aleatorios.
  • 5.
    5 •¿QUIÉNES VAN ASER MEDIDOS?: Los sujetos u objetos o Unidades de Análisis de una Población o una Muestra • POBLACIÓN : Es el total de unidades de análisis que son tema de estudio. Muestra: 10 alumnos de Estadística de la carrera Licenciatura en Informática de la Universidad x Unidad de análisis: cada alumnos que compone la muestra Población: “Alumnos de estadística de la carrera de Licenciatura en Informática en la Universidad x” • MUESTRA: Es un conjunto de unidades de análisis provenientes de una población. Muestra Si queremos estudiar una población ó muestra en particular, se tendrán en cuenta características de ella que resulten de interés; por ejemplo: género, edad, año de nacimiento, sueldo, altura, color de cabello, etc. Cada una de estas características toma distintos valores según cada individuo/objeto que conforma la población ó muestra. A estas características se las denomina 𝒗𝒂𝒓𝒊𝒂𝒃𝒍𝒆𝒔.
  • 6.
    6 TIPOS DE VARIABLES VariablesCuantitativas Intervalo DISCRETA Variables Cualitativas CONTINUA Toma valores enteros Ejemplos: Número de Hijos, Número de empleados de una empresa, Número de asignaturas regularizadas en un cuatrimestre, etc. Toma cualquier valor dentro de un intervalo Ejemplos: Peso; Estatura; Temperatura, etc. ORDINAL NOMINAL Característica o cualidad cuyas categorías no tienen un orden preestablecido. Ejemplos: Genero, Deporte Favorito, etc. Característica o cualidad cuyas categorías tienen un orden preestablecido. Ejemplos: Nivel de estudio ,Grado de Interés por un tema, etc. VARIABLE: es lo que se va a medir y representa una característica de la UNIDAD DE ANÁLISIS.
  • 7.
    7 Clasificar las siguientesvariables en Cualitativa, Cuantitativa Discreta o Cuantitativa Continua. Género Conformidad con los contenidos aprendidos en una determinada materia Materia de preferencia Cantidad de hermanos Sueldo mensual en pesos Cantidad de hijos Ejemplo
  • 8.
    ✓ Frecuencias Absolutas, fi ➢Variables cuantitativas discretas xi fi x1 ... xi ... xk n1 ... ni ... nk n Tablas Estadísticas Frecuencia: desde un conjunto de unidades, corresponde al Número o Porcentaje de veces que se presenta una característica.
  • 9.
    9 DEFINICIONES fi: Frecuencia absolutadel valor observado. Constituye la cantidad de veces que se presenta el valor xi de la variable.
  • 10.
    10 Ejemplo: Se consultóa un grupo de 40 niños sobre cuántos hermanos tenían 𝑥𝑖 𝑓𝑖 𝐹𝑖 𝑓𝑟𝑖 𝑓𝑟𝑖% 𝐹𝑟𝑖 𝐹𝑟𝑖% 0 5 1 2 3 4 5 0 , 1 , 3 , 0 , 1 , 2 , 3 , 1 , 0 , 0 , 3 , 0 , 5 , 3 , 1 , 5 , 1 , 3 , 1 , 2 , 1 , 2 , 2 , 1 , 2 , 4 , 2 , 1 , 3 , 1 , 1 , 3 , 1, 4 , 1, 4 , 2 ,1, 2 , 2
  • 11.
    11 Ejemplo: Se consultóa un grupo de 40 niños sobre cuántos hermanos tenían 𝑥𝑖 𝑓𝑖 𝐹𝑖 𝑓𝑟𝑖 𝑓𝑟𝑖% 𝐹𝑟𝑖 𝐹𝑟𝑖% 0 5 1 14 2 9 3 7 4 3 5 2 40 0 , 1 , 3 , 0 , 1 , 2 , 3 , 1 , 0 , 0 , 3 , 0 , 5 , 3 , 1 , 5 , 1 , 3 , 1 , 2 , 1 , 2 , 2 , 1 , 2 , 4 , 2 , 1 , 3 , 1 , 1 , 3 , 1, 4 , 1, 4 , 2 ,1, 2 , 2
  • 12.
    ✓ Frecuencias Absolutas, fi Absolutas acumuladas,Fi ➢ Variables cuantitativas discretas xi fi Fi x1 ... xi ... xk n1 ... ni ... nk n1 n1+n2 Ni ... Nk n Tablas Estadísticas Frecuencia: desde un conjunto de unidades, corresponde al Número o Porcentaje de veces que se presenta una característica.
  • 13.
    13 DEFINICIONES fi: Frecuencia absolutadel valor observado. Constituye la cantidad de veces que se presenta el valor xi de la variable. Fi: Frecuencia absoluta acumulada. Cantidad de casos que se tienen hasta el valor xi de la variable
  • 14.
    14 Ejemplo: Se consultóa un grupo de 40 niños sobre cuántos hermanos tenían 𝑥𝑖 𝑓𝑖 𝐹𝑖 𝑓𝑟𝑖 𝑓𝑟𝑖% 𝐹𝑟𝑖 𝐹𝑟𝑖% 0 5 5 1 14 5+14=19 2 9 9+14+5= 28 3 7 4 3 5 2 40 0,0,0,0,0,1,1,1,1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,2 0 , 1 , 3 , 0 , 1 , 2 , 3 , 1 , 0 , 0 , 3 , 0 , 5 , 3 , 1 , 5 , 1 , 3 , 1 , 2 , 1 , 2 , 2 , 1 , 2 , 4 , 2 , 1 , 3 , 1 , 1 , 3 , 1, 4 , 1, 4 , 2 ,1, 2 , 2
  • 15.
    15 Ejemplo: Se consultóa un grupo de 40 niños sobre cuántos hermanos tenían 𝑥𝑖 𝑓𝑖 𝐹𝑖 𝑓𝑟𝑖 𝑓𝑟𝑖% 𝐹𝑟𝑖 𝐹𝑟𝑖% 0 5 5 1 14 19 2 9 28 3 7 35 4 3 38 5 2 40 40 0 , 1 , 3 , 0 , 1 , 2 , 3 , 1 , 0 , 0 , 3 , 0 , 5 , 3 , 1 , 5 , 1 , 3 , 1 , 2 , 1 , 2 , 2 , 1 , 2 , 4 , 2 , 1 , 3 , 1 , 1 , 3 , 1, 4 , 1, 4 , 2 ,1, 2 , 2
  • 16.
    16 ✓ Frecuencias Absolutas, fi Relativas fri= fi / n Absolutas acumuladas, Fi ➢ Variables cuantitativas discretas xi fi Fi fr Fr x1 ... xi ... xk n1 ... ni ... nk n1 n1+n2 Ni ... Nk f1 ... fi ... fk F1 ... Fi ... Fk n 1 Tablas Estadísticas Frecuencia: desde un conjunto de unidades, corresponde al Número o Porcentaje de veces que se presenta una característica.
  • 17.
    17 DEFINICIONES fi: Frecuencia absolutadel valor observado. Constituye la cantidad de veces que se presenta el valor xi de la variable. Fi: Frecuencia absoluta acumulada. Cantidad de casos que se tienen hasta el valor xi de la variable fr: Frecuencia relativa de un valor observado. Proporción de veces que se presenta o repite el valor xi de la variable. (fi / n)
  • 18.
    18 Ejemplo: Se consultóa un grupo de 40 niños sobre cuántos hermanos tenían 𝑥𝑖 𝑓𝑖 𝐹𝑖 𝑓𝑟𝑖 = 𝒇𝒊 𝒏 𝑓𝑟 𝒊 % = 𝒇𝒊 𝒏 ∗ 𝟏𝟎𝟎 𝐹𝑟𝑖 𝐹𝑟𝑖% 0 5 5 5/40 =0,125 12,5 % 1 14 19 2 9 28 3 7 35 4 3 38 5 2 40 𝑛 40 0 , 1 , 3 , 0 , 1 , 2 , 3 , 1 , 0 , 0 , 3 , 0 , 5 , 3 , 1 , 5 , 1 , 3 , 1 , 2 , 1 , 2 , 2 , 1 , 2 , 4 , 2 , 1 , 3 , 1 , 1 , 3 , 1, 4 , 1, 4 , 2 ,1, 2 , 2
  • 19.
    19 Ejemplo: Se consultóa un grupo de 40 niños sobre cuántos hermanos tenían 𝑥𝑖 𝑓𝑖 𝐹𝑖 𝑓𝑟𝑖 𝑓𝑟𝑖% 𝐹𝑟𝑖 𝐹𝑟𝑖% 0 5 5 0,125 12,5 % 1 14 19 0,35 35 % 2 9 28 0,225 22,5 % 3 7 35 0,175 17,5 % 4 3 38 0,075 7,5 % 5 2 40 0,05 5 % 𝑛 40 1 100 % 0 , 1 , 3 , 0 , 1 , 2 , 3 , 1 , 0 , 0 , 3 , 0 , 5 , 3 , 1 , 5 , 1 , 3 , 1 , 2 , 1 , 2 , 2 , 1 , 2 , 4 , 2 , 1 , 3 , 1 , 1 , 3 , 1, 4 , 1, 4 , 2 ,1, 2 , 2
  • 20.
    20 ✓ Frecuencias Absolutas, fi Relativas fri= fi / n Relativas acumuladas Fri= Fi / n Absolutas acumuladas, Fi ➢ Variables cuantitativas discretas xi fi Fi fr Fr x1 ... xi ... xk n1 ... ni ... nk n1 n1+n2 Ni ... Nk f1 ... fi ... fk F1 ... Fi ... Fk n 1 Tablas Estadísticas Frecuencia: desde un conjunto de unidades, corresponde al Número o Porcentaje de veces que se presenta una característica.
  • 21.
    21 DEFINICIONES fi: Frecuencia absolutadel valor observado. Constituye la cantidad de veces que se presenta el valor xi de la variable. Fi: Frecuencia absoluta acumulada. Cantidad de casos que se tienen hasta el valor xi de la variable fr: Frecuencia relativa de un valor observado. Proporción de veces que se presenta o repite el valor xi de la variable. (fi / n) Fr : Frecuencia relativa acumulada. Contituye la proporción de casos que se tienen hasta el valor xi de la variable (Fi / n)
  • 22.
    22 Ejemplo: Se consultóa un grupo de 40 niños sobre cuántos hermanos tenían 𝑥𝑖 𝑓𝑖 𝐹𝑖 𝑓𝑟𝑖 𝑓𝑟𝑖% 𝐹𝑟𝑖 𝐹𝑟𝑖% 0 5 5 0,125 12,5 % 0,125 12,5 % 1 14 19 0,35 35 % 0,125+0,35= 0,475 2 9 28 0,225 22,5 % 3 7 35 0,175 17,5 % 4 3 38 0,075 7,5 % 5 2 40 0,05 5 % 𝑛 40 1 100 % 0 , 1 , 3 , 0 , 1 , 2 , 3 , 1 , 0 , 0 , 3 , 0 , 5 , 3 , 1 , 5 , 1 , 3 , 1 , 2 , 1 , 2 , 2 , 1 , 2 , 4 , 2 , 1 , 3 , 1 , 1 , 3 , 1, 4 , 1, 4 , 2 ,1, 2 , 2
  • 23.
    23 Ejemplo: Se consultóa un grupo de 40 niños sobre cuántos hermanos tenían 𝑥𝑖 𝑓𝑖 𝐹𝑖 𝑓𝑟𝑖 𝑓𝑟𝑖% 𝐹𝑟𝑖 𝐹𝑟𝑖% 0 5 5 0,125 12,5 % 0,125 12,5 % 1 14 19 0,35 35 % 0,475 47,5 % 2 9 28 0,225 22,5 % 0,7 70 % 3 7 35 0,175 17,5 % 0,875 87,5 4 3 38 0,075 7,5 % 0,95 95 5 2 40 0,05 5 % 1 100 40 1 100 % 0 , 1 , 3 , 0 , 1 , 2 , 3 , 1 , 0 , 0 , 3 , 0 , 5 , 3 , 1 , 5 , 1 , 3 , 1 , 2 , 1 , 2 , 2 , 1 , 2 , 4 , 2 , 1 , 3 , 1 , 1 , 3 , 1, 4 , 1, 4 , 2 ,1, 2 , 2
  • 24.
    24 Luego de observarla tabla de frecuencias podríamos preguntarnos: • ¿Qué porcentaje de niños a lo sumo tienen 2 hermanos? • ¿Cuál es la cantidad de hermanos que predomina? • ¿Qué porcentaje de niños tienen exactamente 5 hermanos?
  • 25.
    25 Luego de observarla tabla de frecuencias podríamos preguntarnos: • ¿Qué porcentaje de niños a lo sumo tienen 2 hermanos? “El 70% de los niños consultados tienen a lo sumo 2 hermanos” • ¿Cuál es la cantidad de hermanos que predomina? “Predominan los niños que tienen sólo un hermano” • ¿Qué porcentaje de niños tienen exactamente 5 hermanos? “Exactamente el 5% de los niños tienen 5 hermanos”
  • 26.
    26 Objetivo: Resumir lainformación más relevante de la muestra o población en unos pocos números (parámetros). • Medidas de Centralización y Posición Las medidas de centralización o de tendencia central expresan el valor en torno al cual se sitúan los datos de una muestra. Media, mediana y moda Dividen un conjunto ordenado de datos en grupos con la misma cantidad de individuos. Cuantiles: percentiles, cuartiles, deciles. • Medidas de Dispersión o Variabilidad Indican la mayor o menor concentración de los datos con respecto a las medidas de centralización. Rango, varianza, desviación típica, rango intercuartílico, coeficiente de variación Medidas resumen de las distribuciones de frecuencias
  • 27.
    27 • Datos agrupados(pero no en intervalos) Es el valor de la variable que ocurre con mayor frecuencia absoluta, es el valor más frecuente. Puede NO existir o puede no ser única. En el ejemplo, podemos observar que la moda 𝑀𝑜 = 1, pues es el valor de la variable de mayor frecuencia absoluta. repite" se más que dato el " Mo = Moda 𝑥𝑖 𝑓𝑖 0 5 1 14 2 9 3 7 4 3 5 2 Medidas de Centralización
  • 28.
    28 Ejemplo: Se consultó aun grupo de 40 niños sobre cuántos hermanos tenían 0 , 1 , 3 , 0 , 1 , 2 , 3 , 1 , 0 , 0 , 3 , 0 , 5 , 3 , 1 , 5 , 1 , 3 , 1 , 2 , 1 , 2 , 2 , 1 , 2 , 4 , 2 , 1 , 3 , 1 , 1 , 3 , 1, 4 , 1, 4 , 2 ,1, 2 , 2 Mediana Representa el valor de la variable de posición central en un conjunto de datos ordenados
  • 29.
    29 Los resultados seresumieron en la siguiente tabla de distribución de frecuencias: 𝑥𝑖 𝑓𝑖 𝐹𝑖 0 5 5 1 14 19 2 9 28 3 7 35 4 3 38 5 2 40 40 𝑃𝑜𝑠 𝑀𝑒 = 𝒏 + 1 2 𝑃𝑜𝑠 𝑀𝑒 = 40 + 1 2 = 20,5 0,0,0,0,0,1,1,1,1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,2,….. 𝑀𝑒 = 2 + 2 2 = 2
  • 30.
    30 • Datos NOagrupados La 𝑚𝑒𝑑𝑖𝑎 𝑎𝑟𝑖𝑡𝑚é𝑡𝑖𝑐𝑎, ҧ 𝑥, es el cociente entre la suma de todos los valores de la muestra y el número total de ellos: Media Aritmética ҧ 𝑥 = 𝑥1 + 𝑥2 + ⋯ + 𝑥𝑚 𝑛 = σ𝑖=1 𝑚 𝑥𝑖 𝑛 Donde 𝑚 es la cantidad de valores distintos que toma la variable 𝑥𝑖 y 𝑛 es la cantidad total de valores.
  • 31.
    31 Se consultó aun grupo de 40 niños sobre cuántos hermanos tenían 0 , 1 , 3 , 0 , 1 , 2 , 3 , 1 , 0 , 0 , 3 , 0 , 5 , 3 , 1 , 5 , 1 , 3 , 1 , 2 , 1 , 2 , 2 , 1 , 2 , 4 , 2 , 1 , 3 , 1 , 1 , 3 , 1, 4 , 1, 4 , 2 ,1, 2 , 2 Si los ordenamos: 0,0,0,0,0,1,1,1,1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,2,….. 𝑥𝑖 𝑓𝑖 𝒙𝒊 ∗ 𝑓𝑖 0 5 0 1 14 14 2 9 18 3 7 21 4 3 12 5 2 10 40 75 ҧ 𝑥 = 𝑥1. 𝑓1 + 𝑥2. 𝑓2 + ⋯ + 𝑥𝑚. 𝑓𝑚 𝒏 = 𝟕𝟓 𝟒𝟎 = 1,875 ҧ 𝑥 = σ𝑖=1 𝑚 𝑥𝑖. 𝑓𝑖 𝑛
  • 32.
    32 Percentiles, Deciles oCuartiles -Percentil (ejemplo: 25, 50, 75) -Decil (ejemplo: 4, 5, 8) -Cuartil (ejemplo: 1, 2, 3) El Decil va de 1 a 10 El Decil 4: es el valor de la variable que reúne al menos el 40% de los datos Percentil, Decil o Cuartil: corresponde al valor que toma la variable (cuantitativa), cuando losn datos están ordenados de Menor a Mayor El Percentil va de 1 a 100 El percentil 25 : es el valor de la variable que reúne al menos el 25% de los datos El Cuartil va de 1 a 4 El Cuartil 3 es el valor de la variable que reúne al menos el 75% de los datos
  • 33.
    33 Datos agrupados enno intervalos CUARTILES Posición del 𝑄𝑘 = 𝑘.(𝑛+1) 4 DECILES Posición del 𝐷𝑘 = 𝑘.(𝑛+1) 10 PERCENTILES Posición del 𝑃𝑘 = 𝑘(.𝑛+1) 100
  • 34.
    34 𝑸𝟏 𝑸𝟐 =𝑴𝒆 𝑸𝟑
  • 35.
    35 𝑫𝟏 𝑫𝟐 𝑫𝟑𝑫𝟒 𝑫𝟓 = 𝑸 𝟐 = 𝑴𝒆 𝑫𝟏 = 𝑷𝟏𝟎
  • 36.
    Se consultó aun grupo de 40 niños sobre cuántos hermanos tenían 0 , 1 , 3 , 0 , 1 , 2 , 3 , 1 , 0 , 0 , 3 , 0 , 5 , 3 , 1 , 5 , 1 , 3 , 1 , 2 , 1 , 2 , 2 , 1 , 2 , 4 , 2 , 1 , 3 , 1 , 1 , 3 , 1, 4 , 1, 4 , 2 ,1, 2 , 2 Dada la siguiente tabla, calcular el Q1, Q3 y D3 𝑥𝑖 𝑓𝑖 𝐹𝑖 0 5 5 1 14 19 2 9 28 3 7 35 4 3 38 5 2 40 40 Posición del 𝑄𝑘 = 𝑘.(𝑛+𝟏) 4
  • 37.
    Se consultó aun grupo de 40 niños sobre cuántos hermanos tenían 0 , 1 , 3 , 0 , 1 , 2 , 3 , 1 , 0 , 0 , 3 , 0 , 5 , 3 , 1 , 5 , 1 , 3 , 1 , 2 , 1 , 2 , 2 , 1 , 2 , 4 , 2 , 1 , 3 , 1 , 1 , 3 , 1, 4 , 1, 4 , 2 ,1, 2 , 2 Dada la siguiente tabla, calcular el Q1, Q3 y D3 𝑥𝑖 𝑓𝑖 𝐹𝑖 0 5 5 1 14 19 2 9 28 3 7 35 4 3 38 5 2 40 40 Posición del 𝑄𝑘 = 𝑘.(𝑛+𝟏) 4 Posición del 𝑄1 = 1. (𝟒𝟎+𝟏) 4 = 10,25 𝑄1 = 1
  • 38.
    38 Se consultó aun grupo de 40 niños sobre cuántos hermanos tenían 0 , 1 , 3 , 0 , 1 , 2 , 3 , 1 , 0 , 0 , 3 , 0 , 5 , 3 , 1 , 5 , 1 , 3 , 1 , 2 , 1 , 2 , 2 , 1 , 2 , 4 , 2 , 1 , 3 , 1 , 1 , 3 , 1, 4 , 1, 4 , 2 ,1, 2 , 2 Dada la siguiente tabla, calcular el Q1, Q3 y D3 𝑥𝑖 𝑓𝑖 𝐹𝑖 0 5 5 1 14 19 2 9 28 3 7 35 4 3 38 5 2 40 40 Posición del 𝑄𝑘 = 𝑘.(𝑛+𝟏) 4 Posición del 𝑄3 = 3. (𝟒𝟎+𝟏) 4 = 30,75 𝑄3 = 3
  • 39.
    Se consultó aun grupo de 40 niños sobre cuántos hermanos tenían 0 , 1 , 3 , 0 , 1 , 2 , 3 , 1 , 0 , 0 , 3 , 0 , 5 , 3 , 1 , 5 , 1 , 3 , 1 , 2 , 1 , 2 , 2 , 1 , 2 , 4 , 2 , 1 , 3 , 1 , 1 , 3 , 1, 4 , 1, 4 , 2 ,1, 2 , 2 Dada la siguiente tabla, calcular el Q1, Q3 y D3 𝑥𝑖 𝑓𝑖 𝐹𝑖 0 5 5 1 14 19 2 9 28 3 7 35 4 3 38 5 2 40 40 Posición del 𝐷𝑘 = 𝑘.(𝑛+𝟏) 10 Posición del 𝐷3 = 3.(𝟒𝟎+𝟏) 10 = 12,3 𝐷3 = 1
  • 40.
    40 Los estadísticos detendencia central o posición indican dónde se sitúa un grupo de puntuaciones. Los de variabilidad o dispersión nos indican si estas puntaciones o valores están próximos entre sí o si por el contrario están muy dispersos. Las medidas son: • 𝑅𝑎𝑛𝑔𝑜 • 𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 (𝑆2 ); • 𝑑𝑒𝑠𝑣í𝑜 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟 o 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑡í𝑝𝑖𝑐𝑎 (𝑆) y • 𝑐𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 (𝐶𝑣). Como queremos averiguar qué tan separados están de la media aritmética los datos de la muestra, debemos medir la diferencia entre cada valor de la muestra y la media. Medidas de Dispersión o Variabilidad
  • 41.
    41 Rango: Una medida razonablede la variabilidad podría ser la amplitud o rango. El mismo se obtiene restando el valor más bajo de un conjunto de observaciones del valor más alto. 𝑹 = 𝒙𝒎á𝒙 − 𝒙𝒎í𝒏 Si bien es muy sencillo su cálculo posee algunos inconvenientes: • No utiliza todas las observaciones (sólo dos de ellas) • Se puede ver muy afectada por alguna observación externa. Existen medidas de dispersión mejores que ésta y se determinan. Estas permiten averiguar qué tan separados están de la media aritmética los datos de la muestra.
  • 42.
    42 Varianza: La varianza deun conjunto de "𝑛" observaciones 𝑥1, 𝑥2, 𝑥3, … 𝑥𝑚, es la suma de los cuadrados de los 𝑛 desvíos entre cada valor 𝑥𝑖 y su media aritmética, dividida por 𝑛 − 1. (Promedio de desvíos cuadráticos) 𝑆2 = σ𝑖=1 𝑛 𝑥𝑖 − ҧ 𝑥 2 . 𝑓𝑖 𝑛 − 1 (Se divide por "𝑛 − 1" cuando consideramos los datos como MUESTRA. En el caso de considerar los datos de una POBLACIÓN, se divide por "𝑛". Luego, la raíz cuadrada de la varianza nos da como resultado lo que llamaremos 𝑑𝑒𝑠𝑣í𝑜 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟 o 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑡í𝑝𝑖𝑐𝑎:
  • 43.
    43 Desvío estándar (desviacióntípica) En general, el 𝑑𝑒𝑠𝑣í𝑜 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟 se calcula así: 𝑆 = σ𝑖=1 𝑛 𝑥𝑖 − ҧ 𝑥 2. 𝑓𝑖 𝑛 − 1
  • 44.
    44 Se consultó aun grupo de 40 niños sobre cuántos hermanos tenían 0 , 1 , 3 , 0 , 1 , 2 , 3 , 1 , 0 , 0 , 3 , 0 , 5 , 3 , 1 , 5 , 1 , 3 , 1 , 2 , 1 , 2 , 2 , 1 , 2 , 4 , 2 , 1 , 3 , 1 , 1 , 3 , 1, 4 , 1, 4 , 2 ,1, 2 , 2 𝑥𝑖 𝑓𝑖 𝒙𝒊 ∗ 𝑓𝑖 𝑥𝑖 − ҧ 𝑥 2 0 5 0 3,51 1 14 14 0,76 2 9 18 0,015 3 7 21 1,26 4 3 12 4,51 5 2 10 9,76 40 75 ҧ 𝑥 = 1,875 ҧ 𝑥 = σ𝑖=1 𝑛 𝑥𝑖. 𝑓𝑖 𝑛 𝑆2 = σ𝑖=1 𝑛 𝑥𝑖 − ҧ 𝑥 2 . 𝑓𝑖 𝑛 − 1
  • 45.
    45 Se consultó aun grupo de 40 niños sobre cuántos hermanos tenían 0 , 1 , 3 , 0 , 1 , 2 , 3 , 1 , 0 , 0 , 3 , 0 , 5 , 3 , 1 , 5 , 1 , 3 , 1 , 2 , 1 , 2 , 2 , 1 , 2 , 4 , 2 , 1 , 3 , 1 , 1 , 3 , 1, 4 , 1, 4 , 2 ,1, 2 , 2 𝑥𝑖 𝑓𝑖 𝒙𝒊 ∗ 𝑓𝑖 𝑥𝑖 − ҧ 𝑥 2 𝑥𝑖 − ҧ 𝑥 2 . 𝑓𝑖 0 5 0 3,51 17,55 1 14 14 0,76 10,64 2 9 18 0,015 0,09 3 7 21 1,26 8,82 4 3 12 4,51 13,53 5 2 10 9,76 19,52 40 75 70,2 𝑆2 = σ𝑖=1 𝑛 𝑥𝑖 − ҧ 𝑥 2 . 𝑓𝑖 𝑛 − 1 𝑆2 = σ𝑖=1 𝑛 𝑥𝑖− ҧ 𝑥 2.𝑓𝑖 𝑛−1 = 70,2 40−1 =1,8
  • 46.
    46 Coeficiente de variación(𝐶𝑣) En estadística, cuando se desea hacer referencia a la relación entre el tamaño de la media y la variabilidad de la variable, se utiliza el coeficiente de variación. Su fórmula expresa la desviación estándar como porcentaje de la media aritmética, mostrando una mejor interpretación porcentual del grado de variabilidad que la desviación típica o estándar. A mayor valor del 𝐶𝑣, mayor heterogeneidad de los valores de la variable; y a menor 𝐶𝑣, mayor homogeneidad en los valores de la variable, por lo que se recomienda que no sea mayor a 0,2 (20%). Entonces, si 𝐶𝑣 ≤ 0,2, los datos son homogéneos.
  • 47.
    47 Los datos quese muestran a continuación representan las razones costo-beneficio para 25 distintos tipos de acciones en el mercado de valores. Aclaración: El índice beneficio/costo (I B/C), también conocido como relación beneficio/costo compara directamente, como su nombre lo indica, los beneficios y los costos de un proyecto para definir su viabilidad. ... Si B/C > 1, esto indica que los beneficios son mayores a los costos. 6, 7.8 , 8.1, 9.15, 10.2, 10.9, 11.2 ,12.5, 13.4, 13.7, 14.1, 14.9, 15.4, 15.8, 16.3, 17.1, 17,6, 18.2, 18,7, 20.4, 20.7, 21, 21.2, 24.9, 25,3 Ejemplo 1
  • 48.
    48 Completar la siguientetabla: 6, 7.8 , 8.1, 9.15, 10.2, 10.9, 11.2 ,12.5, 13.4, 13.7, 14.1, 14.9, 15.4, 15.8, 16.3, 17.1, 17,6, 18.2, 18,7, 20.4, 20.7, 21, 21.2, 24.9, 25,3 𝑥𝑖 𝑓𝑖 𝐹𝑖 ሾ5; 9) 7 ሾ9; 13) ሾ13; 17) ሾ17; 21) ሾ21; 25) ሾ25; 29)
  • 49.
    49 𝑥𝑖 𝑓𝑖 𝐹𝑖 ሾ5;9) 7 3 ሾ9; 13) 11 ሾ13; 17) 15 ሾ17; 21) 19 ሾ21; 25) 23 ሾ25; 29) 27 6, 7.8 , 8.1, 9.15, 10.2, 10.9, 11.2 ,12.5, 13.4, 13.7, 14.1, 14.9, 15.4, 15.8, 16.3, 17.1, 17,6, 18.2, 18,7, 20.4, 20.7, 21, 21.2, 24.9, 25.3
  • 50.
    50 𝑥𝑖 𝑓𝑖 𝐹𝑖 ሾ5;9) 7 3 3 ሾ9; 13) 11 5 8 ሾ13; 17) 15 7 15 ሾ17; 21) 19 6 21 ሾ21; 25) 23 3 24 ሾ25; 29) 27 1 25
  • 51.
    51 𝑥𝑖 𝑓𝑖 𝐹𝑖 𝑓𝐫𝑖= 𝒇𝒊 𝒏 𝐹𝐫𝑖 ሾ5; 9) 7 3 3 0,12 0,12 ሾ9; 13) 11 5 8 0,2 0,32 ሾ13; 17) 15 7 15 0,28 0,6 ሾ17; 21) 19 6 21 0,24 0,84 ሾ21; 25) 23 3 24 0,12 0,96 ሾ25; 29) 27 1 25 0,04 1 25 1
  • 52.
    52 • Medidas deCentralización y Posición Las medidas de centralización o de tendencia central expresan el valor en torno al cual se sitúan los datos de una muestra. Media, mediana y moda Dividen un conjunto ordenado de datos en grupos con la misma cantidad de individuos. Cuantiles: percentiles, cuartiles, deciles. • Medidas de Dispersión o Variabilidad Indican la mayor o menor concentración de los datos con respecto a las medidas de centralización. Rango, varianza, desviación típica, rango intercuartílico, coeficiente de variación
  • 53.
    53 • Datos agrupadosen intervalos Clase modal: Es el intervalo que posee la mayor frecuencia absoluta simple. La MODA está localizada en la “clase modal” y se calcula con la siguiente fórmula: 𝑀𝑜 = 𝐿𝑖 + 𝑓𝑖 − 𝑓𝑖−1 𝑓𝑖 − 𝑓𝑖−1 + 𝑓𝑖 − 𝑓𝑖+1 . 𝑎𝑖𝑛𝑡 Donde 𝐿𝑖 = 𝑙í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑓𝑖 = 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎 𝑠𝑖𝑚𝑝𝑙𝑒 𝑓𝑖−1 = 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎 𝑠𝑖𝑚𝑝𝑙𝑒 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟 𝑓𝑖+1 = 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎 𝑠𝑖𝑚𝑝𝑙𝑒 𝑝𝑜𝑠𝑡𝑒𝑟𝑖𝑜𝑟 𝑎𝑖𝑛𝑡 = 𝑎𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜
  • 54.
    54 Los datos quese muestran a continuación representan las razones costo- beneficio para 25 distintos tipos de acciones en el mercado de valores. Calculemos la moda Primero debemos encontrar el intervalo que posee mayor frecuencia o clase modal: ሾ13; 17) Luego: 𝑀𝑜 = 𝐿𝑖 + 𝑓𝑖 − 𝑓𝑖−1 𝑓𝑖 − 𝑓𝑖−1 + 𝑓𝑖 − 𝑓𝑖+1 . 𝑎𝑖𝑛𝑡 = 13 + 7 − 5 7 − 5 + 7 − 6 . 4 = 47 3 = 15, ෠ 6 𝑥𝑖 𝑓𝑖 𝐹𝑖 ሾ5; 9) 7 3 3 ሾ9; 13) 11 5 8 ሾ13; 17) 15 7 15 ሾ17; 21) 19 6 21 ሾ21; 25) 23 3 24 ሾ25; 29) 27 1 25 𝒂𝒊𝒏𝒕 = 𝟏𝟕 − 𝟏𝟑 = 𝟒
  • 55.
    55 Donde 𝐿𝑖 = 𝑙í𝑚𝑖𝑡𝑒𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝐹𝑖−1 = 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟 𝑎 𝑙𝑎 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑑𝑒 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 𝑓𝑚𝑒 = 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑑𝑒 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 𝑎𝑖𝑛𝑡 = 𝑎𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑀𝑒 = 𝐿𝑖 + 𝑛 2 − 𝐹𝑖−1 𝑓𝒎𝒆 . 𝑎𝑖𝑛𝑡
  • 56.
    56 Retomemos el ejemplo: Losdatos que se muestran a continuación representan las razones costo-beneficio para 25 distintos tipos de acciones en el mercado de valores. Debemos primero calcular la posición de la mediana 𝑃𝑀𝑒 = 25 2 = 12,5. Buscamos en la frecuencia acumulada 𝐹𝑖 el intervalo al cual pertenece dicha frecuencia. Luego el intervalo que contiene a la frecuencia 12,5 es ሾ13; 17) Calculamos la mediana: 𝑀𝑒 = 𝐿𝑖 + 𝑛 2 − 𝐹𝑖−1 𝑓𝒊 . 𝑎𝑖𝑛𝑡 = 13 + 12,5 − 8 7 . 4 = 109 7 = 15,5714 𝑥𝑖 𝑓𝑖 𝐹𝑖 ሾ5; 9) 7 3 3 ሾ9; 13) 11 5 8 ሾ13; 17) 15 7 15 ሾ17; 21) 19 6 21 ሾ21; 25) 23 3 24 ሾ25; 29) 27 1 25 𝑃𝑀𝑒 = 𝑛 2
  • 57.
    57 DATOS AGRUPADOS Si losvalores de la variable 𝑥𝑖 están repetidos, podemos calcular la media aritmética incluyendo el concepto de frecuencia absoluta simple 𝑓𝑖 , utilizando la siguiente fórmula: ҧ 𝑥 = 𝑥1. 𝑓1 + 𝑥2. 𝑓2 + ⋯ + 𝑥𝑚. 𝑓 𝑚 𝒏 = σ𝑖=1 𝑚 𝑥𝑖. 𝑓𝑖 σ𝑖=1 𝑚 𝑓𝑖 = σ𝑖=1 𝑚 𝑥𝑖. 𝑓𝑖 𝑛 Media Aritmética
  • 58.
    58 Retomemos el ejemplo: Losdatos que se muestran a continuación representan las razones costo-beneficio para 25 distintos tipos de acciones en el mercado de valores. 𝑥𝑖 𝑓𝑖 𝒙𝒊 . 𝒇𝒊 ሾ5; 9) 7 3 21 ሾ9; 13) 11 5 55 ሾ13; 17) 15 7 ሾ17; 21) 19 6 ሾ21; 25) 23 3 ሾ25; 29) 27 1 ҧ 𝑥 = σ𝑖=1 𝑚 𝑥𝑖. 𝑓𝑖 𝑛
  • 59.
    59 Retomemos el ejemplo: Losdatos que se muestran a continuación representan las razones costo-beneficio para 25 distintos tipos de acciones en el mercado de valores. 𝑥𝑖 𝑓𝑖 𝒙𝒊 . 𝒇𝒊 ሾ5; 9) 7 3 21 ሾ9; 13) 11 5 55 ሾ13; 17) 15 7 105 ሾ17; 21) 19 6 114 ሾ21; 25) 23 3 69 ሾ25; 29) 27 1 27 ҧ 𝑥 = 𝑥1. 𝑓1 + 𝑥2. 𝑓2 + ⋯ + 𝑥𝑚. 𝑓𝑚 𝒏 = 𝟑𝟗𝟏 𝟐𝟓 = 𝟏𝟓. 𝟔𝟒
  • 60.
    60 Datos agrupados enno intervalos Datos agrupados en intervalos CUARTILES Posición del 𝑄𝑘 = 𝑘.(𝑛+𝟏) 4 CUARTILES Posición del 𝑄𝑘= 𝑘.𝑛 4 𝑄𝑘 = 𝐿𝑖 + 𝑘. 𝑛 4 − 𝐹𝑖−1 𝑓𝑖 𝑎𝑖 DECILES Posición del 𝐷𝑘 = 𝑘.(𝑛+𝟏) 10 DECILES Posición del 𝐷𝑘 = 𝑘.𝑛 10 𝐷𝑘 = 𝐿𝑖 + 𝑘. 𝑛 10 − 𝐹𝑖−1 𝑓𝑖 𝑎𝑖 PERCENTILES Posición del 𝑃𝑘 = 𝑘(.𝑛+1) 100 PERCENTILES Posición del 𝑃𝑘 = 𝑘.𝑛 100 𝑃𝑘 = 𝐿𝑖 + 𝑘. 𝑛 100 − 𝐹𝑖−1 𝑓𝑖 𝑎𝑖
  • 61.
    Retomemos el ejemplo: Losdatos que se muestran a continuación representan las razones costo-beneficio para 25 distintos tipos de acciones en el mercado de valores. 𝑥𝑖 𝑓𝑖 𝑭𝒊 ሾ5; 9) 7 3 3 ሾ9; 13) 11 5 8 ሾ13; 17) 15 7 15 ሾ17; 21) 19 6 21 ሾ21; 25) 23 3 24 ሾ25; 29) 27 1 25 Posición del 𝑄𝑘 = 𝑘.(𝑛) 4 𝑄𝑘 = 𝐿𝑖 + 𝑘. 𝑛 4 − 𝐹𝑖−1 𝑓𝑖 𝑎𝑖
  • 62.
    62 Retomemos el ejemplo: Losdatos que se muestran a continuación representan las razones costo-beneficio para 25 distintos tipos de acciones en el mercado de valores. 𝑥𝑖 𝑓𝑖 𝑭𝒊 ሾ5; 9) 7 3 3 ሾ9; 13) 11 5 8 ሾ13; 17) 15 7 15 ሾ17; 21) 19 6 21 ሾ21; 25) 23 3 24 ሾ25; 29) 27 1 25 Calcular el Q3 Posición del 𝑄𝑘 = 𝑘.(𝑛) 4 Posición del 𝑄𝟑 = 𝟑.(𝟐𝟓) 4 = 𝟏𝟖, 𝟕𝟓 Definimos el intervalo: [ 17 ; 21) 𝑄𝑘 = 𝐿𝑖 + 𝑘. 𝑛 4 − 𝐹𝑖−1 𝑓𝑖 𝑎𝑖 𝑄𝟑 = 𝟏𝟕 + 𝟑. 𝟐𝟓 4 − 𝟏𝟓 𝟔 . 𝟒 = 𝟏𝟗. 𝟓
  • 63.
    63 Calcular el D2 𝑫𝑘= 𝑘. (𝑛) 𝟏𝟎 𝑥𝑖 𝑓𝑖 𝑭𝒊 ሾ5; 9) 7 3 3 ሾ9; 13) 11 5 8 ሾ13; 17) 15 7 15 ሾ17; 21) 19 6 21 ሾ21; 25) 23 3 24 ሾ25; 29) 27 1 25 𝐷𝑘 = 𝐿𝑖 + 𝑘. 𝑛 10 − 𝐹𝑖−1 𝑓𝑖 𝑎𝑖
  • 64.
    64 Calcular el D2 Posicióndel 𝑫𝟐 = 𝟓 Definimos el intervalo: [ 9;13) 𝑫𝑘 = 𝑘. (𝑛) 𝟏𝟎 𝑥𝑖 𝑓𝑖 𝑭𝒊 ሾ5; 9) 7 3 3 ሾ9; 13) 11 5 8 ሾ13; 17) 15 7 15 ሾ17; 21) 19 6 21 ሾ21; 25) 23 3 24 ሾ25; 29) 27 1 25 𝐷𝟐 = 𝟗 + (𝟓 − 𝟑) 𝟓 . 𝟒 = 𝟏𝟎, 𝟔 𝐷𝑘 = 𝐿𝑖 + 𝑘. 𝑛 10 − 𝐹𝑖−1 𝑓𝑖 𝑎𝑖
  • 65.
    65 MEDIDAS DE DISPERSIÓN 𝐶𝑣= 𝑆 ҧ 𝑥 Donde: 𝑆: desvío estándar ത x: media aritmética 𝑥𝑖 𝑓𝑖 𝐹𝑖 ሾ5; 9) 7 3 3 ሾ9; 13) 11 5 8 ሾ13; 17) 15 7 15 ሾ17; 21) 19 6 21 ሾ21; 25) 23 3 24 ሾ25; 29) 27 1 25 Retomemos el ejemplo: Los datos que se muestran a continuación representan las razones costo-beneficio para 25 distintos tipos de acciones en el mercado de valores.
  • 66.
    66 𝑆2 = σ𝑖=1 𝑛 𝑥𝑖 − ҧ 𝑥2 . 𝑓𝑖 𝑛 − 1 𝑥𝑖 𝑓𝑖 𝒙𝒊 . 𝒇𝒊 ሾ5; 9) 7 3 21 ሾ9; 13) 11 5 55 ሾ13; 17) 15 7 105 ሾ17; 21) 19 6 114 ሾ21; 25) 23 3 69 ሾ25; 29) 27 1 27 ҧ 𝑥 = 𝑥1. 𝑓1 + 𝑥2. 𝑓2 + ⋯ + 𝑥𝑚. 𝑓𝑚 𝒏 = 𝟑𝟗𝟏 𝟐𝟓 = 𝟏𝟓. 𝟔𝟒
  • 67.
    67 𝑥𝑖 𝑓𝑖 𝒙𝒊. 𝒇𝒊 (𝒙𝒊 − 𝟏𝟓, 𝟔𝟒)^2 ∗ f_i ሾ5; 9) 7 3 21 223,9488 [9;13) 11 5 55 107,648 [13;17) 15 7 105 2,8672 [17;21) 19 6 114 67,7376 [21;25) 23 3 69 162,5088 [25;29) 27 1 27 129,0496 𝑆2 = σ𝑖=1 𝑛 𝑥𝑖 − ҧ 𝑥 2 . 𝑓𝑖 𝑛 − 1
  • 68.
    68 Calculamos la Varianza 𝑆2 = σ𝑖=1 𝑛 𝑥𝑖− ҧ 𝑥 2 . 𝑓𝑖 𝑛 − 1 = 693,76 24 = 28,90෠ 6 Calculamos el Desvío estándar 𝑆 = σ𝑖=1 𝑛 𝑥𝑖 − ҧ 𝑥 2. 𝑓𝑖 𝑛 − 1 = 28,90෠ 6 = 5,38 Finalmente calculamos el coeficiente de variación: 𝐶𝑣 = 𝑆 ҧ 𝑥 = 5,38 15,64 = 0,344 → 𝟎, 𝟑𝟒𝟒 ∗ 𝟏𝟎𝟎% = 34,4% Podemos interpretar que los valores de la variable son heterogéneos, pues supera 20% o el promedio no es representativo.
  • 69.
    69 Los siguientes datosrepresentan el tiempo (en segundos) que 30 trabajadores estuvieron al control de la unidad central de procesos (CPU) de una computadora mainframe grande 0.02 0.75 1.16 1.38 1.94 3.07 0.15 0.82 1.17 1.4 2.01 3.53 0.19 0.84 1.19 1.42 2.16 3.76 0.47 0.92 1.22 1.59 2.41 4.50 0.71 0.96 1.23 1.61 2.59 4.75 Ejemplo 2
  • 70.
    70 Para construirlos debemos: 1º)Calcular la 𝑎𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝑡𝑜𝑡𝑎𝑙 (𝑟𝑎𝑛𝑔𝑜 o 𝑟𝑒𝑐𝑜𝑟𝑟𝑖𝑑𝑜) de la muestra. Entonces la amplitud total (𝑎𝑡) es: 𝑎𝑡 = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛 Donde 𝑥𝑚𝑎𝑥 es el valor máximo y 𝑥𝑚𝑖𝑛 es el mínimo que toma la variable 2º) Decidir la cantidad de intervalos, 𝑘, en que se va a dividir la amplitud total, en función de la naturaleza de la variable, de las necesidades del investigador y de la cantidad de datos. Lo recomendable es entre 5 y 10 intervalos.
  • 71.
    71 REGLA DE STURGES Esun criterio utilizado para determinar el número de clases o intervalos que son necesarios para representar gráficamente un conjunto de datos estadísticos. Es un método sencillo, basado en el número de muestras que permiten encontrar el número de clases y su amplitud de rango, utilizando la siguiente fórmula: 𝑘 = 1 + 𝑙𝑜𝑔2(𝑛) ó bien: 𝑘 = 1 + 3,3. 𝑙𝑜𝑔(𝑛), donde n es el número total de observaciones de la muestra. 3º) Calcular la amplitud de cada intervalo, 𝑎𝑖𝑛𝑡, o simplemente 𝑎𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜: 𝑎𝑖𝑛𝑡 = 𝑎𝑡 𝑘 = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛 𝑘 En caso que 𝑎𝑡 no fuere divisible por 𝑘, y a los efectos de que lo sea, se reemplaza por una amplitud total que contenga a la observada (se disminuye el 𝑥𝑚𝑖𝑛 o se aumenta el 𝑥𝑚𝑎𝑥 )
  • 72.
    72 4º) A partirdel 𝐿𝑖 considerado, la construcción de los intervalos se realiza de la siguiente manera: ൣ𝐿𝑖; 𝐿𝑖 + 𝑎𝑖𝑛𝑡) ሾ𝐿𝑖 + 𝑎𝑖𝑛𝑡; 𝐿𝑖 + 2. 𝑎𝑖𝑛𝑡) ⋮ ሾ𝐿𝑖 + 𝑘 − 1 . 𝑎𝑖𝑛𝑡; 𝐿𝑖 + 𝑘. 𝑎𝑖𝑛𝑡)
  • 73.
    73 Los siguientes datosrepresentan el tiempo (en segundos) que 30 trabajadores estuvieron al control de la unidad central de procesos (CPU) de una computadora mainframe grande 0.02 0.75 1.16 1.38 1.94 3.07 0.15 0.82 1.17 1.4 2.01 3.53 0.19 0.84 1.19 1.42 2.16 3.76 0.47 0.92 1.22 1.59 2.41 4.50 0.71 0.96 1.23 1.61 2.59 4.75 Ejemplo
  • 74.
    PROCEDIMIENTO 1º Calcule elrango (R) o recorrido R = 4.75 - 0.02 = 4.73 2º Determine el número de intervalos (K). K = 1 + 3.3 Log(n) = 1+3.3Log(30) K =5.875 K = 6 (siempre es un número natural) 3º Determine el Tamaño del Intervalo de Clase (𝑎𝑖𝑛𝑡) 𝑎𝑖𝑛𝑡 = R/K = 4.73 / 6 𝑎𝑖𝑛𝑡 =0.788 = 0.79 (por exceso) 4°Elabore la tabla de frecuencias a partir de la información anterior. 74 R = Obs.máx. - Obs.mín. 𝑘 = 1 + 3,3. 𝑙𝑜𝑔(𝑛),
  • 75.
    75 Li Ls xifi Fi fri fri % Fri [0.02 0,02+0,79 =0.81) [0.81 1,6)
  • 76.
    76 Li Ls xifi Fi fri fri % Fri [0.02 0.81) [0.81 1.6) [1.6 2.39) [2.39 3.18) [3.18 3.97) [3.97 4.76)
  • 77.
    77 Li Ls xifi Fi fri fri % Fri [0.02 0.81) (0.02+0.81) /2=0.415 [0.81 1.6) [1.6 2.39) [2.39 3.18) [3.18 3.97) [3.97 4.76)
  • 78.
    78 Li Ls xifi Fi fri fri % Fri [0.02 0.81) 0.415 [0.81 1.6) 1.205 [1.6 2.39) 1.995 [2.39 3.18) 2.785 [3.18 3.97) 3.575 [3.97 4.76) 4.365
  • 79.
    79 Li Ls xifi Fi fri fri % Fri [0.02 0.81) 0.415 6 6 0.20 20 0.2 [0.81 1.6) =1.205 [1.6 2.39) 1.995 [2.39 3.18) 2.785 [3.18 3.97) 3.575 [3.97 4.76) 4.365
  • 80.
    80 Li Ls xifi Fi fri fri % Fri [0.02 0.81) 0,415 6 6 0.20 20 0.2 [0.81 1.6) 1.205 13 19 0.43 43.33 0.63 [1.6 2.39) 1.995 4 23 0.13 13.33 0.77 [2.39 3.18) 2.785 3 26 0.10 10 0.87 [3.18 3.97) 3.575 2 28 0.07 6.67 0.93 [3.97 4.76) 4.365 2 30 0.07 6.67 1 30 1.00 100
  • 81.
    81 Las distribuciones defrecuencias se presentan en tablas como las anteriores, o bien en gráficas. La representación gráfica se utiliza para facilitar al lector la comprensión de los resultados, pero no añade ninguna información sobre la que contendría una tabla de frecuencias; el objetivo de las gráficas es que la información “impacte” directamente al lector y que se exprese el “perfil” de la distribución, pero no debe olvidarse el rigor en aras de la estética: las gráficas deben reflejar fielmente lo que tratan de representar, fundamentalmente las frecuencias de cada modalidad o valor. Representación gráfica de la información Existen diversos tipos de gráficas, cada uno de ellos adecuado a un cierto tipo de variables, por lo que podemos clasificar las gráficas atendiendo a estos tipos.
  • 82.
    82 Gráfico de Barras 𝑥𝑖𝑓𝑖 0 5 1 14 2 9 3 7 4 3 5 2 40 𝑥𝑖 𝑓𝑖
  • 83.
    83 - El ejex se refiere a la variable. - El eje y se refiere a la frecuencia (Fi). Gráfico de frecuencias acumulada 𝑥𝑖 𝑓𝑖 𝑭𝑖 0 5 5 1 14 19 2 9 28 3 7 35 4 3 38 5 2 40 40
  • 84.
  • 85.
    85 Gráfico de SectoresCirculares (de Torta) Distribución de las unidades de análisis de acuerdo a variable 1 A 20% D 10% C 40% B 30% Distribución de las unidades de análisis de acuerdo a variable 1 B 30% C 40% D 10% A 20% Distribución de las unidades de análisis de acuerdo a variable 1 B 30% C 40% D 10% A 20%
  • 86.
    86 𝑥𝑖 𝑓𝑖 𝐹𝑖 ሾ5;9) 7 3 3 ሾ9; 13) 11 5 8 ሾ13; 17) 15 7 15 ሾ17; 21) 19 6 21 ሾ21; 25) 23 3 24 ሾ25; 29) 27 1 25 25 𝑥𝑖 𝑓𝑖 Histograma Histograma - Permite la representación de la frecuencia de una variable Cuantitativa. - El eje x se refiere a la variable. - El eje y se refiere a la frecuencia (fi ó fa. - Cada barra representa la frecuencia de la variable en la población en estudio (o la muestra).
  • 87.
    Polígono de Frecuencia -Estarepresentación se basa en el Histograma. -Sólo es útil para variables cuantitativas. -El eje x se refiere a la variable. - El eje y se refiere a la frecuencia (Nº , %). -Los puntos que permiten la unión de las líneas representa el centro de clase (o marca de clase). 87 𝑥𝑖 𝑓𝑖
  • 88.
    88 Histograma de frecuenciasacumulada 𝑥𝑖 𝑓𝑖 𝐹𝑖 ሾ5; 9) 7 3 3 ሾ9; 13) 11 5 8 ሾ13; 17) 15 7 15 ሾ17; 21) 19 6 21 ሾ21; 25) 23 3 24 ሾ25; 29) 27 1 25 25 𝑥𝑖
  • 89.
    89 Grafico de frecuenciasacumulada 𝒙𝒊
  • 90.
  • 91.
    91 TIPOS DE GRÁFICOSDiagrama de Caja - Permite identificar gráficamente la mediana, los cuartiles 1 y 3 (percentiles 25 y 75) -Sólo es útil para variables cuantitativas.
  • 92.
  • 93.
    93 El Diagrama deCaja se representa sobre el eje de la variable en análisis, construyéndose un rectángulo o “caja” con prolongaciones o “bigotes” teniendo en cuenta los siguientes valores: Q1: el Cuartilo de orden 1 marca el límite inferior del rectángulo. Q3: el Cuartilo de orden 3 marca el límite superior del rectángulo. Me= Q2 : la Mediana se marca con una línea dentro del rectángulo. Un valor mínimo: que es el mayor entre el xMín (menor valor de la variable) y 1,5 veces el Q ( Rango intercuartílico), restado al Q1. Desde el límite inferior del rectángulo, se extiende una línea o “bigote” hasta este valor mínimo. Un valor máximo: que es el menor entre el xMáx (mayor valor de la variable) y 1,5 veces el Q (Rango intercuartílico), sumado al Q3. Desde el límite superior del rectángulo, se extiende una línea o “bigote” hasta este valor máximo. El xMín y/o el xMáx si es que no quedan comprendidos dentro del Diagrama del rectángulo con los bigotes, constituyen valores anómalos.
  • 94.
    Ejemplo Ejemplo: Supongamos quese tienen 30 pequeños pueblos del Partido de Bragado, para los cuales se ha contabilizado la cantidad de manzanas que tenían catastradas al 31 de Diciembre último, resultando las siguientes cifras: 7, 46, 32, 16, 24, 38, 59, 45, 12, 27, 91, 84, 47, 65, 43, 55, 83, 34, 29, 24, 16, 22, 46, 73, 38, 61, 37, 16, 34 y 60. De los datos se calcula: 94
  • 95.
    95 Medidas de Posicióndel conjunto: xMín = 7 manzanas xMáx = 91 manzanas Me = 38 manzanas Q1 = 23 manzanas Q3 = 59,5 manzanas ҧ 𝑥 = 41,7 manzanas
  • 96.
    96 Rango intercuartilico Q =(Q3 - Q1) = (59.5 - 23) = 36.5 manzanas xMín = 7 manzanas ó (Q1 – 1,5 Q) = 23 – 1,5 . 36.5 = valor negativo (imposible en este ejemplo); entre ambos valores, el mayor es 7 quien constituye el extremo inferior del “bigote” izquierdo del Diagrama de Caja. xMáx = 91 manzanas ó (Q3 + 1,5 Q) = 59,5 + 1,5 . 36,5 = 114.25 manzanas; entre ambos valores, el menor es 91 quien constituye el extremo superior del “bigote” derecho del Diagrama de Caja.
  • 97.
    97 0 10 2030 40 50 60 70 80 90 100 Q1 = 23 manzanas Q3 = 59,5 manzanas Me = 38 manzanas xMín = 7 manzanas xMáx = 91 manzanas