SlideShare una empresa de Scribd logo
24/09/2023
Ing. Dr. Sc. Abraham Palacios
Velasquez 1
HUANCAYO - PERU
2023
24/09/2023
Ing. Dr. Sc. Abraham Palacios
Velasquez 2
I. CONSTRUCCION DE UNA DISTRIBUCION DE
FRECUENCIAS
A.-Sean las siguientes cifras, los pH de bebidas carbonatadas, que se
han tomado n = 56 unidades, siendo entre acido y básico.
7.3 6.3 8.1 7.2 4.4 5.2 6.9 5.5 3.0 7.5 3.8 4.3
7.5 6.7 6.6 6.1 7.6 8.7 8.4 3.9 7.2 6.2 8.2
5.8 7.5 8.9 6.9 7.3 5.3 5.9 7.9 8.7 9.5 6.3
4.3 5.0 5.9 3.8 6.4 7.0 7.4 8.4 6.3 8.2 6.3
4.8 9.5 5.2 5.9 7.7 7.5 6.8 3.6 4.7 6.5 5.3
CUADRO 01
B.-El siguiente paso es ordenarlos sea en sentido creciente o en
sentido decreciente. En el presente libro ordenamos en sentido
creciente es decir del menor dato al mayor dato
C.-De la tabla de datos se puede distinguir entre los números el
menor valor 3.0 y el mayor valor 9.5.
24/09/2023
Ing. Dr. Sc. Abraham Palacios
Velasquez 3
II. CONSTRUCCION INTERVALOS DE CLASE Y
LÍMITES DE CLASE
Para la construcción de los intervalos de clase o limites de clase, se realiza según
los siguientes pasos:
a.- ¿Cuántas CLASES O INTERVALOS necesitaremos? Para
saber esto se utiliza la formula de Sturges (empírica).
K = 1 + 3.3 log n o
En donde:
K = número de intervalos o clases
n = número de datos (tamaño de la muestra)
Remplazando en la formula
K = 1 + 3.3 log 56
= 1 + 3.3 (1.748)
K = 6.8
Pero se ha dicho que la formula es empírica, entonces para obtener el
numero que realmente es necesario, redondeamos al siguiente entero mayor.
K = 7
10
n  k n
 24 400
n
 
24/09/2023
Ing. Dr. Sc. Abraham Palacios
Velasquez 4
b.- Calculara el RECORRIDO O EXTENSIÓN
de los datos que se denota con la letra R, su fórmula es:
R = Valor máximo – valor mínimo
Se debe sumar el número 1 cuando los datos se expresan
en números enteros.
Si los datos son decimales no se suma 1.
R = 9.5 – 3.0
R = 6.5
Entonces
La extensión o recorrido es 6.5.
24/09/2023
Ing. Dr. Sc. Abraham Palacios
Velasquez 5
c.- Determinar el ANCHO O AMPLITUD DE
CADA INTERVALO, y se representa con la letra
C.
en donde R = C . K
Redondeamos a 0.93
R = C.K = 0.9285 x 7 = 6.4995
R´= C.K = 0.93 x 7 = 6.51
24/09/2023
Ing. Dr. Sc. Abraham Palacios
Velasquez 6
d.-Teniendo en cuenta que este recorrido es mayor que el
recorrido original buscaremos el exceso :
Exceso = 6.51 – 6.4995
Exceso = 0.0105
El exceso proviene de haber aumentado la amplitud de cada
intervalo de 0.9285 a 0.93
Para buscar la simetría de los datos, debemos repartir este
exceso a los dos extremos del recorrido original, mitad para
cada lado, 0.010 / 2 = 0.005
Restamos del valor mínimo 0.005 y súmanos 0.005 al valor
máximo.
3.0 – 0.005 = 2.995
9.5 + 0.005 = 9.505
A partir del valor obtenido de 2.995 agregamos
sucesivamente la amplitud de 0.93 y así obtenemos los
puntos de división que determinan los 7 intervalos.
24/09/2023
Ing. Dr. Sc. Abraham Palacios
Velasquez 7
Cuando se presenta que algunos datos coinciden con cualquiera de los
puntos de división se debe tomar en cuenta lo siguiente:
[ > Cerrado por la izquierda y abierto por la derecha.
< ] Abierto por la izquierda y cerrado por la derecha
[ ] Cerrado por ambos lados
< > Abierto por ambos lados
En la práctica los intervalos deben colocarse uno debajo del otro,
formando una columna base o columna matriz, que dará origen a la
distribución de frecuencias que vamos a formar.
Intervalos o clases
[2.995 – 3.925>
[3.925 - 4.855>
[4.855 - 5.785>
[5.785 - 6.715>
[6.715 - 7.645>
[7.645 - 8.575>
[8.575 - 9.505>
24/09/2023
Ing. Dr. Sc. Abraham Palacios
Velasquez 8
e.- El siguiente paso, de este proceso de resumen, es
ponernos de acuerdo que todos y cada uno de los datos
que se hallen dentro de un mismo intervalo, estén
representados por el mismo valor. Este valor caracteriza a la
clase y por eso se llama MARCA DE CLASE, se
obtiene promediando los extremos de cada intervalo.
La marca de clase para los 7 intervalos son:
2.995 + 3.925/2 = 3.46
3.925 + 4.855/2 = 4.39
4.855 + 5.785/2 = 5.32
5.785 + 6.715/2 = 6.25
6.715 + 7.645/2 = 7.18
7.645 + 8.575/2 = 8.11
8.575 + 9.505/2 = 9.04
24/09/2023
Ing. Dr. Sc. Abraham Palacios
Velasquez 9
f.- Ahora llevaremos a cabo la clasificación y el conteo de
los datos, es decir, colocar cada uno de los datos en el
intervalo que le corresponde.
Intervalos o
clases
Marca de
clase
Frecuencias
absoluta
f ( ni )
[2.995 – 3.925> 3.46 5
[3.925 - 4.855> 4.39 5
[4.855 - 5.785> 5.32 6
[5.785 - 6.715> 6.25 14
[6.715 - 7.645> 7.18 14
[7.645 - 8.575> 8.11 7
[8.575 - 9.505> 9.04 5
24/09/2023
Ing. Dr. Sc. Abraham Palacios
Velasquez 10
REGLA GENERAL PARA ELEBORAR LAS
DISTRIBUCIONES DE FRECUENCIAS
1.- Determinar el número de clases (k) a considerar.
2.- Determinar el recorrido o rango de los datos (R).
3.- Determinar la amplitud o longitud de los intervalos de clase (C )
4.- Determinar los limites de clase
5.- Se determina la marca de clase.
6.- Finalmente se halla la frecuencia absoluta de cada clase.
24/09/2023
Ing. Dr. Sc. Abraham Palacios
Velasquez 11
MEDIDAS DE RESUMEN
Entre las medidas que permiten resumir
información proveniente de una población,
podemos considerar las medidas de posición,
medidas de dispersión y medidas de forma.
24/09/2023
Ing. Dr. Sc. Abraham Palacios
Velasquez 12
Medidas de Media
Tendencia Mediana
Central Moda
Medidas de
Posición Percentiles
Cuartiles
Deciles
Medidas de Rango
Resumen Medidas de Recorrido Intercuartílico
Dispersión Varianza, Desviación Estándar
Coeficiente de Variación
Medidas de Asimetría
Forma Apuntamiento
24/09/2023
Ing. Dr. Sc. Abraham Palacios
Velasquez 13
24/09/2023
Ing. Dr. Sc. Abraham Palacios
Velasquez 14
Medidas de Posición
Tienen por objeto, obtener un valor que
resuma en sí todas las mediciones. La
mayoría de ellas trata de ubicar el centro
de la distribución, razón por la cual, se
llaman MEDIDAS DE TENDENCIA
CENTRAL; estas son: Media, Mediana
y Moda.
24/09/2023
Ing. Dr. Sc. Abraham Palacios
Velasquez 15
MEDIDAS DE TENDENCIA CENTRAL
Media Aritmética, Media o Promedio:
Es una de las medidas de tendencia central de
mayor uso. La media muestral se simboliza
por y la media poblacional de denota por
.
X
X
24/09/2023
Ing. Dr. Sc. Abraham Palacios
Velasquez 16
MEDIDAS DE TENDENCIA CENTRAL. MEDIA ARITMÉTICA
CARACTERÍSTICAS:
• Es sensible a la variación de las puntuaciones
• Si hay intervalos de clase abiertos no se puede calcular
• No es recomendable cuando hay valores muy extremos
-DATOS SIN AGRUPAR:
X = x1 + x2 + x3 + ....... + xn = Σxi
N N
Es la suma de todos los valores de una variable dividida
por el número total de ellos.
_
-DATOS AGRUPADOS:
X = Σxi . fi
N
_
24/09/2023
Ing. Dr. Sc. Abraham Palacios
Velasquez 17
PROMEDIO PARA DATOS NO TABULADOS
Sea X una variable cuantitativa y x1, x2,…, xn
una muestra de tamaño "n" de valores de la
variable, se define la media aritmética de X como:
n
x
x
x
x
X n





.....
3
2
1
Esta expresión se puede escribir también , como:
n
x
X
n
i
i


 1
24/09/2023
Ing. Dr. Sc. Abraham Palacios
Velasquez 18
CÁLCULO DE LA MEDIA. EJEMPLOS
1.- DATOS NO AGRUPADOS: Calcular la T.A. sistólica
media de 5 pacientes en los que se han obtenido las
siguientes cifras. 110, 118, 125, 136, 145
X = 110 + 118 + 125 + 136 + 145 = 634 = 126,8
5 5
_
2.- DATOS AGRUPADOS:
xi fi xi . fi
1 3 3
2 4 8
3 6 18
4 5 20
5 2 10
___ ___
20 59
X = Σxi . fi = 59 = 2,95
N 20
_
24/09/2023 19
Ing. Dr. Sc. Abraham Palacios
Velasquez
24/09/2023 20
Ing. Dr. Sc. Abraham Palacios
Velasquez
24/09/2023
Ing. Dr. Sc. Abraham Palacios
Velasquez 21
1
n
i
fd
X A
n

 

MEDIAARITMETICA
METODO LARGO
METODO CLAVE
1
n
i
fu
X A C
n

 
 
 
 
 
 
 

A = Es cualquier supuesta media aritmética
C = Tamaño del intervalo
n = Conjunto de números
d = desviaciones.
u = desviaciones
= Sumatoria de frecuencias
1
n
i
i
f


24/09/2023
Ing. Dr. Sc. Abraham Palacios
Velasquez 22
PROPIEDADES DE LA MEDIAARITMETICA
1ra Propiedad
2da Propiedad
3ra Propiedad
M (x) = M (b) = b
( ) ( )
Y M y M x b
  
( ) ( )
Y M y aM x
 
4ta Propiedad
1
( ) 0
n
i
i
x X

 

24/09/2023
Ing. Dr. Sc. Abraham Palacios
Velasquez 23
5ta Propiedad
6ta Propiedad
7ma Propiedad
2 2
1 1
( ) ( )
n n
i i i i
i i
n y Y n y a
 
  
 
( ) ( ) ( )
M x y M x M y
  
Total NX

24/09/2023
Ing. Dr. Sc. Abraham Palacios
Velasquez 24
Ventajas de la media aritmética
1.- Es un concepto familiar a la mayoría de las personas e intuitivamente
claro.
2.- Es una medida que se puede calcular y es única. Ya que cada conjunto
de datos tiene una y sola media.
3.- En le calculo de la media, es tomada en cuenta cada observación del
conjunto de datos.
4.- La media es una medida digna de confianza, porque se determina con
mayor certeza que otras características de un conjunto de datos.
Desventajas de la media aritmética
1.- La media aritmética puede verse afectada por valores extremos que
no son representativos del resto de observaciones. Por ello, cuando se
esta utilizando esta mediad en un análisis, vale la pena advertir la
representatividad de los valores extremos y la influencia que estos tiene
sobre el resultado.
24/09/2023
Ing. Dr. Sc. Abraham Palacios
Velasquez 25
Medias
•Media generalizada de orden p.
Propiedad: xp xp+
•Media armónica
1
1
1 p
p p
p p i i
i
M a n x
N 
  
1 1
1
i
i i
N
H M
n
x


 

24/09/2023
Ing. Dr. Sc. Abraham Palacios
Velasquez 26
•Media Geométrica
Media Aritmética Simple
0
1
i
I
n
N
i
i
g M x

  
1
1
1
1
i i
i
X M n x
N 
  
•Media Aritmética Ponderadas
1 1
1 1
1
i i i
i i
X p x Siendo p N
N  
 
 
24/09/2023
Ing. Dr. Sc. Abraham Palacios
Velasquez 27
LA MEDIANA
1
´
1
1
2
j
i j
j j
n
N
Me y c
N N



 

 
   

 
 
Cj = amplitud de la clase mediana
Nj = Frecuencia absoluta acumulada de la clase mediana
N = numero de observaciones
Y i-1= Limite inferior de la clase mediana
Nj-1= Frecuencia absoluta acumulada antes de la medina
24/09/2023
Ing. Dr. Sc. Abraham Palacios
Velasquez 28
Mediana (Me)
Sea X una variable por lo menos ordinal y sea x1, x2,…xn una
muestra de tamaño n de observaciones de la variable, se define
como Mediana "Me" un valor tal que supera a no más del 50%
de las observaciones y es superado por no más del 50% de las
observaciones, cuando estas han sido ordenadas según
magnitud.
impar
es
n
si
x
Me
par
es
n
si
x
x
Me
n
n
n
2
1
1
2
2
2





MEDIANA PARA DATOS NO TABULADOS
24/09/2023
Ing. Dr. Sc. Abraham Palacios
Velasquez 29
MEDIDAS DE TENDENCIA CENTRAL. MEDIANA
- DATOS SIN AGRUPAR:
a) Nº de datos impares: Valor central
7,4,2,5,9 2,4,5,7,9 X = 5
b) Nº de datos pares: Media de los dos valores centrales:
7,4,2,5,9,6 2,4,5,6,7,9 X = 5 +6 = 5,5
2
La mediana de una serie de N datos ordenados en orden
creciente o decreciente es la puntuación que ocupa el valor
central de la distribución.
24/09/2023
Ing. Dr. Sc. Abraham Palacios
Velasquez 30
- DATOS AGRUPADOS:
La mediana es el valor de la variable que tiene la propiedad
de que los valores menores que él son tan frecuentes como los
mayores que él.
X = Li + N/2 – fd
fc
donde: Li = Límite inferior del intervalo crítico
N = Nº total de datos
fd = Frecuencia acumulada por debajo del intervalo crítico
fc = Frecuencia del intervalo crítico
i = Amplitud del intervalo
MEDIDAS DE TENDENCIA CENTRAL. MEDIANA
. i
24/09/2023
Ing. Dr. Sc. Abraham Palacios
Velasquez 31
INTERVALOS fi Fac.
151,5 – 172,5 5 5
172,5 – 193,5 7 12
193,5 – 214,5 9 21
214,5 – 235,5 6 27
235,5 – 256,5 3 30
___
30
X = Li + N/2 – fd . i = 193,5 + 30 /2 - 12 . 21 = 200,5
fc 9
24/09/2023 32
Ing. Dr. Sc. Abraham Palacios
Velasquez
24/09/2023
Ing. Dr. Sc. Abraham Palacios
Velasquez 33
CARACTERÍSTICAS DE LA MEDIANA
• Es menos sensible que la media a la variación
de las puntuaciones.
• Se puede calcular aunque existan algún
intervalo abierto, siempre que no sea ese el
intervalo crítico.
• Es más representativa cuando la distribución
tiene puntuaciones muy extremas.
24/09/2023
Ing. Dr. Sc. Abraham Palacios
Velasquez 34
Ventajas de la mediana
1.- La mediana es fácil de entender y puede ser calculada a partir de
cualquier clase de datos
2.- La mediana esta afectada por el numero de observaciones y no por la
magnitud de cualquier valor extremo
3.- Se puede encontrar la medina inclusive de datos cualitativos ordinal
Desventajas de la Mediana
1.- Se debe organizar los datos antes de realizar cualquier tipo de calculo
para determinar la mediana.
2.-Ciertos procedimientos estadísticos que usan la medina son muchos
mas complejos que aquellos que usan la media.
3.- La mediana no es adecuada a manipulaciones algebraicas posteriores.
24/09/2023
Ing. Dr. Sc. Abraham Palacios
Velasquez 35
PROPIEDADES DE LA MEDIANA
1ra Propiedad
2da Propiedad
1
( ) min
n
i i
i
n y Me imo

 

1
2
m
Me y 

2
,
m
Me y

Si m es impar
Si m es par
24/09/2023
Ing. Dr. Sc. Abraham Palacios
Velasquez 36
LA MODA
L1 = Limite inferior de la clase modal
= Exceso de la frecuencia modal sobre la frecuencia de
la clase contigua inferior
= Exceso de la frecuencia modal sobre la frecuencia de
la clase contigua superior
C = Tamaño del intervalo de clase modal
1

2

1
1 2
i
Moda L c
 
   

 
24/09/2023
Ing. Dr. Sc. Abraham Palacios
Velasquez 37
171 174 169 171 173 166 162 150
162 175 169 162 168 167 180 154
180 172 170 171 173 167 182 170
163 175 155 185 173 170 183 167
161 175 156 172 174 173 184 165
164 176 157 170 171 168 174 170
170 176 158 174 185 174 172 159
165 177 170 175 186 168 168 159
166 178 172 172 189 169 174 160
166 179 171 173 192 169 174 163
24/09/2023
Ing. Dr. Sc. Abraham Palacios
Velasquez 38
Moda o Modo (Mo)
Como su nombre lo indica es aquel valor de la variable
que tiene una mayor frecuencia.
Si consideramos el ejemplo N°2 del peso de
una muestra de personas:
65 76 48 48 68 78 90 87 67 72 78
Mo = 48 kilos
Mo = 78 kilos.
Esto significa que la mayoría de estas personas
pesa 48 kilos y 78 kilos.
Esta distribución es bimodal.
24/09/2023 39
Ing. Dr. Sc. Abraham Palacios
Velasquez
24/09/2023
Ing. Dr. Sc. Abraham Palacios
Velasquez 40
MEDIDAS DE TENDENCIA CENTRAL. MODA
Es el valor de la variable a la que corresponde la máxima
frecuencia.
Si los datos están agrupados en intervalos, la moda es la
marca de clase del intervalo con mayor frecuencia.
CARACTERÍSTICAS:
• Es muy sencilla de obtener.
• Se puede calcular aunque existan intervalos abiertos,
siempre que no esté incluida en él.
• Es poco representativa.
24/09/2023
Ing. Dr. Sc. Abraham Palacios
Velasquez 41
Ventajas de la Moda
1.- La moda, se puede usar como una localización tanto para datos
cualitativos como cuantitativos
2.- La moda no esta indebidamente afectada por valores extremos. Aun si
los valores altos son muy altos y los valores pequeños muy pequeños, se
escoge el valor mas frecuente del conjunto de datos como el valor modal.
3.- La moda se puede calcular aun cuando una mas de las clases sean
abiertas en los extremos.
Desventajas de la moda
1.- Muy a menudo, no hay un valor modal, por que el conjunto de datos
no contiene valores que se repiten mas de una vez. Otras veces, cada
valor es la moda, por que cada uno aparece el mismo numero de veces.
Claramente, la moda no es una medida útil en estos casos.
2.- Cuando el conjunto de observaciones contiene dos, tres o mas modas,
estas son difíciles de interpretar y comparar
24/09/2023
Ing. Dr. Sc. Abraham Palacios
Velasquez 42
5. COMPARACION ENTRE MEDIDAS DE
TENDENCIA CENTRAL
¿CUANDO ELEGIR MEDIA, MEDIANA
O MODA?
NORMA GENERAL:
1º MEDIA.
2º MEDIANA.
3º MODA.
RAZONES PARA PREFERIR LA
MEDIA:
1. EN ELLA SE BASAN OTROS
ESTADISTICOS.
2. LAS MEDIAS MUESTRALES SON
MEJORES ESTIMADORES DE LOS
PARAMETROS POBLACIONALES.
24/09/2023
Ing. Dr. Sc. Abraham Palacios
Velasquez 43
¿CUANDO ELEGIR LA MEDIANA EN
LUGAR DE LA MEDIA?:
1. CUANDO LA VARIABLE ESTE
MEDIDA EN UNA ESCALA ORDINAL.
2. CUANDO HAYA VALORES EXTREMOS,
PUES ESTOS DISTORSIONAN LA
INTERPRETACION DE LA MEDIA.
EJEMPLO: 3,4,8,5,6,124 Media=25
LA MEDIA ES MUY SENSIBLE A LAS
PUNTUACIONES EXTREMAS
3. CUANDO HAYA INTERVALOS
ABIERTOS, YA QUE ESTOS CARECEN
DE PUNTO MEDIO.
24/09/2023
Ing. Dr. Sc. Abraham Palacios
Velasquez 44
¿CUANDO ELEGIR LA MODA EN
LUGAR DE LA MEDIANA ?:
1. CUANDO LA VARIABLE ESTE
MEDIDA EN UNA ESCALA NOMINAL.
2. CUANDO HAYA INTERVALOS
ABIERTOS Y LA MEDIANA
PERTENEZCA A UNO DE ELLOS.
EL CALCULO DE LA MEDIANA (C50)
SUPONE UNA DISTRIBUCION
HOMOGENEA DE LOS VALORES
DENTRO DEL INTERVALO.
ESTE SUPUESTO SOLO SE PUEDE
MANTENER SI EL INTERVALO ESTA
CERRADO.
24/09/2023
Ing. Dr. Sc. Abraham Palacios
Velasquez 45
LAS TRES MEDIDAS DE TENDENCIA
CENTRAL COINCIDEN CUANDO LA
DISTRIBUCION ES UNIMODAL Y
SIMETRICA (EJEMPLO: DISTRIBUCION
NORMAL).
CUANTO MAS ASIMETRIA, MAS
DIFERENCIAS ENTRE ELLAS.
24/09/2023
Ing. Dr. Sc. Abraham Palacios
Velasquez 46
• Se refiere a la simetría respecto a la media.
Si f es la función de distribución, diremos que la
distribución es:
Distribución simétrica
0
2
4
6
8
10
12
m-a
m
m+a
Densidad
Asimetría negativa
0
1
2
3
4
5
6
7
8
1 2 3 4 5 6 7 8 9
Densidad
0
1
2
3
4
5
6
7
8
1 2 3 4 5 6 7 8 9
Densidad
Asimetría positiva
( ) ( )
f media a f media a
  
Simétrica si para todo a es
( ) ( )
f media a f media a
  
Asimetría negativa si para algún a es
( ) ( )
f media a f media a
  
Asimetría positiva si para algún a es
24/09/2023
Ing. Dr. Sc. Abraham Palacios
Velasquez 47
RELACION ENTRE LA MODA, MEDIA Y MEDIAN EN
DISTRIBUCION SIMETRICA Y ASIMETRICA
1.- En la distribución de frecuencias simétricas cuya
representación grafica es acampanada y además unimodal,
coinciden exactamente en el mismo valor; media, median y
moda.
2.- Si la distribución tiene la forma acampanada, es unimodal,
pero no tiene simetría las tres medidas toman valores
diferentes, y la mediana queda comprendida
generalmente entre la moda y la media aritmética
a.- Si la asimetría a la derecha o positiva X>Me >Mo
b.- Si la asimetría es a la izquierda o negativa: X<Me <Mo
c.- Si la distribución es moderadamente asimétrica y
unimodal, se cumple aproximadamente la relación;
X – Mo = 3 (x - Me)
24/09/2023
Ing. Dr. Sc. Abraham Palacios
Velasquez 48
Una distribución estadística viene dada por la siguiente
tabla:
Hallar:
La moda, mediana y media.
Frecue
ncia
10-15 15-20 20-25 25-30 30-35
f 3 5 7 4 2
EJERCICIO
24/09/2023
Ing. Dr. Sc. Abraham Palacios
Velasquez 49
xi fi Fi xi · fi
|x − x |
· fi
xi
2 · fi
[10, 15) 12.5 3 3 37.5 27.857 468.75
[15, 20) 17.5 5 8 87.5 21.429 1537.3
[20, 25) 22.5 7 15 157.5 5 3543.8
[25, 30) 27.5 4 19 110 22.857 3025
[30, 35) 32.5 2 21 65 21.429 2112.5
21 457.5 98.571
10681.2
5
24/09/2023
Ing. Dr. Sc. Abraham Palacios
Velasquez 50
MODA
MEDIANA
MEDIA
24/09/2023
Ing. Dr. Sc. Abraham Palacios
Velasquez 51
PROBLEMAS DE REPASO
Se tiene una distribución de frecuencia simétrica, con 6
intervalos de clase de amplitud constante, y los siguientes
datos:
n =150; n3=30 y’5=5 n2=n1+5
Q1=43.5
Calcule:
a) El sexto decil
b) El 90 percentil
c) El valor que es superado por el 15 % de la
Informacion
24/09/2023
Ing. Dr. Sc. Abraham Palacios
Velasquez 52
Solución
1.- Como la distribución es simétrica, con m=6, entonces
n1=n6; n2=n5; n3=n4=30
2.- Como n=150, entonces n1+n2+n3=75
luego n1 + n1 + 5 + 30 =75
2 n1 = 75 – 25
De donde n1=20 y n2 + 5 = 25
24/09/2023
Ing. Dr. Sc. Abraham Palacios
Velasquez 53
Con los datos disponibles hasta ahora, puede disponerse
ene una tabla de frecuencias incluyendo las frecuencias
acumuladas
Y’i-1 ------- y’i ni Ni
Y’0 ------- y’1 20 20
Y’1 ------- y’2 25 45
Y’2 ------- y’3 30 75
Y’3 ------- y’4 30 105
Y’4 ------- 60 25 130
60 ------- y’6 20 150
Totales 150
24/09/2023
Ing. Dr. Sc. Abraham Palacios
Velasquez 54
3.-Calculo de c=amplitud de clase constante. Para lo cual
usamos el dato de Q1=43.5
a) Determínanos
b) De la tabla, de frecuencias absolutas acumuladas que
supere a es N2 = 45
Entonces j = 2 y j-1=1, por tanto, el intervalo de clase que
contiene a Q1 es y’1 - y’2
c) Como > N1 = 20
150
37.5
4 4
n
 
37.5
4
n

37.5
4
n

1
' '
1 1 1
2 1
37.5 20
4
45 20
n
N
Q y c y c
N N
 

  
 
   
   
 
 
 
 
24/09/2023
Ing. Dr. Sc. Abraham Palacios
Velasquez 55
Pero
' ' '
5 0 0 1
5 4 4 60
y y c y c c y c
       
'
1 60 4
y c
 
Reemplazando esta expresión en Q1, se tiene
15.5
43.5 60 4 60 4 0,7 60 3,3
25
c c c c c
       
3.3 60 43.5 16.6
c    De donde
16.5
5
3.3
c  
Y’i-1 ------- y’i ni Ni
35 ------- 40 20 20
40 ------- 45 25 45
45 ------- 50 30 75
50 ------- 55 30 105
55 ------- 60 25 130
60 ------- 656 20 150
Totales 150
24/09/2023
Ing. Dr. Sc. Abraham Palacios
Velasquez 56
a) Calculo del 6to decil
1.- La menor frecuencia acumulada que supere a
60 6 150
90
10 10
x
 
Es N4=105, luego j=4 y j-1=3, entonces la clase que
contiene a D6 es y’3 ---- y’4 = 50 --- 55
2.- Como se tiene
3
60
90 75
10
N
 
3
'
6 3
4 3
60
90 75 15
10 50 5 50 5 52.5
105 75 30
n
N
D y c
N N
 

  
   
      
   
 
 
   
 
 
b) Calculo del 90avo percentil
5
'
90 5
6 5
90
135 130 5
100 60 5 60 5 61.25
150 130 20
n
N
P y c
N N
 

  
   
      
   
 
 
   
 
 
24/09/2023
Ing. Dr. Sc. Abraham Palacios
Velasquez 57
c.- El valor que es superado por el 15 % de la
información corresponde al 85avo percentil o sea P85
Entonces
4
'
85 4
5 4
85
127.5 105 22.5
100 55 5 55 5 59.5
130 105 25
n
N
P y c
N N
 

  
   
      
   
 
 
   
 
 
24/09/2023
Ing. Dr. Sc. Abraham Palacios
Velasquez 58
En una distribución simétrica de 8 intervalos, que se refiere al
ingreso diario en S/. De 212 trabajadores de una empresa, donde se
conoce:
Moda= 19 amplitud de clase =4, n1=10 N6=186
Y Q1=14.375
Hallar
a) El ingreso mínimo del 30 % de los trabajadores de mayor
ingreso.
b) El sindicato solicita que el nuevo pacto colectivo se establezca
un salario mínimo de S/. 120 ?Que porcentaje de trabajadores
de beneficiara?
c) Los trabajadores que ganan mas de S/ 28.00 por dia, se supone
son muy calificados ?Que % de trabajadores pertenecen a este
grupo?
d) El ingreso medio por día de los trabajadores de la empresa
e) El ingreso mediano de la distribución.
24/09/2023
Ing. Dr. Sc. Abraham Palacios
Velasquez 59
1.- La distribución es simétrica con m=8 por entonces
' '
4
2
19
m
Mo y y
  
Como c=amplitud de clase =4, los limites de clase
restantes son:
'
3 19 4 15
y    '
2 11
y  '
1 7
y 
'
0 3
y 
'
5 19 4 23
y   
'
6 23 4 27
y    '
7 31
y  '
8 35
y 
Intervalo yi ni Ni
3 ----- 7 10 10
7 ----- 11 16 26
11 ----- 15 32 58
15 ----- 19 48 106
19 ----- 23 48 154
23 ----- 27 32 186
27 ----- 31 16 202
31 ----- 35 10 212
24/09/2023
Ing. Dr. Sc. Abraham Palacios
Velasquez 60
1
'
1
1 3
53 26 27
4
14.375 11 4 11 4
26 26
j
j
j j
n
N
y c
N N n n



 

   

 
       
   
  
   
 
 
O sea 14.375+11n3+108
n3= 32=n6
Entonces n4=80-32=48=n5
a) El ingreso minimo del 30 %
1
'
30 1
1
70
148 106
4 19 4 22.53
154 106
j
j
j j
n
N
P y c
N N



 

  
 
    
   
 
 
 
 
24/09/2023
Ing. Dr. Sc. Abraham Palacios
Velasquez 61
b) Se beneficiara todos los trabajadores que tengan un
ingreso por debajo de S/. 12.00 diarios.
1.- Primero determinaremos el numero de
trabajadores que reciban un sueldo debajo de S/. 12.00.
Este salario se encuentra en el tercer intervalo.
N=10+16+r
11 r 12 15
Si una amplitud de 4 le corresponde 32 observaciones a
una amplitud de 12 – 11=1 le corresponde r
observaciones. Es decir:
32(12 11) 32 1
8
4 4
x
r

  
32(12 11)
10 16 10 16 8 34
4
N

      
24/09/2023
Ing. Dr. Sc. Abraham Palacios
Velasquez 62
2.- Calculamos el porcentaje, que estará dado por
34
100 100 16.04%
212
N
P x x
n
  
c) En forma complementa mente análoga al caso anterior, el
numero de trabajadores que pertenece al grupo muy
calificado será aproximadamente
16(31 28)
10 4 3 10 22
4
M x

    
22
100 100 10.38%
212 212
M
P x x
  
d) La distribución es simétrica con m=8 par (m=numero de
clases) Entonces: ' '
4
2
19
m
Y y y Mo
   
e) Por la misma razón anterior Me = 19
24/09/2023
Ing. Dr. Sc. Abraham Palacios
Velasquez 63

Más contenido relacionado

Similar a MedidasdeTendenciacentral.ppt

Medidas de tendencia central Estadística
Medidas de tendencia central EstadísticaMedidas de tendencia central Estadística
Medidas de tendencia central Estadística
Universidad Particular de Loja
 
Medidas de tendencia central
Medidas de tendencia centralMedidas de tendencia central
Medidas de tendencia central
eradio2508
 
Prueba de reconocimiento de comp y capa 4° mate
Prueba de reconocimiento de comp y capa 4° matePrueba de reconocimiento de comp y capa 4° mate
Prueba de reconocimiento de comp y capa 4° mate
Reymundo Salcedo
 
Py e 10
Py e 10Py e 10
Py e 10
Py e 10Py e 10
Unidad I.pdf
Unidad I.pdfUnidad I.pdf
Unidad I.pdf
FidelParedes6
 
clase de estadística para la educación matematica
clase de estadística para la educación matematicaclase de estadística para la educación matematica
clase de estadística para la educación matematica
EDSONAVAlayo
 
Separata de medidas variabilidad o dispersion
Separata de medidas variabilidad o dispersionSeparata de medidas variabilidad o dispersion
Separata de medidas variabilidad o dispersionLuis Alberto Fernandez
 
Separata de medidas variabilidad o dispersion
Separata de medidas variabilidad o dispersionSeparata de medidas variabilidad o dispersion
Separata de medidas variabilidad o dispersionLuis Alberto Fernandez
 
utilicemos medidas de tendencia central
 utilicemos medidas de tendencia central utilicemos medidas de tendencia central
utilicemos medidas de tendencia central
Stanley Arias
 
Medidas de tendencia central
Medidas de tendencia centralMedidas de tendencia central
Medidas de tendencia central
SalomonVillacres
 
Diapositivas de metodos no parametricos
Diapositivas de metodos no parametricosDiapositivas de metodos no parametricos
Diapositivas de metodos no parametricosMarlon Villacis
 
Urquizo roni
Urquizo roniUrquizo roni
Urquizo roni
Ronny Urquizo
 
Medidas de Tendencia Central en la estadística
Medidas de Tendencia Central en la estadísticaMedidas de Tendencia Central en la estadística
Medidas de Tendencia Central en la estadística
ELERARIOSKARENALEJAN
 
Estadistica descriptiva
Estadistica descriptivaEstadistica descriptiva
Estadistica descriptivachica_morales
 
Nociones basicas-estadisticas-educacion
Nociones basicas-estadisticas-educacionNociones basicas-estadisticas-educacion
Nociones basicas-estadisticas-educacion
paulminiguano
 

Similar a MedidasdeTendenciacentral.ppt (20)

Medidas de tendencia central Estadística
Medidas de tendencia central EstadísticaMedidas de tendencia central Estadística
Medidas de tendencia central Estadística
 
Medidas de tendencia central
Medidas de tendencia centralMedidas de tendencia central
Medidas de tendencia central
 
Tercer corte
Tercer corteTercer corte
Tercer corte
 
Prueba de reconocimiento de comp y capa 4° mate
Prueba de reconocimiento de comp y capa 4° matePrueba de reconocimiento de comp y capa 4° mate
Prueba de reconocimiento de comp y capa 4° mate
 
Py e 10
Py e 10Py e 10
Py e 10
 
Py e 10
Py e 10Py e 10
Py e 10
 
Guia de estadistica
Guia de estadisticaGuia de estadistica
Guia de estadistica
 
Fisica. Periodo de un pendulo
Fisica. Periodo de un penduloFisica. Periodo de un pendulo
Fisica. Periodo de un pendulo
 
Unidad I.pdf
Unidad I.pdfUnidad I.pdf
Unidad I.pdf
 
clase de estadística para la educación matematica
clase de estadística para la educación matematicaclase de estadística para la educación matematica
clase de estadística para la educación matematica
 
Separata de medidas variabilidad o dispersion
Separata de medidas variabilidad o dispersionSeparata de medidas variabilidad o dispersion
Separata de medidas variabilidad o dispersion
 
Separata de medidas variabilidad o dispersion
Separata de medidas variabilidad o dispersionSeparata de medidas variabilidad o dispersion
Separata de medidas variabilidad o dispersion
 
utilicemos medidas de tendencia central
 utilicemos medidas de tendencia central utilicemos medidas de tendencia central
utilicemos medidas de tendencia central
 
Medidas de tendencia central
Medidas de tendencia centralMedidas de tendencia central
Medidas de tendencia central
 
Diapositivas de metodos no parametricos
Diapositivas de metodos no parametricosDiapositivas de metodos no parametricos
Diapositivas de metodos no parametricos
 
Urquizo roni
Urquizo roniUrquizo roni
Urquizo roni
 
Medidas de Tendencia Central en la estadística
Medidas de Tendencia Central en la estadísticaMedidas de Tendencia Central en la estadística
Medidas de Tendencia Central en la estadística
 
Estadistica descriptiva
Estadistica descriptivaEstadistica descriptiva
Estadistica descriptiva
 
Estadistica+basica
Estadistica+basicaEstadistica+basica
Estadistica+basica
 
Nociones basicas-estadisticas-educacion
Nociones basicas-estadisticas-educacionNociones basicas-estadisticas-educacion
Nociones basicas-estadisticas-educacion
 

Último

MODELO PEDAG DE LA FPI SENA PARA LA FORMACION PROFESIONAL E INTEGRAL
MODELO PEDAG DE LA FPI SENA PARA LA FORMACION PROFESIONAL E INTEGRALMODELO PEDAG DE LA FPI SENA PARA LA FORMACION PROFESIONAL E INTEGRAL
MODELO PEDAG DE LA FPI SENA PARA LA FORMACION PROFESIONAL E INTEGRAL
Fernando540828
 
Solucionario 5° P2P16.pptxihiuhiuhihihini
Solucionario 5° P2P16.pptxihiuhiuhihihiniSolucionario 5° P2P16.pptxihiuhiuhihihini
Solucionario 5° P2P16.pptxihiuhiuhihihini
corderojulia187
 
QUÉ ES ALARA proteccion rayografica.pptx
QUÉ ES ALARA proteccion rayografica.pptxQUÉ ES ALARA proteccion rayografica.pptx
QUÉ ES ALARA proteccion rayografica.pptx
AnthonyFernandoArias
 
TRABAJO DE TECNOLOGIA increíble y próspero epico
TRABAJO DE TECNOLOGIA increíble y próspero epicoTRABAJO DE TECNOLOGIA increíble y próspero epico
TRABAJO DE TECNOLOGIA increíble y próspero epico
edepjuanorozco
 
Las plantas ornamental su importancia, sus variedades etc
Las plantas ornamental su importancia, sus variedades etcLas plantas ornamental su importancia, sus variedades etc
Las plantas ornamental su importancia, sus variedades etc
60475271
 
TAREA DE TECNOLOGIA DE LA FICHHA 1 Y DOS
TAREA DE TECNOLOGIA DE LA FICHHA 1 Y DOSTAREA DE TECNOLOGIA DE LA FICHHA 1 Y DOS
TAREA DE TECNOLOGIA DE LA FICHHA 1 Y DOS
darlingreserved
 
Presentación- PLATAFORMA VIRTUAL E-LEARNING .pptx
Presentación-  PLATAFORMA VIRTUAL E-LEARNING .pptxPresentación-  PLATAFORMA VIRTUAL E-LEARNING .pptx
Presentación- PLATAFORMA VIRTUAL E-LEARNING .pptx
arelisguerra707
 

Último (7)

MODELO PEDAG DE LA FPI SENA PARA LA FORMACION PROFESIONAL E INTEGRAL
MODELO PEDAG DE LA FPI SENA PARA LA FORMACION PROFESIONAL E INTEGRALMODELO PEDAG DE LA FPI SENA PARA LA FORMACION PROFESIONAL E INTEGRAL
MODELO PEDAG DE LA FPI SENA PARA LA FORMACION PROFESIONAL E INTEGRAL
 
Solucionario 5° P2P16.pptxihiuhiuhihihini
Solucionario 5° P2P16.pptxihiuhiuhihihiniSolucionario 5° P2P16.pptxihiuhiuhihihini
Solucionario 5° P2P16.pptxihiuhiuhihihini
 
QUÉ ES ALARA proteccion rayografica.pptx
QUÉ ES ALARA proteccion rayografica.pptxQUÉ ES ALARA proteccion rayografica.pptx
QUÉ ES ALARA proteccion rayografica.pptx
 
TRABAJO DE TECNOLOGIA increíble y próspero epico
TRABAJO DE TECNOLOGIA increíble y próspero epicoTRABAJO DE TECNOLOGIA increíble y próspero epico
TRABAJO DE TECNOLOGIA increíble y próspero epico
 
Las plantas ornamental su importancia, sus variedades etc
Las plantas ornamental su importancia, sus variedades etcLas plantas ornamental su importancia, sus variedades etc
Las plantas ornamental su importancia, sus variedades etc
 
TAREA DE TECNOLOGIA DE LA FICHHA 1 Y DOS
TAREA DE TECNOLOGIA DE LA FICHHA 1 Y DOSTAREA DE TECNOLOGIA DE LA FICHHA 1 Y DOS
TAREA DE TECNOLOGIA DE LA FICHHA 1 Y DOS
 
Presentación- PLATAFORMA VIRTUAL E-LEARNING .pptx
Presentación-  PLATAFORMA VIRTUAL E-LEARNING .pptxPresentación-  PLATAFORMA VIRTUAL E-LEARNING .pptx
Presentación- PLATAFORMA VIRTUAL E-LEARNING .pptx
 

MedidasdeTendenciacentral.ppt

  • 1. 24/09/2023 Ing. Dr. Sc. Abraham Palacios Velasquez 1 HUANCAYO - PERU 2023
  • 2. 24/09/2023 Ing. Dr. Sc. Abraham Palacios Velasquez 2 I. CONSTRUCCION DE UNA DISTRIBUCION DE FRECUENCIAS A.-Sean las siguientes cifras, los pH de bebidas carbonatadas, que se han tomado n = 56 unidades, siendo entre acido y básico. 7.3 6.3 8.1 7.2 4.4 5.2 6.9 5.5 3.0 7.5 3.8 4.3 7.5 6.7 6.6 6.1 7.6 8.7 8.4 3.9 7.2 6.2 8.2 5.8 7.5 8.9 6.9 7.3 5.3 5.9 7.9 8.7 9.5 6.3 4.3 5.0 5.9 3.8 6.4 7.0 7.4 8.4 6.3 8.2 6.3 4.8 9.5 5.2 5.9 7.7 7.5 6.8 3.6 4.7 6.5 5.3 CUADRO 01 B.-El siguiente paso es ordenarlos sea en sentido creciente o en sentido decreciente. En el presente libro ordenamos en sentido creciente es decir del menor dato al mayor dato C.-De la tabla de datos se puede distinguir entre los números el menor valor 3.0 y el mayor valor 9.5.
  • 3. 24/09/2023 Ing. Dr. Sc. Abraham Palacios Velasquez 3 II. CONSTRUCCION INTERVALOS DE CLASE Y LÍMITES DE CLASE Para la construcción de los intervalos de clase o limites de clase, se realiza según los siguientes pasos: a.- ¿Cuántas CLASES O INTERVALOS necesitaremos? Para saber esto se utiliza la formula de Sturges (empírica). K = 1 + 3.3 log n o En donde: K = número de intervalos o clases n = número de datos (tamaño de la muestra) Remplazando en la formula K = 1 + 3.3 log 56 = 1 + 3.3 (1.748) K = 6.8 Pero se ha dicho que la formula es empírica, entonces para obtener el numero que realmente es necesario, redondeamos al siguiente entero mayor. K = 7 10 n  k n  24 400 n  
  • 4. 24/09/2023 Ing. Dr. Sc. Abraham Palacios Velasquez 4 b.- Calculara el RECORRIDO O EXTENSIÓN de los datos que se denota con la letra R, su fórmula es: R = Valor máximo – valor mínimo Se debe sumar el número 1 cuando los datos se expresan en números enteros. Si los datos son decimales no se suma 1. R = 9.5 – 3.0 R = 6.5 Entonces La extensión o recorrido es 6.5.
  • 5. 24/09/2023 Ing. Dr. Sc. Abraham Palacios Velasquez 5 c.- Determinar el ANCHO O AMPLITUD DE CADA INTERVALO, y se representa con la letra C. en donde R = C . K Redondeamos a 0.93 R = C.K = 0.9285 x 7 = 6.4995 R´= C.K = 0.93 x 7 = 6.51
  • 6. 24/09/2023 Ing. Dr. Sc. Abraham Palacios Velasquez 6 d.-Teniendo en cuenta que este recorrido es mayor que el recorrido original buscaremos el exceso : Exceso = 6.51 – 6.4995 Exceso = 0.0105 El exceso proviene de haber aumentado la amplitud de cada intervalo de 0.9285 a 0.93 Para buscar la simetría de los datos, debemos repartir este exceso a los dos extremos del recorrido original, mitad para cada lado, 0.010 / 2 = 0.005 Restamos del valor mínimo 0.005 y súmanos 0.005 al valor máximo. 3.0 – 0.005 = 2.995 9.5 + 0.005 = 9.505 A partir del valor obtenido de 2.995 agregamos sucesivamente la amplitud de 0.93 y así obtenemos los puntos de división que determinan los 7 intervalos.
  • 7. 24/09/2023 Ing. Dr. Sc. Abraham Palacios Velasquez 7 Cuando se presenta que algunos datos coinciden con cualquiera de los puntos de división se debe tomar en cuenta lo siguiente: [ > Cerrado por la izquierda y abierto por la derecha. < ] Abierto por la izquierda y cerrado por la derecha [ ] Cerrado por ambos lados < > Abierto por ambos lados En la práctica los intervalos deben colocarse uno debajo del otro, formando una columna base o columna matriz, que dará origen a la distribución de frecuencias que vamos a formar. Intervalos o clases [2.995 – 3.925> [3.925 - 4.855> [4.855 - 5.785> [5.785 - 6.715> [6.715 - 7.645> [7.645 - 8.575> [8.575 - 9.505>
  • 8. 24/09/2023 Ing. Dr. Sc. Abraham Palacios Velasquez 8 e.- El siguiente paso, de este proceso de resumen, es ponernos de acuerdo que todos y cada uno de los datos que se hallen dentro de un mismo intervalo, estén representados por el mismo valor. Este valor caracteriza a la clase y por eso se llama MARCA DE CLASE, se obtiene promediando los extremos de cada intervalo. La marca de clase para los 7 intervalos son: 2.995 + 3.925/2 = 3.46 3.925 + 4.855/2 = 4.39 4.855 + 5.785/2 = 5.32 5.785 + 6.715/2 = 6.25 6.715 + 7.645/2 = 7.18 7.645 + 8.575/2 = 8.11 8.575 + 9.505/2 = 9.04
  • 9. 24/09/2023 Ing. Dr. Sc. Abraham Palacios Velasquez 9 f.- Ahora llevaremos a cabo la clasificación y el conteo de los datos, es decir, colocar cada uno de los datos en el intervalo que le corresponde. Intervalos o clases Marca de clase Frecuencias absoluta f ( ni ) [2.995 – 3.925> 3.46 5 [3.925 - 4.855> 4.39 5 [4.855 - 5.785> 5.32 6 [5.785 - 6.715> 6.25 14 [6.715 - 7.645> 7.18 14 [7.645 - 8.575> 8.11 7 [8.575 - 9.505> 9.04 5
  • 10. 24/09/2023 Ing. Dr. Sc. Abraham Palacios Velasquez 10 REGLA GENERAL PARA ELEBORAR LAS DISTRIBUCIONES DE FRECUENCIAS 1.- Determinar el número de clases (k) a considerar. 2.- Determinar el recorrido o rango de los datos (R). 3.- Determinar la amplitud o longitud de los intervalos de clase (C ) 4.- Determinar los limites de clase 5.- Se determina la marca de clase. 6.- Finalmente se halla la frecuencia absoluta de cada clase.
  • 11. 24/09/2023 Ing. Dr. Sc. Abraham Palacios Velasquez 11 MEDIDAS DE RESUMEN Entre las medidas que permiten resumir información proveniente de una población, podemos considerar las medidas de posición, medidas de dispersión y medidas de forma.
  • 12. 24/09/2023 Ing. Dr. Sc. Abraham Palacios Velasquez 12 Medidas de Media Tendencia Mediana Central Moda Medidas de Posición Percentiles Cuartiles Deciles Medidas de Rango Resumen Medidas de Recorrido Intercuartílico Dispersión Varianza, Desviación Estándar Coeficiente de Variación Medidas de Asimetría Forma Apuntamiento
  • 13. 24/09/2023 Ing. Dr. Sc. Abraham Palacios Velasquez 13
  • 14. 24/09/2023 Ing. Dr. Sc. Abraham Palacios Velasquez 14 Medidas de Posición Tienen por objeto, obtener un valor que resuma en sí todas las mediciones. La mayoría de ellas trata de ubicar el centro de la distribución, razón por la cual, se llaman MEDIDAS DE TENDENCIA CENTRAL; estas son: Media, Mediana y Moda.
  • 15. 24/09/2023 Ing. Dr. Sc. Abraham Palacios Velasquez 15 MEDIDAS DE TENDENCIA CENTRAL Media Aritmética, Media o Promedio: Es una de las medidas de tendencia central de mayor uso. La media muestral se simboliza por y la media poblacional de denota por . X X
  • 16. 24/09/2023 Ing. Dr. Sc. Abraham Palacios Velasquez 16 MEDIDAS DE TENDENCIA CENTRAL. MEDIA ARITMÉTICA CARACTERÍSTICAS: • Es sensible a la variación de las puntuaciones • Si hay intervalos de clase abiertos no se puede calcular • No es recomendable cuando hay valores muy extremos -DATOS SIN AGRUPAR: X = x1 + x2 + x3 + ....... + xn = Σxi N N Es la suma de todos los valores de una variable dividida por el número total de ellos. _ -DATOS AGRUPADOS: X = Σxi . fi N _
  • 17. 24/09/2023 Ing. Dr. Sc. Abraham Palacios Velasquez 17 PROMEDIO PARA DATOS NO TABULADOS Sea X una variable cuantitativa y x1, x2,…, xn una muestra de tamaño "n" de valores de la variable, se define la media aritmética de X como: n x x x x X n      ..... 3 2 1 Esta expresión se puede escribir también , como: n x X n i i    1
  • 18. 24/09/2023 Ing. Dr. Sc. Abraham Palacios Velasquez 18 CÁLCULO DE LA MEDIA. EJEMPLOS 1.- DATOS NO AGRUPADOS: Calcular la T.A. sistólica media de 5 pacientes en los que se han obtenido las siguientes cifras. 110, 118, 125, 136, 145 X = 110 + 118 + 125 + 136 + 145 = 634 = 126,8 5 5 _ 2.- DATOS AGRUPADOS: xi fi xi . fi 1 3 3 2 4 8 3 6 18 4 5 20 5 2 10 ___ ___ 20 59 X = Σxi . fi = 59 = 2,95 N 20 _
  • 19. 24/09/2023 19 Ing. Dr. Sc. Abraham Palacios Velasquez
  • 20. 24/09/2023 20 Ing. Dr. Sc. Abraham Palacios Velasquez
  • 21. 24/09/2023 Ing. Dr. Sc. Abraham Palacios Velasquez 21 1 n i fd X A n     MEDIAARITMETICA METODO LARGO METODO CLAVE 1 n i fu X A C n                 A = Es cualquier supuesta media aritmética C = Tamaño del intervalo n = Conjunto de números d = desviaciones. u = desviaciones = Sumatoria de frecuencias 1 n i i f  
  • 22. 24/09/2023 Ing. Dr. Sc. Abraham Palacios Velasquez 22 PROPIEDADES DE LA MEDIAARITMETICA 1ra Propiedad 2da Propiedad 3ra Propiedad M (x) = M (b) = b ( ) ( ) Y M y M x b    ( ) ( ) Y M y aM x   4ta Propiedad 1 ( ) 0 n i i x X    
  • 23. 24/09/2023 Ing. Dr. Sc. Abraham Palacios Velasquez 23 5ta Propiedad 6ta Propiedad 7ma Propiedad 2 2 1 1 ( ) ( ) n n i i i i i i n y Y n y a        ( ) ( ) ( ) M x y M x M y    Total NX 
  • 24. 24/09/2023 Ing. Dr. Sc. Abraham Palacios Velasquez 24 Ventajas de la media aritmética 1.- Es un concepto familiar a la mayoría de las personas e intuitivamente claro. 2.- Es una medida que se puede calcular y es única. Ya que cada conjunto de datos tiene una y sola media. 3.- En le calculo de la media, es tomada en cuenta cada observación del conjunto de datos. 4.- La media es una medida digna de confianza, porque se determina con mayor certeza que otras características de un conjunto de datos. Desventajas de la media aritmética 1.- La media aritmética puede verse afectada por valores extremos que no son representativos del resto de observaciones. Por ello, cuando se esta utilizando esta mediad en un análisis, vale la pena advertir la representatividad de los valores extremos y la influencia que estos tiene sobre el resultado.
  • 25. 24/09/2023 Ing. Dr. Sc. Abraham Palacios Velasquez 25 Medias •Media generalizada de orden p. Propiedad: xp xp+ •Media armónica 1 1 1 p p p p p i i i M a n x N     1 1 1 i i i N H M n x     
  • 26. 24/09/2023 Ing. Dr. Sc. Abraham Palacios Velasquez 26 •Media Geométrica Media Aritmética Simple 0 1 i I n N i i g M x     1 1 1 1 i i i X M n x N     •Media Aritmética Ponderadas 1 1 1 1 1 i i i i i X p x Siendo p N N      
  • 27. 24/09/2023 Ing. Dr. Sc. Abraham Palacios Velasquez 27 LA MEDIANA 1 ´ 1 1 2 j i j j j n N Me y c N N                  Cj = amplitud de la clase mediana Nj = Frecuencia absoluta acumulada de la clase mediana N = numero de observaciones Y i-1= Limite inferior de la clase mediana Nj-1= Frecuencia absoluta acumulada antes de la medina
  • 28. 24/09/2023 Ing. Dr. Sc. Abraham Palacios Velasquez 28 Mediana (Me) Sea X una variable por lo menos ordinal y sea x1, x2,…xn una muestra de tamaño n de observaciones de la variable, se define como Mediana "Me" un valor tal que supera a no más del 50% de las observaciones y es superado por no más del 50% de las observaciones, cuando estas han sido ordenadas según magnitud. impar es n si x Me par es n si x x Me n n n 2 1 1 2 2 2      MEDIANA PARA DATOS NO TABULADOS
  • 29. 24/09/2023 Ing. Dr. Sc. Abraham Palacios Velasquez 29 MEDIDAS DE TENDENCIA CENTRAL. MEDIANA - DATOS SIN AGRUPAR: a) Nº de datos impares: Valor central 7,4,2,5,9 2,4,5,7,9 X = 5 b) Nº de datos pares: Media de los dos valores centrales: 7,4,2,5,9,6 2,4,5,6,7,9 X = 5 +6 = 5,5 2 La mediana de una serie de N datos ordenados en orden creciente o decreciente es la puntuación que ocupa el valor central de la distribución.
  • 30. 24/09/2023 Ing. Dr. Sc. Abraham Palacios Velasquez 30 - DATOS AGRUPADOS: La mediana es el valor de la variable que tiene la propiedad de que los valores menores que él son tan frecuentes como los mayores que él. X = Li + N/2 – fd fc donde: Li = Límite inferior del intervalo crítico N = Nº total de datos fd = Frecuencia acumulada por debajo del intervalo crítico fc = Frecuencia del intervalo crítico i = Amplitud del intervalo MEDIDAS DE TENDENCIA CENTRAL. MEDIANA . i
  • 31. 24/09/2023 Ing. Dr. Sc. Abraham Palacios Velasquez 31 INTERVALOS fi Fac. 151,5 – 172,5 5 5 172,5 – 193,5 7 12 193,5 – 214,5 9 21 214,5 – 235,5 6 27 235,5 – 256,5 3 30 ___ 30 X = Li + N/2 – fd . i = 193,5 + 30 /2 - 12 . 21 = 200,5 fc 9
  • 32. 24/09/2023 32 Ing. Dr. Sc. Abraham Palacios Velasquez
  • 33. 24/09/2023 Ing. Dr. Sc. Abraham Palacios Velasquez 33 CARACTERÍSTICAS DE LA MEDIANA • Es menos sensible que la media a la variación de las puntuaciones. • Se puede calcular aunque existan algún intervalo abierto, siempre que no sea ese el intervalo crítico. • Es más representativa cuando la distribución tiene puntuaciones muy extremas.
  • 34. 24/09/2023 Ing. Dr. Sc. Abraham Palacios Velasquez 34 Ventajas de la mediana 1.- La mediana es fácil de entender y puede ser calculada a partir de cualquier clase de datos 2.- La mediana esta afectada por el numero de observaciones y no por la magnitud de cualquier valor extremo 3.- Se puede encontrar la medina inclusive de datos cualitativos ordinal Desventajas de la Mediana 1.- Se debe organizar los datos antes de realizar cualquier tipo de calculo para determinar la mediana. 2.-Ciertos procedimientos estadísticos que usan la medina son muchos mas complejos que aquellos que usan la media. 3.- La mediana no es adecuada a manipulaciones algebraicas posteriores.
  • 35. 24/09/2023 Ing. Dr. Sc. Abraham Palacios Velasquez 35 PROPIEDADES DE LA MEDIANA 1ra Propiedad 2da Propiedad 1 ( ) min n i i i n y Me imo     1 2 m Me y   2 , m Me y  Si m es impar Si m es par
  • 36. 24/09/2023 Ing. Dr. Sc. Abraham Palacios Velasquez 36 LA MODA L1 = Limite inferior de la clase modal = Exceso de la frecuencia modal sobre la frecuencia de la clase contigua inferior = Exceso de la frecuencia modal sobre la frecuencia de la clase contigua superior C = Tamaño del intervalo de clase modal 1  2  1 1 2 i Moda L c         
  • 37. 24/09/2023 Ing. Dr. Sc. Abraham Palacios Velasquez 37 171 174 169 171 173 166 162 150 162 175 169 162 168 167 180 154 180 172 170 171 173 167 182 170 163 175 155 185 173 170 183 167 161 175 156 172 174 173 184 165 164 176 157 170 171 168 174 170 170 176 158 174 185 174 172 159 165 177 170 175 186 168 168 159 166 178 172 172 189 169 174 160 166 179 171 173 192 169 174 163
  • 38. 24/09/2023 Ing. Dr. Sc. Abraham Palacios Velasquez 38 Moda o Modo (Mo) Como su nombre lo indica es aquel valor de la variable que tiene una mayor frecuencia. Si consideramos el ejemplo N°2 del peso de una muestra de personas: 65 76 48 48 68 78 90 87 67 72 78 Mo = 48 kilos Mo = 78 kilos. Esto significa que la mayoría de estas personas pesa 48 kilos y 78 kilos. Esta distribución es bimodal.
  • 39. 24/09/2023 39 Ing. Dr. Sc. Abraham Palacios Velasquez
  • 40. 24/09/2023 Ing. Dr. Sc. Abraham Palacios Velasquez 40 MEDIDAS DE TENDENCIA CENTRAL. MODA Es el valor de la variable a la que corresponde la máxima frecuencia. Si los datos están agrupados en intervalos, la moda es la marca de clase del intervalo con mayor frecuencia. CARACTERÍSTICAS: • Es muy sencilla de obtener. • Se puede calcular aunque existan intervalos abiertos, siempre que no esté incluida en él. • Es poco representativa.
  • 41. 24/09/2023 Ing. Dr. Sc. Abraham Palacios Velasquez 41 Ventajas de la Moda 1.- La moda, se puede usar como una localización tanto para datos cualitativos como cuantitativos 2.- La moda no esta indebidamente afectada por valores extremos. Aun si los valores altos son muy altos y los valores pequeños muy pequeños, se escoge el valor mas frecuente del conjunto de datos como el valor modal. 3.- La moda se puede calcular aun cuando una mas de las clases sean abiertas en los extremos. Desventajas de la moda 1.- Muy a menudo, no hay un valor modal, por que el conjunto de datos no contiene valores que se repiten mas de una vez. Otras veces, cada valor es la moda, por que cada uno aparece el mismo numero de veces. Claramente, la moda no es una medida útil en estos casos. 2.- Cuando el conjunto de observaciones contiene dos, tres o mas modas, estas son difíciles de interpretar y comparar
  • 42. 24/09/2023 Ing. Dr. Sc. Abraham Palacios Velasquez 42 5. COMPARACION ENTRE MEDIDAS DE TENDENCIA CENTRAL ¿CUANDO ELEGIR MEDIA, MEDIANA O MODA? NORMA GENERAL: 1º MEDIA. 2º MEDIANA. 3º MODA. RAZONES PARA PREFERIR LA MEDIA: 1. EN ELLA SE BASAN OTROS ESTADISTICOS. 2. LAS MEDIAS MUESTRALES SON MEJORES ESTIMADORES DE LOS PARAMETROS POBLACIONALES.
  • 43. 24/09/2023 Ing. Dr. Sc. Abraham Palacios Velasquez 43 ¿CUANDO ELEGIR LA MEDIANA EN LUGAR DE LA MEDIA?: 1. CUANDO LA VARIABLE ESTE MEDIDA EN UNA ESCALA ORDINAL. 2. CUANDO HAYA VALORES EXTREMOS, PUES ESTOS DISTORSIONAN LA INTERPRETACION DE LA MEDIA. EJEMPLO: 3,4,8,5,6,124 Media=25 LA MEDIA ES MUY SENSIBLE A LAS PUNTUACIONES EXTREMAS 3. CUANDO HAYA INTERVALOS ABIERTOS, YA QUE ESTOS CARECEN DE PUNTO MEDIO.
  • 44. 24/09/2023 Ing. Dr. Sc. Abraham Palacios Velasquez 44 ¿CUANDO ELEGIR LA MODA EN LUGAR DE LA MEDIANA ?: 1. CUANDO LA VARIABLE ESTE MEDIDA EN UNA ESCALA NOMINAL. 2. CUANDO HAYA INTERVALOS ABIERTOS Y LA MEDIANA PERTENEZCA A UNO DE ELLOS. EL CALCULO DE LA MEDIANA (C50) SUPONE UNA DISTRIBUCION HOMOGENEA DE LOS VALORES DENTRO DEL INTERVALO. ESTE SUPUESTO SOLO SE PUEDE MANTENER SI EL INTERVALO ESTA CERRADO.
  • 45. 24/09/2023 Ing. Dr. Sc. Abraham Palacios Velasquez 45 LAS TRES MEDIDAS DE TENDENCIA CENTRAL COINCIDEN CUANDO LA DISTRIBUCION ES UNIMODAL Y SIMETRICA (EJEMPLO: DISTRIBUCION NORMAL). CUANTO MAS ASIMETRIA, MAS DIFERENCIAS ENTRE ELLAS.
  • 46. 24/09/2023 Ing. Dr. Sc. Abraham Palacios Velasquez 46 • Se refiere a la simetría respecto a la media. Si f es la función de distribución, diremos que la distribución es: Distribución simétrica 0 2 4 6 8 10 12 m-a m m+a Densidad Asimetría negativa 0 1 2 3 4 5 6 7 8 1 2 3 4 5 6 7 8 9 Densidad 0 1 2 3 4 5 6 7 8 1 2 3 4 5 6 7 8 9 Densidad Asimetría positiva ( ) ( ) f media a f media a    Simétrica si para todo a es ( ) ( ) f media a f media a    Asimetría negativa si para algún a es ( ) ( ) f media a f media a    Asimetría positiva si para algún a es
  • 47. 24/09/2023 Ing. Dr. Sc. Abraham Palacios Velasquez 47 RELACION ENTRE LA MODA, MEDIA Y MEDIAN EN DISTRIBUCION SIMETRICA Y ASIMETRICA 1.- En la distribución de frecuencias simétricas cuya representación grafica es acampanada y además unimodal, coinciden exactamente en el mismo valor; media, median y moda. 2.- Si la distribución tiene la forma acampanada, es unimodal, pero no tiene simetría las tres medidas toman valores diferentes, y la mediana queda comprendida generalmente entre la moda y la media aritmética a.- Si la asimetría a la derecha o positiva X>Me >Mo b.- Si la asimetría es a la izquierda o negativa: X<Me <Mo c.- Si la distribución es moderadamente asimétrica y unimodal, se cumple aproximadamente la relación; X – Mo = 3 (x - Me)
  • 48. 24/09/2023 Ing. Dr. Sc. Abraham Palacios Velasquez 48 Una distribución estadística viene dada por la siguiente tabla: Hallar: La moda, mediana y media. Frecue ncia 10-15 15-20 20-25 25-30 30-35 f 3 5 7 4 2 EJERCICIO
  • 49. 24/09/2023 Ing. Dr. Sc. Abraham Palacios Velasquez 49 xi fi Fi xi · fi |x − x | · fi xi 2 · fi [10, 15) 12.5 3 3 37.5 27.857 468.75 [15, 20) 17.5 5 8 87.5 21.429 1537.3 [20, 25) 22.5 7 15 157.5 5 3543.8 [25, 30) 27.5 4 19 110 22.857 3025 [30, 35) 32.5 2 21 65 21.429 2112.5 21 457.5 98.571 10681.2 5
  • 50. 24/09/2023 Ing. Dr. Sc. Abraham Palacios Velasquez 50 MODA MEDIANA MEDIA
  • 51. 24/09/2023 Ing. Dr. Sc. Abraham Palacios Velasquez 51 PROBLEMAS DE REPASO Se tiene una distribución de frecuencia simétrica, con 6 intervalos de clase de amplitud constante, y los siguientes datos: n =150; n3=30 y’5=5 n2=n1+5 Q1=43.5 Calcule: a) El sexto decil b) El 90 percentil c) El valor que es superado por el 15 % de la Informacion
  • 52. 24/09/2023 Ing. Dr. Sc. Abraham Palacios Velasquez 52 Solución 1.- Como la distribución es simétrica, con m=6, entonces n1=n6; n2=n5; n3=n4=30 2.- Como n=150, entonces n1+n2+n3=75 luego n1 + n1 + 5 + 30 =75 2 n1 = 75 – 25 De donde n1=20 y n2 + 5 = 25
  • 53. 24/09/2023 Ing. Dr. Sc. Abraham Palacios Velasquez 53 Con los datos disponibles hasta ahora, puede disponerse ene una tabla de frecuencias incluyendo las frecuencias acumuladas Y’i-1 ------- y’i ni Ni Y’0 ------- y’1 20 20 Y’1 ------- y’2 25 45 Y’2 ------- y’3 30 75 Y’3 ------- y’4 30 105 Y’4 ------- 60 25 130 60 ------- y’6 20 150 Totales 150
  • 54. 24/09/2023 Ing. Dr. Sc. Abraham Palacios Velasquez 54 3.-Calculo de c=amplitud de clase constante. Para lo cual usamos el dato de Q1=43.5 a) Determínanos b) De la tabla, de frecuencias absolutas acumuladas que supere a es N2 = 45 Entonces j = 2 y j-1=1, por tanto, el intervalo de clase que contiene a Q1 es y’1 - y’2 c) Como > N1 = 20 150 37.5 4 4 n   37.5 4 n  37.5 4 n  1 ' ' 1 1 1 2 1 37.5 20 4 45 20 n N Q y c y c N N                        
  • 55. 24/09/2023 Ing. Dr. Sc. Abraham Palacios Velasquez 55 Pero ' ' ' 5 0 0 1 5 4 4 60 y y c y c c y c         ' 1 60 4 y c   Reemplazando esta expresión en Q1, se tiene 15.5 43.5 60 4 60 4 0,7 60 3,3 25 c c c c c         3.3 60 43.5 16.6 c    De donde 16.5 5 3.3 c   Y’i-1 ------- y’i ni Ni 35 ------- 40 20 20 40 ------- 45 25 45 45 ------- 50 30 75 50 ------- 55 30 105 55 ------- 60 25 130 60 ------- 656 20 150 Totales 150
  • 56. 24/09/2023 Ing. Dr. Sc. Abraham Palacios Velasquez 56 a) Calculo del 6to decil 1.- La menor frecuencia acumulada que supere a 60 6 150 90 10 10 x   Es N4=105, luego j=4 y j-1=3, entonces la clase que contiene a D6 es y’3 ---- y’4 = 50 --- 55 2.- Como se tiene 3 60 90 75 10 N   3 ' 6 3 4 3 60 90 75 15 10 50 5 50 5 52.5 105 75 30 n N D y c N N                                  b) Calculo del 90avo percentil 5 ' 90 5 6 5 90 135 130 5 100 60 5 60 5 61.25 150 130 20 n N P y c N N                                 
  • 57. 24/09/2023 Ing. Dr. Sc. Abraham Palacios Velasquez 57 c.- El valor que es superado por el 15 % de la información corresponde al 85avo percentil o sea P85 Entonces 4 ' 85 4 5 4 85 127.5 105 22.5 100 55 5 55 5 59.5 130 105 25 n N P y c N N                                 
  • 58. 24/09/2023 Ing. Dr. Sc. Abraham Palacios Velasquez 58 En una distribución simétrica de 8 intervalos, que se refiere al ingreso diario en S/. De 212 trabajadores de una empresa, donde se conoce: Moda= 19 amplitud de clase =4, n1=10 N6=186 Y Q1=14.375 Hallar a) El ingreso mínimo del 30 % de los trabajadores de mayor ingreso. b) El sindicato solicita que el nuevo pacto colectivo se establezca un salario mínimo de S/. 120 ?Que porcentaje de trabajadores de beneficiara? c) Los trabajadores que ganan mas de S/ 28.00 por dia, se supone son muy calificados ?Que % de trabajadores pertenecen a este grupo? d) El ingreso medio por día de los trabajadores de la empresa e) El ingreso mediano de la distribución.
  • 59. 24/09/2023 Ing. Dr. Sc. Abraham Palacios Velasquez 59 1.- La distribución es simétrica con m=8 por entonces ' ' 4 2 19 m Mo y y    Como c=amplitud de clase =4, los limites de clase restantes son: ' 3 19 4 15 y    ' 2 11 y  ' 1 7 y  ' 0 3 y  ' 5 19 4 23 y    ' 6 23 4 27 y    ' 7 31 y  ' 8 35 y  Intervalo yi ni Ni 3 ----- 7 10 10 7 ----- 11 16 26 11 ----- 15 32 58 15 ----- 19 48 106 19 ----- 23 48 154 23 ----- 27 32 186 27 ----- 31 16 202 31 ----- 35 10 212
  • 60. 24/09/2023 Ing. Dr. Sc. Abraham Palacios Velasquez 60 1 ' 1 1 3 53 26 27 4 14.375 11 4 11 4 26 26 j j j j n N y c N N n n                                     O sea 14.375+11n3+108 n3= 32=n6 Entonces n4=80-32=48=n5 a) El ingreso minimo del 30 % 1 ' 30 1 1 70 148 106 4 19 4 22.53 154 106 j j j j n N P y c N N                            
  • 61. 24/09/2023 Ing. Dr. Sc. Abraham Palacios Velasquez 61 b) Se beneficiara todos los trabajadores que tengan un ingreso por debajo de S/. 12.00 diarios. 1.- Primero determinaremos el numero de trabajadores que reciban un sueldo debajo de S/. 12.00. Este salario se encuentra en el tercer intervalo. N=10+16+r 11 r 12 15 Si una amplitud de 4 le corresponde 32 observaciones a una amplitud de 12 – 11=1 le corresponde r observaciones. Es decir: 32(12 11) 32 1 8 4 4 x r     32(12 11) 10 16 10 16 8 34 4 N        
  • 62. 24/09/2023 Ing. Dr. Sc. Abraham Palacios Velasquez 62 2.- Calculamos el porcentaje, que estará dado por 34 100 100 16.04% 212 N P x x n    c) En forma complementa mente análoga al caso anterior, el numero de trabajadores que pertenece al grupo muy calificado será aproximadamente 16(31 28) 10 4 3 10 22 4 M x       22 100 100 10.38% 212 212 M P x x    d) La distribución es simétrica con m=8 par (m=numero de clases) Entonces: ' ' 4 2 19 m Y y y Mo     e) Por la misma razón anterior Me = 19
  • 63. 24/09/2023 Ing. Dr. Sc. Abraham Palacios Velasquez 63