UC Fundamentos de tuberías en equipos de refrigeración m.pdf
TEMA 10 MEDIDAS DE LOCALIZACION Y DISPERSION 2023.pdf
1. TEMA 10
MEDIDAS DE LOCALIZACION
Y DISPERSION
DOCENTE. MSc. JAQUELINE MARTINEZ CALDERON
2. DEFINICIÓN
2
En estadística descriptiva,
las medidas de posición no
central permiten conocer
otros puntos
característicos de la
distribución que no son los
valores centrales. Entre
las medidas de posición no
central más importantes
están los cuantiles. El
término cuantil fue usado
por primera vez por
Maurice Kendall en 1940.
3. MEDIDAS DE POSICIÓN NO CENTRAL
Las medidas de posición se suelen dividir en dos grandes
grupos: la de tendencia no central y las centrales. Las medidas
de posición no centrales son los cuantiles. Estos realizan una
serie de divisiones iguales en la distribución ordenada de los
datos. De esta forma, reflejan los valores superiores, medios e
inferiores.
3
4. CUANTILES
Son medidas descriptivas que distribuyen o clasifican los datos
una vez ordenados a uno y a otro lado en porcentajes dados.
Cada cuantil delimita dos regiones:
El p% de datos de menor valor (acumulados a la izquierda
del cuantil C)
El (1-p)% de datos de mayor valor (acumulados a la
derecha del cuantil C).
4
7. 7
CUARTILES (Q)
Se llaman cuartiles a aquellos valores que dividen a un conjunto
de datos ordenados en 4 partes iguales, encuentran el valor
acumulado al 25%, 50% y 75% respectivamente; se presenta por
(Q1, Q2, Q3) y la relación que nos permite encontrar cuartiles es la
siguiente:
8. 8
CUARTILES (Q)
El cuartil es uno de los más utilizados y divide la distribución en
cuatro partes iguales. Así, existen tres cuartiles. Los valores
inferiores de la distribución se sitúan por debajo del primero (Q1).
La mitad o mediana son los valores menores iguales al cuartil dos
(Q2) y los superiores son representados por el cuartil tres (Q3).
Equipotencias
Q1 = P25
Q2 = D5 = P50 = Me
Q3 = P75
10. 10
DECIL (D)
Son aquellos valores que dividen al conjunto de datos en 10
partes iguales se representan por D1, D2, D3, D4, D5, D6, D7, D8,
D9. Representan el 10%, 20%, ... , 90% de los datos
acumulados respectivamente. El cálculo de deciles se la calcula
por la siguiente formula.
11. 11
DECIL
Donde :
j=1, 2, 3,………………..9
i=1, 2, 3…..
El decil divide los datos en diez partes iguales. Existen nueve
deciles, de D1 a D9. El D5 se corresponde con la mediana.
Por su lado, los valores superiores e inferiores (equivalentes a
los diferentes cuartiles) se sitúan en puntos intermedios entre
estos.
12. 12
PERCENTILES (P)
Se llama percentiles a aquellos valores que dividen a un conjunto
de datos en 100 partes iguales P1, P2, P3, P4…………, P99 donde: J
= 1, 2,3…..99. Representan el 1%, 2%, ... , 99% de los datos
acumulados respectivamente. El cálculo se realiza por la siguiente
relación:
13. 13
PERCENTIL
Donde :
j=1, 2, 3,………………..99
i=1, 2, 3…..
El percentil divide la distribución en cien partes. Hay 99
percentiles. Tiene, a su vez, una equivalencia con los
deciles y cuartiles.
14. MEDIDAS DE DISPERSION
DEFINICION
También llamadas medidas de variabilidad,
muestran la variabilidad de una distribución,
indicando por medio de un número, si las
diferentes puntuaciones de una variable están muy
alejadas de la media. Cuanto mayor sea ese valor,
mayor será la variabilidad, cuanto menor sea, más
homogénea será a la media. Así se sabe si todos
los casos son parecidos o varían mucho entre ellos.
15. Las medidas de dispersión nos sirven para
cuantificar la separación de los valores de una
distribución.
Llamaremos Dispersión O Variabilidad, a la mayor o
menor separación de los valores de la muestra,
respecto de las medidas de centralización que
hayamos calculado.
Al calcular una medida de centralización como es la
media aritmética, resulta necesario acompañarla de
otra medida que indique el grado de dispersión,
del resto de valores de la distribución, respecto de
esta media.
CARACTERISTICAS
16. Estas medidas permiten evaluar la confiabilidad del valor
del dato central de un conjunto de datos, siendo la media
aritmética el dato central más utilizado. Cuando existe
una dispersión pequeña se dice que los datos están
dispersos o acumulados cercanamente respecto a un
valor central, en este caso el dato central es un valor muy
representativo. En el caso que la dispersión sea grande el
valor central no es muy confiable. Cuando una
distribución de datos tiene poca dispersión toma el
nombre de distribución homogénea y si su dispersión es
alta se llama heterogénea.
UTILIDAD
17. RANGO
DEFINICION:
El rango se suele definir como la diferencia entre
los dos valores extremos que toma la variable. Es la
medida de dispersión más sencilla y también, por
tanto, la que proporciona menos información.
Además, esta información puede ser errónea, pues
el hecho de que no influyan más de dos valores del
total de la serie puede provocar una deformación
de la realidad.
18. CARACTERISTICAS
Suministra información de los extremos de la variable
Informa sobre la distancia entre el mínimo y el máximo
valor observado. Se limita su uso a una información inicial
X min X max R x.
UTILIDAD ESTADISTICA:
El rango señala la amplitud de la
variaciónde un fenómeno entre su límite menor
y uno claramente mayor
19. DESVIACIONES TÍPICAS
DEFINICION:
La desviación típica es la raíz cuadrada de la
varianza. Es decir, la raíz cuadrada de la media de
los cuadrados de las puntuaciones de desviación.
La desviación típica se representa por σ.
20. CARACTERISTICAS
La desviación típica será siempre un valor positivo o
cero, en el caso de que las puntuaciones sean iguales.
Si a todos los valores de la variable se les suma un
número la desviación típica no varía.
Si todos los valores de la variable se multiplican por un
número la desviación típica queda multiplicada por
dicho número.
Si tenemos varias distribuciones con la misma media y
conocemos sus respectivas desviaciones típicas se puede
calcular la desviación típica total.
21. UTILIDAD ESTADISTICA
Esta medida nos permite determinar el promedio
aritmético de fluctuación de los datos respecto a su punto
central o media. La desviación estándar nos da como
resultado un valor numérico que representa el promedio
de diferencia que hay entre los datos y la media. Para
calcular la desviación estándar basta con hallar la raíz
cuadrada de la varianza, por lo tanto su ecuación sería:
S = √S
22. VARIANZA
DEFINICION:
La varianza es la media aritmética de los cuadrados de las
desviaciones respecto a la media aritmética, es decir, es el
promedio de las desviaciones de la media elevadas al
cuadrado.
La varianza se representa por:
23. CARACTERISTICAS
Una de las características de la varianza es que viene
expresada en unidades cuadráticas respecto de las
unidades originales de la variable.
UTILIDAD ESTADISTICA:
Nos permite saber y determinar qué es normal, qué es
grande, qué es pequeño, aquello que es extra grande o
bien aquello que es extra pequeño.
25. COEFICIENTE DE VARIACION
DEFINICION:
El Coeficiente de variación (CV) es una medida de la
dispersión relativa de un conjunto de datos, que se
obtiene dividiendo la desviación estándar del conjunto
entre su media aritmética:
para una
muestra y
para la
población.
26. CARACTERISTICAS
Puesto que tanto la desviación estándar como la
media se miden en las unidades originales, el CV es
una medida independiente de las unidades de
medición.
Debido a la propiedad anterior el CV es la cantidad
más adecuada para comparar la variabilidad de dos
conjuntos de datos.
En áreas de investigación donde se tienen datos de
experimentos previos, el CV es muy usado para
evaluar la precisión de un experimento, comparando
en CV del experimento en cuestión con los valores del
mismo en experiencias anteriores.
27. UTILIDAD ESTADISTICA:
Su utilidad radica en que podemos
determinar que tanta variabilidad existe
entre dos muestra en las que inclusive la
información no tienen las mismas unidades
o se trata de datos diferentes. En el
siguiente ejemplo se muestra la utilidad del
coeficiente de variación