Tema 10. Dinámica y funciones de la Atmosfera 2024
Mapas estadistica 3 corte
1. MEDIDAS DE DISPERSION
Los métodos numéricos que describen a los conjuntos de observaciones tienen como objetivo dar
una imagen mental de la distribución de frecuencias. Una vez localizado el centro de la
distribución de un conjunto de datos, lo que procede es buscar una medida de dispersión de los
datos. La dispersión o variación es una característica importante de un conjunto de datos porque
intenta dar una idea de cuán esparcidos se encuentran éstos.
RANGO
Datos no agrupados
El rango de un conjunto de
números es la diferencia
entre el mayor y el menor
de todos ellos.
Hay 2 maneras de expresar
ésta medida:
1) La diferencia entre el
valor mayor y menor
2) Los valores mayor y
menor del grupo
Datos agrupados
Hay dos formas para
determinar el rango para
datos agrupados:
1) Rango = punto medio de
la clase más alta – punto
medio de la más baja
2) Rango = límite superior
de la clase más alta – límite
inferior de la más baja
DESVIACIÓN ESTÁNDAR
La desviación estándar se
denota por s.
Datos no agrupados
Se define como
S=
√Σ = 푛푗
1(푋푗−푋)2
푛
Datos agrupados
Si x1, x2, …, xk ocurren con
frecuencias f1, f2, …, fk,
respectivamente, la
desviación típica se expresa
como:
S=
√Σ =1푓푗(푋푗− 푛푗
푋)2
푛
VARIANZA
Se define como el cuadrado de
la desviación estándar y se
representa como 푆2
Datos no agrupados
푆2 =
Σ = 1 푛푗
(푋푗 − 푋)2
푛
Datos agrupados.
푆2 =
Σ = 1푓푗(푋푗 − 푋)2 푛푗
푛
COEFICIENTE DE VARIACIÓN
La variación o dispersión real, tal como
se determina de la desviación estándar
u otra medida de dispersión, se llama
dispersión absoluta.
La dispersión relativa es:
2. Ventajas
• Es relativamente sencilla
su obtención
• El significado de ésta
medida es fácil de
comprender
Limitaciones
• Considera sólo los valores
extremos de un conjunto, y
no proporciona
mayor información respecto
a los demás valores del
mismo
• Tiene una limitada utilidad
para los distintos tipos de
análisis estadísticos
Dispersión relativa=dispersión absoluta
Promedio
A la dispersión relativa se le llama coeficiente de variación o
coeficiente de dispersión si la dispersión absoluta es la
desviación estándar s y el promedio es la media x. Se define
como:
푆
푋
Coeficiente de variación (V)=
La dispersión indica que tan cercanos o lejanos se encuentran los
valores unos de otros. Dichos valores pueden pertenecer a un
conjunto de datos agrupados (distribuciones de frecuencias) o no
agrupados (ordenados de acuerdo a su magnitud). Las medidas de
dispersión que son más comunes son: rango, desviación media,
desviación estándar, varianza. Las medidas de dispersión que
utilizan la media como referencia son: desviación media,
desviación estándar, varianza. Las medidas de dispersión vistas
fueron para datos muéstrales.
3. REGRESIONES.
Regresión lineal
Las observaciones se dispondrán en dos
columnas, de modo que en cada fila figuren
la abscisa x y su correspondiente ordenada
y. La importancia de las distribuciones
bidimensionales radica en investigar cómo
influye una variable sobre la otra. Esta puede
ser una dependencia causa efecto, por
ejemplo, la cantidad de lluvia (causa), da
lugar a un aumento de la producción agrícola
(efecto). O bien, el aumento del precio de un
bien, da lugar a una disminución de la
cantidad demandada del mismo.
Si utilizamos un sistema de coordenadas
cartesianas para representar la distribución
bidimensional, obtendremos un conjunto de
puntos conocido con el diagrama de
dispersión, cuyo análisis permite estudiar
cualitativamente, la relación entre ambas
variables tal como se ve en la figura.
El siguiente paso, es la determinación de la
dependencia funcional entre las dos
variables x e y que mejor ajusta a la
distribución bidimensional. Se denomina
regresión lineal cuando la función es lineal,
es decir, requiere la determinación de dos
parámetros: la pendiente y la ordenada en el
origen de la recta de regresión, y=ax+b.
MEDIDAS DE APUNTAMIENTO Y ASIMETRIA
Las medidas de asimetría son indicadores que
permiten establecer el grado de simetría (o
asimetría) que presenta una distribución de
probabilidad de una variable aleatoria sin tener que
hacer su representación gráfica.
Como eje de simetría consideramos una recta
paralela al eje de ordenadas que pasa por la media
de la distribución. Si una distribución es simétrica,
existe el mismo número de valores a la derecha que
a la izquierda de la media, por tanto, el mismo
número de desviaciones con signo positivo que con
signo negativo. Decimos que hay asimetría positiva
(o a la derecha) si la "cola" a la derecha de la media
es más larga que la de la izquierda, es decir, si hay
valores más separados de la media a la derecha.
Diremos que hay asimetría negativa (o a la
izquierda) si la "cola" a la izquierda de la media es
más larga que la de la derecha, es decir, si hay
valores más separados de la media a la izquierda.
Medidas de asimetría
Coeficiente de asimetría de Fisher.
En teoría de la probabilidad y estadística, la
medida de asimetría más utilizada parte del uso
del tercer momento estándar. La razón de esto es
que nos interesa mantener el signo de las
desviaciones con respecto a la media, para
obtener si son mayores las que ocurren a la
derecha de la media que las de la izquierda. Sin
embargo, no es buena idea tomar el momento
estándar con respecto a la media de orden 1.
Debido a que una simple suma de todas las
desviaciones siempre es cero. En efecto, si por
ejemplo, los datos están agrupados en clases, se
tiene que:
4. Sólo se puede utilizar en distribuciones uniformes, unimodales y
moderadamente asimétricas. Se basa en que en distribuciones simétricas la
media de la distribución es igual a la moda ente de asimetría de Pearson
Si la distribución es simétrica, y Ap =0 Si la distribución es asimétrica
positiva la media se sitúa por encima de la moda y, por tanto,
Apuntamiento
Se trata de visualizar
los datos en una
curva, chata, normal o
puntada.
Coeficiente de Gini
Mide la desigualdad de los ingresos pero puede
utilizarse para medir cualquier forma de
distribución desigual.
También puede medirse la desigualdad de la
riqueza, pero este uso requiere que nadie
disponga de una riqueza neta negativa.
Coeficiente de Gini.
Es un número comprendido entre 0 y 1.
Índice de Gini.
Es el coeficiente de Gini expresado en
porcentajes.
El cálculo del coeficiente Gini se puede realizar
de dos formas.
A través de la curva de Lorenz mediante la fórmula
de Brown la curva de Brown es un gráfico que se
puede utilizar para representar la distribución
relativa de una variable en un dominio
determinado.
5. l
Línea de igualdad perfecta.
Es la línea de 45° (recta y=x) y corresponde a una
distribución de ingresos perfectamente equitativa.
Línea de desigualdad perfecta
Función.
Y=0 para X <100
X=100 para X=100
Curva de Lorenz
En general se encuentra en la situación
intermedia e indica una mayor igualdad cuanto
más cercana este a la línea de igualdad
perfecta y viceversa.
Calculo del coeficiente Gini.
Siendo A el área entre la línea de la igualdad
perfecta y curva de Lorenz y B el área debajo de la
curva de Lorenz el coeficiente de Gini se define
como A/(A+B)