1. VARIANZA
ESTADISTICA I
DAVID PONCE VIZCAINO
JOSE ALBERTO OROZCO HOLGUIN
JORGE AVILA JONGUITUD
KEVIN ALDAIR TURRUBIATES MARTINEZ
GUSTAVO ANGEL GONZALEZ GARCIA
2. VARIANZA
La varianza es una medida de dispersión que representa la
variabilidad de una serie de datos respecto a su media.
Formalmente se calcula como la suma de los residuos al
cuadrado divididos entre el total de observaciones.
Nos permite entender mejor los datos. Además, nos ofrece
múltiples capas a las que podemos aproximarnos. Desde un
punto de vista intuitivo, ayuda a comprender la noción de
dispersión. Desde uno más formal, permite múltiples
aplicaciones en el ámbito de la estadística.
3. ¿Qué diferencia existe entre la varianza y la desviación típica?
Una cuestión que se podría plantear, y con razón, sería la diferencia entre varianza y
desviación típica. En realidad, vienen a medir lo mismo. La varianza es la desviación
típica elevada al cuadrado. O al revés, la desviación típica es la raíz cuadrada de la
varianza.
La desviación típica se hace para poder trabajar en las unidades de medida iniciales.
Claro que, como es normal, uno puede preguntarse, ¿de qué sirve tener como concepto
la varianza? Bien, aunque la interpretación del valor que arroja no nos da demasiada
información, su cálculo es necesario para obtener el valor de otros parámetros.
Para calcular la covarianza necesitamos la varianza y no la desviación típica, para
calcular algunas matrices econométricas se utiliza la varianza y no la desviación típica.
Es una cuestión de comodidad a la hora de trabajar con los datos en según qué
cálculos.
4. La unidad de medida de la varianza será siempre la unidad de
medida correspondiente a los datos pero elevada al cuadrado. La
varianza siempre es mayor o igual que cero. Al elevarse los
residuos al cuadrado es matemáticamente imposible que la
varianza salga negativa. Y de esa forma no puede ser menor que
cero.
Fórmula para calcular la varianza
Donde:
X: variable sobre la que se pretenden calcular la varianza
xi: observación número i de la variable X. i puede tomará
valores entre 1 y n.
n: número de observaciones.
x
̄ : Es la media de la variable X.
O lo que es lo mismo:
5. La varianza es una medida de dispersión. Eso significa que
pretende capturar en qué medida los datos están en torno a la
media. Si tenemos datos muy por encima y muy por debajo de
la media, esta será menos representativa y lo veremos reflejado
en una elevada varianza.
Imaginemos, por ejemplo, que queremos calcular el salario
medio de dos empresas de solo dos trabajadores. En la empresa
A, los salarios son de 24.500 y 23.500 euros. En la B, son de
16.000 y 32.000 euros. Vemos que, en ambos casos, la media es
la misma: 24.000 euros. Sin embargo, esa media es más
representativa en la empresa A, ya que los 2 valores se
encuentran mucho más próximos a la media que en la empresa
B.
Qué mide la varianza
6. Las aplicaciones estadísticas del concepto de la varianza son
incontables. Las siguientes son solo algunas de las principales:
• Los estimadores eficientes. Son aquellos cuya esperanza es
el verdadero valor del parámetro y, además, tienen una
mínima varianza. De este modo, hacemos lo más pequeño
posible el riesgo de que lo que extraemos de una muestra se
aparte demasiado del verdadero valor del parámetro.
• Los estimadores consistentes. Son aquellos que, a medida
que crece el tamaño de la muestra, tienden a tener una
varianza de cero. Por lo tanto, con muestras grandes, la
estimación tiende a desviarse muy poco del verdadero valor.
• En la distribución normal, la varianza (su raíz cuadrada, la
desviación típica) es uno de los parámetros. La campana de
Gauss tiende a ser más alta y estrecha a medida que la
varianza disminuye.
• Etc………..
Algunas aplicaciones de la varianza
7. Ejemplo de cálculo de la varianza
Tenemos cinco personas, cada uno con un salario diferente:
Juan: 1.500 euros
Enrique: 1.200 euros
José: 1.700 euros
Miguel: 1.300 euros
Mateo: 1.800 euros
La media del salario, la cual necesitamos para nuestro cálculo,
es de ((1.500 + 1.200 + 1.700 + 1.300 + 1.800) /5) 1.500 euros.
Dado que la fórmula de la varianza en su forma desglosada
se formula como sigue:
Obtendremos que se debe calcular tal que:
El resultado es de 52.000 euros al cuadrado. Es importante recordar
que siempre que calculamos la varianza tenemos las unidades de
medida al cuadrado. Para pasarlo a euros, en este caso tendríamos que
realizar la desviación típica. El resultado aproximado sería de 228
euros. Esto quiere decir que, en media, la diferencia entre los salarios
de las distintas personas será de 228 euros.
8. ■ Ventajas y desventajas de la varianza
■ La varianza se utiliza para ver cómo se relacionan los números individuales
dentro de un conjunto de datos, en lugar de utilizar técnicas matemáticas más
amplias.
■ También se distingue por tratar a todas las desviaciones de la media como si
fueran iguales, independientemente de su dirección. Las desviaciones al
cuadrado no pueden sumar cero y dar la apariencia de que no hay variabilidad
en los datos.
■ Sin embargo, un inconveniente es que da más peso a los valores atípicos.
Estos son números alejados de la media. Elevar al cuadrado estos números
puede sesgar los datos.
■ Otro inconveniente del uso de la varianza es que no es fácil de interpretar. Se
suele emplear principalmente para sacar la raíz cuadrada de su valor, que
indica la desviación estándar de los datos.