1. Analizaremos tres muestras de 40 alumnos cada una, a los que se les
tomó una evaluación de seis preguntas.
xi fi xi fi xi fi
1 1 1 16 1 6
2 2 2 3 2 7
3 17 3 1 3 7
4 17 4 1 4 7
5 2 5 3 5 7
6 1 6 16 6 6
Grupo 1 Grupo 2 Grupo 3
Los xi indican el número de respuestas correctas y fi, indica la cantidad de
alumnos que lo hicieron.
2. Puntuaciones en tres grupos de alumnos
•Las tres distribuciones tienen la misma media aritmética, 3,5 puntos.
•Las tres distribuciones tienen la misma mediana, 3,5 puntos.
¿Podemos afirmar, a partir de tener la misma media y la misma mediana, que hay
homogeneidad entre los grupos?
Gráficamente, vemos que el valor de la media aritmética y de la mediana no son
suficientes para describir cada una de las situaciones.
Para precisar mejor lo que denominamos como dispersión podemos calcular unos
estadísticos que nos den información, sin necesidad de representar los datos.
3. ¡Sí..., me imagino que las
recuerdan!
x Me Mo
No me gusta decirlo, pero vimos
que las medidas de tendencia
central son insuficientes para
describir un conjunto de datos.
Por esto surgimos nosotras..., las
medidas de dispersión.
Las medidas de dispersión damos
una idea de cuánto se alejan los
valores respecto de los valores
centrales.
6. Soy una característica exclusiva de la
muestra y mi valor no puede ser extrapolado a
la población.
Soy muy simple. Indico la amplitud de la
muestra.
No me llevo bien con las variables cualitativas,
en ellas no hay números, por eso yo no existo.
R = xmáx – xmín
Me llaman RANGO, RECORRIDO o AMPLITUD
MUESTRAL.
Debido a mi simpleza, no soy tenido en cuenta.
Pero sirvo para completar las características
de una muestra, cuando se tiene una gran
dispersión de los datos.
Soy la diferencia entre los valores extremos
de la muestra.
¡Hola, yo soy el rango!
7. Aunque a mi pesar, dependo de la media
aritmética y la fórmula para calcularme,
parece fea, pero pronto la aprendés:
¡Cómo que no entendés!
Estoy definida rigurosamente y me baso en
todas las observaciones.
Me llaman DESVIACIÓN ESTÁNDAR o
DESVÍO TÍPICO.
Represento, nada más y nada menos, que la
desviación promedio de los valores de la muestra
respecto a la media aritmética.
¡Hola, yo soy la desviación estándar!
s =
x x .f
n 1
i
2
i
i
Indico cuánto se alejan de la media aritmética,
en promedio, los valores de la muestra.
8. Para calcular las desviaciones de los valores
respecto de la media aritmética, basta con
hacer
La llamo ‘mi madre’ porque surjo de ella.
Veamos por qué:
Voy a hablar de mi madre, la VARIANZA.
Sigo yo, la desviación estándar, pero no voy a
hablar de mí.
xxi
en los valores mayores que la media, estas
diferencias serán positivas y para los valores
menores que la media, serán negativas.
Entonces..., al sumarlos, para calcular el
promedio, la suma da cero.
Para evitar esto, se elevan las diferencias al
cuadrado y se calcula el promedio de los
cuadrados de las diferencias.
Dividiendo por n-1, para mejorar las estimaciones
que haremos posteriormente.
A este valor se lo llama VARIANZA.
9. La fórmula de la varianza es:
1n
.fxx
=s i
i
2
i
2
¿Y cuál es el incoveniente?
¿Por qué usamos la desviación estándar en lugar
de la varianza?
Por eso utilizamos la desviación estándar, que se calcula,
simplemente, sacando la raíz cuadrada de la varianza.
Porque la unidad de medida está al cuadrado y es difícil de
interpretar.
s =
x x .f
n 1
i
2
i
i
10. Yo mido la desviación estándar en términos de
la media aritmética.
Sí..., ya sé. Te preguntás, ¿qué es eso?
¡Hola, yo soy el COEFICIENTE DE
VARIACIÓN!
Empiezo dándote la fórmula para que me
calculés:
C.V.
s
x
Mi gran virtud es que soy independiente de las
unidades utilizadas. Soy adimensional.
Soy una medida de dispersión relativa, indico
qué proporción de la media representa la
desviación estándar.
Tengo un inconveniente... dejo de ser útil cuando
la media está próxima a cero.
A partir de la expresión s = C.V. . , sirvo para
interpretar a la desviación estándar en
términos de la media aritmética.
x
Por esto, suelen expresarme en forma porcentual.
12. Dos estadísticos al enrolarse en el
ejército fueron enviados al frente y puesto uno
junto al otro. Ambos a la vez, divisaron a un soldado
enemigo, apuntaron sus fusiles y abrieron fuego.
Uno de los estadísticos disparó medio metro hacia
la derecha y el otro, medio metro hacia la izquierda.
Se miraron el uno al otro, con el gozo pintado en la
cara, se estrecharon la mano y exclamaron:
¡Enhorabuena!
Está demás decir que poco provecho sacaron de saber
que, en promedio el soldado enemigo había resultado
muerto. En un caso como éste son los detalles triviales
los que más importan, como el detalle de que el
soldado enemigo estaba vivo, preparándose para
devolver el disparo, mientras los estadísticos
celebraban su hazaña imaginaria.
La moraleja de esta anécdota descabellada es que a veces la dispersión
es más importante que el promedio. Entendiendo por dispersión, la
cantidad de diseminación de datos, esto es, el grado en que difieren
entre sí unos datos de otros.
13. Dice Lord Justice Matthews: “Cuando era
joven y practicaba en el juzgado perdí muchos casos que
debería haber ganado, pero con el tiempo, gané muchos
casos que debería haber perdido; así la justicia quedó
compensada”.
14. Los ejemplos de conclusiones fallidas por no considerar la dispersión
son bastantes abundantes. Se suele citar una anécdota ocurrida durante la
guerra civil entre mandarines chinos, hacia los años veinte de este siglo. Al
llegar a la orilla de un río, uno de los mandarines se dio cuenta de que no había
barcas para cruzarlo. El mandarín recordó haber leído que la profundidad
promedio del agua era de noventa centímetros en esa época del año y dio la
orden de cruzarlo a pie. Una vez cruzado el río, el mandarín se dio cuenta,
para su asombro, que se habían ahogado varios centenares de sus soldados.
Aunque el río realmente tenía noventa centímetros de profundidad en
promedio, en algunos lugares era mucho más hondo, de manera que al parecer,
en este caso, no bastaba con conocer sólo el promedio.
Hay un promedio
de noventa centímetros
de profundidad
¡Glup!
¡¿Dónde?!
¡Glup!
¡Glup!
¡Glup!
¡Glup!
15. A menudo se compara una observación única con un promedio, de
donde aparecen resultados sorprendentes; sorprendentes, entiéndase, porque
no se hace mención de la dispersión. Por ejemplo, un muchacho alardea que
tarda en correr los 100 metros, menos que el promedio de todos los chicos de
su clase.
No ha dicho que sea el mejor, ni siquiera uno de los mejores,
aunque su jactancia se podría interpretar fácilmente en este
sentido. Sin conocimiento de la cantidad de dispersión que hay
en torno al promedio, no se puede tener ni siquiera una idea
lejana de cómo está él con relación a los demás.
¡Siempre esté alerta frente a comparaciones donde
se coteja una única observación con un promedio, a
menos que sepa usted con certeza que existe muy
poca dispersión en los datos! Cuando no se conoce la
dispersión, tales comparaciones no dicen gran cosa.
¿Qué es lo que ha dicho en realidad?
Sólo que él está por debajo del promedio de su clase (“En el país de los ciegos el
tuerto es rey”).