18. ¿Qué estadísticas pueden ser usadas en diferentes escalas de medición ? Nominal Ordinal Intervalo Razón Moda SI SI SI SI Mediana NO SI SI SI Media NO NO SI SI
19.
20.
Notas del editor
Bienvenidos a la segunda presentación del módulo sobre bioestadística. En esta sesión, hablaremos sobre algunas maneras de describir los datos.
El objetivo de aprendizaje de esta sesión será el de calcular las medidas de tendencia central: media, mediana y moda.
Enfocaremos esta presentación en tres de las maneras de calcular las medidas de tendencia central--- la media, la mediana y la moda.
Para datos cuantitativos, generalmente se usan mediciones de la escala de intervalos (cuando los datos están clasificados dentro de categorías que espaciadas proporcionalmente en intervalos iguales) o en la escala de razones (cuando los datos están clasificados dentro de categorías espaciadas a intervalos iguales pero que requieren un “0” claramente definido) donde podemos examinar las medidas de tendencia central para describir los datos. Las tres medidas de tendencia central son la media, la mediana y la moda. Vamos a explicar estas tres medidas en las siguientes diapositivas.
La media es la medida mejor conocida y más comúnmente usada en la tendencia central. También se le conoce como el “promedio”. Para calcular la media, usted toma la suma de todos los valores y los divide por el número de observaciones.
Una de las razones porqué la media se usa comúnmente, es porque es fácil de calcular y fácil de comprender. También se convierte más confiable o estable a medida que el número de observaciones aumenta. Por ejemplo, si nosotros quisiéramos escoger a 50 personas de su vecindario para calcular la edad media, ésta podría ser una estimación más estable del promedio de edad que si calculamos la media solamente entre 5 personas. La desventaja de utilizar la media es que es sensible a los valores extremos, de manera que si sus datos están agrupados alrededor de un cierto valor, pero usted tiene varios valores muy grandes o muy pequeños, la media será sacada de esos valores extremos.
Tenemos los resultados de una clase con 11 estudiantes. Cuál es la primera cosa que necesitamos calcular para obtener la media? Respuesta: Sume todos los valores para obtener la suma total. Nota al Instructor: De un clic para mostrar la suma total Correcto y para estos datos la suma total es 902. También tenemos 11 observaciones Nota al Instructor: De un clic para mostrar el total de observaciones De manera que ahora debemos dividir 902 entre 11 para obtener la media. Nota al Instructor: De un clic para mostrar el cálculo. Por tanto, podemos ver que la media de punteo de los estudiantes para esta clase es de 82. Si el estudiante no se presentó al examen y recibió un “cero”, entonces obtendríamos un valor mucho más bajo para la media, lo que es un ejemplo de porqué es más sensible a los valores extremos
La mediana es el punto medio de una lista ordenada de valores. También es igual al 50 avo percentil, o sea, es el punto o valor que se encuentra entre el 50% de los valores de arriba y el 50% de los valores de abajo (vamos a hacer una ilustración en unos momentos). La manera de encontrar la mediana es poner todos los valores en orden desde el más pequeño hasta el más grande y luego encontrar el valor que está en el medio. Cuando el número de valores es un número par, usted necesitará tomar los dos valores que se encuentran en medio de la lista para obtener la mediana.
La mediana no es sensible a los valores extremos como la media, por tanto, es una mejor medida de tendencia central para la mayoría de los casos. Como la media, también es fácil de entender y de interpretar. Una desventaja de la mediana es que uno debe ordenar los datos primero para poder encontrar la mediana y si usted está haciendo el cálculo a mano requiere más trabajo. Este no es un problema cuando se usan programas de computación tales como Excel o Epi Info, que hace este ordenamiento automáticamente. Adicionalmente, debido a que la mediana es el valor que simplemente se encuentra a la mitad, no contabiliza los valores de los extremos. En algunos casos, algunos de estos valores muy altos o muy bajos pueden ser importantes; sin embargo, éstos no influencian a la mediana.
Usemos nuevamente los mismos punteos del examen pero esta vez para encontrar la mediana. Cuál es el primer paso que tenemos que tomar para llegar a la mediana? Respuesta: Poner los valores en orden Nota al Instructor: De un clic para mostrar los datos ordenados Ahora que hemos ordenado los datos, que hacemos a continuación? Respuesta: Encontrar el valor que está a la mitad de la lista con 11 valores Nota al Instructor: De un clic para mostrar la respuesta Cuál es la mediana? Respuesta: La mediana de los punteos es 84. Nota al Instructor: De un clic para mostrar el recuadro con la respuesta.
La moda es el valor que ocurre con más frecuencia en una distribución. Para encontrar la moda, usted necesita poner todos los valores en orden y luego contar cuántas veces ocurre cada uno de los valores. El valor que ocurre con mayor frecuencia, es la moda, (o sea, es el valor que está “de moda”).
La moda puede ser una medida de tendencia central muy útil para datos que están agrupados con varios valores diferentes. También es la única medida que puede usarse para datos no-cuantitativos, debido a que se basa en frecuencias. Las desventajas de usar la moda es que ésta puede no existir para algunos datos. Esto puede suceder cuando muchos valores ocurren con la misma frecuencia por lo que no hay un valor que ocurra con más frecuencia que los otros. Otra desventaja adicional es que puede encontrarse demasiado lejos de la mitad de los datos.
Veamos a los punteos del examen de la clase nuevamente para practicar el encuentro de la moda. ¿Cuál es el primer paso que debemos tomar para obtener la moda? Respuesta: Poner los valores en orden Nota al Instructor: De un clic para mostrar los datos ordenados Ahora que hemos ordenado los datos, ¿qué debemos hacer? Respuesta: Contar cuántas veces ocurre cada uno de los valores Nota al Instructor: De un clic para mostrar la respuesta ¿Cuál es la moda y cómo la encontró? Respuesta: La moda es el valor más común. En este caso todos los números ocurrieron solo una vez, exceptuado el 100 que ocurrió dos veces. La moda del punteo del examen es 100. Nota al Instructor: De un clic para mostrar el recuadro con la respuesta
Una nota final acerca de las medidas de tendencia central. Éstas se reportan frecuentemente en combinación con las medidas de dispersión. Las medidas de dispersión describen el alcance de una distribución. Estas medidas incluyen el rango, varianza y la desviación estándar. Discutiremos estas medidas en más detalle en presentaciones futuras, pero por el momento, estamos introduciendo el concepto de rango El rango es la diferencia entre los valores más bajos y los valores más altos en una distribución. Usando los datos sobre punteos de la prueba, intentemos encontrar el rango de los punteos. El primer paso para identificar el rango es ordenar los valores. Nota al Instructor: De un clic para mostrar los valores ordenados. Ahora que hemos ordenado los datos, encontremos el valor más bajo. ¿Cuál es el valor más bajo? Respuesta: 44 Nota al Instructor: De un clic para mostrar la respuesta. ¿Cuál es el valor más alto? Respuesta: 100 Nota al Instructor: De un clic para mostrar la respuesta El rango de los punteos fue de (44-100). Nota al Instructor: De un clic para mostrar la respuesta El rango es frecuentemente usado cuando se describe la media o la mediana, sin embargo, generalmente no se utiliza para describir la moda. Por consiguiente, podemos decir que la media del punteo de la prueba fue de 82 con un rango de (44-100). Nota al Instructor: De un clic para mostrar la respuesta También podemos decir que la mediana de los punteos fue de 84 con un rango de de 44 a 100. Nota al Instructor: De un clic para mostrar la respuesta
Ahora yo quisiera que cada uno de ustedes tratara de calcular las medidas por su cuenta. Aquí hay una lista de valores que corresponden al número de visitas al médico durante el año pasado de un grupo de diez personas. Encuentre la media, la mediana y la moda de estos datos. Nota al Instructor: De a los estudiantes 5 minutos para hacer este ejercicio individualmente y luego pase a la próxima diapositiva para las respuestas.
Bueno, ¿quién me puede decir cual es el número de la media de visitas al médico para este grupo de personas? Nota al Instructor: Espere respuestas y luego de un clic para mostrar el cálculo y la respuesta Respuesta: 2.5 ¡Bien!, y ¿quién puede decirme cuál es el valor de la mediana y cómo la encontró? Nota al Instructor: Espere por respuestas y luego de un clic para mostrar el cálculo y la respuesta Respuesta: 2. Debido a que no hay un número par de individuos, usted tiene que tomar los dos valores que se encuentran en el punto medio, los cuales son 2 y 2. Y finalmente, ¿cuál es la moda para esta serie de datos? Nota al Instructor: Espere las respuestas y luego de un clic para mostrar el cálculo y la respuesta. Respuesta: 2
Para resumir todo lo que hemos discutido el día de hoy, esta tabla es útil para entender cuáles estadísticas pueden ser utilizadas en diferentes escalas de medición. Recuerden que en nuestra primera presentación, “Introducción a la Bioestadística”, discutimos las escalas de medición. La moda puede ser usada para describir todos los tipos de variables. La mediana puede ser usada para describir todas las escalas excepto la escala nominal. La media puede ser usada solamente para la escala de variables de intervalo y de razón, y esto también es verdadero para calcular diferencias. La escala de razón, como lo implica su nombre, es la única escala que puede ser utilizada para calcular razones.
En resumen, hay muchas diferentes medidas de tendencia central incluyendo a la media, la mediana y la moda. Cada una de estas tiene sus propias ventajas y desventajas.