Factores ecosistemas: interacciones, energia y dinamica
Revista de medidas de tendencia central
1. Realizado por Anthony ParadaEdición 30/05/2016
Medidas de tendencia
central
Promedio
Mediana
Moda
Medidas de
dispersión
Rango
Desviación estándar
Relación entre las
medidas de dispersión
Conceptos de
población y muestra
Comparación entre
población y muestra
2. Página 2
Medidas de Tendencia Central
N
os indican en torno a qué
valor (centro) se distribuyen
los datos.
Las medidas de Tendencia
Central son:
Media aritmética: La media es el
valor promedio de la distribución.
Mediana: La mediana es la puntuación de
la escala que separa la mitad
superior de la distribución y la inferior,
es decir divide la serie de datos en dos
partes iguales.
Moda: La moda es el valor que más se
repite en una distribución.
Definición de media aritmética
La media aritmética es
el valor obtenido al sumar todos
los datos y dividir el resultado entre
el número total de datos.
µx es el símbolo de la media
aritmética para población.
es el símbolo de la media
aritmética para población.
Su fórmula estará dada por la siguiente
ecuación:
Calculo de media aritmética para
datos NO agrupados:
Ejemplo
Los tiempos de diez vehículos en
hacer un determinado recorrido son: 39, 29,
43, 52, 39, 44, 40, 31, 44, 35 minutos.
Hallar el tiempo medio.
Media aritmética para datos
agrupados
Si los datos vienen agrupados en
una tabla de frecuencias, la expresión de
la media es:
( ∑xi . fi ) / N
(x1f1 + x2f2 + x3f3 +....+xnfn) / N
3. Página 3
Mediana
Es el valor que ocupa el lugar
central de todos los datos cuando
éstos están ordenados de menor a
mayor. Es decir divide a la serie en
dos partes iguales en la que el 50% de
los datos están por debajo de la Md y
el otro 50% está por encima de ella.
La mediana se representa por Md.
La mediana se puede hallar sólo
para variables cuantitativas.
Cálculo de la mediana
1) Ordenamos los datos de menor
a mayor.
2) Si la serie tiene un número
impar de medidas la mediana es
la puntuación central de la misma.
2, 3, 4, 4, 5, 5, 5, 6, 6 Md= 5
3) Si la serie tiene un número par de
puntuaciones la mediana es la media entre
las dos puntuaciones centrales.
7, 8, 9, 10, 11, 12 Md= 9.5
Cálculo de la mediana para datos
agrupados
La mediana se encuentra en
el intervalo donde la frecuencia
acumulada llega hasta la mitad de la suma
de las frecuencias absolutas.
Es decir tenemos que buscar el
intervalo en el que se encuentre el 50% de
los datos.
Ejemplo
4. Página 4
Moda
En estadística, la moda es el valor con
mayor frecuencia en una distribución de datos.
Por ejemplo las calificaciones de tu escuela,
sacas 7,8,9,8,8 y 9, la moda seria 8 ya que es el
numero o calificación mas repetida.
Se hablará de una distribución bimodal de los
datos adquiridos en una columna cuando
encontremos dos modas, es decir, dos datos
que tengan la misma frecuencia absoluta
máxima. Una distribución trimodal de los datos
es en la que encontramos tres modas. Si todas
las variables tienen la misma frecuencia diremos
que no hay moda.
El intervalo modal es el de mayor frecuencia
absoluta. Cuando tratamos con datos agrupados
antes de definir la moda, se ha de definir el
intervalo modal.
La moda, cuando los datos están agrupados, es
un punto que divide al intervalo modal en dos
partes de la forma p y c-p, siendo c la amplitud
del intervalo, que verifiquen que:
Siendo la frecuencia absoluta del intervalo
modal las frecuencias absolutas de los
intervalos anterior y posterior,
respectivamente, al intervalo modal.
Para obtener la moda en datos agrupados se
usa la siguiente fórmula:
Donde:
= -inferior de la clase modal.
= es el delta de frecuencia absoluta
modal y la frecuencia absoluta premodal.
= es el delta de frecuencia absoluta
modal y la frecuencia absoluta
postmodal.
= Amplitud del intervalo modal
5. Página 5
Medidas de dispersión
Además de obtener la información que
reúnen las medidas de tendencia central es
muy conveniente tener conocimiento sobre el
grado de dispersión o variabilidad que
presentan los datos. Las medidas de
dispersión indican si los valores están
relativamente cercanos uno del otro o si se
encuentran dispersos.
Por consiguiente, además de las medidas de
tendencia central, siempre es importante
contar con indicadores que midan la
dispersión de los datos. Una medida de
tendencia central, casi nunca es suficiente por
sí sola, para resumir adecuadamente las
características de un conjunto de datos. Por lo
general, es necesario, adicionalmente, una
medida de la dispersión de los datos.
Rango o recorrido
Esta es la medida más sencilla de calcular y
comprender. Se concentra en el valor máximo
y mínimo de la colección de datos y viene
dada por:
R = Valor máximo - Valor mínimo
En el caso de distribuciones de frecuencias, el
rango se obtiene restándole al límite superior
de la última clase el límite inferior de la
primera clase:
R=LSk-LI1
En los ejemplos anteriores para los dos
grupos de cerdos se tiene que el recorrido
para el grupo 1 es R = 178 - 172 = 6 Kg., y
para el grupo 2 es R = 185 - 165 = 20Kg.
La ventaja de utilizar el rango como medida
de dispersión, es la sencillez de su cálculo,
aun cuando se trate de un conjunto bastante
grande de datos. Además, el significado de
esta medida es fácil de comprender.
La principal limitación del rango es que
considera solamente los valores extremos de
6. Página 6
Desviación Estándar
La desviación
típica o desviación
estándar (denotada con el
símbolo σ o s, dependiendo de la
procedencia del conjunto de
datos) es una dispersión para
variables de razón (variables
cuantitativas o cantidades
racionales) y de intervalo. Se
define como la raíz cuadrada de
la varianza de la variable.
Para conocer con detalle un
conjunto de datos, no basta con
conocer las medidas de
tendencia central, sino que
necesitamos conocer también la
desviación que presentan los
datos en su distribución respecto
de la media aritmética de dicha
distribución, con objeto de tener
una visión de los mismos más
acorde con la realidad al
momento de describirlos e
interpretarlos para la toma de
decisiones.
Interpretación y aplicación
La desviación típica es
una medida del grado de
dispersión de los datos con
respecto al valor promedio. Dicho
de otra manera, la desviación
estándar es simplemente el
"promedio" o variación esperada
con respecto a la media
aritmética.
Por ejemplo, las tres poblaciones
(0, 0, 14, 14), (0, 6, 8, 14) y (6, 6,
8, 8) cada una tiene una media
de 7. Sus desviaciones estándar
poblacionales son 7, 5 y 1,
respectivamente. La tercera
población tiene una desviación
mucho menor que las otras dos
porque sus valores están más
cerca de 7.
La desviación estándar puede
ser interpretada como una
medida de incertidumbre. La
desviación estándar de un grupo
repetido de medidas nos da
la precisión de éstas. Cuando se
va a determinar si un grupo de
medidas está de acuerdo con el
modelo teórico, la desviación
estándar de esas medidas es de
vital importancia: si la media de
las medidas está demasiado
alejada de la predicción (con la
distancia medida en desviaciones
estándar), entonces
consideramos que las medidas
contradicen la teoría. Esto es
coherente, ya que las mediciones
caen fuera del rango de valores
en el cual sería razonable
esperar que ocurrieran si
el modelo teórico fuera correcto.
La desviación estándar es uno de
tres parámetros de ubicación
central; muestra la agrupación de
7. Página 7
Relación entre las medidas
de dispersión
Las medidas de tendencia
central son medidas estadísticas
que pretenden resumir en un
solo valor a un conjunto de
valores. Representan un centro
en torno al cual se encuentra
ubicado el conjunto de los datos.
Las medidas de tendencia
central más utilizadas
son: media, mediana y moda.
Las medidas de dispersión en
cambio miden el grado de
dispersión de los valores de la
variable. Dicho en otros términos
las medidas de dispersión
pretenden evaluar en qué
medida los datos difieren entre
sí. De esta forma, ambos tipos
de medidas usadas en conjunto
permiten describir un conjunto de
datos entregando información
acerca de su posición y su
dispersión.
Los procedimientos para obtener
las medidas estadísticas difieren
levemente dependiendo de la
forma en que se encuentren los
datos. Si los datos se encuentran
ordenados en una tabla
estadística diremos que se
encuentran “agrupados” y si los
datos no están en una tabla
hablaremos de datos “no
agrupados”.
Población
Es la colección de datos que
corresponde a las características
de la totalidad de individuos,
objetos, cosas o valores en un
proceso de investigación.
Para su estudio, en general se
clasifican en Poblaciones Finitas
y Poblaciones Infinitas.
Poblaciones Finitas: Constan de
un número determinado de
elementos, susceptible a ser
contado. Ejemplo: Los
empleados de
una fábrica, elementos de un lote
de producción, etc.
Poblaciones Infinitas: Tienen un
número indeterminado de
elementos, los cuales no pueden
ser contados. Ejemplo: Los
números naturales.
Así también las poblaciones
pueden ser clasificadas en
Reales e Hipotéticas, las reales
son aquellas concretas, que ya
existen. Ejemplo: Los aspirantes
a un puesto de trabajo, los
vendedores de una empresa.
Mientras que las hipotéticas, son
las formas imaginables en que se
podría presentar un suceso.
Ejemplo: Estimaciones de la
población económicamente
activa dentro de diez años.
Muestra
“Es una parte representativa de
la población que es seleccionada
para ser estudiada, ya que la
población es demasiado grande
para ser estudiada en su
totalidad” Allen Webster.
Comparación entre
población y muestra
La Población es el todo, es el
conjunto total de personas. En
cambio muestra es una parte de
la población, tomada
generalmente de manera
aleatoria, para efectos de un
estudio, normalmente
estadístico. Por ejemplo: para las
encuestas de intención de voto
no se entrevista al 100% de los
votantes, sino que se toma una
muestra, buscando equilibrio