LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...
Medidas de dispersion estadistica
1. República Bolivariana de Venezuela
Ministerio del Poder Popular para la Educación
Instituto Universitario Politécnico Santiago Mariño
Sede: Barcelona
Escuela: Ing. en mantenimiento mecánico
Sección: ZV
Prof.: Pedro Beltrán Bachiller:
fffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffff Víctor Urbina C.I.:
fffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffff 26146663
Barcelona, 19/06/2015
2. Medidas de Dispersión
La Dispersión permite analizar cómo se dispersan los valores de una variable de
tipo intervalo/razón de menor a mayor y la forma gráfica que estos valores
presentan. Si se conoce la media e una población hay distintas posibles formas de
distribuir los valores, e posible que todos estén alrededor de la media o podrán estar
sesgados hacia un lado. Estudiar la dispersión es revisar el eje horizontal y observar
donde están alojados los datos.
Entonces los Estadísticos de Dispersión o Medidas de Dispersión describen como
se dispersan los datos de una variable a lo largo de su distribución. Las Medidas de
Dispersión son: el Rango, la Desviación Estándar y la Varianza.
El Rango es una Medida de Dispersión que indica cómo los datos de una variable
se distribuyen de menor a mayor, es decir la distancia entre el valor mínimo y
máximo, es fácil de calcular porque solo deberá restar el valor máximo menos el
valor mínimo. El Rango se ve afectado cuando exista valores muy aislados del
grupo, la información que suministra no dice nada de la distribución de
puntuaciones
La Desviación Estándar es una Medida de Dispersión que describe la forma en que
los valores de la variable se dispersan a lo largo de la distribución en relación a la
media. El cálculo de la Desviación Estándar involucra cuanta separación existe
entre el valor y la media, así como el número de datos, por lo tat es una medida que
involucra a todos los datos de la muestra o población.
Las medidas de dispersión, también llamadas medidas de variabilidad, muestran la
variabilidad de una distribución, indicando por medio de un número si las
diferentes puntuaciones de una variable están muy alejadas de la media. Cuanto
mayor sea ese valor, mayor será la variabilidad, y cuanto menor sea, más
homogénea será a la media. Así se sabe si todos los casos son parecidos o varían
mucho entre ellos.
Para calcular la variabilidad que una distribución tiene respecto de su media, se
calcula la media de las desviaciones de las puntuaciones respecto a la media
aritmética. Pero la suma de las desviaciones es siempre cero, así que se adoptandos
clases de estrategias para salvar este problema. Una es tomando las desviaciones en
valor absoluto (desviación media) y otra es tomando las desviaciones al cuadrado
(varianza).
3. Rango
Es el intervalo entre el valor máximo y el valor mínimo; por ello,
comparte unidades con obtener una idea de la dispersión de los datos, cuanto mayor
es el rango, más dispersos están los datos de un conjunto.
Por ejemplo, para una serie de datos de carácter cuantitativo, como lo es la estatura
medida en centímetros, tendríamos:
Es posible ordenar los datos como sigue:
Donde la notación x(i) indica que se trata del elemento i-ésimo de la serie de datos.
De este modo, el rango sería la diferencia entre el valor máximo (k) y el mínimo; o,
lo que es lo mismo:
En nuestro ejemplo, con cinco valores, nos da que R = 185-155 = 30.
Desviación típica
La desviación típica o desviación estándar (denotada con el símbolo σ o s,
dependiendo de la procedencia del conjunto de datos) es una medida de
dispersión para variables de razón (variables cuantitativas o cantidades racionales)
y de intervalo. Se define como la raíz cuadrada de la varianza de la variable.
Para conocercondetalle un conjunto de datos, no basta conconocer las medidas de
tendencia central, sino que necesitamos conocer también la desviación que
presentan los datos en su distribución respecto de la media aritmética de dicha
distribución, con objeto de tener una visión de los mismos más acorde con la
realidad al momento de describirlos e interpretarlos para la toma de decisiones.
La desviación típica es una medida del grado de dispersión de los datos con
respecto al valor promedio. Dicho de otra manera, la desviación estándar es
simplemente el "promedio" o variación esperada con respecto a la media aritmética.
Por ejemplo, las tres muestras (0, 0, 14, 14), (0, 6, 8, 14) y (6, 6, 8, 8) cada una
tiene una media de 7. Sus desviaciones estándar muestrales
son 7, 5 y 1 respectivamente. La tercera muestra tiene una desviación mucho menor
que las otras dos porque sus valores están más cerca de 7.
4. La desviación estándar puede ser interpretada como una medida de incertidumbre.
La desviación estándar de un grupo repetido de medidas nos da la precisión de
éstas. Cuando se va a determinar si un grupo de medidas está de acuerdo con el
modelo teórico, la desviación estándar de esas medidas es de vital importancia: si la
media de las medidas está demasiado alejada de la predicción (con la distancia
medida en desviaciones estándar), entonces consideramos que las medidas
contradicen la teoría. Esto es coherente, ya que las mediciones caen fuera del rango
de valores en el cual sería razonable esperar que ocurrieran si el modelo
teórico fuera correcto. La desviación estándar es uno de tres parámetros de
ubicación central; muestra la agrupación de los datos alrededor de un valor central
(la media o promedio).
La desviación estándar (DS/DE), también llamada desviación típica, es una
medida de dispersión usada en estadística que nos dice cuánto tienden a alejarse los
valores concretos delpromedio en una distribución. De hecho, específicamente, el
cuadrado de la desviación estándar es "el promedio del cuadrado de la distancia de
cada punto respecto del promedio". Se suele representar por una S o con la letra
sigma, .
La desviación estándar de un conjunto de datos es una medida de cuánto se desvían
los datos de su media. Esta medida es más estable que el recorrido y toma en
consideración el valor de cada dato.
Distribución de probabilidad continúa
Es posible calcular la desviación estándar de una variable aleatoria continua como
la raíz cuadrada de la integral
donde
Distribución de probabilidad discreta
La Desviación Estándar es la raíz cuadrada de la varianza de la distribución de
probabilidad discreta:
Cuando los casos tomados son iguales al total de la población se aplica la fórmula
de desviación estándar poblacional. Así la varianza es la media de los cuadrados de
5. las diferencias entre cada valor de la variable y la media aritmética de la
distribución.
Aunque esta fórmula es correcta, en la práctica interesa el realizar inferencias
poblacionales, por lo que en el denominador en vez de , se usa según
la corrección de Bessel. Esta ocurre cuando la media de muestra se utiliza para
centrar los datos, en lugar de la media de la población. Puesto que la media de la
muestra es una combinación lineal de los datos, el residual a la muestra media se
extiende más allá del número de grados de libertad por el número de ecuaciones de
restricción —en este caso una—. Dado esto a la muestra así obtenida de una
muestra sin el total de la población se le aplica esta corrección con la fórmula
desviación estándar muestral.
Varianza
En teoría de probabilidad, la varianza (que suele representarse como ) de
una variable aleatoria es una medida de dispersión definida como la esperanza del
cuadrado de la desviación de dicha variable respecto a su media.
Está medida en unidades distintas de las de la variable. Por ejemplo, si la variable
mide una distancia en metros, la varianza se expresa en metros al cuadrado.
La desviación estándar es la raíz cuadrada de la varianza, es una medida de
dispersión alternativa expresada en las mismas unidades de los datos de la variable
objeto de estudio. La varianza tiene como valor mínimo 0.
Hay que tener en cuenta que la varianza puede verse muy influida por los valores
atípicos y no se aconseja su uso cuando las distribuciones de las variables aleatorias
tienen colas pesadas. En tales casos se recomienda el uso de otras medidas de
dispersión más robustas.
El término varianza fue acuñado por Ronald Fisher en un artículo publicado en
enero de 1919 con el título The Correlation Between Relatives on the Supposition
of Mendelian Inheritance
Si tenemos un conjunto de datos de una misma variable, la varianza se calcula de la
siguiente forma:
6. Siendo:
: cada dato
: El número de datos
: la media aritmética de los datos
Variable aleatoria
Aplicando este concepto a una variable aleatoria con media μ = E[X], se define
su varianza, Var(X) (también representada como o, simplemente σ2), como
Desarrollando la definición anterior, se obtiene la siguiente definición alternativa (y
equivalente):
Si una distribución no tiene esperanza, como ocurre con la de Cauchy, tampoco
tiene varianza. Existen otras distribuciones que, aun teniendo esperanza, carecen de
varianza. Un ejemplo de ellas es la de Pareto cuando su índice k satisface 1 < k ≤ 2.
Caso continuo
Si la variable aleatoria X es continua con función de densidad f(x), entonces
donde
y las integrales están definidas sobreel rango de X.
7. Caso discreto
Si la variable aleatoria X es discreta con pesos x1 ↦ p1, ..., xn ↦ pn y n es la cantidad
total de datos, entonces tenemos:
Donde
.
Coeficiente de Variación
En estadística, cuando se desea hacer referencia a la relación entre el tamaño de la media y la
variabilidad de la variable, se utiliza el coeficiente de variación.
Su fórmula expresa la desviación estándar como porcentaje de la media aritmética, mostrando una
mejor interpretación porcentual del grado de variabilidad que la desviación típica o estándar. Por otro
lado presenta problemas ya que a diferencia de la desviación típica este coeficiente es variable ante
cambios de origen. Por ello es importante que todos los valores sean positivos y su media dé, por
tanto, un valor positivo. A mayor valor del coeficiente de variación mayor heterogeneidad de los
valores de la variable; y a menor C.V., mayor homogeneidad en los valores de la variable. Suele
representarse por medio de las siglas C.V.
Se calcula:
Donde es la desviación típica. Se puede dar en tanto por ciento calculando:
Propiedades y aplicaciones
El coeficiente de variación no posee unidades.
El coeficiente de variación es típicamente menor que uno. Sin embargo, en ciertas distribuciones
de probabilidad puede ser 1 o mayor que 1.
8. Para su mejor interpretación se expresa como porcentaje.
Depende de la desviación típica, también llamada "desviación estándar", y en mayor medida de
la media aritmética, dado que cuando ésta es 0 o muy próxima a este valor el C.V. pierde
significado, ya que puede dar valores muy grandes, que no necesariamente implican dispersión
de datos.
El coeficiente de variación es común en varios campos de la probabilidad aplicada, como teoría
de renovación y teoría de colas. En estos campos la distribución exponencial es a menudo más
importante que la distribución normal. La desviación típica de una distribución exponencial es
igual a su media, por lo que su coeficiente de variación es 1. La distribuciones con un C.V.
menor que uno, como la distribución de Erlang se consideran de "baja varianza", mientras que
aquellas con un C.V. mayor que uno, como la distribución hiperexponencial se consideran de
"alta varianza". Algunas fórmulas en estos campos se expresan usando el cuadrado del
coeficiente de variación, abreviado como S.C.V. (por su siglas en inglés).