Este documento trata sobre la historia y conceptos básicos de la estadística. Brevemente describe los orígenes de la estadística en el antiguo Egipto y China, y cómo se desarrolló formalmente en el siglo XVII. Luego define conceptos clave como población, muestra, variables cualitativas y cuantitativas, y los pasos para formar distribuciones de frecuencia a partir de datos primarios.
Es la rama de las matemáticas que se ocupa de reunir y organizar datos numéricos, que ayuden a resolver problemas como el diseño de experimentos y la toma de decisiones.Un ejemplo de la estadística de probabilidad es cuando tiramos un dado y estudiamos las posibilidades que contamos en lograr un determinado número.
Es la rama de las matemáticas que se ocupa de reunir y organizar datos numéricos, que ayuden a resolver problemas como el diseño de experimentos y la toma de decisiones.Un ejemplo de la estadística de probabilidad es cuando tiramos un dado y estudiamos las posibilidades que contamos en lograr un determinado número.
EL MERCADO LABORAL EN EL SEMESTRE EUROPEO. COMPARATIVA.ManfredNolte
Hoy repasaremos a uña de caballo otro reciente documento de la Comisión (SWD-2024) que lleva por título ‘Análisis de países sobre la convergencia social en línea con las características del Marco de Convergencia Social (SCF)’.
“La teoría de la producción sostiene que en un proceso productivo que se caracteriza por tener factores fijos (corto plazo), al aumentar el uso del factor variable, a partir de cierta tasa de producción
Conceptos básicos del gasto de gobierno en Bolivia
Esta di stica_descriptiva_ppt completa dr gilberto lopez
1. Dr. Gilberto López Canteñs
TEMAS:
1.INTRODUCCIÓN
2.ESTADÍSTICA DESCRIPTIVA
2. Historia de la Estadística
Se cree que los orígenes de la estadística están ligados
al antiguo Egipto y a los censos chinos hace unos 4000
años, aproximadamente.
Desde esa época, diversos estados realizaron estudios
sobre algunas características de sus poblaciones, sus
riquezas, posesiones, etc.
En 1662, John Graunt, un mercader Inglés, publicó un
libro sobre los nacimientos y defunciones ocurridos en
Londres; el libro tenia conclusiones acerca de ciertos
aspectos relacionados con estos acontecimientos. Esta
obra es considerada como el punto de partida de la
estadística moderna.
3. La palabra estadística comenzó a usarse en el siglo XVIII,
en Alemania, en relación a estudios donde los grandes
números, que representaban datos, eran de importancia
para el estado. Sin embargo, la estadística moderna se
desarrolló en el siglo XX a partir de los estudios de Karl
Pearson.
Hoy la estadística tiene gran importancia, no sólo por que
presenta información, sino que además permite inferir y
predecir lo que va a ocurrir, y por lo tanto, es una
herramienta fundamental a la hora de tomar decisiones de
importancia.
Historia de la Estadística
4. La Ingeniería y la Solución de
Problemas
Un ingeniero resuelve problemas de interés para la
sociedad mediante la aplicación eficiente de principios
científicos.
El método de la ingeniería o científico es el enfoque
aplicado para formular y resolver estos problemas.
5. Pasos del Método de la Ingeniería
1. Desarrollar una descripción clara y concisa del
problema.
2. Identificar los factores importantes que afectan el
problema o que pueden jugar un papel en su
solución.
3. Proponer un modelo para el problema, utilizando los
conocimientos científicos o de la ingeniería del
fenómeno en estudio. Consignar todas las
limitaciones y/o supuestos del modelo.
Cont.
6. Pasos del Método de la Ingeniería
4. Realizar los experimentos apropiados y recolectar datos
para probar o validar el modelo tentativo o las
conclusiones planteadas en los pasos 2 y 3.
5. Refinar el modelo con base en los datos observados.
6. Manipular el modelo para contribuir a desarrollar una
solución del problema.
7. Realizar un experimento apropiado para confirmar que
la solución propuesta es efectiva y eficiente.
8. Sacar conclusiones o hacer recomendaciones con base
en la solución del problema.
7. Pasos del Método de la Ingeniería
El recuadro punteado indica que puede requerirse varios
ciclos e iteraciones para obtener la solución final.
Los ingenieros deben conocer una manera eficiente para planear
experimentos, recolectar datos, analizar e interpretar datos, y entender
cómo se relacionan los datos observados con el modelo propuesto.
10. INVESTIGACIÓN CIENTÍFICA
El planteamiento de un problema científico.
El desarrollo de un modelo verificable para resolverlo.
Un proceso riguroso y objetivo de observación y
recopilación de datos.
El análisis e interpretación de los hallazgos en función
del modelo planteado, el contexto y el conocimiento
científico previamente establecido.
La comunicación apropiada de sus resultados a la
comunidad científica y la sociedad para su verificación y
aplicación.
11. EL PROCESO DE INVESTIGACIÓN
CIENTÍFICA
Recolección de datos:
Puede ser con un
estudio observacional, y
con un experimento
diseñado. La cantidad de
información necesaria, la
forma de recolección y las
técnicas para adquirirla,
de manera que sea
relevante al problema, y
las conclusiones que se
extraigan tengan cierto
grado de confiabilidad,
son tratados en el Diseño
de Experimentos y
Muestreo Estadístico.
12. Es una ciencia que constantemente
proporciona métodos y técnicas para
mejorar la calidad de las observaciones
científicas, y ayuda a la toma de
decisiones acerca de problemas
científicos específicos.
13. La estadística tiene que ver con la recopilación,
presentación, análisis y uso de datos para tomar
decisiones, resolver problemas y diseñar productos y
procesos.
Cualquier persona recibe información en forma de datos a
través de algún medio; y a menudo es necesario obtener
alguna conclusión a partir de la información contenida en los
datos.
Los métodos empleados para resumir y organizar datos
se denominan estadística descriptiva; mientras que los
métodos para tomar decisiones se denominan
inferencia estadística.
14. Métodos estadísticos
Se utilizan como ayuda para describir y entender la
variabilidad.
Variabilidad: Se entiende que observaciones sucesivas
de un sistema o fenómeno no producen exactamente el
mismo resultado.
El pensamiento estadístico puede ofrecernos un
recurso conveniente para incorporar esta variabilidad
en nuestros procesos de toma de decisiones.
15. Métodos estadísticos
Ejemplo: Consideremos el rendimiento del tanque de
diesel de un tractor que tiene acoplado un arado.
¿Se arará siempre la misma cantidad de área con cada
tanque de combustible?
No, depende de varios factores
Estos factores son fuentes de variabilidad potenciales en
el sistema.
La estadística proporciona el marco para describir
esta variabilidad y para saber cuáles de las fuentes
tienen mayor impacto sobre el rendimiento.
16. Estadística e Incertidumbre
Ejemplo: Queremos saber la producción de maíz por
ha en una región, pero nuestros recursos económicos
nos permiten entrevistar sólo a 100 de los 1000
agricultores de la zona.
Cualquier conclusión contendrá elementos de
incertidumbre, ya que no es imposible que
entrevistemos a los 100 peores (o mejores) agricultores
y por tanto nuestras afirmaciones, basadas en los
datos, subestimará (o sobreestimará) la producción
verdadera de maíz.
17. Estadística e Incertidumbre
Esta incertidumbre ocurre cuando se concluye sobre
un conjunto mayor que aquél sobre el que se tiene
información.
El método de razonamiento aplicado es el inductivo,
que es un proceso lógico que va de lo particular a lo
general.
Otro método es el deductivo, que se procede de lo
general a lo particular.
18. Estadística e Incertidumbre
El papel de la Estadística en el caso analizado es es
cuantificar la incertidumbre que es inseparable de las
conclusiones obtenidas.
La cuantificación se logra mediante el uso de los
conceptos y técnicas de la Probabilidad.
Con el conocimiento de la Probabilidad, podremos
desarrollar los métodos estadísticos de naturaleza
inductiva, que se conocen como: Inferencia
Estadística o Estadística Inductiva.
19. Estadística e Incertidumbre
Estudio enumerativo: Usa una muestra para inferir sobre
la población de la que se ha seleccionado.
Estudio analítico: Usa una muestra para hacer inferencia
sobre una población futura.
20. Conceptos Básicos
En muchas ocasiones, para llevar a cabo una
investigación se hacen encuestas, las cuales
son dirigidas a una muestra representativa de
la población. Para comprender mejor este tipo
de estudios es importante que conozcas los
siguientes términos básicos:
21. Población:
Es un conjunto de personas, eventos o cosas de las
cuales se desea hacer un estudio, y tienen una
característica en común.
Muestra:
Es un subconjunto cualquiera de
la población; es importante
escoger la muestra en forma
aleatoria (al azar), pues así se
logra que sea representativa y
se puedan obtener conclusiones
más afines acerca de las
características de la población.
Población
Elementos o
unidad de análisis
Muestra
22. A cada característica de los elementos de una
población se le llama variables. Nos
encontraremos con varios tipos de variables:
cualitativas y cuantitativas.
Las variables cualitativas son aquellas que se
refieren a categorías o atributos de los elementos
(individuos) estudiados.
Las variables cuantitativas son aquellas cuyos
datos son de tipo numérico.
Para estudiar alguna característica especifica de
la población se pueden definir los siguientes
tipos de variables:
23. TIPOS DE VARIABLES CUALITATIVAS
Dicotómicas: Sólo hay dos categoría, que son
excluyentes una de la otra.
Ejemplo: planta enferma-sana, se rego-no se rego
Nominal: tiene mas de dos categorías y no hay
orden entre ellas.
Ejemplo: marca de tractores, tipos de sembradora
(neumática, mecánica)
Ordinal: tiene varias categorías y hay orden entre
ellas.
Ejemplo: grado de salinidad, calidad de la
fumigación realizada.
24. TIPOS DE VARIABLES CUANTITATIVAS
Continuas: números infinito no numerables de
elementos. Tiene asociado el concepto de medida
Ejemplo: Consumo de combustible, Potencia del motor.
Discretas: números finitos o infinitos numerables de
elementos. Se asocia con el concepto de conteo.
Ejemplo: N° de tractores, N° de cosechadoras por estado.
Hay ocasiones en las que las medidas cuantitativas continuas son
transformadas en ordinales mediante la utilización de uno o varios puntos de
corte.
Ejemplo: La variable conductividad hidráulica del suelo es codificada en varias
categorías y se utiliza en términos como: permeabilidad alta, media o baja
25.
26. DATOS PRIMARIOS
Los datos primarios son los datos recolectados que no
han sido ordenados numéricamente. Como ejemplo
puede servir el conjunto de las propiedades físico-
mecánicas (humedad (%), espesor (m), masa de 1000
semillas (g), masa volumétrica (kg/m3) y
características dimensionales de la semilla de una
planta (longitud y anchura (m)) para el diseño de una
sembradora (25 semillas de amaranto).
27. ORDENAMIENTO
Un ordenamiento es una disposición de los datos
numéricos primarios en orden creciente o decreciente
de magnitud. La diferencia entre el número mayor y el
menor se denomina recorrido. Por ejemplo, si la
humedad mayor de las 25 semillas es 7.49 % y la menor
es de 7.34 %, el recorrido es 0.15%.
28. DISTRIBUCIÓN DE FRECUENCIA
Cuando se reúnen grandes cantidades de datos
primarios con frecuencia es útil distribuir los datos en
clases y categorías, y determinar el número de
individuos que pertenecen a una clase, llamada
frecuencia de clase.
29. DISTRIBUCIÓN DE FRECUENCIA
El ordenamiento tabular de los datos por clases
conjuntamente con las frecuencias de clase se
denomina distribución de frecuencia o tabla de
frecuencia.
Cuadro 1. Humedad en porcentaje de las 25 semillas de amaranto
Límite
Inferior
Límite
Superior
Valores
Medio
Frecuencia
7.35 7.37 7.36 3
7.38 7.40 7.39 6
7.41 7.43 7.42 10
7.44 7.46 7.45 4
7.47 7.49 7.48 2
30. DISTRIBUCIÓN DE FRECUENCIA
Los datos organizados y dosificados como en la
distribución de frecuencia anterior se denominan
datos agrupados. Este proceso tiene la desventaja que
destruye el detalle original de los datos, y como
ventaja, la claridad que se muestra en el cuadro
anterior y en las relaciones, que así se hacen evidentes
31. INTERVALOS DE CLASE Y LÍMITES
DE CLASE
Si las humedades de las semillas se registran con
aproximación de 0.01 %, el intervalo de clase teórico
incluye todas las medidas desde 7.345 y 7.375 % son
llamados límites reales; el número más pequeño es el
límite de clase real inferior y el mayor 7.375 % es el
límite de clase real superior.
En la práctica, los límites de clases reales se obtienen
sumando al límite superior de un intervalo de clase el
límite inferior del intervalo de clase próximo mayor y
dividiendo por dos.
32. LIMITES DE CLASES REALES
Algunas veces los límites de clases reales son
utilizados para simbolizar las clases. Para evitar
ambigüedades al utilizar ésta notación, los límites de
clase no deben coincidir con las observaciones reales.
Así, si una observación fuera de 7.375 % no sería
posible decidir si pertenecía al intervalo de clase
7.345 – 7.375 ó al 7.375 – 7.405.
33. TAMAÑO O AMPLITUD DE UN
INTERVALO
Es la diferencia entre los límites de clase reales
superior e inferior que también se refiere a la
amplitud de clase, tamaño de clase, longitud de
clase.
Si todos los intervalos de clase de una distribución de
frecuencia tienen las mismas amplitudes, ésta
amplitud común es denotada por c.
En este caso c es igual a la diferencia entre los dos
límites de clase inferiores sucesivos o los dos límites de
clase superiores sucesivos. Para nuestro caso c = 7.375
– 7.345 = 7.405 – 7.375 = 0.03.
34. MARCA DE CLASE
La marca de clase o punto medio de la clase es el
punto medio del intervalo de clase y se obtiene
sumando los límites de clase inferior y superior y
dividiéndolos por dos. Por lo que, para el intervalo 7.35
– 7.37 del Cuadro 1, sería (7.35 + 7.37)/2 =7.36.
Para el análisis estadístico, se considera que todas las
mediciones que pertenecen a un intervalo de clase
dado coinciden con la marca de clase. Por ejemplo,
todas las humedades de la semilla que caen en el
intervalo 7.35 -7.37 % se consideran 7.36 %.
35. REGLAS GENERALES PARA FORMAR
LAS DISTRIBUCIONES DE FRECUENCIA
1. Determine los números mayores y menores en los datos
primarios y entonces halle el recorrido o amplitud.
2. Divida el recorrido por un número conveniente de intervalos
de clase que tengan el mismo tamaño. Si esto no es factible,
use intervalos de clase de diferentes tamaños o intervalos de
clase abiertos. El número de los intervalos de clase usualmente
se toma entre 5 y 20, dependiendo de los datos. Los intervalos
de clase son también seleccionados de manera que las marcas
de clase o puntos medios coincidan con los datos realmente
observados. Esto tiene a aminorar el llamado error de
agrupación implicado en el análisis estadístico posterior. Sin
embargo, los límites de clase reales no deben coincidir con los
datos observados.
3. Determine el número de observaciones que caen dentro de
cada intervalo de clase, es decir halle las frecuencias de clase.
36. HISTOGRAMA Y POLÍGONOS DE
FRECUENCIA
Se corresponden con dos representaciones gráficas de las distribuciones
de frecuencia:
Un histograma consiste en un conjunto de rectángulos (gráfica de
barras) que tienen:
Base sobre un eje horizontal (el eje X) con los centros en las marcas
de clase o puntos medios y las longitudes iguales a los tamaños de los
intervalos de clase.
El eje vertical (el eje Y) representa las frecuencias con que se repiten
las mediciones en un intervalo de clase.
Las áreas proporcionales a las frecuencias de clase. Si los intervalos de
clase tienen todos los mismos tamaños, las alturas de los rectángulos
son proporcionales a las frecuencias de clase y entonces es costumbre
tomar las alturas numéricamente iguales a las frecuencias de clase. Si
los intervalos de clase no tienen igual tamaño, estas alturas pueden ser
ajustadas.
37. HISTOGRAMA Y POLÍGONOS DE
FRECUENCIA
Un polígono de frecuencia es un gráfico de líneas de
frecuencia de clase trazado en función del punto medio.
Puede obtenerse uniendo entre sí los puntos medios de los
topes de los rectángulos en el histograma.
Figura 1. Histograma
y polígonos de
frecuencia de la
humedad de la
semilla de amaranto.
38. DISTRIBUCIONES DE FRECUENCIAS
RELATIVAS
La frecuencia relativa de una clase es la frecuencia de la
clase dividida por la frecuencia total de todas las clases
y generalmente se expresa como un porcentaje.
Límite
Inferior
Límite
Superior
Valores
Medio
Frecuencia Frecuencia
Relativa
7.35 7.37 7.36 3 0.12
7.38 7.40 7.39 6 0.24
7.41 7.43 7.42 10 0.40
7.44 7.46 7.45 4 0.16
7.47 7.49 7.48 2 0.08
Total Sumatoria
25 1.00
Cuadro 2. Frecuencia relativa de la humedad de 25
semillas de amaranto.
39. DISTRIBUCIONES DE FRECUENCIAS
RELATIVAS
Si las frecuencias en el Cuadro 1 (Tabla de frecuencia)
son reemplazadas por las frecuencias relativas
correspondientes, el cuadro resultante se llama
distribución de frecuencia relativa, distribución
porcentual, o tabla de frecuencia relativa (Cuadro 2).
Los gráficos resultantes son llamados histogramas de
frecuencia relativa, o histogramas porcentuales y
polígonos de frecuencia relativa o polígonos
porcentuales respectivamente.
40. DISTRIBUCIONES DE FRECUENCIAS
ACUMULATIVAS U OJIVAS
La frecuencia total de todos los valores menores o
igual que el límite de clase real superior del intervalo
de clase dado se llama frecuencia acumulada. Por
ejemplo, la frecuencia acumulada que incluya el
intervalo de clase 7.41 – 7.43 en el Cuadro 1 es 3 + 6 + 10
= 19, lo que significa que 19 semillas tienen humedades
menores que 7.435 %.
41. DISTRIBUCIONES DE FRECUENCIAS
ACUMULATIVAS U OJIVAS
Una tabla que presente tales frecuencias acumuladas
se denomina distribución de frecuencia acumulada,
tabla de frecuencia acumulada o simplemente
distribución acumulativa.
Humedades (%) No. de semillas
Menos de 7.345 0
Menos de 7.375 3
Menos de 7.405 9
Menos de 7.435 19
Menos de 7.465 23
Menos de 7.495 25
Cuadro 3. Frecuencia acumulada de la humedad de 25
semillas de amaranto.
42. DISTRIBUCIONES DE FRECUENCIAS
ACUMULATIVAS U OJIVAS
Un gráfico que muestre la frecuencia acumulada
menor que cualquier límite de clase real superior
trazado en función del límite de clase superior se
denomina polígono de frecuencia acumulativa u
ojiva .
Figura 2. Número de
semillas acumuladas para
los diferentes intervalos
de clase
43. DISTRIBUCIONES DE FRECUENCIAS
ACUMULATIVAS U OJIVAS
Para algunos propósitos es aconsejable considerar una
distribución de frecuencia acumulativa de todos los valores
mayores o iguales al límite de clase inferior real década intervalo
de clase. Como consideramos en este caso las humedades de 7.345
ó mayor, 7.375 % ó mayor, algunas veces esta distribución
acumulativa se llama “ó mayor” mientras la considerada
anteriormente es una distribución acumulativa “menor que”.
Una se obtiene fácilmente de la otra, por ejemplo para la humedad
de 7.345 % ó mayor el número de semillas es 25, mientras que para
7.375 % es 22 y así sucesivamente hasta que la frecuencia
acumulada es igual a CERO. Las ojivas correspondientes son
llamadas ojivas “o mayor” y “menor que”.
44. DISTRIBUCIONES DE FRECUENCIAS ACUMULATIVAS
RELATIVAS U OJIVAS PORCENTUALES
La frecuencia acumulativa relativa o frecuencia
acumulativa porcentual es la frecuencia acumulativa
dividida por la frecuencia total. Por ejemplo, la frecuencia
acumulativa relativa de las humedades menores de 7.435 %
es 19/25 = 76 %, lo que significa que el 76 % de las semillas
tienen humedades menores que 7.435 %.
Si las frecuencias acumulativas relativas son utilizadas en el
Cuadro 3 y la Figura 2 en lugar de las frecuencias
acumuladas los resultados son llamados distribuciones
de frecuencia acumulativas relativas o distribuciones
acumulativas porcentuales, y polígonos de frecuencia
acumulativa relativa u ojivas porcentuales
respectivamente.
45. CURVAS DE FRECUENCIA. OJIVAS SUAVIZADAS
Los datos obtenidos pueden ser considerados como que pertenecen a
una muestra sacada de una población grande. Como en la población
están disponibles muchas observaciones, teóricamente es posible (para
los datos continuos) escoger los intervalos de clase muy pequeños y no
obstante que tengan números medibles de observaciones que caigan
dentro de cada clase. Así se podría esperar que el polígono de
frecuencia o polígono de frecuencia relativa para una población grande
estuviera dividida en tan pequeños segmentos lineales que pueden
aproximarse por curvas, las cuales se llaman curvas de frecuencia o
curvas de frecuencia relativas, respectivamente.
46. CURVAS DE FRECUENCIA. OJIVAS SUAVIZADAS
Es razonable esperar que tales curvas teóricas puedan ser
aproximadas suavizando los polígonos de frecuencia o los
polígonos de frecuencia relativa de la muestra, mejorando
la aproximación a medida que aumenta el tamaño de la
muestra. Por esta razón una curva de frecuencia algunas
veces es llamada polígono de frecuencia suavizado.
De una forma similar las ojivas suavizadas se obtienen
suavizando los polígonos de frecuencia acumulativa u
ojivas.
47. TIPOS DE CURVAS DE FRECUENCIA
Curva simétrica o acampanada
Las curvas simétricas o acampanadas se
caracterizan por el hecho de que las observaciones
equidistantes del máximo central tienen la misma
frecuencia. Un ejemplo importante es la curva normal.
48. TIPOS DE CURVAS DE FRECUENCIA
Curva asimétrica a la derecha
(asimetría positiva)
En las curvas de frecuencia moderadamente asimétricas o
asimétricas, la cola de la curva a un lado del máximo
central es más larga que al otro. Si la cola más larga está
a la derecha, se dice que la curva es asimétrica a la
derecha o que tiene asimetría positiva, pero si ocurre lo
contrario, se dice que la curva es asimétrica a la izquierda,
o que tiene asimetría negativa.
Curva asimétrica a la izquierda
(asimetría negativa)
49. TIPOS DE CURVAS DE FRECUENCIA
Curva forma de J
En una curva en forma de J, o de J a la inversa el
máximo se encuentra en un extremo.
Curva forma de J a la
inversa
50. TIPOS DE CURVAS DE FRECUENCIA
Curva forma de U
Una curva de frecuencia en forma de U tiene los
máximos a ambos extremos.
51. TIPOS DE CURVAS DE FRECUENCIA
Curva bimodal
Una curva de frecuencia bimodal (g) tiene dos
máximos.
52. TIPOS DE CURVAS DE FRECUENCIA
Curva multimodal
Una curva de frecuencia multimodal tiene más de dos
máximos.
53.
54. ÍNDICE O SUBÍNDICE
Sea el símbolo Xj cualquiera de los N valores X1, X2, X3,
…, XN tomados por una variable X. La letra j en Xj, que
significa cualquiera de los números 1, 2, 3, …, N se
llama subíndice o índice.
55. SUMATORIA
El símbolo se utiliza para denotar la suma de todas
las Xj de j = 1 hasta j = N, es decir, por definición:
Ejemplos:
56. PROMEDIOS Y MEDIDAS DE
TENDENCIA CENTRAL
Un promedio es un valor que es típico o representativo
de un conjunto de datos. Como tales valores típicos
tienden a distribuirse centralmente dentro de un
conjunto de datos ordenados de acuerdo con su
magnitud, los promedios son llamados también
medidas de tendencia central.
Tipos de medidas centrales son las siguientes: media
aritmética o como se conoce comúnmente media, la
mediana, la moda, la media geométrica, y la
media armónica.
57. MEDIA ARITMÉTICA
La media de un conjunto de N números X1, X2, X3, …,
XN se denota por y se define como:
Si los números X1, X2, X3, …, XK aparecen f1, f2, f3, …,
fK veces respectivamente (es decir, aparecen con
frecuencias f1, f2, f3, …, fK ), la media aritmética es:
Ec. 2
Ej.
Ejemplo: Si 5, 10, 15, 20 y 25 aparecen con frecuencias 3, 2, 4, 3 y 1
respectivamente
58. MEDIA ARITMÉTICA PONDERADA
Algunas veces con los números X1, X2, X3, …, XK
asociamos ciertos factores de ponderación o
ponderaciones w1, w2, w3, …, wK dependiendo de la
significación o importancia dada a los números. En
este caso:
Ej.
Ejemplo: Se obtiene en un punto de la parcela los valores de
conductividad hidráulica de 1.5 y 0.22 m/día para dos profundidades 0.1 y
0.3 m respectivamente.
59. PROPIEDADES DE LA MEDIA ARITMÉTICA
La suma algebraica de las desviaciones de un conjunto
de números de su media aritmética es cero.
La suma de los cuadrados de las desviaciones de un
conjunto de números Xj de cualquier número a es un
mínimo si y sólo si a = .
Ej.
Ejemplo: Pruebe que
.
es un mínimo si a =
La expresión es un mínimo cuando
60. PROPIEDADES DE LA MEDIA ARITMÉTICA
Si f1 números tienen la media m1, f2 números tienen la
media m2, f3 números tienen la media m3, …, fK
números tienen la media mK, la media de todos los
números es:
Ej.
61. PROPIEDADES DE LA MEDIA ARITMÉTICA
Supongamos que A es una media aritmética (puede ser
cualquier número) y si dj = Xj – A son las desviaciones
de Xj con respecto a A, entonces las ecuaciones de la
media aritmética (1 y 2) se convierten en:
Donde:
Ec. 6
62. MEDIA ARITMÉTICA CALCULADA DE DATOS
AGRUPADOS
Cuando los datos se presentan en una distribución de
frecuencia, todos los valores que caen en un intervalo
de clase dado son considerados como coincidentes con
el punto medio del intervalo. Las ecuaciones (2) y (6)
son válidas para tales datos agrupados si interpretamos
a Xj, como un punto medio, y a fj como su
correspondiente frecuencia de clase, a A como
cualquier punto medio supuesto y a dj = Xj – A como
las desviaciones de Xj con respecto a A.
Ej. 15 o 20
63. MEDIA ARITMÉTICA CALCULADA DE DATOS
AGRUPADOS
Si los intervalos de clase tienen todos el mismo tamaño c,
las desviaciones dj = Xj – A pueden expresarse también como
cuj, donde uj pueden ser enteros positivos o negativos o
cero, es decir, 0, ±1, ±2, ±3, …, y la formula (6) se convierte:
Que es equivalente a la ecuación:
Esto es llamado el método de codificación para calcular la
media
Ej. 22
64. MEDIANA
La mediana de un conjunto de números dispuestos en
orden de magnitud (es decir, en un ordenamiento) es
el valor medio o la media aritmética de los valores
centrales.
Ejemplo: El conjunto de números 3, 4, 4, 5, 6, 8, 8, 8, 10
tiene la mediana 6.
El conjunto de números 5, 5, 7, 9, 11, 12, 15,
18 tiene la mediana ½(9+11) = 10
1 2
2 ( 2) 1
2
n
n n
x si n es impar
Me x x
si n es par
65. MEDIANA
Para los datos agrupados la mediana obtenida por
interpolación está dada por:
Donde:
L1, es el límite de clase real inferior de la clase mediana ( es decir, la
clase que contiene la mediana)
N, es el número de datos observados ( es decir frecuencia total)
, es la suma de las frecuencias de todas las clases inferiores a la
clase mediana
fmediana, es la frecuencia de la clase mediana
c, es el tamaño del intervalo de clase de la mediana.
Ej. 28
66. MEDIANA
Geométricamente la mediana es el valor de X (abscisa)
correspondiente a la línea vertical que divide un
histograma en dos partes que tienen áreas iguales. Este
valor de X algunas veces se denota por .
67. La mediana es aquel valor que deja el cincuenta por
ciento de los datos por debajo y otro cincuenta por
encima.
Cabe destacar que es preferible el uso de la
mediana como medida descriptiva del centro
cuando se quiere reducir o eliminar el efecto de
valores extremos en un conjunto de datos (muy
grandes o muy pequeños).
MEDIANA
68. MODA
La moda de un conjunto de números es el valor que
aparece con mayor frecuencia, es decir, es el valor más
común. La moda puede no existir, o incluso si existe,
puede no ser única.
Ejemplo: El conjunto 2, 2, 3, 5, 7, 9, 9, 9, 10, 11, 12, 18 tiene la moda 9 y se
llama unimodal
El conjunto 3, 5, 8, 10, 12, 15, 16 no tiene moda
El conjunto 2, 3, 4, 4, 4, 5, 5, 7, 7, 7, 9 tiene dos modas 4 y 7 y se llama
bimodal.
69. MODA
En el caso de datos agrupados donde una curva de
frecuencia ha sido construida para ajustarse a los datos, la
moda será el valor (o valores) de X correspondiente al
punto máximo (o puntos) de la curva. Este valor de X
algunas veces se denota por .
En una distribución de frecuencia o histograma la moda
puede ser obtenida a partir de la ecuación:
Donde:
L1, es el límite de clase real inferior de la clase modal (es decir, que contiene la moda)
Δ1, es el exceso de la frecuencia modal sobre la frecuencia de la clase inferior más
próxima
Δ2, es el exceso de la frecuencia modal sobre la frecuencia de la clase superior más
próxima
c, es el tamaño del intervalo de clase modal.
Ej. 33
70. RELACIÓN EMPÍRICA ENTRE LA MEDIA, LA
MEDIANA Y LA MODA
Para las curvas de frecuencia unimodales que son
moderadamente asimétricas tenemos la relación
empírica:
Media – Moda = 3(Media – Mediana)
71. RELACIÓN EMPÍRICA ENTRE LA MEDIA, LA
MEDIANA Y LA MODA
A continuación se muestran las posiciones relativas de la media, la mediana
y la moda para las curvas de frecuencia que son asimétricas a la derecha y a
la izquierda respectivamente. Para las curvas simétricas la media, la moda y
la mediana coinciden en un mismo valor.
a) Asimétrica a la derecha b. Asimétrica a la izquierda
72. MEDIA GEOMÉTRICA
La media geométrica G de un conjunto de valores de N
números X1, X2, X3, …, XN es la Nésima raíz del
producto de los números:
Ejemplo: La media geométrica de los números 2, 4 y 8 es
73. MEDIA ARMÓNICA
La media armónica H de un conjunto de N números
X1, X2, X3, …, XN es el recíproco de la media aritmética
de los recíprocos de los números:
En la práctica puede ser más fácil recordar que:
Ejemplo: La media armónica de los números 2, 4 y 8 es:
74. RELACIÓN ENTRE LAS MEDIAS ARITMÉTICA,
GEOMÉTRICA Y ARMÓNICA
La media geométrica de un conjunto de valores
positivos X1, X2, X3, …, XN es menor que o igual a su
media aritmética pero es mayor que o igual a su media
armónica. En símbolos:
Los signos de igualdad se conservan sólo si todos los
números X1, X2, X3, …, XN son idénticos.
Ejemplo: El conjunto 2, 4 y 8 tiene la media aritmética
4.67, la media geométrica 4, y la media armónica 3.43.
75. RAÍZ MEDIA CUADRADA
La raíz media cuadrada (RMC) o media cuadrática de
un conjunto de valores X1, X2, X3, …, XN algunas veces se
denota por y se define por:
Este tipo de promedio frecuentemente se emplea en aplicaciones físicas.
Ejemplo: La RMC de un conjunto de números 1, 3, 4, 5 y 7 es:
76. CUARTILES, DECILES Y PERCENTILES
Si un conjunto de datos se coloca en orden de
magnitud, el valor medio que divide el conjunto en dos
partes iguales es la mediana.
Ampliando esta idea podemos pensar igual de los
valores que dividen al conjunto en cuatro partes
iguales. Estos valores denotados por Q1, Q2 y Q3, son
denominados el primer, segundo y tercer cuartil
respectivamente, siendo el valor Q2 igual a la mediana.
77. El primer cuartil, al que se le llama Q1, es el valor por
debajo del cual se encuentra el 25% de los datos, y el
tercer cuartil usualmente llamado Q3, es el valor por
debajo de el se encuentra el 75% de los datos. Q2 es la
mediana.
Los valores Q1, Q2 y Q3 dividen al conjunto de datos
ordenados en cuatro partes iguales. Q1 se puede
entender como la mediana de la mitad inferior de los
datos ordenados y Q3 como la mediana de la mitad
superior de los datos ordenado.
CUARTILES, DECILES Y PERCENTILES
78. CUARTILES, DECILES Y PERCENTILES
Igualmente los valores que dividen los datos en diez
partes iguales se llaman deciles y se denotan por D1,
D2, D3, …,D9.
Los valores que dividen los datos en cien partes
iguales son denominados percentiles y son denotados
por P1, P2, P3, …, P99.
El quinto decil y el percentil 50 corresponden a la
mediana. Los percentiles 25 y 75 corresponden al
primer y tercer cuartil respectivamente.
79. Sea Lp la posición del percentil deseado.
Entonces
Donde: n es el numero de datos y p el percentil
Ejemplo: el percentil 33 es el P33, el percentil 50 es el
P50, que es también la mediana ó el Q2. El percentil
25 es el P25=Q1 y el percentil 75 es el P75=Q3
( )
100
p
p
L n
PROCEDIMIENTO PARA EL CALCULO
DE LOS PERCENTILES
80. Paso 1: Ordenar los datos de manera ascendente.
Paso 2: Calculamos el Lp ( )
Paso 3: a) Si Lp no es entero, se redondea. El valor
entero inmediato mayor que Lp, indica la posición
del p-ésimo percentil.
b) Si Lp es entero, el p-ésimo persentil es el
promedio de los valores de los datos ubicados en
los lugares i e i+1
%
100
)
(
p
n
Lp
CALCULO DEL P-ÉSIMO PERCENTIL
81. Por Ejemplo:
Si tenemos 15 datos ordenados y queremos localizar el
primer cuartil (percentil 25) según la formula este
estará ubicado en la posición 4 (por redondeo) y el
tercer cuartil (percentil 75) estará ubicado en la
posición 12 (por redondeo)
Si tenemos 20 datos ordenados el primer cuartil estará
en la posición intermedia entre el 5° y el 6° dato es
decir si el 5° dato fuese 36 y el 6° 41 el P25=Q1=38,5
82.
83. La localización o tendencia central de un conjunto
de datos no necesariamente proporciona
información suficiente para describirlos
adecuadamente. Debido a que no todos los valores
son semejantes, la variación entre ellos se
considera importante. Se puede decir que un
conjunto de datos tiene una dispersión reducida si
los mismos se aglomeran estrechamente en torno a
alguna medida de localización de interés y se dice
que tiene una dispersión grande si se esparcen
ampliamente alrededor de alguna medida de
localización de interés.
84. Las medidas descriptivas más comunes de dispersión
son:
Recorrido o Rango
Desviación media
Recorrido semi-intercuartílico
Recorrido del percentil 10-90
Desviación estándar
MEDIDA DE DISPERSIÓN
85. RECORRIDO O RANGO
El recorrido de un conjunto de números es la
diferencia entre el número mayor y menor del
conjunto.
min
max x
x
r
Ejemplo: El recorrido de un conjunto 2, 3, 3, 5, 5, 5, 8, 10 y 12 es 12 – 2 = 10.
86. Aunque es una medida muy fácil de calcular, ignora
toda la información de la muestra entre las
observaciones más grande y más pequeña. Sin
embargo, vale la pena resaltar que el rango se utiliza
mucho en aplicaciones estadísticas al control de
calidad, donde lo común es emplear muestras con
tamaños n = 4 o 5, ya que en estos casos la pérdida de
información no se considera relevante.
RECORRIDO O RANGO
87. En general, se desea una medida de variabilidad que
dependa de todas las observaciones y no sólo de unas
pocas; así que parece razonable medir la variación en
términos de las desviaciones relativas a alguna medida
de localización (generalmente esta medida es la
media)
RECORRIDO O RANGO
88. DESVIACIÓN MEDIA O DESVIACIÓN
PROMEDIO O DESVIACIÓN ABSOLUTA
La desviación media de un conjunto de N números X1,
X2, X3, …, XN se define por:
Donde:
, es el valor absoluto de la desviación de Xj con respecto a (El valor
absoluto de un número es el número sin el signo asociado y se indica por las
dos líneas verticales colocadas junto al número.
Ejemplo: Halle la desviación media del conjunto de números 2, 3, 6, 8 y 11
Media aritmética = 6
89. DESVIACIÓN MEDIA O DESVIACIÓN
PROMEDIO O DESVIACIÓN ABSOLUTA
Si X1, X2, X3, …, XK aparecen con frecuencias f1, f2, f3,
…,fK respectivamente, la desviación media puede ser
escrita como:
Donde:
. Esta norma es útil para datos agrupados donde las Xj representan los
puntos medios y las fj son las correspondientes frecuencias de clase.
Ocasionalmente la desviación media se define en términos de
desviaciones absolutas de la mediana o de otro promedio en vez de la
media. Una interesante propiedad de la suma es que es un mínimo
cuando a es la mediana, es decir, la desviación media sobre la mediana es un
mínimo.
94. RECORRIDO DEL PERCENTIL 10-90
El recorrido del percentil 10-90 de un conjunto de
datos se define por:
Recorrido del percentil 10-90 = P90 – P10
Donde: P10 y P90 son los percentiles 10mo y 90mo de los
datos (ver Problema 8). El recorrido del semi-
percentílico 10-90, ½(P90 – P10), puede emplearse
también pero no es comúnmente usado.
Ej. 8
96. DESVIACIÓN ESTÁNDAR
La desviación estándar de un conjunto de N números
X1, X2, X3, …, XN se denota por s y se calcula como:
Para el conjunto de datos x1, x2,….,xn . Las diferencias
determinan las desviaciones de la media.
Dado que la suma de estas desviaciones es cero, se utiliza como medida
de variabilidad el promedio de los cuadrados de tales desviaciones.
)
(
),.....,
(
),
( 2
1 x
x
x
x
x
x n
Ec. 5
97. DESVIACIÓN ESTÁNDAR
Si X1, X2, X3, …, XKaparecen con frecuencias f1, f2, f3, …,
fK respectivamente, la desviación estándar puede
determinarse como:
Donde:
Algunas veces la desviación estándar para los datos de una muestra se
define con (N - 1) reemplazando a N en los denominadores de las ecuaciones
5 y 6 porque el valor resultante representa una estimación mejor de la desviación
estándar de una población de la cual se toma la muestra. Para los valores
grandes de N (por ejemplo N > 30) prácticamente no hay diferencia entre las
dos definiciones.
Ec. 6
98. VARIANZA
La varianza de un conjunto de datos se define como el
cuadrado de la desviación estándar y se representa por
s2 en las ecuaciones (5) y (6).
La desviación estándar para una muestra se representa
por s, mientras que para la población se representa por
. Así, s2 y 2 representarían la varianza muestral y la
varianza poblacional respectivamente.
Sin embargo, como sólo hay n-1 desviaciones independiente se
conviene en dividir entre n-1, es decir,
1
)
(
1
2
2
n
x
x
S
n
i
i
99. PROPIEDADES DE LA DESVIACIÓN
ESTANDAR
1. La desviación estándar puede ser definida como
Donde a es cualquier promedio además de la media aritmética. De
todas esas desviaciones estándar la mínima es aquella en que , en
virtud de la propiedad (2) de la media. Esta propiedad ofrece una
importante razón para definir la desviación estándar del modo anterior.
2. Para las distribuciones normales resulta que:
El 68.27 % de los casos están incluidos entre y (es decir, una
desviación estándar a cada lado de la media)
El 95.45 % de los casos están incluidos entre y (es decir, dos
desviación estándar a cada lado de la media)
El 99.73 % de los casos están incluidos entre y (es decir, tres
desviación estándar a cada lado de la media)
Ej.27
100. PROPIEDADES DE LA DESVIACIÓN
ESTANDAR
Lo anterior puede verse en la Figura 1 para una
distribución moderadamente asimétrica o simétrica.
Figura 1. Ubicación de los casos para la distribución normal teniendo
en cuenta la media y la desviación estándar.
3. Supongamos que dos conjuntos consistentes en N1 y N2 números (o dos
distribuciones de frecuencia con las frecuencias totales N1 y N2) tienen
varianzas dadas por s2
1 y s2
2 respectivamente y la misma media . Entonces la
varianza combinada o completa de ambos conjuntos (o ambas distribuciones
de frecuencia) está dada por:
101. RELACIONES EMPÍRICAS ENTRE LAS
MEDIDAS DE DISPERSIÓN
Para las distribuciones moderadamente asimétricas
tenemos las fórmulas empíricas:
Desviación Media = 4/5 (Desviación Estándar)
Recorrido Semi-intercuartílico = 2/3 (Desviación Estándar)
Estas son consecuencias del hecho de que para la
distribución normal hallamos que la desviación media y
el recorrido Semi-intercuartílico son iguales a 0.7979 y
0.6745 veces la desviación estándar respectivamente.
102. DISPERSIÓN ABSOLUTA Y RELATIVA.
COEFICIENTE DE VARIACIÓN
La variación real o dispersión determinada a partir de
la desviación estándar u otra medida de dispersión se
llama dispersión absoluta. Sin embargo, una
variación o dispersión de 10 pulgadas al medir una
distancia de 1000 pies tiene un efecto muy distinto que
la misma variación de 10 pulgadas en una distancia de
20 pies. Una medida de este efecto es ofrecida por la
dispersión relativa definida por:
103. Si la dispersión absoluta es la desviación estándar s y el
promedio es la media , la dispersión relativa es llamada
Coeficiente de variación o Coeficiente de
dispersión dado por:
DISPERSIÓN ABSOLUTA Y RELATIVA.
COEFICIENTE DE VARIACIÓN
y generalmente se expresa como un porcentaje
Este coeficiente mide la dispersión relativa de la muestra y su ventaja es
que resulta independiente de la unidad de medida o cambio de escala; por
tanto, permite establecer una comparación entre las dispersiones de dos
muestras que vengan expresadas en distintas unidades.
El problema que tiene este coeficiente es que pierde representatividad
cuando la media se acerca a cero.
104. EJEMPLO DE COEFICIENTE DE
VARIACIÓN
Un fabricante de tubos de televisión produce dos tipos
de tubos, A y B, que tienen vidas medias respectivas
¯xA=1495 horas y ¯xB=1875 horas, y desviación típica
A=280 horas y B=310. Comparar las dispersiones de las
dos poblaciones en términos absolutos y relativos.
%
53
.
16
100
*
1875
310
%
73
.
18
100
*
1495
280
B
A
CV
CV
Indican que, en términos relativos, la dispersión es mayor en la
población A; a pesar de que las desviaciones típicas sugieran lo
contrario.
105. VARIABLE ESTANDARIZADA.
PUNTUACIONES ESTANDAR
La variable
que mide la desviación de la media en unidades de la desviación estándar
es llamada variable estandarizada y es una cantidad sin dimensión (es
decir, es independiente de las unidades usadas).
Si las desviaciones de la media vienen dadas en unidades de la
desviación estándar, se dice que están expresadas en unidades o
puntuaciones estándar. Estas son de gran valor al comparar distribuciones
Ej.31
106. EJEMPLO DE VARIABLE
ESTANDARIZADA
Un estudiante obtuvo 84 puntos en el examen final de
matemáticas, en el que la nota media fue 76 y la
desviación típica 10. En el examen final de física
obtuvo 90 puntos, siendo la media 82 y la desviación
típica 16. Aunque en las dos asignaturas estuvo muy
por encima de la media, ¿en cuál sobresalió más?
Solución: Tipificando las variables para poder
compararlas se obtiene:
107. EJEMPLO DE VARIABLE
ESTANDARIZADA
y se observa que la nota tipificada (M) de matemáticas
es mejor que la de física (F) debido a que se encuentra
más alejada de la media en términos de desviación
típica. Es decir, la nota de matemáticas se encuentra a
0.8 desviaciones típicas por encima de la nota media y
por tanto es superior a la nota de física que sólo supera
a la nota media en 0.5 desviaciones típicas.
5
.
0
16
82
90
8
.
0
10
76
84
F
M
z
108.
109. MEDIDAS DE ASOCIACIÓN Y
APLANAMIENTO
Las características de la forma que presenta la
representación gráfica permite clasificar las
distribuciones de frecuencias.
Dentro de estas medidas se encuentran:
Asimetría
Curtosis
Las cuales proporcionan coeficientes que nos
permitan comparar dos distribuciones.
110. MOMENTOS
Si X1, X2, …, XN son los valores N tomados por una variable
X, definimos la cantidad:
Llamada el r-ésimo momento. El primer momento con r = 1 es la media
aritmética . (r es la orden del momento, 1, 2, 3, etc)
El r-ésimo momento con respecto a la media se define como:
Si r = 1, m1 = 0 tiende a la media aritmética Si r = 2, m2 = s2, la varianza.
Ec. 1
Ec. 2
Los momentos son medidas descriptivas que resultan muy útiles para
calcular determinados parámetros. Estas medidas generalizan las
definiciones de media aritmética y, como se verá, forman parte de la
definición de algunos coeficientes.
111. MOMENTOS
El r-ésimo momento con respecto a cualquier origen A
se define como:
Donde d = X – A son las desviaciones de X con respecto a A.
Si A = 0, la ecuación (3) se reduce a (1). Por esta razón la ecuación (1) se
denomina con frecuencia el r-ésimo momento con respecto a cero.
Ec. 3
112. MOMENTOS PARA DATOS
AGRUPADOS
Si X1, X2, …, XK aparecen con frecuencias f1, f2, …, fK
respectivamente, los momentos anteriores están dados por:
Ec. 4
Ec. 5
Ec. 6
Donde . Las ecuaciones (4), (5) y (6) son adecuadas para calcular los
momentos de datos agrupados.
113. EJEMPLO DE CÁLCULO DE MOMENTOS
Como estudio preliminar a una encuesta de tráfico, fue
necesario recabar cierta información acerca del
número de ocupantes en los automóviles, que
entraban a una población el domingo por la tarde; para
ello se contó el número de ocupantes en 40
automóviles. Los resultados fueron:
1, 3, 2, 2, 3, 1, 1, 2, 2, 1, 1, 4, 3, 1, 3, 2, 3, 2, 2, 2,
1, 2, 5, 1, 3, 1, 2, 1, 3, 1, 4, 1, 1, 3, 4, 2, 2, 1, 1, 4
Calcular los momentos ordinario y central de orden 4 de
los datos.
114. EJEMPLO DE CÁLCULO DE MOMENTOS
Solución: Aplicamos directamente la fórmula para
calcular el momento ordinario
6
.
62
40
2504
40
)
1
*
5
4
*
4
(
)
8
*
3
(
)
12
*
2
(
)
15
*
1
( 4
4
4
4
4
4
X
y sabiendo que la media es 2.1 calculamos el momento
central
752
.
3
40
068
.
150
40
1
*
)
1
.
2
5
(
4
*
)
1
.
2
4
(
8
*
)
1
.
2
3
(
12
*
)
1
.
2
2
(
15
*
)
1
.
2
1
( 4
4
4
4
4
4
m
115. ASIMETRÍA
La asimetría es el grado de desviación de la simetría, de
una distribución.
Si la curva de frecuencia (polígono de frecuencia
suavizado) de una distribución tiene una cola más
larga a la derecha del máximo central que a la
izquierda, se dice que la distribución es asimétrica a la
derecha o que tiene asimetría positiva.
Si ocurre lo contrario, se dice que es asimétrica a la
izquierda o que tiene asimetría negativa.
116. ASIMETRÍA
Para las distribuciones asimétricas la media tiende a
estar situada al mismo lado de la moda como la cola
más larga. Así una medida de la asimetría viene dada
por la diferencia (Media – Moda).
Esta puede hacerse adimensional dividiendo por una
medida de dispersión, tal como la desviación estándar,
lo que lleva a la definición:
Coeficiente de asimetría
de Pearson
Asimetría > 0 Asimetría a la derecha o positiva
Asimetría = 0 Simetría
Asimetría < 0 Asimetría a la izquierda o negativa
117. EJEMPLO DE ASIMETRÍA
Utilizando los datos del ejemplo de momentos, calcula
el coeficiente de asimetría de Pearson, si se conoce que
la media es de 2.1, la moda de 1 y la varianza de 1.19.
0
92
.
0
19
.
1
1
1
.
2
Asimetría
lo que indica que la distribución
es asimétrica a la derecha.
Curva asimétrica a la derecha
(asimetría positiva)
118. ASIMETRÍA
Para evitar el uso de la moda, podemos emplear la
ecuación empírica (Media – Moda = 3(Media -
Mediana) vista anteriormente y definir:
Las dos medidas anteriores se llaman coeficiente de asimetría primero y
segundo de Pearson respectivamente.
119. ASIMETRÍA
Otras medidas de asimetría definidas en términos de
cuartiles y percentiles son las siguientes:
El coeficiente de asimetría percentílico:
120. ASIMETRÍA
Una importante medida de asimetría es la que hace
uso del tercer momento alrededor de la media en
forma adimensional y viene dada por:
121. ASIMETRÍA
Otro coeficiente para medir el nivel de asimetría es el
llamado Coeficiente de Asimetría de Fisher, que viene
definido:
3
1
3
1
)
(
)
/
1
(
s
x
x
n
g
n
i
i
En otras palabras es la relación
entre el momento de orden 3 y la
desviación estándar
n, total de datos
xi, cada dato del conjunto
X media, la media aritmética
s desviación típica o estándar
122. ASIMETRÍA
Los resultados pueden ser los siguientes:
g1 = 0 (distribución simétrica; existe la misma
concentración de valores a la derecha y a la
izquierda de la media)
g1 > 0 (distribución asimétrica positiva; existe
mayor concentración de valores a la derecha de la
media que a su izquierda)
g1 < 0 (distribución asimétrica negativa; existe
mayor concentración de valores a la izquierda de la
media que a su derecha)
123. CURTOSIS
La curtosis es el grado de esbeltez de una distribución,
tomado por lo general en relación a una distribución
normal y analiza el grado de concentración que
presentan los datos alrededor de la zona central de la
distribución.
124. TIPOS DE DISTRIBUCIONES SEGÚN EL
GRADO DE CURTOSIS
Una distribución que tiene un pico relativamente alto,
como la curva de la Figura (a) se llama leptocúrtica,
mientras que la curva de la Figura (b) que es achatada
se llama platicúrtica. La distribución normal, Figura
(c) que no es muy apuntada ni muy achatada se llama
mesocúrtica.
125. DEFINICIÓN DE LAS DISTRIBUCIONES
SEGÚN EL GRADO DE CURTOSIS
Distribución mesocúrtica: presenta un grado de
concentración medio alrededor de los valores
centrales de la variable (el mismo que presenta una
distribución normal).
Distribución leptocúrtica: presenta un elevado
grado de concentración alrededor de los valores
centrales de la variable.
Distribución platicúrtica: presenta un reducido
grado de concentración alrededor de los valores
centrales de la variable.
126. COEFICIENTE DE CURTOSIS
Una medida de curtosis usa el cuarto momento con
respecto a la media expresada en forma adimensional y
viene dada por:
que con frecuencia se designa como b2. Para la distribución normal, b2 =
a4 = 3. Por esta razón la curtosis algunas veces se define por (b2 – 3) que es
positiva para una distribución leptocúrtica, negativa para una platicúrtica y
nula para una distribución normal.
127. COEFICIENTE DE CURTOSIS
3
)
(
)
/
1
(
4
1
4
2
s
x
x
n
g
n
i
i
Teniendo en cuenta la suposición el coeficiente se
calcularía como:
(Relación entre el momento de orden 4 y la
desviación estándar o típica
Los resultados pueden ser los siguientes:
g2 = 0 (distribución mesocúrtica).
g2 > 0 (distribución leptocúrtica).
g2 < 0 (distribución platicúrtica).
128. COEFICIENTE DE CURTOSIS
Otra medida de curtosis que también se usa está
basada en los cuartiles y percentiles a la vez y está dada
por:
Donde Q = ½(Q3 – Q1) es el recorrido semi-intercuartílico. Nos referimos a
este como el coeficiente de curtosis percentílico. Para la distribución
normal este tienen el valor de 0.263.