ClaseModelos1.pptx

MÉTODOS ESTADÍSTICOS
TEMAS:
1. INTRODUCCIÓN
2. ESTADÍSTICA DESCRIPTIVA

Historia de la Estadística
Se cree que los orígenes de la estadística están ligados
al antiguo Egipto y a los censos chinos hace unos 4000
años, aproximadamente.
Desde esa época, diversos estados realizaron estudios
sobre algunas características de sus poblaciones, sus
riquezas, posesiones, etc.
En 1662, John Graunt, un mercader Inglés, publicó un
libro sobre los nacimientos y defunciones ocurridos en
Londres; el libro tenia conclusiones acerca de ciertos
aspectos relacionados con estos acontecimientos. Esta
obra es considerada como el punto de partida de la
estadística moderna.

La palabra estadística comenzó a usarse en el siglo XVIII,
en Alemania, en relación a estudios donde los grandes
números, que representaban datos, eran de importancia
para el estado. Sin embargo, la estadística moderna se
desarrolló en el siglo XX a partir de los estudios de Karl
Pearson.
Hoy la estadística tiene gran importancia, no sólo por que
presenta información, sino que además permite inferir y
predecir lo que va a ocurrir, y por lo tanto, es una
herramienta fundamental a la hora de tomar decisiones de
importancia.
Historia de la Estadística

La Ingeniería y la Solución de Problemas
• Un ingeniero resuelve problemas de interés para la
sociedad mediante la aplicación eficiente de
principios científicos.
• El método de la ingeniería o científico es el enfoque
aplicado para formular y resolver estos problemas.

Pasos del Método de la Ingeniería
1. Desarrollar una descripción clara y concisa del
problema.
2. Identificar los factores importantes que afectan el
problema o que pueden jugar un papel en su
solución.
3. Proponer un modelo para el problema, utilizando
los conocimientos científicos o de la ingeniería del
fenómeno en estudio. Consignar todas las
limitaciones y/o supuestos del modelo.
Cont.

4. Realizar los experimentos apropiados y recolectar datos
para probar o validar el modelo tentativo o las
conclusiones planteadas en los pasos 2 y 3.
5. Refinar el modelo con base en los datos observados.
6. Manipular el modelo para contribuir a desarrollar una
solución del problema.
7. Realizar un experimento apropiado para confirmar que
la solución propuesta es efectiva y eficiente.
8. Sacar conclusiones o hacer recomendaciones con base
en la solución del problema.

El recuadro punteado indica que puede requerirse varios
ciclos e iteraciones para obtener la solución final.
Los ingenieros deben conocer una manera eficiente para planear
experimentos, recolectar datos, analizar e interpretar datos, y entender
cómo se relacionan los datos observados con el modelo propuesto.

UTILIZACIÓN DE LA
ESTADISTICA EN LA
INVESTIGACIÓN CIENTÍFICA

Procedimiento de
búsqueda
Sistemática
Objetiva
Controlada
Verificable
De hechos y
relaciones

El planteamiento de un problema científico.
El desarrollo de un modelo verificable para resolverlo.
Un proceso riguroso y objetivo de observación y
recopilación de datos.
El análisis e interpretación de los hallazgos en función
del modelo planteado, el contexto y el conocimiento
científico previamente establecido.
La comunicación apropiada de sus resultados a la
comunidad científica y la sociedad para su verificación y
aplicación.

EL PROCESO DE INVESTIGACIÓN CIENTÍFICA
Recolección de datos:
Puede ser con un
estudio observacional, y
con un experimento
diseñado. La cantidad de
información necesaria, la
forma de recolección y las
técnicas para adquirirla,
de manera que sea
relevante al problema, y
las conclusiones que se
extraigan tengan cierto
grado de confiabilidad,
son tratados en el Diseño
de Experimentos y
Muestreo Estadístico.

¿QUÉ ES LA ESTADÍSTICA?
Es una ciencia que constantemente
proporciona métodos y técnicas para
mejorar la calidad de las observaciones
científicas, y ayuda a la toma de
decisiones acerca de problemas
científicos específicos.

 La estadística tiene que ver con la recopilación,
presentación, análisis y uso de datos para tomar
decisiones, resolver problemas y diseñar productos
y procesos.
Cualquier persona recibe información en forma de
datos a través de algún medio; y a menudo es
necesario obtener alguna conclusión a partir de la
información contenida en los datos.
Los métodos empleados para resumir y organizar datos
se denominan estadística descriptiva; mientras que los
métodos para tomar decisiones se denominan
inferencia estadística.

Métodos estadísticos
• Se utilizan como ayuda para describir y entender la variabilidad.
• Variabilidad: Se entiende que observaciones sucesivas de un sistema
o fenómeno no producen exactamente el mismo resultado.
• El pensamiento estadístico puede ofrecernos un recurso conveniente
para incorporar esta variabilidad en nuestros procesos de toma de
decisiones.

Métodos estadísticos
• Ejemplo: Consideremos el rendimiento del tanque de diesel
de un tractor que tiene acoplado un arado.
¿Se arará siempre la misma cantidad de área con cada tanque
de combustible?
No, depende de varios factores
• Estos factores son fuentes de variabilidad potenciales en el
sistema.
• La estadística proporciona el marco para describir esta
variabilidad y para saber cuáles de las fuentes tienen
mayor impacto sobre el rendimiento.

Estadística e Incertidumbre
• Ejemplo: Queremos saber la producción de maíz por ha en una
región, pero nuestros recursos económicos nos permiten entrevistar
sólo a 100 de los 1000 agricultores de la zona.
• Cualquier conclusión contendrá elementos de incertidumbre, ya que
no es imposible que entrevistemos a los 100 peores (o mejores)
agricultores y por tanto nuestras afirmaciones, basadas en los datos,
subestimará (o sobreestimará) la producción verdadera de maíz.

• Esta incertidumbre ocurre cuando se concluye sobre un conjunto
mayor que aquél sobre el que se tiene información.
• El método de razonamiento aplicado es el inductivo, que es un
proceso lógico que va de lo particular a lo general.
• Otro método es el deductivo, que se procede de lo general a lo
particular.

Método inductivo
• El método inductivo o razonamiento inductivo es una forma de sacar
conclusiones generales a partir del conocimiento previo sobre eventos
particulares.
• Por ejemplo, vemos que nuestro perro ladra, el perro del vecino ladra y el
perro del comercial de televisión ladra, estas son las premisas. Luego la
conclusión general es que todos los perros ladran
• Un ejemplo de cómo aplicamos el método inductivo en el día a día es la
salida del sol. Es así como si un día sale el sol, al otro día también y al día
siguiente, entonces podemos inducir que el sol sale todos los días.

Método Deductivo
• si a = by b = c, entonces a = c
• Todos los números que terminan en 0 o 5 son divisibles entre 5. El número 35 termina en 5,
por lo que debe ser divisible entre 5.
• Todas las aves tienen plumas. Todos los petirrojos son pájaros. Por lo tanto, los petirrojos
tienen plumas.
• Es peligroso conducir por calles heladas. Las calles están heladas ahora, por lo que sería
peligroso conducir por las calles.
• Todos los gatos tienen un agudo sentido del olfato. Fluffy es un gato, por lo que Fluffy tiene
un agudo sentido del olfato.
• Los cactus son plantas y todas las plantas realizan la fotosíntesis. Por lo tanto, los cactus
realizan la fotosíntesis.
• La carne roja tiene hierro y la carne de res es carne roja. Por lo tanto, la carne de res contiene
hierro.

ACTIVIDAD
• Etapas de cada método (inductivo/deductivo)
• Ventajas de usar cada método

• El papel de la Estadística en el caso analizado es es cuantificar la
incertidumbre que es inseparable de las conclusiones obtenidas.
• La cuantificación se logra mediante el uso de los conceptos y técnicas
de la Probabilidad.
• Con el conocimiento de la Probabilidad, podremos desarrollar los
métodos estadísticos de naturaleza inductiva, que se conocen como:
Inferencia Estadística o Estadística Inductiva.

• Estudio enumerativo: Usa una muestra para inferir sobre la
población de la que se ha seleccionado.
• Estudio analítico: Usa una muestra para hacer inferencia sobre
una población futura.

Conceptos Básicos
En muchas ocasiones, para llevar a cabo una
investigación se hacen encuestas, las cuales
son dirigidas a una muestra representativa de
la población. Para comprender mejor este tipo
de estudios es importante que conozcas los
siguientes términos básicos:

Población:
Es un conjunto de personas, eventos o cosas de las
cuales se desea hacer un estudio, y tienen una
característica en común.
Muestra:
Es un subconjunto cualquiera de
la población; es importante
escoger la muestra en forma
aleatoria (al azar), pues así se
logra que sea representativa y
se puedan obtener conclusiones
más afines acerca de las
características de la población.
Población
Elementos o
unidad de análisis
Muestra

• A cada característica de los elementos de una
población se le llama variables. Nos encontraremos
con varios tipos de variables: cualitativas y
cuantitativas.
• Las variables cualitativas son aquellas que se refieren
a categorías o atributos de los elementos (individuos)
estudiados.
• Las variables cuantitativas son aquellas cuyos datos
son de tipo numérico.
Para estudiar alguna característica especifica de
la población se pueden definir los siguientes
tipos de variables:

TIPOS DE VARIABLES CUALITATIVAS
• Dicotómicas: Sólo hay dos categoría, que son
excluyentes una de la otra.
Ejemplo: planta enferma-sana, se rego-no se rego
• Nominal: tiene mas de dos categorías y no hay orden
entre ellas.
Ejemplo: marca de tractores, tipos de sembradora
(neumática, mecánica)
• Ordinal: tiene varias categorías y hay orden entre
ellas.
Ejemplo: grado de salinidad, calidad de la fumigación
realizada.

TIPOS DE VARIABLES CUANTITATIVAS
• Continuas: números infinito no numerables de
elementos. Tiene asociado el concepto de medida
Ejemplo: Consumo de combustible, Potencia del motor.
• Discretas: números finitos o infinitos numerables de
elementos. Se asocia con el concepto de conteo.
Ejemplo: N° de tractores, N° de cosechadoras por estado.
Hay ocasiones en las que las medidas cuantitativas continuas son
transformadas en ordinales mediante la utilización de uno o varios puntos de
corte.
Ejemplo: La variable conductividad hidráulica del suelo es codificada en varias
categorías y se utiliza en términos como: permeabilidad alta, media o baja

DATOS PRIMARIOS
• Los datos primarios son los datos recolectados que no han sido
ordenados numéricamente. Como ejemplo puede servir el conjunto
de las propiedades físico-mecánicas (humedad (%), espesor (m),
masa de 1000 semillas (g), masa volumétrica (kg/m3) y características
dimensionales de la semilla de una planta (longitud y anchura (m))
para el diseño de una sembradora (25 semillas de amaranto).

ORDENAMIENTO
• Un ordenamiento es una disposición de los datos
numéricos primarios en orden creciente o decreciente
de magnitud. La diferencia entre el número mayor y
el menor se denomina recorrido. Por ejemplo, si la
humedad mayor de las 25 semillas es 7.49 % y la
menor es de 7.34 %, el recorrido es 0.15%.

DISTRIBUCIÓN DE FRECUENCIA
• Cuando se reúnen grandes cantidades de datos
primarios con frecuencia es útil distribuir los datos en
clases y categorías, y determinar el número de
individuos que pertenecen a una clase, llamada
frecuencia de clase.

 El ordenamiento tabular de los datos por clases
conjuntamente con las frecuencias de clase se
denomina distribución de frecuencia o tabla de
frecuencia.
Cuadro 1. Humedad en porcentaje de las 25 semillas de amaranto
Límite
Inferior
Límite
Superior
Valores
Medio
Frecuencia
7.35 7.37 7.36 3
7.38 7.40 7.39 6
7.41 7.43 7.42 10
7.44 7.46 7.45 4
7.47 7.49 7.48 2

• Los datos organizados y dosificados como en la
distribución de frecuencia anterior se denominan
datos agrupados. Este proceso tiene la desventaja
que destruye el detalle original de los datos, y como
ventaja, la claridad que se muestra en el cuadro
anterior y en las relaciones, que así se hacen
evidentes

INTERVALOS DE CLASE Y LÍMITES DE CLASE
 Si las humedades de las semillas se registran con aproximación de
0.01 %, el intervalo de clase teórico incluye todas las medidas desde
7.345 y 7.375 % son llamados límites reales; el número más pequeño
es el límite de clase real inferior y el mayor 7.375 % es el límite de
clase real superior.
 En la práctica, los límites de clases reales se obtienen sumando al
límite superior de un intervalo de clase el límite inferior del intervalo
de clase próximo mayor y dividiendo por dos.

LIMITES DE CLASES REALES
• Algunas veces los límites de clases reales son
utilizados para simbolizar las clases. Para evitar
ambigüedades al utilizar ésta notación, los límites de
clase no deben coincidir con las observaciones
reales. Así, si una observación fuera de 7.375 % no
sería posible decidir si pertenecía al intervalo de
clase 7.345 – 7.375 ó al 7.375 – 7.405.

TAMAÑO O AMPLITUD DE UN INTERVALO
 Es la diferencia entre los límites de clase reales superior e inferior que
también se refiere a la amplitud de clase, tamaño de clase, longitud
de clase.
 Si todos los intervalos de clase de una distribución de frecuencia
tienen las mismas amplitudes, ésta amplitud común es denotada por
c.
 En este caso c es igual a la diferencia entre los dos límites de clase
inferiores sucesivos o los dos límites de clase superiores sucesivos.
Para nuestro caso c = 7.375 – 7.345 = 7.405 – 7.375 = 0.03.

MARCA DE CLASE
 La marca de clase o punto medio de la clase es el punto medio del
intervalo de clase y se obtiene sumando los límites de clase inferior y
superior y dividiéndolos por dos. Por lo que, para el intervalo 7.35 –
7.37 del Cuadro 1, sería (7.35 + 7.37)/2 =7.36.
 Para el análisis estadístico, se considera que todas las mediciones que
pertenecen a un intervalo de clase dado coinciden con la marca de
clase. Por ejemplo, todas las humedades de la semilla que caen en el
intervalo 7.35 -7.37 % se consideran 7.36 %.

REGLAS GENERALES PARA FORMAR LAS
DISTRIBUCIONES DE FRECUENCIA
1. Determine los números mayores y menores en los datos primarios y
entonces halle el recorrido o amplitud.
2. Divida el recorrido por un número conveniente de intervalos de clase
que tengan el mismo tamaño. Si esto no es factible, use intervalos de
clase de diferentes tamaños o intervalos de clase abiertos. El número de
los intervalos de clase usualmente se toma entre 5 y 20, dependiendo de
los datos. Los intervalos de clase son también seleccionados de manera
que las marcas de clase o puntos medios coincidan con los datos
realmente observados. Esto tiene a aminorar el llamado error de
agrupación implicado en el análisis estadístico posterior. Sin embargo, los
límites de clase reales no deben coincidir con los datos observados.
3. Determine el número de observaciones que caen dentro de cada
intervalo de clase, es decir halle las frecuencias de clase.

HISTOGRAMA Y POLÍGONOS DE FRECUENCIA
Se corresponden con dos representaciones gráficas de las distribuciones de
frecuencia:
Un histograma consiste en un conjunto de rectángulos (gráfica de barras) que
tienen:
 Base sobre un eje horizontal (el eje X) con los centros en las marcas de clase o
puntos medios y las longitudes iguales a los tamaños de los intervalos de clase.
 El eje vertical (el eje Y) representa las frecuencias con que se repiten las
mediciones en un intervalo de clase.
 Las áreas proporcionales a las frecuencias de clase. Si los intervalos de clase
tienen todos los mismos tamaños, las alturas de los rectángulos son
proporcionales a las frecuencias de clase y entonces es costumbre tomar las
alturas numéricamente iguales a las frecuencias de clase. Si los intervalos de
clase no tienen igual tamaño, estas alturas pueden ser ajustadas.

HISTOGRAMA Y POLÍGONOS DE FRECUENCIA
 Un polígono de frecuencia es un gráfico de líneas de
frecuencia de clase trazado en función del punto medio.
Puede obtenerse uniendo entre sí los puntos medios de los
topes de los rectángulos en el histograma.
Figura 1. Histograma
y polígonos de
frecuencia de la
humedad de la
semilla de amaranto.

DISTRIBUCIONES DE FRECUENCIAS RELATIVAS
 La frecuencia relativa de una clase es la frecuencia de la
clase dividida por la frecuencia total de todas las clases y
generalmente se expresa como un porcentaje.
Límite
Inferior
Límite
Superior
Valores
Medio
Frecuencia Frecuencia
Relativa
7.35 7.37 7.36 3 0.12
7.38 7.40 7.39 6 0.24
7.41 7.43 7.42 10 0.40
7.44 7.46 7.45 4 0.16
7.47 7.49 7.48 2 0.08
Total Sumatoria
25 1.00
Cuadro 2. Frecuencia relativa de la humedad de 25
semillas de amaranto.

DISTRIBUCIONES DE FRECUENCIAS RELATIVAS
• Si las frecuencias en el Cuadro 1 (Tabla de frecuencia)
son reemplazadas por las frecuencias relativas
correspondientes, el cuadro resultante se llama
distribución de frecuencia relativa, distribución
porcentual, o tabla de frecuencia relativa (Cuadro 2).
Los gráficos resultantes son llamados histogramas de
frecuencia relativa, o histogramas porcentuales y
polígonos de frecuencia relativa o polígonos
porcentuales respectivamente.

DISTRIBUCIONES DE FRECUENCIAS
ACUMULATIVAS U OJIVAS
• La frecuencia total de todos los valores menores o igual que el límite
de clase real superior del intervalo de clase dado se llama frecuencia
acumulada. Por ejemplo, la frecuencia acumulada que incluya el
intervalo de clase 7.41 – 7.43 en el Cuadro 1 es 3 + 6 + 10 = 19, lo que
significa que 19 semillas tienen humedades menores que 7.435 %.

• Una tabla que presente tales frecuencias acumuladas
se denomina distribución de frecuencia acumulada,
tabla de frecuencia acumulada o simplemente
distribución acumulativa.
Humedades (%) No. de semillas
Menos de 7.345 0
Menos de 7.375 3
Menos de 7.405 9
Menos de 7.435 19
Menos de 7.465 23
Menos de 7.495 25
Cuadro 3. Frecuencia acumulada de la humedad de 25
semillas de amaranto.

• Un gráfico que muestre la frecuencia acumulada
menor que cualquier límite de clase real superior
trazado en función del límite de clase superior se
denomina polígono de frecuencia acumulativa u
ojiva .
Figura 2. Número de
semillas acumuladas para
los diferentes intervalos
de clase

• Para algunos propósitos es aconsejable considerar una distribución de
frecuencia acumulativa de todos los valores mayores o iguales al
límite de clase inferior real década intervalo de clase. Como
consideramos en este caso las humedades de 7.345 ó mayor, 7.375 %
ó mayor, algunas veces esta distribución acumulativa se llama “ó
mayor” mientras la considerada anteriormente es una distribución
acumulativa “menor que”.
• Una se obtiene fácilmente de la otra, por ejemplo para la humedad de
7.345 % ó mayor el número de semillas es 25, mientras que para
7.375 % es 22 y así sucesivamente hasta que la frecuencia acumulada
es igual a CERO. Las ojivas correspondientes son llamadas ojivas “o
mayor” y “menor que”.

DISTRIBUCIONES DE FRECUENCIAS ACUMULATIVAS
RELATIVAS U OJIVAS PORCENTUALES
• La frecuencia acumulativa relativa o frecuencia acumulativa porcentual es la
frecuencia acumulativa dividida por la frecuencia total. Por ejemplo, la frecuencia
acumulativa relativa de las humedades menores de 7.435 % es 19/25 = 76 %, lo
que significa que el 76 % de las semillas tienen humedades menores que 7.435 %.
• Si las frecuencias acumulativas relativas son utilizadas en el Cuadro 3 y la Figura 2
en lugar de las frecuencias acumuladas los resultados son llamados
distribuciones de frecuencia acumulativas relativas o distribuciones
acumulativas porcentuales, y polígonos de frecuencia acumulativa relativa u
ojivas porcentuales respectivamente.

CURVAS DE FRECUENCIA. OJIVAS SUAVIZADAS
• Los datos obtenidos pueden ser considerados como que pertenecen a una muestra sacada de una
población grande. Como en la población están disponibles muchas observaciones, teóricamente
es posible (para los datos continuos) escoger los intervalos de clase muy pequeños y no obstante
que tengan números medibles de observaciones que caigan dentro de cada clase. Así se podría
esperar que el polígono de frecuencia o polígono de frecuencia relativa para una población
grande estuviera dividida en tan pequeños segmentos lineales que pueden aproximarse por
curvas, las cuales se llaman curvas de frecuencia o curvas de frecuencia relativas,
respectivamente.

CURVAS DE FRECUENCIA. OJIVAS SUAVIZADAS
• Es razonable esperar que tales curvas teóricas puedan ser aproximadas
suavizando los polígonos de frecuencia o los polígonos de frecuencia relativa de
la muestra, mejorando la aproximación a medida que aumenta el tamaño de la
muestra. Por esta razón una curva de frecuencia algunas veces es llamada
polígono de frecuencia suavizado.
• De una forma similar las ojivas suavizadas se obtienen suavizando los polígonos
de frecuencia acumulativa u ojivas.

TIPOS DE CURVAS DE FRECUENCIA
Curva simétrica o acampanada
Las curvas simétricas o acampanadas se
caracterizan por el hecho de que las observaciones
equidistantes del máximo central tienen la misma
frecuencia. Un ejemplo importante es la curva normal.

Curva asimétrica a la derecha
(asimetría positiva)
En las curvas de frecuencia moderadamente asimétricas o
asimétricas, la cola de la curva a un lado del máximo
central es más larga que al otro. Si la cola más larga está
a la derecha, se dice que la curva es asimétrica a la
derecha o que tiene asimetría positiva, pero si ocurre lo
contrario, se dice que la curva es asimétrica a la izquierda,
o que tiene asimetría negativa.
Curva asimétrica a la izquierda
(asimetría negativa)

Curva forma de J
En una curva en forma de J, o de J a la inversa el
máximo se encuentra en un extremo.
Curva forma de J a la
inversa

Curva forma de U
Una curva de frecuencia en forma de U tiene los
máximos a ambos extremos.

Curva bimodal
Una curva de frecuencia bimodal (g) tiene dos
máximos.

Curva multimodal
Una curva de frecuencia multimodal tiene más de dos
máximos.

ÍNDICE O SUBÍNDICE
• Sea el símbolo Xj cualquiera de los N valores X1, X2, X3,
…, XN tomados por una variable X. La letra j en Xj, que
significa cualquiera de los números 1, 2, 3, …, N se
llama subíndice o índice.

SUMATORIA
• El símbolo se utiliza para denotar la suma de todas las
Xj de j = 1 hasta j = N, es decir, por definición:
Ejemplos:

PROMEDIOS Y MEDIDAS DE TENDENCIA
CENTRAL
• Un promedio es un valor que es típico o representativo de un
conjunto de datos. Como tales valores típicos tienden a distribuirse
centralmente dentro de un conjunto de datos ordenados de acuerdo
con su magnitud, los promedios son llamados también medidas de
tendencia central.
• Tipos de medidas centrales son las siguientes: media aritmética o
como se conoce comúnmente media, la mediana, la moda, la media
geométrica, y la media armónica.

MEDIA ARITMÉTICA
• La media de un conjunto de N números X1, X2, X3, …,
XN se denota por y se define como:
 Si los números X1, X2, X3, …, XK aparecen f1, f2, f3, …, fK
veces respectivamente (es decir, aparecen con
frecuencias f1, f2, f3, …, fK ), la media aritmética es:
Ec. 2
Ej.
Ejemplo: Si 5, 10, 15, 20 y 25 aparecen con frecuencias 3, 2, 4, 3 y 1
respectivamente

MEDIA ARITMÉTICA PONDERADA
• Algunas veces con los números X1, X2, X3, …, XK
asociamos ciertos factores de ponderación o
ponderaciones w1, w2, w3, …, wK dependiendo de la
significación o importancia dada a los números. En
este caso:
Ej.
Ejemplo: Se obtiene en un punto de la parcela los valores de
conductividad hidráulica de 1.5 y 0.22 m/día para dos profundidades 0.1 y
0.3 m respectivamente.

PROPIEDADES DE LA MEDIA ARITMÉTICA
• La suma algebraica de las desviaciones de un
conjunto de números de su media aritmética es cero.
• La suma de los cuadrados de las desviaciones de un
conjunto de números Xj de cualquier número a es un
mínimo si y sólo si a = .
Ej.
Ejemplo: Pruebe que
.
es un mínimo si a =
La expresión es un mínimo cuando

• Si f1 números tienen la media m1, f2 números tienen la
media m2, f3 números tienen la media m3, …, fK
números tienen la media mK, la media de todos los
números es:
Ej.

• Supongamos que A es una media aritmética (puede
ser cualquier número) y si dj = Xj – A son las
desviaciones de Xj con respecto a A, entonces las
ecuaciones de la media aritmética (1 y 2) se
convierten en:
Donde:
Ec. 6

MEDIA ARITMÉTICA CALCULADA DE DATOS AGRUPADOS
• Cuando los datos se presentan en una distribución de frecuencia,
todos los valores que caen en un intervalo de clase dado son
considerados como coincidentes con el punto medio del intervalo. Las
ecuaciones (2) y (6) son válidas para tales datos agrupados si
interpretamos a Xj, como un punto medio, y a fj como su
correspondiente frecuencia de clase, a A como cualquier punto medio
supuesto y a dj = Xj – A como las desviaciones de Xj con respecto a A.
Ej. 15 o 20

MEDIA ARITMÉTICA CALCULADA DE DATOS AGRUPADOS
• Si los intervalos de clase tienen todos el mismo tamaño c, las
desviaciones dj = Xj – A pueden expresarse también como cuj,
donde uj pueden ser enteros positivos o negativos o cero, es
decir, 0, ±1, ±2, ±3, …, y la formula (6) se convierte:
Que es equivalente a la ecuación:
Esto es llamado el método de codificación para calcular la
media
Ej. 22

MEDIANA
• La mediana de un conjunto de números dispuestos en
orden de magnitud (es decir, en un ordenamiento) es el
valor medio o la media aritmética de los valores
centrales.
Ejemplo: El conjunto de números 3, 4, 4, 5, 6, 8, 8, 8, 10
tiene la mediana 6.
El conjunto de números 5, 5, 7, 9, 11, 12, 15,
18 tiene la mediana ½(9+11) = 10
 
 
   
1 2
2 ( 2) 1
2
n
n n
x si n es impar
Me x x
si n es par




  



MEDIANA
Para los datos agrupados la mediana obtenida por
interpolación está dada por:
Donde:
L1, es el límite de clase real inferior de la clase mediana ( es decir, la
clase que contiene la mediana)
N, es el número de datos observados ( es decir frecuencia total)
, es la suma de las frecuencias de todas las clases inferiores a la
clase mediana
fmediana, es la frecuencia de la clase mediana
c, es el tamaño del intervalo de clase de la mediana.
Ej. 28

MEDIANA
• Geométricamente la mediana es el valor de X
(abscisa) correspondiente a la línea vertical que divide
un histograma en dos partes que tienen áreas iguales.
Este valor de X algunas veces se denota por .

MEDIANA
• La mediana es aquel valor que deja el cincuenta por
ciento de los datos por debajo y otro cincuenta por
encima.
• Cabe destacar que es preferible el uso de la mediana
como medida descriptiva del centro cuando se
quiere reducir o eliminar el efecto de valores
extremos en un conjunto de datos (muy grandes o
muy pequeños).

MODA
• La moda de un conjunto de números es el valor que aparece con
mayor frecuencia, es decir, es el valor más común. La moda puede no
existir, o incluso si existe, puede no ser única.
Ejemplo: El conjunto 2, 2, 3, 5, 7, 9, 9, 9, 10, 11, 12, 18 tiene la moda 9 y se
llama unimodal
El conjunto 3, 5, 8, 10, 12, 15, 16 no tiene moda
El conjunto 2, 3, 4, 4, 4, 5, 5, 7, 7, 7, 9 tiene dos modas 4 y 7 y se llama
bimodal.

MODA
• En el caso de datos agrupados donde una curva de frecuencia ha sido construida para ajustarse a los datos, la moda será el valor (o
valores) de X correspondiente al punto máximo (o puntos) de la curva. Este valor de X algunas veces se denota por .
• En una distribución de frecuencia o histograma la moda puede ser obtenida a partir de la ecuación:
Donde:
L1, es el límite de clase real inferior de la clase modal (es decir, que contiene la moda)
Δ1, es el exceso de la frecuencia modal sobre la frecuencia de la clase inferior más
próxima
Δ2, es el exceso de la frecuencia modal sobre la frecuencia de la clase superior más
próxima
c, es el tamaño del intervalo de clase modal.
Ej. 33

RELACIÓN EMPÍRICA ENTRE LA MEDIA, LA MEDIANA Y LA MODA
• Para las curvas de frecuencia unimodales que son
moderadamente asimétricas tenemos la relación
empírica:
Media – Moda = 3(Media – Mediana)

RELACIÓN EMPÍRICA ENTRE LA MEDIA, LA MEDIANA Y LA MODA
A continuación se muestran las posiciones relativas de la media, la mediana
y la moda para las curvas de frecuencia que son asimétricas a la derecha y a
la izquierda respectivamente. Para las curvas simétricas la media, la moda y
la mediana coinciden en un mismo valor.
a) Asimétrica a la derecha b. Asimétrica a la izquierda

MEDIA GEOMÉTRICA
• La media geométrica G de un conjunto de valores de
N números X1, X2, X3, …, XN es la Nésima raíz del
producto de los números:
Ejemplo: La media geométrica de los números 2, 4 y 8 es

MEDIA ARMÓNICA
• La media armónica H de un conjunto de N números
X1, X2, X3, …, XN es el recíproco de la media aritmética
de los recíprocos de los números:
En la práctica puede ser más fácil recordar que:
Ejemplo: La media armónica de los números 2, 4 y 8 es:

RELACIÓN ENTRE LAS MEDIAS ARITMÉTICA, GEOMÉTRICA Y
ARMÓNICA
• La media geométrica de un conjunto de valores
positivos X1, X2, X3, …, XN es menor que o igual a su
media aritmética pero es mayor que o igual a su
media armónica. En símbolos:
Los signos de igualdad se conservan sólo si todos los
números X1, X2, X3, …, XN son idénticos.
Ejemplo: El conjunto 2, 4 y 8 tiene la media aritmética
4.67, la media geométrica 4, y la media armónica 3.43.

RAÍZ MEDIA CUADRADA
• La raíz media cuadrada (RMC) o media cuadrática de
un conjunto de valores X1, X2, X3, …, XN algunas veces
se denota por y se define por:
Este tipo de promedio frecuentemente se emplea en aplicaciones físicas.
Ejemplo: La RMC de un conjunto de números 1, 3, 4, 5 y 7 es:

CUARTILES, DECILES Y PERCENTILES
• Si un conjunto de datos se coloca en orden de magnitud,
el valor medio que divide el conjunto en dos partes
iguales es la mediana.
• Ampliando esta idea podemos pensar igual de los valores
que dividen al conjunto en cuatro partes iguales. Estos
valores denotados por Q1, Q2 y Q3, son denominados el
primer, segundo y tercer cuartil respectivamente, siendo
el valor Q2 igual a la mediana.

• El primer cuartil, al que se le llama Q1, es el valor por
debajo del cual se encuentra el 25% de los datos, y el
tercer cuartil usualmente llamado Q3, es el valor por
debajo de el se encuentra el 75% de los datos. Q2 es la
mediana.
• Los valores Q1, Q2 y Q3 dividen al conjunto de datos
ordenados en cuatro partes iguales. Q1 se puede entender
como la mediana de la mitad inferior de los datos
ordenados y Q3 como la mediana de la mitad superior de
los datos ordenado.

• Igualmente los valores que dividen los datos en diez partes
iguales se llaman deciles y se denotan por D1, D2, D3, …,D9.
• Los valores que dividen los datos en cien partes iguales son
denominados percentiles y son denotados por P1, P2, P3, …,
P99.
• El quinto decil y el percentil 50 corresponden a la mediana. Los
percentiles 25 y 75 corresponden al primer y tercer cuartil
respectivamente.

PROCEDIMIENTO PARA EL CALCULO DE
LOS PERCENTILES
• Sea Lp la posición del percentil deseado.
Entonces
Donde: n es el numero de datos y p el percentil
Ejemplo: el percentil 33 es el P33, el percentil 50 es el
P50, que es también la mediana ó el Q2. El percentil 25
es el P25=Q1 y el percentil 75 es el P75=Q3
( )
100
p
p
L n


CALCULO DEL P-ÉSIMO PERCENTIL
• Paso 1: Ordenar los datos de manera ascendente.
• Paso 2: Calculamos el Lp ( )
• Paso 3: a) Si Lp no es entero, se redondea. El valor
entero inmediato mayor que Lp, indica la posición del
p-ésimo percentil.
• b) Si Lp es entero, el p-ésimo persentil es el promedio
de los valores de los datos ubicados en los lugares i e
i+1
%
100
)
(
p
n
Lp 

Por Ejemplo:
• Si tenemos 15 datos ordenados y queremos localizar
el primer cuartil (percentil 25) según la formula este
estará ubicado en la posición 4 (por redondeo) y el
tercer cuartil (percentil 75) estará ubicado en la
posición 12 (por redondeo)
• Si tenemos 20 datos ordenados el primer cuartil
estará en la posición intermedia entre el 5° y el 6°
dato es decir si el 5° dato fuese 36 y el 6° 41 el
P25=Q1=38,5

• La localización o tendencia central de un conjunto de
datos no necesariamente proporciona información
suficiente para describirlos adecuadamente. Debido a
que no todos los valores son semejantes, la variación
entre ellos se considera importante. Se puede decir
que un conjunto de datos tiene una dispersión
reducida si los mismos se aglomeran estrechamente
en torno a alguna medida de localización de interés y
se dice que tiene una dispersión grande si se esparcen
ampliamente alrededor de alguna medida de
localización de interés.

MEDIDA DE DISPERSIÓN
Las medidas descriptivas más comunes de dispersión son:
• Recorrido o Rango
• Desviación media
• Recorrido semi-intercuartílico
• Recorrido del percentil 10-90
• Desviación estándar

RECORRIDO O RANGO
• El recorrido de un conjunto de números es la
diferencia entre el número mayor y menor del
conjunto.
min
max x
x
r 

Ejemplo: El recorrido de un conjunto 2, 3, 3, 5, 5, 5, 8, 10 y 12 es 12 – 2 = 10.

RECORRIDO O RANGO
• Aunque es una medida muy fácil de calcular, ignora
toda la información de la muestra entre las
observaciones más grande y más pequeña. Sin
embargo, vale la pena resaltar que el rango se utiliza
mucho en aplicaciones estadísticas al control de
calidad, donde lo común es emplear muestras con
tamaños n = 4 o 5, ya que en estos casos la pérdida de
información no se considera relevante.

RECORRIDO O RANGO
• En general, se desea una medida de variabilidad que dependa de
todas las observaciones y no sólo de unas pocas; así que parece
razonable medir la variación en términos de las desviaciones relativas
a alguna medida de localización (generalmente esta medida es la
media)

DESVIACIÓN MEDIA O DESVIACIÓN PROMEDIO O
DESVIACIÓN ABSOLUTA
• La desviación media de un conjunto de N números X1,
X2, X3, …, XN se define por:
Donde:
, es el valor absoluto de la desviación de Xj con respecto a (El valor
absoluto de un número es el número sin el signo asociado y se indica por las
dos líneas verticales colocadas junto al número.
Ejemplo: Halle la desviación media del conjunto de números 2, 3, 6, 8 y 11
Media aritmética = 6

DESVIACIÓN MEDIA O DESVIACIÓN PROMEDIO O
DESVIACIÓN ABSOLUTA
• Si X1, X2, X3, …, XK aparecen con frecuencias f1, f2, f3,
…,fK respectivamente, la desviación media puede ser
escrita como:
Donde:
. Esta norma es útil para datos agrupados donde las Xj representan los
puntos medios y las fj son las correspondientes frecuencias de clase.
Ocasionalmente la desviación media se define en términos de
desviaciones absolutas de la mediana o de otro promedio en vez de la
media. Una interesante propiedad de la suma es que es un mínimo
cuando a es la mediana, es decir, la desviación media sobre la mediana es un
mínimo.

EJEMPLO DE DESVIACIÓN MEDIA
=12.99

RECORRIDO SEMI-INTERCUARTÍLICO O
DESVIACIÓN CUARTÍLICA
• La desviación cuartílica de un conjunto de datos se define
por:
Ej. 6

EJEMPLO RECORRIDO SEMI-INTERCUARTÍLICO O
DESVIACIÓN CUARTÍLICA

RECORRIDO DEL PERCENTIL 10-90
• El recorrido del percentil 10-90 de un conjunto de datos se define por:
Recorrido del percentil 10-90 = P90 – P10
Donde: P10 y P90 son los percentiles 10mo y 90mo de los datos (ver Problema 8). El recorrido del semi-percentílico 10-90, ½(P90 – P10), puede emplearse también pero no es comúnmente usado.
Ej. 8

DESVIACIÓN ESTÁNDAR
• La desviación estándar de un conjunto de N números
X1, X2, X3, …, XN se denota por s y se calcula como:
Para el conjunto de datos x1, x2,….,xn . Las diferencias
determinan las desviaciones de la media.
Dado que la suma de estas desviaciones es cero, se utiliza como medida
de variabilidad el promedio de los cuadrados de tales desviaciones.
)
(
),.....,
(
),
( 2
1 x
x
x
x
x
x n 


Ec. 5

DESVIACIÓN ESTÁNDAR
• Si X1, X2, X3, …, XKaparecen con frecuencias f1, f2, f3, …,
fK respectivamente, la desviación estándar puede
determinarse como:
Donde:
Algunas veces la desviación estándar para los datos de una muestra se
define con (N - 1) reemplazando a N en los denominadores de las ecuaciones
5 y 6 porque el valor resultante representa una estimación mejor de la desviación
estándar de una población de la cual se toma la muestra. Para los valores
grandes de N (por ejemplo N > 30) prácticamente no hay diferencia entre las
dos definiciones.
Ec. 6

VARIANZA
• La varianza de un conjunto de datos se define como el
cuadrado de la desviación estándar y se representa por s2
en las ecuaciones (5) y (6).
• La desviación estándar para una muestra se representa
por s, mientras que para la población se representa por .
Así, s2 y 2 representarían la varianza muestral y la
varianza poblacional respectivamente.
Sin embargo, como sólo hay n-1 desviaciones independiente se
conviene en dividir entre n-1, es decir,
1
)
(
1
2
2





n
x
x
S
n
i
i

PROPIEDADES DE LA DESVIACIÓN ESTANDAR
1. La desviación estándar puede ser definida como
• Donde a es cualquier promedio además de la media aritmética. De todas esas desviaciones
estándar la mínima es aquella en que , en virtud de la propiedad (2) de la media. Esta
propiedad ofrece una importante razón para definir la desviación estándar del modo anterior.
2. Para las distribuciones normales resulta que:
• El 68.27 % de los casos están incluidos entre y (es decir, una desviación estándar a cada
lado de la media)
• El 95.45 % de los casos están incluidos entre y (es decir, dos desviación estándar a cada
lado de la media)
• El 99.73 % de los casos están incluidos entre y (es decir, tres desviación estándar a
cada lado de la media)
Ej.27

PROPIEDADES DE LA DESVIACIÓN ESTANDAR
• Lo anterior puede verse en la Figura 1 para una
distribución moderadamente asimétrica o simétrica.
Figura 1. Ubicación de los casos para la distribución normal teniendo
en cuenta la media y la desviación estándar.
3. Supongamos que dos conjuntos consistentes en N1 y N2 números (o dos
distribuciones de frecuencia con las frecuencias totales N1 y N2) tienen
varianzas dadas por s2
1 y s2
2 respectivamente y la misma media . Entonces la
varianza combinada o completa de ambos conjuntos (o ambas distribuciones
de frecuencia) está dada por:

RELACIONES EMPÍRICAS ENTRE LAS MEDIDAS DE
DISPERSIÓN
• Para las distribuciones moderadamente asimétricas
tenemos las fórmulas empíricas:
Desviación Media = 4/5 (Desviación Estándar)
Recorrido Semi-intercuartílico = 2/3 (Desviación Estándar)
• Estas son consecuencias del hecho de que para la
distribución normal hallamos que la desviación media y
el recorrido Semi-intercuartílico son iguales a 0.7979 y
0.6745 veces la desviación estándar respectivamente.

DISPERSIÓN ABSOLUTA Y RELATIVA. COEFICIENTE
DE VARIACIÓN
• La variación real o dispersión determinada a partir de
la desviación estándar u otra medida de dispersión se
llama dispersión absoluta. Sin embargo, una variación
o dispersión de 10 pulgadas al medir una distancia de
1000 pies tiene un efecto muy distinto que la misma
variación de 10 pulgadas en una distancia de 20 pies.
Una medida de este efecto es ofrecida por la
dispersión relativa definida por:

DISPERSIÓN ABSOLUTA Y RELATIVA. COEFICIENTE
DE VARIACIÓN
• Si la dispersión absoluta es la desviación estándar s y
el promedio es la media , la dispersión relativa es
llamada Coeficiente de variación o Coeficiente de
dispersión dado por:
y generalmente se expresa como un porcentaje
Este coeficiente mide la dispersión relativa de la muestra y su ventaja es
que resulta independiente de la unidad de medida o cambio de escala; por
tanto, permite establecer una comparación entre las dispersiones de dos
muestras que vengan expresadas en distintas unidades.
El problema que tiene este coeficiente es que pierde representatividad
cuando la media se acerca a cero.

EJEMPLO DE COEFICIENTE DE VARIACIÓN
• Un fabricante de tubos de televisión produce dos tipos de
tubos, A y B, que tienen vidas medias respectivas
¯xA=1495 horas y ¯xB=1875 horas, y desviación típica
A=280 horas y B=310. Comparar las dispersiones de las
dos poblaciones en términos absolutos y relativos.
%
53
.
16
100
*
1875
310
%
73
.
18
100
*
1495
280




B
A
CV
CV
Indican que, en términos relativos, la dispersión es mayor en la
población A; a pesar de que las desviaciones típicas sugieran lo
contrario.

VARIABLE ESTANDARIZADA. PUNTUACIONES
ESTANDAR
• La variable
que mide la desviación de la media en unidades de la desviación estándar
es llamada variable estandarizada y es una cantidad sin dimensión (es
decir, es independiente de las unidades usadas).
Si las desviaciones de la media vienen dadas en unidades de la
desviación estándar, se dice que están expresadas en unidades o
puntuaciones estándar. Estas son de gran valor al comparar distribuciones
Ej.31

EJEMPLO DE VARIABLE ESTANDARIZADA
• Un estudiante obtuvo 84 puntos en el examen final de matemáticas,
en el que la nota media fue 76 y la desviación típica 10. En el examen
final de física obtuvo 90 puntos, siendo la media 82 y la desviación
típica 16. Aunque en las dos asignaturas estuvo muy por encima de la
media, ¿en cuál sobresalió más?
• Solución: Tipificando las variables para poder compararlas se obtiene:

EJEMPLO DE VARIABLE ESTANDARIZADA
• y se observa que la nota tipificada (M) de
matemáticas es mejor que la de física (F) debido a
que se encuentra más alejada de la media en
términos de desviación típica. Es decir, la nota de
matemáticas se encuentra a 0.8 desviaciones típicas
por encima de la nota media y por tanto es superior a
la nota de física que sólo supera a la nota media en
0.5 desviaciones típicas.
5
.
0
16
82
90
8
.
0
10
76
84






 F
M
z

MEDIDA DE ASOCIACIÓN Y
APLANAMIENTO

MEDIDAS DE ASOCIACIÓN Y APLANAMIENTO
Las características de la forma que presenta la representación gráfica
permite clasificar las distribuciones de frecuencias.
Dentro de estas medidas se encuentran:
• Asimetría
• Curtosis
Las cuales proporcionan coeficientes que nos permitan comparar dos
distribuciones.

MOMENTOS
• Si X1, X2, …, XN son los valores N tomados por una variable X,
definimos la cantidad:
Llamada el r-ésimo momento. El primer momento con r = 1 es la media
aritmética . (r es la orden del momento, 1, 2, 3, etc)
El r-ésimo momento con respecto a la media se define como:
Si r = 1, m1 = 0 tiende a la media aritmética Si r = 2, m2 = s2, la varianza.
Ec. 1
Ec. 2
Los momentos son medidas descriptivas que resultan muy útiles para
calcular determinados parámetros. Estas medidas generalizan las
definiciones de media aritmética y, como se verá, forman parte de la
definición de algunos coeficientes.

MOMENTOS
• El r-ésimo momento con respecto a cualquier origen
A se define como:
Donde d = X – A son las desviaciones de X con respecto a A.
Si A = 0, la ecuación (3) se reduce a (1). Por esta razón la ecuación (1) se
denomina con frecuencia el r-ésimo momento con respecto a cero.
Ec. 3

MOMENTOS PARA DATOS AGRUPADOS
• Si X1, X2, …, XK aparecen con frecuencias f1, f2, …, fK
respectivamente, los momentos anteriores están dados por:
Ec. 4
Ec. 5
Ec. 6
Donde . Las ecuaciones (4), (5) y (6) son adecuadas para calcular los
momentos de datos agrupados.

EJEMPLO DE CÁLCULO DE MOMENTOS
• Como estudio preliminar a una encuesta de tráfico, fue necesario
recabar cierta información acerca del número de ocupantes en los
automóviles, que entraban a una población el domingo por la tarde;
para ello se contó el número de ocupantes en 40 automóviles. Los
resultados fueron:
1, 3, 2, 2, 3, 1, 1, 2, 2, 1, 1, 4, 3, 1, 3, 2, 3, 2, 2, 2,
1, 2, 5, 1, 3, 1, 2, 1, 3, 1, 4, 1, 1, 3, 4, 2, 2, 1, 1, 4
Calcular los momentos ordinario y central de orden 4 de los datos.

EJEMPLO DE CÁLCULO DE MOMENTOS
• Solución: Aplicamos directamente la fórmula para
calcular el momento ordinario
6
.
62
40
2504
40
)
1
*
5
4
*
4
(
)
8
*
3
(
)
12
*
2
(
)
15
*
1
( 4
4
4
4
4
4








X
y sabiendo que la media es 2.1 calculamos el momento
central
752
.
3
40
068
.
150
40
1
*
)
1
.
2
5
(
4
*
)
1
.
2
4
(
8
*
)
1
.
2
3
(
12
*
)
1
.
2
2
(
15
*
)
1
.
2
1
( 4
4
4
4
4
4 











m

ASIMETRÍA
• La asimetría es el grado de desviación de la simetría, de
una distribución.
• Si la curva de frecuencia (polígono de frecuencia
suavizado) de una distribución tiene una cola más larga a
la derecha del máximo central que a la izquierda, se dice
que la distribución es asimétrica a la derecha o que tiene
asimetría positiva.
• Si ocurre lo contrario, se dice que es asimétrica a la
izquierda o que tiene asimetría negativa.

ASIMETRÍA
• Para las distribuciones asimétricas la media tiende a
estar situada al mismo lado de la moda como la cola
más larga. Así una medida de la asimetría viene dada
por la diferencia (Media – Moda).
• Esta puede hacerse adimensional dividiendo por una
medida de dispersión, tal como la desviación
estándar, lo que lleva a la definición:
Coeficiente de asimetría
de Pearson
Asimetría > 0 Asimetría a la derecha o positiva
Asimetría = 0 Simetría
Asimetría < 0 Asimetría a la izquierda o negativa

EJEMPLO DE ASIMETRÍA
• Utilizando los datos del ejemplo de momentos, calcula el
coeficiente de asimetría de Pearson, si se conoce que la
media es de 2.1, la moda de 1 y la varianza de 1.19.
0
92
.
0
19
.
1
1
1
.
2




Asimetría
lo que indica que la distribución
es asimétrica a la derecha.
Curva asimétrica a la derecha
(asimetría positiva)

ASIMETRÍA
• Para evitar el uso de la moda, podemos emplear la
ecuación empírica (Media – Moda = 3(Media -
Mediana) vista anteriormente y definir:
Las dos medidas anteriores se llaman coeficiente de asimetría primero y
segundo de Pearson respectivamente.

ASIMETRÍA
• Otras medidas de asimetría definidas en términos de
cuartiles y percentiles son las siguientes:
El coeficiente de asimetría percentílico:

ASIMETRÍA
• Una importante medida de asimetría es la que hace
uso del tercer momento alrededor de la media en
forma adimensional y viene dada por:

ASIMETRÍA
• Otro coeficiente para medir el nivel de asimetría es el llamado
Coeficiente de Asimetría de Fisher, que viene definido:
3
1
3
1
)
(
)
/
1
(
s
x
x
n
g
n
i
i




En otras palabras es la relación
entre el momento de orden 3 y la
desviación estándar
n, total de datos
xi, cada dato del conjunto
X media, la media aritmética
s desviación típica o estándar

ASIMETRÍA
Los resultados pueden ser los siguientes:
• g1 = 0 (distribución simétrica; existe la misma concentración de
valores a la derecha y a la izquierda de la media)
• g1 > 0 (distribución asimétrica positiva; existe mayor concentración de
valores a la derecha de la media que a su izquierda)
• g1 < 0 (distribución asimétrica negativa; existe mayor concentración
de valores a la izquierda de la media que a su derecha)

CURTOSIS
• La curtosis es el grado de esbeltez de una distribución, tomado por lo
general en relación a una distribución normal y analiza el grado de
concentración que presentan los datos alrededor de la zona central
de la distribución.

TIPOS DE DISTRIBUCIONES SEGÚN EL GRADO DE
CURTOSIS
• Una distribución que tiene un pico relativamente alto,
como la curva de la Figura (a) se llama leptocúrtica,
mientras que la curva de la Figura (b) que es achatada
se llama platicúrtica. La distribución normal, Figura (c)
que no es muy apuntada ni muy achatada se llama
mesocúrtica.

DEFINICIÓN DE LAS DISTRIBUCIONES SEGÚN EL
GRADO DE CURTOSIS
• Distribución mesocúrtica: presenta un grado de concentración medio
alrededor de los valores centrales de la variable (el mismo que
presenta una distribución normal).
• Distribución leptocúrtica: presenta un elevado grado de
concentración alrededor de los valores centrales de la variable.
• Distribución platicúrtica: presenta un reducido grado de
concentración alrededor de los valores centrales de la variable.

COEFICIENTE DE CURTOSIS
• Una medida de curtosis usa el cuarto momento con
respecto a la media expresada en forma adimensional
y viene dada por:
que con frecuencia se designa como b2. Para la distribución normal, b2 =
a4 = 3. Por esta razón la curtosis algunas veces se define por (b2 – 3) que es
positiva para una distribución leptocúrtica, negativa para una platicúrtica y
nula para una distribución normal.

• Los resultados pueden ser los siguientes:
• g2 = 0 (distribución mesocúrtica).
• g2 > 0 (distribución leptocúrtica).
• g2 < 0 (distribución platicúrtica).
3
)
(
)
/
1
(
4
1
4
2 




s
x
x
n
g
n
i
i
Teniendo en cuenta la suposición el coeficiente se
calcularía como:
(Relación entre el momento de orden 4 y la
desviación estándar o típica

• Otra medida de curtosis que también se usa está
basada en los cuartiles y percentiles a la vez y está
dada por:
Donde Q = ½(Q3 – Q1) es el recorrido semi-intercuartílico. Nos referimos a
este como el coeficiente de curtosis percentílico. Para la distribución
normal este tienen el valor de 0.263.

ClaseModelos1.pptx

Recomendados

Recomendados

Más contenido relacionado

Similar a ClaseModelos1.pptx

Similar a ClaseModelos1.pptx (20)

Último

Último (20)

ClaseModelos1.pptx