SlideShare una empresa de Scribd logo
1 de 5
Descargar para leer sin conexión
Medidas descriptivas para datos agrupados por clases
en una distribución de frecuencia cuando hay pérdida de información
Es muy común encontrar publicaciones de tablas de distribución de frecuencia sin
los datos originales, sobre todo cuando son un gran número de medidas. Cuando no
se calculan las medidas de tendencia central con los datos originales o no se publican
y las necesitamos para analizar los datos, podemos tomar el punto medio del
intervalo como el valor aproximado de todos los datos que pertenecen a un intervalo
dado; para calcular las medidas de tendencia central y de dispersión de forma
aproximada.
Ejemplo: La siguiente tabla muestra una distribución de frecuencia de la edad de
los pacientes con diabetes de cierto hospital, (las frecuencias relativas no se muestran
en la tabla). Los datos originales no fueron publicados. Calcular: la media, mediana,
moda, varianza, desviación típica y el percentil 25 (P25).
Clases
edad (años)
mi fi Fa
[0 - 5) 2,5 3 3
[5-10) 7,5 5 8
[10-15) 12,5 6 14
[15 -20) 17,5 6 20
[20 - 25) 22,5 4 24
[25 - 30) 27,5 7 31
[30 - 35) 32,5 2 33
Total 33
Para este ejemplo se considera entonces que en la primera clase hay 3 pacientes
diabéticos con una edad estimada de 2 años y medio, en la segunda clase hay 5
pacientes, todos con una edad estimada de 7 años y medio: en la última clase hay 2
pacientes, ambos con una edad estimada de 32 años y medio.
Este es un caso donde existe pérdida de información y por lo tanto para el cálculo
de las medidas descriptivas se utiliza el punto medio del intervalo como el valor de
todos los datos que pertenecen a él. Las fórmulas a usar se muestran a continuación:
Media 𝑋̅ =
∑ 𝑚𝑖×𝑓𝑖
𝑛
Mediana: la mediana está en el primer intervalo que acumule una frecuencia (Fa)
mayor o igual a:
n/2 si n es par
(n+1)/2 si n es impar
donde n es la cantidad total de datos.
Una vez ubicada esta clase medianal ”j” el valor de la mediana se calcula con las
siguientes fórmulas:
para n par para n impar
Moda: la moda está en la clase que tenga el mayor valor de frecuencia absoluta fi.
Una vez que se ubica la clase modal (i), la moda se calcula usando la siguiente
fórmula:
Mo =
𝐿𝐼 𝑖+𝐿𝑆 𝑖
2
mi: punto medio del intervalo de clase
fi: frecuencia absoluta de la clase
n: número de datos
LIj: límite inferior de la clase medianal (j)
Faj-1: Frecuencia acumulada de la clase anterior a la clase medianal (j-1)
fj: frecuencia absoluta de la clase medianal (j)
n: cantidad de datos
Md = 𝐿𝐼𝑗 + (
𝑛 + 1
2
− 𝐹𝑎𝑗−1
𝑓𝑗
) ∗ 𝑎𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒Md = 𝐿𝐼𝑗 + (
𝑛
2
− 𝐹𝑎𝑗−1
𝑓𝑗
) ∗ 𝑎𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒
LIi: límite inferior de la clase modal i
LSi: límite superior de la clase modal i
Varianza
Percentil: para hallar un percentil en particular Ph, primero hallamos la posición i
que ocupa para un grupo de datos de tamaño n usando una regla de tres, así
decimos:
100% n
h% i
luego ubicamos la clase k que contiene por primera vez esta frecuencia acumulada
“i” (en la columna Fa) y aplicamos la siguiente ecuación:
donde,
Ph: percentil h
h: porcentaje de datos por debajo del Ph
k: clase a la que pertenece el Ph
LIh: límite inferior de la clase del Ph
Fak-1: frecuencia acumulada de la clase anterior del Ph
Aplicando las fórmulas para el ejemplo anterior:
Media
𝑋̅ =
∑ 𝑚𝑖×𝑓𝑖
𝑛
=
(2,5 ∗ 3) + (7,5 ∗ 5) + (12,5 ∗ 6) + (17,5 ∗ 6) + (22,5 ∗ 4) + (27,5 ∗ 7) + (32,5 ∗ 2)
33
=
572,5
33
= 17,3
𝑖 =
ℎ ∗ 𝑛
100
𝑃ℎ = 𝐿𝐼 𝑘 + (
ℎ ∗ 𝑛
100 − 𝐹𝑎 𝑘−1
𝑓𝑘
) ∗ 𝑎𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒
𝑆2
=
∑(𝑚𝑖 − 𝑋̅)2
∗ 𝑓𝑖
𝑛
Mediana
Hay 33 datos, por lo tanto, n es impar, la mediana está en el primer intervalo de clase
que acumule una frecuencia (Fa) mayor o igual a:
(n+1)/2 = (33+1)/2 = 34/2 = 17
La clase que primero acumula 17 datos es la cuarta clase, que tiene una Fa de 20, allí
está el dato número 17. Esta clase en la fórmula será la clase j donde j=4.
En este caso, la mediana coincide con el punto medio del intervalo m4.
Moda: la clase con mayor frecuencia absoluta es la clase 6 con una frecuencia de 7
datos. En la fórmula i=6
Varianza
𝑆2
=
∑(𝑚𝑖 − 𝑋̅)2
∗ 𝑓𝑖
𝑛
=
(2,5 − 17,3)2
+ (7,5 − 17,3)2
+ (12,5 − 17,3)2
+ (17,5 − 17,3)2
+ (22,5 − 17,3)2
+ (27,5 − 17,3)2
+ (32,5 − 17,3)2
33
=
225 + 100 + 25 + 0 + 25 + 100 + 225
33
=
700
33
= 21,2 𝑎ñ𝑜𝑠2
Md = 𝐿𝐼𝑗 + (
𝑛 + 1
2
− 𝐹𝑎𝑗−1
𝑓𝑗
) ∗ 𝑎𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒
Md = 15 + (
33 + 1
2
− 14
6
) ∗ 5 = 15 + 2,5 = 17,5
Mo =
𝐿𝐼𝑖 + 𝐿𝑆𝑖
2
Mo =
25 + 30
2
= 27,5
Desviación típica: 𝑺 = √𝑺 𝟐 = √ 𝟐𝟏, 𝟐𝟏 = 𝟒, 𝟔 años
Percentil 25 (P25): es un valor de edad por debajo del cual está el 25% de los
pacientes, para calcularlo primero ubicamos la posición “i” del percentil 25 (h)
dentro del grupo de datos ordenados:
i = (h*n)/100 i = (25*33)/100 = 8,25 ≈ 9
luego ubicamos luego ubicamos la clase k que contiene por primera vez esta
frecuencia acumulada “i” (en la columna Fa). Vemos que la clase 3 tiene una
Fa=14, allí se encuentra el dato número 9 (i=9), entonces k=3
finalmente, para estimar el P25 aplicamos la siguiente ecuación:
𝑃25 = 𝐿𝐼3 + (
25 ∗ 33
100 − 𝐹𝑎2
𝑓3
) ∗ 5 = 10 +
8,25 − 8
6
= 10 + 0,042 = 10,042 ≈ 10
El 25% de los pacientes tiene una edad menor a 10 años.
𝑃ℎ = 𝐿𝐼 𝑘 + (
ℎ ∗ 𝑛
100
− 𝐹𝑎 𝑘−1
𝑓𝑘
) ∗ 𝑎𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒

Más contenido relacionado

La actualidad más candente

Medidas de tendencia central
Medidas de tendencia centralMedidas de tendencia central
Medidas de tendencia central
Danelix Cordero
 
media aritmetica en datos agrupados y no agrupados
media aritmetica en datos agrupados y no agrupadosmedia aritmetica en datos agrupados y no agrupados
media aritmetica en datos agrupados y no agrupados
joherman paradas
 
medidas-tendencia-central datos agrupados y no agrupados.pdf
medidas-tendencia-central datos agrupados y no agrupados.pdfmedidas-tendencia-central datos agrupados y no agrupados.pdf
medidas-tendencia-central datos agrupados y no agrupados.pdf
Carlos Franco
 

La actualidad más candente (20)

Medidas de tendencia central
Medidas de tendencia centralMedidas de tendencia central
Medidas de tendencia central
 
Tarea estadística - variable continua
Tarea estadística - variable continuaTarea estadística - variable continua
Tarea estadística - variable continua
 
MEDIDASDEDISPERSION.pdf
MEDIDASDEDISPERSION.pdfMEDIDASDEDISPERSION.pdf
MEDIDASDEDISPERSION.pdf
 
Medidas De Posición Central
Medidas De Posición CentralMedidas De Posición Central
Medidas De Posición Central
 
Medidas de Tendencia Central
Medidas de Tendencia CentralMedidas de Tendencia Central
Medidas de Tendencia Central
 
Medidas de Dispersión..pdf
Medidas de Dispersión..pdfMedidas de Dispersión..pdf
Medidas de Dispersión..pdf
 
Medidas de tendencia central y dispersion cobach
Medidas de tendencia central y dispersion cobachMedidas de tendencia central y dispersion cobach
Medidas de tendencia central y dispersion cobach
 
Capítulo 04, Otras medidas descriptivas
Capítulo 04, Otras medidas descriptivasCapítulo 04, Otras medidas descriptivas
Capítulo 04, Otras medidas descriptivas
 
media aritmetica en datos agrupados y no agrupados
media aritmetica en datos agrupados y no agrupadosmedia aritmetica en datos agrupados y no agrupados
media aritmetica en datos agrupados y no agrupados
 
Medidas de tendencia central
Medidas de tendencia centralMedidas de tendencia central
Medidas de tendencia central
 
Estadistica
EstadisticaEstadistica
Estadistica
 
Medidas de Orden o Posición y Dispersión
Medidas de Orden o Posición y DispersiónMedidas de Orden o Posición y Dispersión
Medidas de Orden o Posición y Dispersión
 
3eso quincena11
3eso quincena113eso quincena11
3eso quincena11
 
Variable discreta
Variable discretaVariable discreta
Variable discreta
 
Medidas de tendencia central
Medidas de tendencia centralMedidas de tendencia central
Medidas de tendencia central
 
medidas-tendencia-central datos agrupados y no agrupados.pdf
medidas-tendencia-central datos agrupados y no agrupados.pdfmedidas-tendencia-central datos agrupados y no agrupados.pdf
medidas-tendencia-central datos agrupados y no agrupados.pdf
 
Medidas de Tendencia Central, Posición y Dispersión
Medidas de Tendencia Central, Posición y DispersiónMedidas de Tendencia Central, Posición y Dispersión
Medidas de Tendencia Central, Posición y Dispersión
 
Cuartiles y percentiles
Cuartiles y percentilesCuartiles y percentiles
Cuartiles y percentiles
 
Medidas de tendencia central
Medidas de tendencia centralMedidas de tendencia central
Medidas de tendencia central
 
Medidas De Dispersion
Medidas De DispersionMedidas De Dispersion
Medidas De Dispersion
 

Similar a Datos agrupados. medidas descriptivas

Comunidad_Emagister_66885_66885. Medidas de Tendencia Central.pdf
Comunidad_Emagister_66885_66885. Medidas de Tendencia Central.pdfComunidad_Emagister_66885_66885. Medidas de Tendencia Central.pdf
Comunidad_Emagister_66885_66885. Medidas de Tendencia Central.pdf
Carlos Franco
 
Estadstica descriptiva-1230745228674108-2
Estadstica descriptiva-1230745228674108-2Estadstica descriptiva-1230745228674108-2
Estadstica descriptiva-1230745228674108-2
danilosaavedra
 
estadistica inferencial
estadistica inferencialestadistica inferencial
estadistica inferencial
Ruben Santos
 
Estadística descriptiva 1ra clase 2do parcial
Estadística descriptiva 1ra clase 2do parcialEstadística descriptiva 1ra clase 2do parcial
Estadística descriptiva 1ra clase 2do parcial
joseramon4225
 
Presentacion 1 Problemas de Medidas de tendencia Central.pptx
Presentacion 1 Problemas de Medidas de tendencia  Central.pptxPresentacion 1 Problemas de Medidas de tendencia  Central.pptx
Presentacion 1 Problemas de Medidas de tendencia Central.pptx
RichardPalaciosCastr
 

Similar a Datos agrupados. medidas descriptivas (20)

Comunidad_Emagister_66885_66885.pdf
Comunidad_Emagister_66885_66885.pdfComunidad_Emagister_66885_66885.pdf
Comunidad_Emagister_66885_66885.pdf
 
Comunidad_Emagister_66885_66885. Medidas de Tendencia Central.pdf
Comunidad_Emagister_66885_66885. Medidas de Tendencia Central.pdfComunidad_Emagister_66885_66885. Medidas de Tendencia Central.pdf
Comunidad_Emagister_66885_66885. Medidas de Tendencia Central.pdf
 
Media Mediana y Moda.pdf
Media Mediana y Moda.pdfMedia Mediana y Moda.pdf
Media Mediana y Moda.pdf
 
630264452-TENDENCIA-CENTRAL-PPT-pptx.pptx
630264452-TENDENCIA-CENTRAL-PPT-pptx.pptx630264452-TENDENCIA-CENTRAL-PPT-pptx.pptx
630264452-TENDENCIA-CENTRAL-PPT-pptx.pptx
 
Bioestadistica - Medidas descriptivas
Bioestadistica - Medidas descriptivasBioestadistica - Medidas descriptivas
Bioestadistica - Medidas descriptivas
 
Estadística I (I Bimestre)
Estadística I (I Bimestre)Estadística I (I Bimestre)
Estadística I (I Bimestre)
 
Unidad 1_Datos agrupados.pdf
Unidad 1_Datos agrupados.pdfUnidad 1_Datos agrupados.pdf
Unidad 1_Datos agrupados.pdf
 
Estadstica descriptiva-1230745228674108-2
Estadstica descriptiva-1230745228674108-2Estadstica descriptiva-1230745228674108-2
Estadstica descriptiva-1230745228674108-2
 
DIAP-UNE.ppt
DIAP-UNE.pptDIAP-UNE.ppt
DIAP-UNE.ppt
 
estadistica inferencial
estadistica inferencialestadistica inferencial
estadistica inferencial
 
datos agrupados.pdf
datos agrupados.pdfdatos agrupados.pdf
datos agrupados.pdf
 
Estadística descriptiva 1ra clase 2do parcial
Estadística descriptiva 1ra clase 2do parcialEstadística descriptiva 1ra clase 2do parcial
Estadística descriptiva 1ra clase 2do parcial
 
Estadística I ( medidas de tendencia)
Estadística I ( medidas de tendencia)Estadística I ( medidas de tendencia)
Estadística I ( medidas de tendencia)
 
Presentacion 1 Problemas de Medidas de tendencia Central.pptx
Presentacion 1 Problemas de Medidas de tendencia  Central.pptxPresentacion 1 Problemas de Medidas de tendencia  Central.pptx
Presentacion 1 Problemas de Medidas de tendencia Central.pptx
 
Medidas de tendencia central
Medidas de tendencia centralMedidas de tendencia central
Medidas de tendencia central
 
UNIDAD 2. MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIÓN.pdf
UNIDAD 2. MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIÓN.pdfUNIDAD 2. MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIÓN.pdf
UNIDAD 2. MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIÓN.pdf
 
PPT-de-Medidas-de-Tendencias-Centrales -bunoooooo.pdf
PPT-de-Medidas-de-Tendencias-Centrales -bunoooooo.pdfPPT-de-Medidas-de-Tendencias-Centrales -bunoooooo.pdf
PPT-de-Medidas-de-Tendencias-Centrales -bunoooooo.pdf
 
Clase 3- Ingeniería y Arquitectura 2024.pptx
Clase 3- Ingeniería y Arquitectura 2024.pptxClase 3- Ingeniería y Arquitectura 2024.pptx
Clase 3- Ingeniería y Arquitectura 2024.pptx
 
20121010141000
2012101014100020121010141000
20121010141000
 
medidasestadisti cont.pptx
medidasestadisti cont.pptxmedidasestadisti cont.pptx
medidasestadisti cont.pptx
 

Más de nchacinp

Más de nchacinp (20)

I Examen parcial de estadística aplicada A 2018
I Examen parcial de estadística aplicada A 2018I Examen parcial de estadística aplicada A 2018
I Examen parcial de estadística aplicada A 2018
 
I examen parcial a y b 2017
I examen parcial a y b 2017I examen parcial a y b 2017
I examen parcial a y b 2017
 
Ii examen estadística probabilidades
Ii examen estadística probabilidadesIi examen estadística probabilidades
Ii examen estadística probabilidades
 
R6 test de hipótesis
R6 test de hipótesisR6 test de hipótesis
R6 test de hipótesis
 
R5 intervalos de confianza
R5 intervalos de confianzaR5 intervalos de confianza
R5 intervalos de confianza
 
Estad uma 04_probabilidades
Estad uma 04_probabilidadesEstad uma 04_probabilidades
Estad uma 04_probabilidades
 
Ejercicios para entregar i parcial sem a2017
Ejercicios para entregar i parcial sem a2017Ejercicios para entregar i parcial sem a2017
Ejercicios para entregar i parcial sem a2017
 
Practica 2.preguntas medidas de resumen y dispersion
Practica 2.preguntas medidas de resumen y dispersionPractica 2.preguntas medidas de resumen y dispersion
Practica 2.preguntas medidas de resumen y dispersion
 
Escalas de medida
Escalas de medidaEscalas de medida
Escalas de medida
 
Ejercicios tema1
Ejercicios tema1Ejercicios tema1
Ejercicios tema1
 
Notacion de suma con sigma
Notacion de suma con sigmaNotacion de suma con sigma
Notacion de suma con sigma
 
Tests hipotesis introducción
Tests hipotesis introducciónTests hipotesis introducción
Tests hipotesis introducción
 
Inferencia introducción
Inferencia introducciónInferencia introducción
Inferencia introducción
 
R2
R2R2
R2
 
R3
R3R3
R3
 
Ejemplos universo poblacion y muestra
Ejemplos universo poblacion y muestraEjemplos universo poblacion y muestra
Ejemplos universo poblacion y muestra
 
Práctica 1 descriptiva parte i
Práctica 1 descriptiva parte iPráctica 1 descriptiva parte i
Práctica 1 descriptiva parte i
 
Propiedades de la media
Propiedades de la mediaPropiedades de la media
Propiedades de la media
 
La moda
La modaLa moda
La moda
 
La mediana
La medianaLa mediana
La mediana
 

Último

metodo SOAP utilizado para evaluar el estado de un paciente
metodo SOAP utilizado para evaluar el estado de un pacientemetodo SOAP utilizado para evaluar el estado de un paciente
metodo SOAP utilizado para evaluar el estado de un paciente
MedicinaInternaresid1
 

Último (20)

P.P ANÁLISIS DE UN TEXTO BÍBLICO. TEMA 10.pptx
P.P ANÁLISIS DE UN TEXTO BÍBLICO. TEMA 10.pptxP.P ANÁLISIS DE UN TEXTO BÍBLICO. TEMA 10.pptx
P.P ANÁLISIS DE UN TEXTO BÍBLICO. TEMA 10.pptx
 
Alfredo Gabriel Rodriguez Yajure Tarea#1
Alfredo Gabriel Rodriguez Yajure Tarea#1Alfredo Gabriel Rodriguez Yajure Tarea#1
Alfredo Gabriel Rodriguez Yajure Tarea#1
 
metodo SOAP utilizado para evaluar el estado de un paciente
metodo SOAP utilizado para evaluar el estado de un pacientemetodo SOAP utilizado para evaluar el estado de un paciente
metodo SOAP utilizado para evaluar el estado de un paciente
 
aine-2014.pdf/tipos de aines-clasificación
aine-2014.pdf/tipos de aines-clasificaciónaine-2014.pdf/tipos de aines-clasificación
aine-2014.pdf/tipos de aines-clasificación
 
variables-estadisticas. Presentación powerpoint
variables-estadisticas. Presentación powerpointvariables-estadisticas. Presentación powerpoint
variables-estadisticas. Presentación powerpoint
 
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptx
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptxCUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptx
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptx
 
decreto 2090 de 2003.pdf actividades de alto riesgo en Colombia
decreto 2090 de 2003.pdf actividades de alto riesgo en Colombiadecreto 2090 de 2003.pdf actividades de alto riesgo en Colombia
decreto 2090 de 2003.pdf actividades de alto riesgo en Colombia
 
Investigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdfInvestigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdf
 
AMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docx
AMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docxAMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docx
AMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docx
 
Adultos Mayores más de 60 años como de la población total (2024).pdf
Adultos Mayores más de 60 años como  de la población total (2024).pdfAdultos Mayores más de 60 años como  de la población total (2024).pdf
Adultos Mayores más de 60 años como de la población total (2024).pdf
 
Principales Retos Demográficos de Puerto Rico
Principales Retos Demográficos de Puerto RicoPrincipales Retos Demográficos de Puerto Rico
Principales Retos Demográficos de Puerto Rico
 
max-weber-principales-aportes de la sociologia (2).pptx
max-weber-principales-aportes de la sociologia (2).pptxmax-weber-principales-aportes de la sociologia (2).pptx
max-weber-principales-aportes de la sociologia (2).pptx
 
Perú en el ranking mundial, segun datos mineria
Perú en el ranking mundial, segun datos mineriaPerú en el ranking mundial, segun datos mineria
Perú en el ranking mundial, segun datos mineria
 
Las familias más ricas de África en el año (2024).pdf
Las familias más ricas de África en el año (2024).pdfLas familias más ricas de África en el año (2024).pdf
Las familias más ricas de África en el año (2024).pdf
 
6.3 Hidrologia Geomorfologia Cuenca.pptx
6.3 Hidrologia Geomorfologia Cuenca.pptx6.3 Hidrologia Geomorfologia Cuenca.pptx
6.3 Hidrologia Geomorfologia Cuenca.pptx
 
Sistema Nacional de Vigilancia en Salud Pública SIVIGILA
Sistema Nacional de Vigilancia en Salud Pública SIVIGILASistema Nacional de Vigilancia en Salud Pública SIVIGILA
Sistema Nacional de Vigilancia en Salud Pública SIVIGILA
 
02 protocolo en caso de robo o asalto.pdf
02 protocolo en caso de robo o asalto.pdf02 protocolo en caso de robo o asalto.pdf
02 protocolo en caso de robo o asalto.pdf
 
Los primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdfLos primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdf
 
procedimiento paran la planificación en los centros educativos tipo v(multig...
procedimiento  paran la planificación en los centros educativos tipo v(multig...procedimiento  paran la planificación en los centros educativos tipo v(multig...
procedimiento paran la planificación en los centros educativos tipo v(multig...
 
biometria hematica y hemostasia y preanalitica.pptx
biometria hematica y hemostasia y preanalitica.pptxbiometria hematica y hemostasia y preanalitica.pptx
biometria hematica y hemostasia y preanalitica.pptx
 

Datos agrupados. medidas descriptivas

  • 1. Medidas descriptivas para datos agrupados por clases en una distribución de frecuencia cuando hay pérdida de información Es muy común encontrar publicaciones de tablas de distribución de frecuencia sin los datos originales, sobre todo cuando son un gran número de medidas. Cuando no se calculan las medidas de tendencia central con los datos originales o no se publican y las necesitamos para analizar los datos, podemos tomar el punto medio del intervalo como el valor aproximado de todos los datos que pertenecen a un intervalo dado; para calcular las medidas de tendencia central y de dispersión de forma aproximada. Ejemplo: La siguiente tabla muestra una distribución de frecuencia de la edad de los pacientes con diabetes de cierto hospital, (las frecuencias relativas no se muestran en la tabla). Los datos originales no fueron publicados. Calcular: la media, mediana, moda, varianza, desviación típica y el percentil 25 (P25). Clases edad (años) mi fi Fa [0 - 5) 2,5 3 3 [5-10) 7,5 5 8 [10-15) 12,5 6 14 [15 -20) 17,5 6 20 [20 - 25) 22,5 4 24 [25 - 30) 27,5 7 31 [30 - 35) 32,5 2 33 Total 33 Para este ejemplo se considera entonces que en la primera clase hay 3 pacientes diabéticos con una edad estimada de 2 años y medio, en la segunda clase hay 5 pacientes, todos con una edad estimada de 7 años y medio: en la última clase hay 2 pacientes, ambos con una edad estimada de 32 años y medio. Este es un caso donde existe pérdida de información y por lo tanto para el cálculo de las medidas descriptivas se utiliza el punto medio del intervalo como el valor de todos los datos que pertenecen a él. Las fórmulas a usar se muestran a continuación:
  • 2. Media 𝑋̅ = ∑ 𝑚𝑖×𝑓𝑖 𝑛 Mediana: la mediana está en el primer intervalo que acumule una frecuencia (Fa) mayor o igual a: n/2 si n es par (n+1)/2 si n es impar donde n es la cantidad total de datos. Una vez ubicada esta clase medianal ”j” el valor de la mediana se calcula con las siguientes fórmulas: para n par para n impar Moda: la moda está en la clase que tenga el mayor valor de frecuencia absoluta fi. Una vez que se ubica la clase modal (i), la moda se calcula usando la siguiente fórmula: Mo = 𝐿𝐼 𝑖+𝐿𝑆 𝑖 2 mi: punto medio del intervalo de clase fi: frecuencia absoluta de la clase n: número de datos LIj: límite inferior de la clase medianal (j) Faj-1: Frecuencia acumulada de la clase anterior a la clase medianal (j-1) fj: frecuencia absoluta de la clase medianal (j) n: cantidad de datos Md = 𝐿𝐼𝑗 + ( 𝑛 + 1 2 − 𝐹𝑎𝑗−1 𝑓𝑗 ) ∗ 𝑎𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒Md = 𝐿𝐼𝑗 + ( 𝑛 2 − 𝐹𝑎𝑗−1 𝑓𝑗 ) ∗ 𝑎𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒 LIi: límite inferior de la clase modal i LSi: límite superior de la clase modal i
  • 3. Varianza Percentil: para hallar un percentil en particular Ph, primero hallamos la posición i que ocupa para un grupo de datos de tamaño n usando una regla de tres, así decimos: 100% n h% i luego ubicamos la clase k que contiene por primera vez esta frecuencia acumulada “i” (en la columna Fa) y aplicamos la siguiente ecuación: donde, Ph: percentil h h: porcentaje de datos por debajo del Ph k: clase a la que pertenece el Ph LIh: límite inferior de la clase del Ph Fak-1: frecuencia acumulada de la clase anterior del Ph Aplicando las fórmulas para el ejemplo anterior: Media 𝑋̅ = ∑ 𝑚𝑖×𝑓𝑖 𝑛 = (2,5 ∗ 3) + (7,5 ∗ 5) + (12,5 ∗ 6) + (17,5 ∗ 6) + (22,5 ∗ 4) + (27,5 ∗ 7) + (32,5 ∗ 2) 33 = 572,5 33 = 17,3 𝑖 = ℎ ∗ 𝑛 100 𝑃ℎ = 𝐿𝐼 𝑘 + ( ℎ ∗ 𝑛 100 − 𝐹𝑎 𝑘−1 𝑓𝑘 ) ∗ 𝑎𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒 𝑆2 = ∑(𝑚𝑖 − 𝑋̅)2 ∗ 𝑓𝑖 𝑛
  • 4. Mediana Hay 33 datos, por lo tanto, n es impar, la mediana está en el primer intervalo de clase que acumule una frecuencia (Fa) mayor o igual a: (n+1)/2 = (33+1)/2 = 34/2 = 17 La clase que primero acumula 17 datos es la cuarta clase, que tiene una Fa de 20, allí está el dato número 17. Esta clase en la fórmula será la clase j donde j=4. En este caso, la mediana coincide con el punto medio del intervalo m4. Moda: la clase con mayor frecuencia absoluta es la clase 6 con una frecuencia de 7 datos. En la fórmula i=6 Varianza 𝑆2 = ∑(𝑚𝑖 − 𝑋̅)2 ∗ 𝑓𝑖 𝑛 = (2,5 − 17,3)2 + (7,5 − 17,3)2 + (12,5 − 17,3)2 + (17,5 − 17,3)2 + (22,5 − 17,3)2 + (27,5 − 17,3)2 + (32,5 − 17,3)2 33 = 225 + 100 + 25 + 0 + 25 + 100 + 225 33 = 700 33 = 21,2 𝑎ñ𝑜𝑠2 Md = 𝐿𝐼𝑗 + ( 𝑛 + 1 2 − 𝐹𝑎𝑗−1 𝑓𝑗 ) ∗ 𝑎𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒 Md = 15 + ( 33 + 1 2 − 14 6 ) ∗ 5 = 15 + 2,5 = 17,5 Mo = 𝐿𝐼𝑖 + 𝐿𝑆𝑖 2 Mo = 25 + 30 2 = 27,5
  • 5. Desviación típica: 𝑺 = √𝑺 𝟐 = √ 𝟐𝟏, 𝟐𝟏 = 𝟒, 𝟔 años Percentil 25 (P25): es un valor de edad por debajo del cual está el 25% de los pacientes, para calcularlo primero ubicamos la posición “i” del percentil 25 (h) dentro del grupo de datos ordenados: i = (h*n)/100 i = (25*33)/100 = 8,25 ≈ 9 luego ubicamos luego ubicamos la clase k que contiene por primera vez esta frecuencia acumulada “i” (en la columna Fa). Vemos que la clase 3 tiene una Fa=14, allí se encuentra el dato número 9 (i=9), entonces k=3 finalmente, para estimar el P25 aplicamos la siguiente ecuación: 𝑃25 = 𝐿𝐼3 + ( 25 ∗ 33 100 − 𝐹𝑎2 𝑓3 ) ∗ 5 = 10 + 8,25 − 8 6 = 10 + 0,042 = 10,042 ≈ 10 El 25% de los pacientes tiene una edad menor a 10 años. 𝑃ℎ = 𝐿𝐼 𝑘 + ( ℎ ∗ 𝑛 100 − 𝐹𝑎 𝑘−1 𝑓𝑘 ) ∗ 𝑎𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒