Este documento explica cómo construir y analizar diagramas de cajas para representar y comparar conjuntos de datos. Un diagrama de caja muestra la mediana, los cuartiles y valores atípicos o extremos para proporcionar información sobre la localización, dispersión y forma de una distribución de datos. El documento describe los pasos para construir un diagrama de caja e identificar valores atípicos y extremos, y proporciona ejemplos para ilustrar cómo se pueden usar los diagramas de cajas para comparar grupos de datos.
El documento trata sobre la prueba de chi-cuadrado. Explica que la prueba de chi-cuadrado es una herramienta importante para determinar si un proyecto es factible o no, al igual que las pruebas de hipótesis y t de Student. Luego procede a definir la distribución chi-cuadrado, sus propiedades y cómo se utiliza para realizar pruebas de ajuste e independencia.
Este documento describe la distribución normal de probabilidad continua, que es una de las distribuciones más importantes en estadística. Explica que la distribución normal describe muchos fenómenos naturales y de medición, y define sus parámetros de media y desviación estándar. Además, proporciona ejemplos y fórmulas para calcular áreas bajo la curva normal y probabilidades asociadas a valores de una variable aleatoria normal.
Este documento describe medidas de forma como la simetría, asimetría, apuntamiento y achatamiento de distribuciones de datos. Explica cómo calcular el coeficiente de asimetría de Pearson y Fisher para determinar si una distribución es simétrica o asimétrica, y el coeficiente de curtosis de Fisher para determinar si una distribución es mesocúrtica, leptocúrtica o platicúrtica. También presenta ejemplos prácticos de cálculos de estos coeficientes.
9. diferencia entre p de hipótesis e intervalos de confianzaYerko Bravo
Este documento explica la diferencia entre pruebas de hipótesis e intervalos de confianza. Las pruebas de hipótesis determinan la probabilidad de que los resultados observados sean producto del azar, mientras que los intervalos de confianza miden la confiabilidad de los resultados obtenidos de una muestra para estimar parámetros poblacionales. El documento ilustra estos conceptos con ejemplos de efectos de tratamientos en cerdos y tasas de enfermedades en humanos.
Este documento presenta información sobre pruebas de hipótesis estadísticas para muestras grandes. Explica las cinco partes clave de una prueba de hipótesis: 1) la hipótesis nula, 2) la hipótesis alternativa, 3) el estadístico de prueba y su valor p, 4) la región de rechazo, y 5) la conclusión. También discute conceptos como el nivel de significación, los errores tipo I y tipo II, y cómo usar pruebas de hipótesis para probar valores
El documento presenta los conceptos y procedimientos del análisis de varianza (ANOVA) de un factor. Explica que ANOVA compara la variación entre grupos con la variación dentro de los grupos para determinar si los efectos de diferentes tratamientos son estadísticamente significativos. Proporciona un ejemplo numérico donde se analizan los efectos de diferentes promociones de ventas utilizando ANOVA de un factor.
Problemas de determinación de tamaño de la muestra (9)Luz Hernández
Este documento presenta varios problemas de determinación de tamaño de muestra. Explica cómo calcular el tamaño de muestra necesario para diferentes niveles de confianza, márgenes de error y desviaciones estándar. También analiza si es recomendable o no tomar una muestra de cierto tamaño dado los parámetros del estudio.
Guión del tema 6, Estimación de parámetros poblacionales (intervalos de confianza) Estadística+Ingeniería Multimedia. Más recursos en http://blogs.ua.es/violeta/
El documento trata sobre la prueba de chi-cuadrado. Explica que la prueba de chi-cuadrado es una herramienta importante para determinar si un proyecto es factible o no, al igual que las pruebas de hipótesis y t de Student. Luego procede a definir la distribución chi-cuadrado, sus propiedades y cómo se utiliza para realizar pruebas de ajuste e independencia.
Este documento describe la distribución normal de probabilidad continua, que es una de las distribuciones más importantes en estadística. Explica que la distribución normal describe muchos fenómenos naturales y de medición, y define sus parámetros de media y desviación estándar. Además, proporciona ejemplos y fórmulas para calcular áreas bajo la curva normal y probabilidades asociadas a valores de una variable aleatoria normal.
Este documento describe medidas de forma como la simetría, asimetría, apuntamiento y achatamiento de distribuciones de datos. Explica cómo calcular el coeficiente de asimetría de Pearson y Fisher para determinar si una distribución es simétrica o asimétrica, y el coeficiente de curtosis de Fisher para determinar si una distribución es mesocúrtica, leptocúrtica o platicúrtica. También presenta ejemplos prácticos de cálculos de estos coeficientes.
9. diferencia entre p de hipótesis e intervalos de confianzaYerko Bravo
Este documento explica la diferencia entre pruebas de hipótesis e intervalos de confianza. Las pruebas de hipótesis determinan la probabilidad de que los resultados observados sean producto del azar, mientras que los intervalos de confianza miden la confiabilidad de los resultados obtenidos de una muestra para estimar parámetros poblacionales. El documento ilustra estos conceptos con ejemplos de efectos de tratamientos en cerdos y tasas de enfermedades en humanos.
Este documento presenta información sobre pruebas de hipótesis estadísticas para muestras grandes. Explica las cinco partes clave de una prueba de hipótesis: 1) la hipótesis nula, 2) la hipótesis alternativa, 3) el estadístico de prueba y su valor p, 4) la región de rechazo, y 5) la conclusión. También discute conceptos como el nivel de significación, los errores tipo I y tipo II, y cómo usar pruebas de hipótesis para probar valores
El documento presenta los conceptos y procedimientos del análisis de varianza (ANOVA) de un factor. Explica que ANOVA compara la variación entre grupos con la variación dentro de los grupos para determinar si los efectos de diferentes tratamientos son estadísticamente significativos. Proporciona un ejemplo numérico donde se analizan los efectos de diferentes promociones de ventas utilizando ANOVA de un factor.
Problemas de determinación de tamaño de la muestra (9)Luz Hernández
Este documento presenta varios problemas de determinación de tamaño de muestra. Explica cómo calcular el tamaño de muestra necesario para diferentes niveles de confianza, márgenes de error y desviaciones estándar. También analiza si es recomendable o no tomar una muestra de cierto tamaño dado los parámetros del estudio.
Guión del tema 6, Estimación de parámetros poblacionales (intervalos de confianza) Estadística+Ingeniería Multimedia. Más recursos en http://blogs.ua.es/violeta/
Este documento describe conceptos básicos de probabilidad, incluyendo experimentos determinísticos y no determinísticos, experimentos aleatorios, sucesos posibles, imposibles y seguros, y definiciones de probabilidad clásica y por frecuencia relativa. También cubre propiedades como la suma de probabilidades, probabilidad condicional, regla de la multiplicación, y provee ejemplos ilustrativos.
El documento describe una unidad de estimación de parámetros que incluye estimación puntual y por intervalos. La estimación puntual calcula valores estadísticos para estimar parámetros de poblaciones, mientras que la estimación por intervalos provee rangos de valores dentro de los cuales es probable que se encuentren los parámetros. El documento también presenta ejemplos numéricos de cómo aplicar estos métodos.
La distribución t de Student surge al estimar la media de una población normal con muestras pequeñas cuando se desconoce la desviación estándar poblacional. Se usa para calcular intervalos de confianza, probar hipótesis con muestras pequeñas, y comparar dos muestras. A diferencia de la distribución Z, la varianza de t de Student depende del tamaño de la muestra y siempre es mayor a 1, pero ambas tienen forma de campana.
Este documento describe los procedimientos para realizar pruebas de hipótesis para comparar dos medias con muestras independientes. Explica cómo formular las hipótesis nula y alternativa, calcular el estadístico de prueba, establecer una regla de decisión y tomar una decisión sobre la hipótesis nula. También cubre el uso de pruebas unilaterales cuando la hipótesis alternativa es direccional. Finalmente, presenta un ejemplo completo de cómo aplicar estos conceptos para comparar las proporciones de defectos en
Este documento explica la distribución T de Student, que se utiliza para estimar la media de una población cuando el tamaño de la muestra es pequeño. Describe que la distribución T de Student tiene forma de campana, es simétrica alrededor de la media y tiene una varianza mayor que 1. También proporciona ejemplos de cómo usar tablas de distribución T de Student para encontrar valores críticos con diferentes grados de libertad y áreas bajo la curva.
Este documento contiene 14 problemas de probabilidad relacionados con diferentes escenarios como el comportamiento criminal, encuestas demográficas, diagnósticos médicos y resultados educativos. Los problemas incluyen calcular probabilidades condicionales e independientes usando tablas de datos y porcentajes provistos.
Se lleva a cabo un experimento para comparar el desgaste por abrasivo de dos materiales laminados. El material 1 tuvo un desgaste promedio de 85 unidades y el material 2 de 81 unidades. Usando una prueba t de Student con un nivel de significancia del 0.05, no se puede concluir que el desgaste del material 1 exceda el del material 2 en más de 2 unidades.
El documento presenta conceptos básicos de estadística como parámetros, estadígrafos, estimación e inferencia estadística. Explica qué son los estimadores puntuales e intervalales y cómo construir intervalos de confianza para la media, varianza y proporción poblacional a partir de datos muestrales. Incluye ejemplos para ilustrar el cálculo de intervalos de confianza y conclusiones acerca de parámetros desconocidos de una población.
El documento habla sobre la probabilidad condicional. Define la probabilidad condicional de un evento B dado un evento A como la probabilidad de B ocurriendo dividida entre la probabilidad de A ocurriendo. Explica el concepto con tres ejemplos, incluyendo calcular la probabilidad condicional de eventos como un vuelo llegando a tiempo dado que salió a tiempo, y un listón fallando la prueba de textura dado que falló la prueba de longitud. Finalmente define eventos independientes como aquellos cuya probabilidad condicional es igual a su probabilidad general
APROXIMACIÓN BINOMIAL DE HIPERGEOMÉTRICAyaritza_ing
Se estima que 4000 de 10000 votantes de una ciudad están en contra de un nuevo impuesto a las ventas. Si se seleccionan al azar 15 votantes y se les pide su opinión, la probabilidad de que por lo menos 7 estén a favor del nuevo impuesto puede aproximarse mediante una distribución binomial, siendo 0.9049.
La distribución binomial describe el número de éxitos en una serie de ensayos independientes con dos posibles resultados (éxito o fracaso) y una probabilidad constante de éxito en cada ensayo. Esta tabla muestra las probabilidades de obtener diferentes números de éxitos para diferentes números de ensayos y probabilidades de éxito.
El documento describe la distribución t de Student, la cual fue desarrollada por William Gosset en 1908 mientras trabajaba para la cervecería Guinness. Gosset no podía publicar bajo su propio nombre debido a un acuerdo de confidencialidad, por lo que usó el seudónimo "Student". La distribución t es útil para realizar pruebas estadísticas cuando las muestras son pequeñas o la desviación estándar de la población es desconocida. Se diferencia de la distribución normal en que depende del t
Este documento presenta los resultados de varias pruebas de hipótesis realizadas sobre diferentes conjuntos de datos. En la prueba 13, se comparan las desviaciones estándar de los pesos de paquetes en el pasado (0.25 onzas) y en una muestra actual (0.32 onzas) para determinar si la variabilidad ha aumentado de manera significativa a niveles de significancia del 0.05 y 0.005. Los resultados muestran que la hipótesis nula de que no hay un aumento significativo en la variabilidad no puede ser rechazada
1) Se calculan las ecuaciones de regresión lineal de la edad sobre el peso y del peso sobre la edad para 5 niños. Se predice que el peso de un niño de 6 años sería de aproximadamente 35.55 kg.
2) Se calcula el coeficiente de correlación lineal entre el número de clientes y la distancia a un centro comercial. Se predice que a una distancia de 2 km habría 1151 clientes y que para recibir 500 clientes se debería situar a 24.96 km.
3) Se calculan las ecuaciones de regresión line
Este documento describe tres pruebas estadísticas para analizar datos categóricos: la prueba de bondad de ajuste, la prueba de independencia y la prueba de homogeneidad. Explica cómo usar la prueba chi-cuadrado de bondad de ajuste para determinar si las proporciones observadas en una muestra difieren de las proporciones esperadas en la población total. También incluye un ejemplo numérico para ilustrar el cálculo e interpretación de la prueba chi-cuadrado de bondad de ajuste
Este documento proporciona una introducción a la prueba de chi-cuadrado, incluyendo cómo se aplica para medir la relación entre dos variables nominales, cómo se calcula, su distribución, y ejemplos de su uso para probar la independencia entre variables. También discute brevemente algunas limitaciones de la prueba de chi-cuadrado.
Este documento describe diferentes medidas de dispersión como la desviación típica, varianza, coeficiente de variación y rango. Explica que las medidas de dispersión cuantifican cuán alejados están los valores de una variable de su media y son útiles para comparar la variabilidad entre muestras. También define cada medida de dispersión, sus propiedades y usos.
Este documento describe métodos para calcular medidas descriptivas como la media, mediana, moda, varianza y percentiles cuando se presenta pérdida de información en los datos originales de una distribución de frecuencia. Explica cómo utilizar el punto medio de cada intervalo como valor aproximado de los datos en él para calcular dichas medidas de forma aproximada. Proporciona un ejemplo con datos de edades de pacientes diabéticos y resuelve paso a paso el cálculo de dichas medidas descriptivas para ese conjunto de datos agrupados.
Este documento describe las diferentes escalas de medida para variables. Existen cuatro tipos de escalas: nominal, ordinal, de intervalo y de razón. La escala nominal clasifica variables sin orden, mientras que la escala ordinal establece un orden. La escala de intervalo permite comparaciones de distancia, y la escala de razón admite todas las operaciones matemáticas. El tipo de escala determina qué análisis estadísticos pueden realizarse con los datos.
Este documento describe conceptos básicos de probabilidad, incluyendo experimentos determinísticos y no determinísticos, experimentos aleatorios, sucesos posibles, imposibles y seguros, y definiciones de probabilidad clásica y por frecuencia relativa. También cubre propiedades como la suma de probabilidades, probabilidad condicional, regla de la multiplicación, y provee ejemplos ilustrativos.
El documento describe una unidad de estimación de parámetros que incluye estimación puntual y por intervalos. La estimación puntual calcula valores estadísticos para estimar parámetros de poblaciones, mientras que la estimación por intervalos provee rangos de valores dentro de los cuales es probable que se encuentren los parámetros. El documento también presenta ejemplos numéricos de cómo aplicar estos métodos.
La distribución t de Student surge al estimar la media de una población normal con muestras pequeñas cuando se desconoce la desviación estándar poblacional. Se usa para calcular intervalos de confianza, probar hipótesis con muestras pequeñas, y comparar dos muestras. A diferencia de la distribución Z, la varianza de t de Student depende del tamaño de la muestra y siempre es mayor a 1, pero ambas tienen forma de campana.
Este documento describe los procedimientos para realizar pruebas de hipótesis para comparar dos medias con muestras independientes. Explica cómo formular las hipótesis nula y alternativa, calcular el estadístico de prueba, establecer una regla de decisión y tomar una decisión sobre la hipótesis nula. También cubre el uso de pruebas unilaterales cuando la hipótesis alternativa es direccional. Finalmente, presenta un ejemplo completo de cómo aplicar estos conceptos para comparar las proporciones de defectos en
Este documento explica la distribución T de Student, que se utiliza para estimar la media de una población cuando el tamaño de la muestra es pequeño. Describe que la distribución T de Student tiene forma de campana, es simétrica alrededor de la media y tiene una varianza mayor que 1. También proporciona ejemplos de cómo usar tablas de distribución T de Student para encontrar valores críticos con diferentes grados de libertad y áreas bajo la curva.
Este documento contiene 14 problemas de probabilidad relacionados con diferentes escenarios como el comportamiento criminal, encuestas demográficas, diagnósticos médicos y resultados educativos. Los problemas incluyen calcular probabilidades condicionales e independientes usando tablas de datos y porcentajes provistos.
Se lleva a cabo un experimento para comparar el desgaste por abrasivo de dos materiales laminados. El material 1 tuvo un desgaste promedio de 85 unidades y el material 2 de 81 unidades. Usando una prueba t de Student con un nivel de significancia del 0.05, no se puede concluir que el desgaste del material 1 exceda el del material 2 en más de 2 unidades.
El documento presenta conceptos básicos de estadística como parámetros, estadígrafos, estimación e inferencia estadística. Explica qué son los estimadores puntuales e intervalales y cómo construir intervalos de confianza para la media, varianza y proporción poblacional a partir de datos muestrales. Incluye ejemplos para ilustrar el cálculo de intervalos de confianza y conclusiones acerca de parámetros desconocidos de una población.
El documento habla sobre la probabilidad condicional. Define la probabilidad condicional de un evento B dado un evento A como la probabilidad de B ocurriendo dividida entre la probabilidad de A ocurriendo. Explica el concepto con tres ejemplos, incluyendo calcular la probabilidad condicional de eventos como un vuelo llegando a tiempo dado que salió a tiempo, y un listón fallando la prueba de textura dado que falló la prueba de longitud. Finalmente define eventos independientes como aquellos cuya probabilidad condicional es igual a su probabilidad general
APROXIMACIÓN BINOMIAL DE HIPERGEOMÉTRICAyaritza_ing
Se estima que 4000 de 10000 votantes de una ciudad están en contra de un nuevo impuesto a las ventas. Si se seleccionan al azar 15 votantes y se les pide su opinión, la probabilidad de que por lo menos 7 estén a favor del nuevo impuesto puede aproximarse mediante una distribución binomial, siendo 0.9049.
La distribución binomial describe el número de éxitos en una serie de ensayos independientes con dos posibles resultados (éxito o fracaso) y una probabilidad constante de éxito en cada ensayo. Esta tabla muestra las probabilidades de obtener diferentes números de éxitos para diferentes números de ensayos y probabilidades de éxito.
El documento describe la distribución t de Student, la cual fue desarrollada por William Gosset en 1908 mientras trabajaba para la cervecería Guinness. Gosset no podía publicar bajo su propio nombre debido a un acuerdo de confidencialidad, por lo que usó el seudónimo "Student". La distribución t es útil para realizar pruebas estadísticas cuando las muestras son pequeñas o la desviación estándar de la población es desconocida. Se diferencia de la distribución normal en que depende del t
Este documento presenta los resultados de varias pruebas de hipótesis realizadas sobre diferentes conjuntos de datos. En la prueba 13, se comparan las desviaciones estándar de los pesos de paquetes en el pasado (0.25 onzas) y en una muestra actual (0.32 onzas) para determinar si la variabilidad ha aumentado de manera significativa a niveles de significancia del 0.05 y 0.005. Los resultados muestran que la hipótesis nula de que no hay un aumento significativo en la variabilidad no puede ser rechazada
1) Se calculan las ecuaciones de regresión lineal de la edad sobre el peso y del peso sobre la edad para 5 niños. Se predice que el peso de un niño de 6 años sería de aproximadamente 35.55 kg.
2) Se calcula el coeficiente de correlación lineal entre el número de clientes y la distancia a un centro comercial. Se predice que a una distancia de 2 km habría 1151 clientes y que para recibir 500 clientes se debería situar a 24.96 km.
3) Se calculan las ecuaciones de regresión line
Este documento describe tres pruebas estadísticas para analizar datos categóricos: la prueba de bondad de ajuste, la prueba de independencia y la prueba de homogeneidad. Explica cómo usar la prueba chi-cuadrado de bondad de ajuste para determinar si las proporciones observadas en una muestra difieren de las proporciones esperadas en la población total. También incluye un ejemplo numérico para ilustrar el cálculo e interpretación de la prueba chi-cuadrado de bondad de ajuste
Este documento proporciona una introducción a la prueba de chi-cuadrado, incluyendo cómo se aplica para medir la relación entre dos variables nominales, cómo se calcula, su distribución, y ejemplos de su uso para probar la independencia entre variables. También discute brevemente algunas limitaciones de la prueba de chi-cuadrado.
Este documento describe diferentes medidas de dispersión como la desviación típica, varianza, coeficiente de variación y rango. Explica que las medidas de dispersión cuantifican cuán alejados están los valores de una variable de su media y son útiles para comparar la variabilidad entre muestras. También define cada medida de dispersión, sus propiedades y usos.
Este documento describe métodos para calcular medidas descriptivas como la media, mediana, moda, varianza y percentiles cuando se presenta pérdida de información en los datos originales de una distribución de frecuencia. Explica cómo utilizar el punto medio de cada intervalo como valor aproximado de los datos en él para calcular dichas medidas de forma aproximada. Proporciona un ejemplo con datos de edades de pacientes diabéticos y resuelve paso a paso el cálculo de dichas medidas descriptivas para ese conjunto de datos agrupados.
Este documento describe las diferentes escalas de medida para variables. Existen cuatro tipos de escalas: nominal, ordinal, de intervalo y de razón. La escala nominal clasifica variables sin orden, mientras que la escala ordinal establece un orden. La escala de intervalo permite comparaciones de distancia, y la escala de razón admite todas las operaciones matemáticas. El tipo de escala determina qué análisis estadísticos pueden realizarse con los datos.
Este documento resume diferentes medidas de dispersión, incluyendo medidas absolutas como rango, varianza y desviación típica, y medidas relativas como el coeficiente de variación. Explica cómo calcular e interpretar cada medida y cómo usarlas para comparar la variabilidad entre conjuntos de datos.
Este documento presenta información sobre la probabilidad y conceptos estadísticos relacionados. Explica las definiciones de probabilidad subjetiva y objetiva, sucesos, reglas de probabilidad y cálculo. También proporciona ejemplos de cómo calcular probabilidades utilizando recuentos de datos y conceptos como la probabilidad condicional, la independencia de sucesos, el teorema de la probabilidad total y Bayes. Finalmente, aplica estos conceptos al diagnóstico de la diabetes mediante pruebas.
El documento presenta 4 diagramas de cajas que resumen datos estadísticos sobre la valoración social de enfermería, horas de deporte, cigarrillos fumados y peso de estudiantes. Cada diagrama muestra los cuartiles, mediana, valores atípicos y simetría de la distribución para analizar y comparar los conjuntos de datos.
Ejercicios para entregar i parcial sem a2017nchacinp
Este documento presenta 6 ejercicios de estadística descriptiva. El primer ejercicio pide analizar datos sobre el tiempo requerido para alcanzar la concentración máxima de dos medicamentos para la gripe, incluyendo construir diagramas de cajas y calcular promedios. El segundo ejercicio involucra contar bacterias en cultivos y calcular medidas de tendencia central, dispersión y ajuste de datos. Los ejercicios 3 al 6 analizan diferentes conjuntos de datos médicos calculando medidas estadísticas y creando gráficos para visualizar los
Este documento describe diferentes medidas de tendencia central y dispersión estadísticas. Explica que la media aritmética se calcula sumando todos los valores y dividiéndolos por el total. La moda es el valor más frecuente. La mediana divide los datos en dos partes iguales. También describe cómo calcular la varianza, desviación estándar, cuartiles, deciles y percentiles, los cuales miden la dispersión de los datos.
Este documento describe diferentes medidas de tendencia central y dispersión estadísticas. Explica que la media aritmética se calcula sumando todos los valores y dividiéndolos por el total. La moda es el valor más frecuente. La mediana divide los datos en dos partes iguales. También describe cómo calcular la varianza, desviación estándar, cuartiles, deciles y percentiles, los cuales miden la dispersión de los datos.
Este documento presenta diferentes medidas de resumen para describir conjuntos de datos. Describe cuatro tipos de medidas: medidas de centro como el promedio y la mediana, medidas de posición como los percentiles y cuartiles, medidas de dispersión como el rango y la desviación media, y medidas de forma. Incluye ejemplos del cálculo de estas medidas para tres conjuntos de datos.
Un diagrama de caja es un gráfico que resume un conjunto de datos mediante un rectángulo (la caja) que muestra el rango intercuartílico y bigotes que se extienden hasta los valores máximos y mínimos. Muestra la mediana, los cuartiles y cualquier valor atípico fuera de 1.5 veces el rango intercuartílico. Se usa para visualizar la simetría de los datos y detectar valores atípicos.
ESTADÍSTICA CAPÍTULO 04 MEDIDAS DESCRIPTIVAS Y DIAGRAMA DE CAJAS.pdfEnriqueQc2
Este documento presenta información sobre diferentes medidas estadísticas para describir datos cuantitativos, incluyendo medidas de posición, dispersión y forma. Define estadísticos como la media, moda, mediana, varianza, desviación estándar, coeficiente de variación, asimetría y curtosis. También explica cómo calcular el índice académico de un estudiante y realizar cálculos estadísticos como la media geométrica y armónica. Finalmente, describe el uso del diagrama de caja y bigotes para visualizar y res
Estadística Descriptiva - Medidas de tendencia central, posición y dispersiónManuelIgnacioMontero
Es una presentación del cpech psu, donde trabajé alguna vez, tiene conceptos básicos de manera ordenada, donde podrán comprender las medidas de posición, dispersión y centrales.
Este documento presenta conceptos básicos de estadística como variable, frecuencia y tamaño de muestra. Explica medidas de tendencia central como la media aritmética, mediana y moda, incluyendo sus definiciones y cómo calcularlas. Finalmente, asigna una tarea sobre hojas de trabajo y establece criterios de valoración.
Este documento presenta información sobre la clasificación y presentación de datos. Explica dos métodos para clasificar datos cuantitativos en intervalos de clase y cómo construir tablas de frecuencias. También describe cómo presentar datos cualitativos y cuantitativos usando tablas y gráficos como barras, sectores y histogramas. El objetivo es resumir y organizar los datos para facilitar su análisis e interpretación.
El documento proporciona una introducción a conceptos estadísticos fundamentales como medidas de tendencia central (media, mediana, moda), medidas de dispersión (rango, desviación estándar, varianza), y formas de distribución (simetría y asimetría). Explica cómo calcular y entender estos estadísticos descriptivos y cómo resumir y visualizar conjuntos de datos usando tablas de frecuencias, diagramas de cajas y otros gráficos.
El documento proporciona una introducción a conceptos estadísticos fundamentales como medidas de tendencia central (media, mediana, moda), medidas de dispersión (rango, desviación estándar, varianza), y formas de distribución (simetría y asimetría). Explica cómo calcular y entender estos estadísticos descriptivos y cómo resumir y visualizar conjuntos de datos usando tablas de frecuencias, diagramas de cajas y otros gráficos.
Este documento presenta conceptos básicos de bioestadística como variable, frecuencia y tamaño de muestra. Explica medidas de tendencia central como media aritmética, mediana y moda, incluyendo ejemplos. Finalmente, asigna una tarea sobre hoja de trabajo número 3 para la próxima clase y destaca la importancia de incluir la hoja de retroalimentación.
Este documento presenta el plan de trabajo de un estudiante de SENATI para su curso de Calidad Total. Incluye información general del estudiante, la planificación del trabajo, preguntas guía relacionadas con herramientas de calidad como diagramas de Pareto y gráficas de control, y definiciones de medidas de tendencia central y dispersión. El trabajo final aplicará estas herramientas para analizar casos de rechazos por errores de pintura.
Este documento describe diferentes medidas de tendencia central y posición como la media aritmética, mediana y moda. La media aritmética es la suma de todos los valores dividida por el número total de observaciones. La mediana divide los datos ordenados en dos partes iguales. La moda es el valor con mayor frecuencia. También introduce el diagrama de caja y bigotes, cuartiles y otros cuantiles para analizar y resumir conjuntos de datos.
Taller de Medidas de Tendencia Central
Armónica, Geométrica, Aritmética o promedio, Cuadrática, Ponderada, Mediana y Moda para datos Agrupados y no agrupados
EL MODO O MODA
INTERVALO MODAL
PROPIEDADES DEL MODO
LA MEDIANA
LA MEDIA ARITMETICA
FACTOR DE CORRECCION
LA MEDIA ARITMETICA SUPUESTA
MEDIDAS DE DISPERCION
El documento describe la moda y la mediana. La mediana es el valor central de un conjunto de datos ordenados. Si la cantidad de datos es impar, la mediana es el valor central. Si es par, es el promedio de los dos valores centrales. La moda es el valor que más se repite en los datos.
Este documento explica diferentes medidas de dispersión como la desviación estándar, la fluctuación intercuartil y los percentiles. La desviación estándar mide el grado de desviación de los datos respecto a la media y se utiliza para comparar la variabilidad de los salarios entre profesiones. La fluctuación intercuartil mide el rango en el que se encuentra el 50% de los datos alrededor de la mediana. También se explican los cuartiles, deciles y gráficas de caja, las cuales resumen la distribución de los datos.
Este documento describe diferentes medidas de posición no central y de dispersión para caracterizar una distribución de datos. Explica conceptos como cuartiles, deciles y percentiles, los cuales dividen una distribución ordenada en tramos iguales. También define medidas de dispersión como rango, varianza y desviación estándar, las cuales miden qué tan concentrados o dispersos están los valores respecto a la media.
Este documento proporciona instrucciones sobre cómo presentar estadísticas descriptivas y comparativas en un trabajo científico. Explica cómo presentar datos cualitativos y numéricos para un grupo utilizando tablas de frecuencias, diagramas y medidas como la media y desviación típica. También cubre la presentación de datos entre varios grupos y el uso de diagramas de cajas y gráficos cuantil-cuantil.
I Examen parcial de estadística aplicada A 2018nchacinp
Este documento presenta un examen parcial de Estadística aplicada que incluye varios problemas y preguntas. El primer problema analiza datos de 10 pacientes pediátricos incluyendo edad, peso y localidad. Otro problema examina los niveles de glicemia en ayunas de 10 pacientes diabéticos. Un tercer problema analiza variables como edad y peso. Finalmente, un problema analiza los niveles de hemoglobina en un grupo de niños y realiza cálculos estadísticos e interpretaciones.
El documento presenta 5 preguntas sobre estadística aplicada a estudios médicos y de control de calidad. La primera pregunta analiza los resultados de pruebas de hermeticidad de blísteres farmacéuticos. La segunda examina los niveles de colesterol de pacientes con hipertensión. La tercera pide identificar elementos de la muestra de la segunda pregunta. La cuarta completa y analiza una tabla de distribución de pesos de pacientes. La quinta identifica un percentil específico.
El documento presenta 5 problemas de probabilidad y estadística. El primer problema presenta datos sobre grupo sanguíneo y sexo de 502 personas. El segundo problema presenta los resultados de una prueba para detectar una enfermedad en 1660 personas. El tercer problema calcula la probabilidad de que 9 o 10 personas encuentren alivio de migrañas con un medicamento dado que la probabilidad de alivio para cada persona es del 90%. Los problemas 4 y 5 usan una distribución normal para calcular probabilidades sobre los niveles de glucosa en la sangre.
1) The document presents several statistical hypothesis tests and solutions analyzing data from various experiments and populations.
2) Hypothesis tests are conducted to analyze nicotine levels in cigarettes, body temperatures of desert lizards, and calcium levels in a patient's blood.
3) Additional analyses include comparing cream content in tubes, weight changes from drinking a specific water, and cholesterol levels between men and women.
This document presents several statistical problems and solutions involving confidence intervals. The problems cover a range of topics including comparing laboratory measurements, estimating population proportions and means, and comparing two medical therapies. For each problem, the solution provides the confidence interval calculation at the stated confidence level.
Las distribuciones de frecuencia clasifican datos en grupos para establecer la frecuencia de cada grupo. Pueden usarse para datos cualitativos o cuantitativos. Para datos cualitativos, las clases son las categorías de la variable y la frecuencia es el número de datos en cada categoría. Para datos cuantitativos continuos o discretos, las clases pueden ser valores individuales o intervalos numéricos, y la frecuencia es el número de datos en cada clase. Esto permite resumir grandes conjuntos de datos.
Practica 2.preguntas medidas de resumen y dispersionnchacinp
Este documento presenta 35 preguntas sobre medidas descriptivas para resumir datos, incluyendo medidas de tendencia central (media, mediana, moda), dispersión (desviación típica, rango intercuartílico), forma (asimetría, curtosis) y posición (percentiles). Explica cómo utilizar estas medidas para describir y comparar variables, así como sus fortalezas y limitaciones dependiendo de la distribución de los datos.
El documento introduce los conceptos de cuartiles y percentiles como medidas de tendencia no central y dispersión de datos. Explica que los cuartiles dividen los datos ordenados en 4 partes iguales (Q1, Q2, Q3), y que los percentiles dividen los datos en 100 partes iguales. Proporciona ejemplos numéricos para calcular cuartiles y percentiles de conjuntos de datos.
Este documento presenta una serie de ejercicios sobre conceptos básicos de estadística aplicada. Cada ejercicio describe una situación de estudio e identifica características como la unidad experimental, variable, población, muestra, tipo y escala de medida. Los ejercicios cubren temas como la opinión de estudiantes sobre una nueva materia, la efectividad de un medicamento para el dolor de cabeza, la estructura por edades de los habitantes de una ciudad, y la opinión sobre el manejo de desechos sólidos, entre
Este documento presenta conceptos básicos para el manejo de datos, incluyendo la numeración de datos usando subíndices, la notación de suma con sigma, y cálculos como resta de variables y sumatorias. Explica cómo organizar y analizar tablas de datos usando estas herramientas matemáticas.
Este documento trata sobre tests de hipótesis. Explica los pasos para realizar un test, incluyendo definir las hipótesis nula y alternativa, seleccionar un estadístico de contraste apropiado, determinar la región crítica, y adoptar una decisión sobre si rechazar o no la hipótesis nula. También discute tests paramétricos y no paramétricos, y proporciona ejemplos de cómo aplicar tests para contrastar parámetros como la media y la varianza de distribuciones normales.
Este documento presenta los conceptos básicos de la inferencia estadística. Introduce la inferencia estadística y el muestreo aleatorio simple. Explica las distribuciones asociadas al muestreo como la Chi-cuadrado, t-Student y F de Snedecor. Finalmente, describe las distribuciones de estadísticos muestrales como la media, varianza y proporción.
This document presents several probability word problems and their solutions. It asks the probability of various mutually exclusive and independent events occurring and provides the solutions.
This document provides solutions to multiple probability problems involving discrete probability distributions. The problems cover a wide range of applications including sampling from populations with different proportions, binomial distributions modeling things like disease treatment success rates, and Poisson distributions modeling rare events. The solutions calculate probabilities and expected values for each problem.
El documento define los conceptos de universo, población y muestra. Un universo es el conjunto total de individuos, objetos o eventos sobre los cuales se desea obtener información. Una población se refiere al conjunto de observaciones o datos recolectados sobre el universo. Una muestra es un subconjunto finito de la población seleccionado para su estudio. Se proveen ejemplos de cómo estos conceptos se aplican en estudios biológicos y agrícolas.
Este documento presenta nueve preguntas sobre conceptos estadísticos como medidas de tendencia central, dispersión, simetría y percentiles. Las preguntas abarcan temas como el análisis de pequeños conjuntos de datos, cálculo de medias, medianas, modas, desviaciones típicas, coeficientes de variación, diagramas de caja y de puntos, y percentiles.
1. La media aritmética siempre se puede calcular independientemente de si los valores representan una muestra o una población completa.
2. La media es única para un conjunto dado de números.
3. La media se ve afectada por cada valor del conjunto de datos, si cambia algún valor la media también cambiará.
La moda es el valor que se presenta con más frecuencia en un conjunto de datos. Por ejemplo, en el conjunto {10, 10, 10}, la moda es 10. En algunos conjuntos pueden existir múltiples modas, como en el conjunto de edades {10, 12, 12, 12, 8, 11, 16} donde la moda son los valores 12 y 8. No siempre existe una moda, como en el conjunto {2, 0, 1, 2, 5} donde ningún valor se repite.
1. La mediana es una medida de tendencia central que divide un conjunto de datos ordenados en dos grupos de igual tamaño.
2. Para calcular la mediana, se ordenan los datos de menor a mayor y se ubica la posición central. Si el número de datos es impar, la mediana es el valor central. Si es par, es el promedio de los dos valores centrales.
3. Los pasos para calcular la mediana son: ordenar los valores, contarlos para saber si son pares o impares, y aplicar la fórmula correspondiente para obtener el valor de la mediana.
El documento describe medidas de tendencia central utilizadas para resumir conjuntos de datos numéricos. Explica que la media aritmética es una de las medidas más comunes, calculada sumando todos los valores y dividiendo por la cantidad de valores, dando como resultado un único número que representa el conjunto de datos de manera central. Usa como ejemplo el cálculo de la media para un conjunto de notas de un estudiante.
Minería de Datos e IA Conceptos, Fundamentos y Aplicaciones.pdfMedTechBiz
Este libro ofrece una introducción completa y accesible a los campos de la minería de datos y la inteligencia artificial. Cubre todo, desde conceptos básicos hasta estudios de casos avanzados, con énfasis en la aplicación práctica utilizando herramientas como Python y R.
También aborda cuestiones críticas de ética y responsabilidad en el uso de estas tecnologías, discutiendo temas como la privacidad, el sesgo algorítmico y transparencia.
El objetivo es permitir al lector aplicar técnicas de minería de datos e inteligencia artificial a problemas reales, contribuyendo a la innovación y el progreso en su área de especialización.
Este documento ha sido elaborado por el Observatorio Ciudadano de Seguridad Justicia y Legalidad de Irapuato siendo nuestro propósito conocer datos sociodemográficos en conjunto con información de incidencia delictiva de las 10 colonias y/o comunidades que del año 2020 a la fecha han tenido mayor incidencia.
Existen muchas más colonias que presentan cifras y datos en materia de seguridad, sin embargo, en este primer acercamiento lo que se prevées darle al lector una idea de como se encuentran las colonias analizadas, tomando como referencia los datos del INEGI 2020, datos del Secretariado Ejecutivo del Sistema Nacional de Seguridad Pública del 2020 al 2023 y las bases de datos propias que desde el 2017 el Observatorio Ciudadano ha recopilado de manera puntual con datos de las vıć timas de homicidio doloso, accidentes de tránsito, personas lesionadas por arma de fuego, entre otros indicadores.
LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIOAaronPleitez
linea de tiempo del antiguo testamento donde se detalla la cronología de todos los eventos, personas, sucesos, etc. Además se incluye una parte del periodo intertestamentario en orden cronológico donde se detalla todo lo que sucede en los 400 años del periodo del silencio. Basicamente es un resumen de todos los sucesos desde Abraham hasta Cristo
resumen de manual de organizacion y funciones de TI
Diagrama de cajas y datos atípicos
1. Diagrama de cajas y datos atípicos
El diagrama de cajas es una representación gráfica de un conjunto de datos que
facilita la percepción visual de su localización, extensión y del grado y la dirección
del sesgo; también permite identificar datos atípicos. Es especialmente útil cuando
se desean comparar 2 ó más conjuntos de datos.
Pasos para construir un diagrama de caja:
1. Construir una escala de referencia horizontal o vertical
2. Calcular los cuartiles Q1, Q2 y Q3
3. Construir una caja o rectángulo sobre la escala usando como límites los
valores de Q1 y Q3. (el ancho es discrecional)
4. Dibujar la mediana (Q2) con una línea interior dentro de la caja
5. Calcular el rango intercuartil RI = Q3 – Q1.
6. Determinar los límites f1 y f2 a partir de los cuales se considera que un dato es
un valor atípico:
f1 = Q1 – 1,5*RI
f2 = Q3 + 1,5*RI
Escala de medida
de la variable
Q1 Q3
Q1 Q3Q2
2. 7. Determinar los límites F1 y F2 a partir de los cuales se considera que un dato
es un valor extremo:
F1 = Q1 – 2*(1,5*RI)
F2 = Q3 + 2*(1,5*RI)
8. Ubicar estos límites en el eje
9. Los datos que se encuentren entre los límites entre [F1 - f1] y/o entre [f2 - F2]
se consideran valores atípicos.
10. Los datos mayores que F2 y/o menores que F1 se consideran valores
extremos.
11. Si no hay valores atípicos ni extremos, se extiende una línea desde los
extremos de la caja hasta los valores máximo y mínimo de los datos, esta línea
se llama bigote.
f2f1 F2F1 Q1 Q3Q2
Valores
extremos
Valores
atípicos
Valores
atípicos
f2f1 F2F1 Q1 Q3Q2
Valores
extremos
f2f1 F2F1 Q1 Q3Q2mín máx
3. 12. Cuando hay valores atípicos y/o extremos, los bigotes se extienden hasta el
valor menor más cercano a f1 y el valor mayor más cercano a f2. Los valores
atípicos se marcan con un círculo pequeño (○) y los valores extremos con un
asterisco (*), alineados con los bigotes. En el siguiente diagrama de caja se
observan 2 valores atípicos y un valor extremo:
13. La ubicación de la media se representa con una x
En general, un diagrama de caja se puede observar lo siguiente:
✓ El 50% de los datos estarán concentrados dentro de la caja, entre el
primer y tercer cuartil.
✓ La localización de la línea central de la caja, que es la mediana, es una
indicación de la forma de la distribución. Si la línea está descentrada,
sabremos que la distribución está sesgada en la dirección de extremo
más largo de la caja, así se indica en los siguientes 2 diagramas:
f2f1 F2F1 Q1 Q3Q2
f2f1 F2F1 Q1 Q3Q2
sesgo
f2f1 F2F1 Q1 Q3Q2
4. ✓ Cuando se grafican 2 diagramas de caja sobre el mismo eje se puede
hacer una comparación visual de la dispersión, el sesgo y la asimetría
entre los dos conjuntos de datos. Los valores de los cuartiles.
✓ Los cuartiles y valores límites para los datos atípicos y extremos no se
marcan en el eje, esto se hizo como un medio didáctico.
Ejemplo 1: Observemos los siguientes diagramas de caja:
• El grupo II es más simétrico y menos disperso (o más homogéneo) que
el grupo I, pues la barra central de la mediana está en el centro, los
bigotes tienen aproximadamente la misma longitud y la media y la
mediana coinciden en su valor. Estas son las características visuales
más representativas de una distribución simétrica.
• El grupo I es más disperso que el grupo II, esto se observa por su caja
que es más larga; por otro lado, presenta un sesgo a la izquierda y un
valor atípico y otro extremo también la izquierda, lo que influye sobre
la media colocándola a la izquierda de la mediana.
f2f1 F2F1 Q1 Q3Q2
sesgo
Grupo I
Grupo II
5. Tratamiento de los valores atípicos
Puede demostrarse que si los datos vienen de una distribución normal (simétrica)
sólo 7 valores de 1.000 caerán en las zonas entre f1 y F1 ó f2 y F2. Puesto que estos
valores son muy inusuales o poco probables, se consideran datos atípicos.
Los datos atípicos deben tratarse con cuidado, pues como se sabe su presencia tiene
un impacto crucial sobre los estadísticos como la media, la varianza, la desviación
típica y el rango, es decir, sobre medidas usuales de tendencia central y dispersión.
Cuando se encuentra un dato atípico deberá considerarse su origen,
¿es un dato legítimo cuyo valor, inusualmente, es grande o pequeño?
¿es un valor mal registrado?
¿es el resultado de un error o accidente en la experimentación?
En los dos últimos casos puede borrarse el punto del conjunto de datos y
completarse el análisis con los datos restantes. En el primer caso se sugiere que se
dé a conocer la presencia del dato atípico y se calculen los estadísticos con y sin el
dato atípico. De esta forma el investigador, que es el experto en la materia, puede
tomar la decisión de incluir o no el dato atípico en futuros análisis.
Ejemplo 2. A continuación se muestran las edades de un grupo de pacientes en un
día de consulta en de la unidad de nefrología de cierto hospital. Hacer el diagrama
de caja para los datos.
20 50 55 58 59 60 62 63 65 68 75
Calculamos los cuartiles y los límites para valores atípicos y extremos, así:
Q1 = 55; Q2= 60; Q3= 65; RI =10
Valores atípicos
Datos entre F1 y f1 entre 25 y 40: No hay datos
Datos entre f2 y F2 entre 80 y 95: No hay datos
f1 = Q1 - 1,5*RI = 55 +1,5*10 = 40
f2 = Q3 + 1,5*RI = 65 +1,5*10 = 80
F1 = Q1 - 2*(1,5*RI) = 55 +3*10 = 25
F2 = Q3 + 2*(1,5*RI) = 65 +3*30 = 95
6. Valores extremos
Datos menores que F1 menor que 25: hay 1 dato: 20
Datos mayores que F2 mayor que 95: no hay datos
Hay un paciente de 20 años en la consulta de nefrología, esto representa un valor
extremo para este grupo particular de datos, es decir, de edades en este grupo de
pacientes, por lo tanto, el bigote izquierdo se extiende hasta el valor más cercano a
f1, esto es 50 y el bigote derecho hasta el valor máximo de los datos que es 75, pues
a la derecha no hay valores atípicos ni extremos.
La media es 56,8 y se marca a la izquierda de la mediana, esto era de esperarse pues
los datos están sesgados a la izquierda.
El diagrama de caja para la edad del grupo de pacientes de la consulta de nefrología
se muestra a continuación:
En los paquetes (programas) estadísticos el diagrama de caja suele presentarse con
el eje de datos en forma vertical. A continuación, se muestra la gráfica obtenida con
el programa Excel para el ejemplo anterior, observe que el valor extremo en este
programa es simbolizado por un pequeño círculo (◦) en lugar de un asterisco (*).
25 353020
*
40 8580757050
f2f1
F2F1
55 656045 95
X Edad
7. Ejemplo 3.
En un estudio de la eficacia de 2 medicamentos para la diabetes tipo II se
tomaron 16 pacientes diabéticos en condiciones similares, se dividieron en 2
grupos al azar y a cada uno se le administró un tratamiento distinto, al primer
grupo el tratamiento I y al segundo grupo el tratamiento II. Al cabo de 1 mes
de tratamiento se les tomaron muestras de sangre y se midió la glicemia, los
resultados se muestran en la tabla 1. Se pide comparar los 2 grupos de
tratamiento mediante los diagramas de caja:
Tabla 1. Glicemia en sangre (mg/dl) en 2 grupos pacientes diabéticos tipo II
medicados con 2 tratamientos concentraciones distintas de metformina
Tratamiento I 90 95 77 98 100 110 120 130
Tratamiento II 90 100 102 110 115 120 140 200
Para el grupo del tratamiento I:
Q1 = 96; Q2= 99; Q3= 115; RI =11
f1 = Q1 - 1,5*RI = 96 +1,5*11 = 79,5
f2 = Q3 + 1,5*RI = 115 +1,5*11 = 131,5
F1 = Q1 - 2*(1,5*RI) = 96 +3*11 = 63
F2 = Q3 + 2*(1,5*RI) = 115 +3*11 = 148
𝑋̅1 = 105
Valores atípicos
Datos entre F1 y f1 entre 63 y 79,5: No hay datos
Datos entre f2 y F2 entre 131,5 y 148: No hay datos
Valores extremos
Datos menores que F1 menor que 63: no hay datos
Datos mayores que F2 mayor que 140: no hay datos
8. Como no hay valores atípicos ni extremos, el bigote izquierdo se extiende
hasta el valor mínimo de los datos 90; y el bigote derecho se extiende hasta el
máximo de los datos 130, el diagrama queda entonces así:
En el diagrama se observa un sesgo de los datos hacia la derecha
Para el grupo del tratamiento II:
Q1 = 101; Q2= 113; Q3= 130; RI = 29
f1 = Q1 - 1,5*RI = 101 +1,5*29 = 57,5
f2 = Q3 + 1,5*RI = 130 +1,5*29 = 173,5
F1 = Q1 - 2*(1,5*RI) = 101 +3*29 = 14
F2 = Q3 + 2*(1,5*RI) = 130 +3*29 = 217
𝑋̅1 = 122
Valores atípicos
Datos entre F1 y f1 entre 14 y 57,5: No hay datos
Datos entre f2 y F2 entre 173,5 y 217: hay 1 dato: 200
Valores extremos
Datos menores que F1 menor que 14: No hay datos
Datos mayores que F2 mayor que 217: No hay datos
Tenemos un valor atípico: 200 significa que, para la población a la que pertenece este
grupo de pacientes, este nivel de glicemia se considera un valor poco probable. Se
recomienda entonces calcular la media y la desviación típica con y sin este valor para
decidir si se incluye o no en futuros análisis. Para efectos clínicos se debe revisar al
paciente y de ser un dato real reconsiderar su tratamiento, pues su nivel de glicemia
está muy elevado con respecto al rango normal de 80-110 mg/dl.
40 22020018016080 100 1401206020
XTratamiento I
9. Como hay sólo un dato atípico a la derecha, el bigote izquierdo se extiende hasta el
valor mínimo de los datos que es 90; y el bigote derecho se extiende hasta el máximo
de los datos que sea menor a F2, esto es el dato 140.
Vamos a graficar este diagrama de caja sobre el anterior para comparar los 2
tratamientos, así tenemos entonces en siguiente diagrama:
En el tratamiento II se observa una mayor dispersión de los datos, pues la caja es
más larga; sin embargo, la caja es más simétrica que la del tratamiento I, aunque la
media no coincide con la mediana pues se ve muy afectada por el valor atípico de
glicemia de 200. Considerando el rango normal de glicemia ¿Qué opinión le merece
estos dos tratamientos?
Vamos a mostrar el diagrama de caja dado por el Excel (el eje de datos es vertical):
En el Excel se utiliza otra fórmula particular más complicada para calcular los
cuartiles que la de la mediana para los dos grupos de datos vista en clase. Cuando n
40 22020018016080 100 1401206020
XTratamiento I
XTratamiento II ○
10. es par, esta fórmula hace una interpolación de los datos que están al lado de la
posición de un cuartil particular Qj según la distancia que separe al este par de datos
y la posición i calculada del cuartil j. Como vimos un cuartil Qj en particular es un
valor que garantiza que el j% de los datos estarán por debajo de él, esa es la única
restricción, por eso existen varias formas de calcularlo. En este ejemplo en particular,
si calculamos los cuartiles con el Excel usando la función “QUARTILE:EXC”
obtendremos los siguientes resultados:
"QUARLE.EXC" Tratamiento I Tratamiento II
Q1 95,5 100,5
Q2 99 112,5
Q3 117,5 135
RI 22 34,5
Si observamos con detalle el gráfico de caja generado por el Excel observaremos que
cada caja está limitada por estos valores particulares de Q1 y Q2, quedando
ligeramente desplazada con respecto a los valores de los cuartiles obtenidos con la
fórmula de la mediana vista en clase. Esto no representa un problema siempre y
cuando se utilice el mismo método para calcular los cuartiles en todas las cajas en
un problema en particular y el resultado del análisis es el mismo.
Los dos grupos de pacientes provienen de una misma población de pacientes
diabetes tipo 2; sin embargo, cuando se dividen en 2 grupos y se cada grupo a un
tratamiento en particular por un período de tiempo, el análisis teórico en principio
es como si pertenecieran a 2 poblaciones distintas una son los pacientes con el
tratamiento I y la otra son los pacientes con el tratamiento II.
El valor atípico de 200 significa que, para la población a la que pertenece el grupo de
pacientes del tratamiento II, este nivel de glicemia se considera un valor poco
probable. Se recomienda entonces calcular la media y la desviación típica con y sin
este valor para decidir si se incluye o no en futuros análisis. Para efectos clínicos se
debe revisar al paciente con el dato atípico y de ser un dato real en este caso
reconsiderar su tratamiento, pues su nivel de glicemia está muy elevado con
respecto al rango normal de 80-110 mg/dl. Los cálculos de la media y la desviación
típica se muestran en la siguiente tabla:
11. Tratamiento II
con el valor atípico 200 sin el valor atípico 200
media 122 111
desv tip 33 15
Observamos que al eliminar el valor atípico la media de glicemia del grupo II baja
hasta un valor considerado normal, por ende, la desviación típica también se reduce.
Queda la decisión de eliminar o no este dato en futuros análisis en manos de los
expertos. En este caso por ser un ejemplo didáctico no contamos con suficientes
datos para tomar decisiones estadísticas sobre la efectividad de los tratamientos.
Bibliografía
Milton, Susan. Estadística para Ciencias de la Salud