Este documento introduce los conceptos básicos del análisis de datos categóricos. Explica que los datos categóricos miden variables en grupos limitados en lugar de valores continuos. También define variables independientes y dependientes, y describe las escalas de medición nominal, ordinal y de conteo para variables categóricas. Además, introduce las distribuciones binomial y multinomial para modelar datos categóricos, y métodos estadísticos como estimación por máxima verosimilitud e intervalos de confianza.
F:\planteamiento de hipótesis en mas de dos poblacionesLizeth
Este documento presenta un análisis de varianza (ANOVA) para comparar los costos de producción de un producto fabricado bajo tres tecnologías diferentes (A, B, C). Explica los conceptos clave del ANOVA como la identidad fundamental, las sumas de cuadrados total, entre grupos y dentro de grupos, y los grados de libertad asociados. Finalmente, aplica el ANOVA a un conjunto de datos de costos para las tres tecnologías y determina si existen diferencias significativas entre ellas.
Este documento explica la prueba de Chi-cuadrado, una prueba estadística no paramétrica que mide la discrepancia entre una distribución observada en una muestra y una distribución teórica esperada. Describe la naturaleza y cálculo de la prueba de Chi-cuadrado, incluyendo la formulación de hipótesis nula e hipótesis alternativa. También proporciona un ejemplo numérico para ilustrar cómo aplicar la prueba y determinar si se acepta o rechaza la hipótesis n
Este documento describe conceptos básicos relacionados con variables aleatorias. Explica que una variable aleatoria asocia números reales a elementos de un espacio muestral y puede ser discreta o continua. También describe distribuciones de probabilidad como la uniforme, binomial y normal, así como conceptos estadísticos como media, varianza, distribuciones muestrales y teoremas centrales del límite para inferencia estadística.
Planteamiento de Hipótesis para dos poblaciones (WORD)HOTELES2
Este documento describe el planteamiento de hipótesis estadística para comparar proporciones entre dos poblaciones. Explica la teoría, supuestos, fórmulas y ejemplos de cómo calcular el tamaño de muestra y contrastar la hipótesis nula de que las proporciones son iguales vs. la alternativa de que son diferentes mediante el estadístico Z. También incluye definiciones clave como distribución muestral, hipótesis, homocedasticidad y tablas de contingencia.
Este documento describe los pasos básicos para realizar una prueba de bondad de ajuste. Estos incluyen definir la variable a analizar, obtener la media y varianza de los datos, elaborar un histograma de frecuencias, elegir una posible distribución de probabilidad, calcular los parámetros, realizar la prueba (como chi-cuadrada o Kolmogorov-Smirnov), y verificar si los datos cumplen con los criterios de la prueba. También presenta ejemplos de cómo aplicar estas pruebas para analizar datos de tiempos
El documento describe los modelos de análisis de varianza de dos vías y diseños factoriales. Estos modelos permiten estudiar simultáneamente los efectos de dos factores o variables independientes. En un análisis de varianza de dos vías, los individuos se clasifican de acuerdo a dos factores para estudiar sus efectos individuales y de interacción. Los diseños factoriales combinan niveles de dos o más factores dentro de una misma situación experimental para analizar efectos principales y de interacción.
Este documento presenta cuatro ejemplos numéricos para ilustrar cómo realizar pruebas estadísticas sobre dos proporciones utilizando la distribución normal. Los ejemplos calculan el estadístico Z para determinar si existe una diferencia significativa entre las proporciones de dos grupos muestrales basado en un nivel de significancia predeterminado.
Prueba De HipóTesis Para Dos Medias De PoblacióN (Muestras Grandes)María Isabel Bautista
Este documento describe cómo probar si las medias de dos poblaciones son iguales utilizando una prueba de hipótesis con muestras pequeñas. Explica el procedimiento de cinco pasos que incluye definir las hipótesis nula y alternativa, establecer el nivel de significancia, calcular el estadístico Z y tomar una decisión sobre si rechazar o aceptar la hipótesis nula. También presenta un ejemplo resuelto para ilustrar el proceso.
F:\planteamiento de hipótesis en mas de dos poblacionesLizeth
Este documento presenta un análisis de varianza (ANOVA) para comparar los costos de producción de un producto fabricado bajo tres tecnologías diferentes (A, B, C). Explica los conceptos clave del ANOVA como la identidad fundamental, las sumas de cuadrados total, entre grupos y dentro de grupos, y los grados de libertad asociados. Finalmente, aplica el ANOVA a un conjunto de datos de costos para las tres tecnologías y determina si existen diferencias significativas entre ellas.
Este documento explica la prueba de Chi-cuadrado, una prueba estadística no paramétrica que mide la discrepancia entre una distribución observada en una muestra y una distribución teórica esperada. Describe la naturaleza y cálculo de la prueba de Chi-cuadrado, incluyendo la formulación de hipótesis nula e hipótesis alternativa. También proporciona un ejemplo numérico para ilustrar cómo aplicar la prueba y determinar si se acepta o rechaza la hipótesis n
Este documento describe conceptos básicos relacionados con variables aleatorias. Explica que una variable aleatoria asocia números reales a elementos de un espacio muestral y puede ser discreta o continua. También describe distribuciones de probabilidad como la uniforme, binomial y normal, así como conceptos estadísticos como media, varianza, distribuciones muestrales y teoremas centrales del límite para inferencia estadística.
Planteamiento de Hipótesis para dos poblaciones (WORD)HOTELES2
Este documento describe el planteamiento de hipótesis estadística para comparar proporciones entre dos poblaciones. Explica la teoría, supuestos, fórmulas y ejemplos de cómo calcular el tamaño de muestra y contrastar la hipótesis nula de que las proporciones son iguales vs. la alternativa de que son diferentes mediante el estadístico Z. También incluye definiciones clave como distribución muestral, hipótesis, homocedasticidad y tablas de contingencia.
Este documento describe los pasos básicos para realizar una prueba de bondad de ajuste. Estos incluyen definir la variable a analizar, obtener la media y varianza de los datos, elaborar un histograma de frecuencias, elegir una posible distribución de probabilidad, calcular los parámetros, realizar la prueba (como chi-cuadrada o Kolmogorov-Smirnov), y verificar si los datos cumplen con los criterios de la prueba. También presenta ejemplos de cómo aplicar estas pruebas para analizar datos de tiempos
El documento describe los modelos de análisis de varianza de dos vías y diseños factoriales. Estos modelos permiten estudiar simultáneamente los efectos de dos factores o variables independientes. En un análisis de varianza de dos vías, los individuos se clasifican de acuerdo a dos factores para estudiar sus efectos individuales y de interacción. Los diseños factoriales combinan niveles de dos o más factores dentro de una misma situación experimental para analizar efectos principales y de interacción.
Este documento presenta cuatro ejemplos numéricos para ilustrar cómo realizar pruebas estadísticas sobre dos proporciones utilizando la distribución normal. Los ejemplos calculan el estadístico Z para determinar si existe una diferencia significativa entre las proporciones de dos grupos muestrales basado en un nivel de significancia predeterminado.
Prueba De HipóTesis Para Dos Medias De PoblacióN (Muestras Grandes)María Isabel Bautista
Este documento describe cómo probar si las medias de dos poblaciones son iguales utilizando una prueba de hipótesis con muestras pequeñas. Explica el procedimiento de cinco pasos que incluye definir las hipótesis nula y alternativa, establecer el nivel de significancia, calcular el estadístico Z y tomar una decisión sobre si rechazar o aceptar la hipótesis nula. También presenta un ejemplo resuelto para ilustrar el proceso.
Este documento presenta información sobre la distribución Ji-cuadrada y su uso en pruebas de bondad de ajuste e independencia. Explica cómo se pueden usar tablas de contingencia con la distribución Ji-cuadrada para determinar si dos variables son independientes. También introduce el análisis de varianza (ANOVA) y cómo se puede usar para comparar varianzas entre poblaciones y determinar si son iguales o diferentes.
Este documento describe cómo realizar una prueba de bondad de ajuste para determinar si los datos de una muestra se ajustan a una distribución teórica específica. Explica el procedimiento general que incluye formular la hipótesis nula de que los datos se ajustan a la distribución versus la hipótesis alternativa de que no se ajustan, establecer el nivel de significación, calcular la estadística de prueba y determinar la región crítica para decidir si se rechaza o no la hipótesis nula. Tamb
El documento trata sobre la distribución normal y su importancia en estadística. Explica que muchas variables siguen esta distribución y que permite estimar parámetros poblacionales a partir de muestras. También describe métodos como el de máxima verosimilitud y momentos para obtener estimaciones puntuales de parámetros, así como el cálculo de intervalos de confianza que contienen los valores reales con cierta probabilidad.
Este documento describe diferentes métodos para realizar pruebas de hipótesis estadísticas. Explica cómo realizar pruebas para muestras grandes y pequeñas utilizando las distribuciones Z y T de Student respectivamente. También cubre cómo realizar pruebas para proporciones poblacionales, diferencias de medias, datos apareados y la distribución chi cuadrado. El objetivo general es determinar si los resultados de una muestra son consistentes con una hipótesis planteada sobre la población.
Este documento introduce la distribución t de Student, que se utiliza para realizar inferencias estadísticas cuando la desviación estándar poblacional es desconocida y el tamaño de la muestra es menor a 30. Explica que la distribución t se aproxima a la normal a medida que aumenta el tamaño de la muestra, y que depende de los grados de libertad. También presenta la fórmula para calcular el intervalo de confianza para estimar la media poblacional usando la distribución t.
5 Planteamiento de Hipotesis en mas de 2 Poblaciones (ji cuadrada)Ana
Este documento presenta un resumen de 3 oraciones o menos sobre la distribución Ji-cuadrada y su aplicación en pruebas de hipótesis. Explica los supuestos, fórmulas y ejemplos de uso de la prueba Ji-cuadrada para comparar frecuencias observadas con las esperadas y determinar si son estadísticamente iguales. Adicionalmente, incluye ejercicios resueltos para reforzar el concepto.
Este documento describe diferentes diseños de análisis de varianza (ANOVA) como el diseño completamente aleatorizado y el diseño en bloques completamente aleatorizado. Explica los pasos para realizar la prueba de hipótesis en un diseño completamente aleatorizado y sus características principales. También cubre conceptos como diseños de mediciones repetidas y experimentos factoriales, resaltando sus ventajas y desventajas.
El documento describe el análisis de varianza (ANOVA) de dos factores, incluyendo la interacción entre factores, ejemplos, el modelo de ANOVA, grados de libertad, cuadrados medios, tablas resumen y contrastes. Explica cómo realizar un ANOVA de dos factores en SPSS y analizar los resultados, incluidas las comparaciones posteriores.
Métodos no experimentales y cuasi-experimentales. Comparación antes-después. Diferencias simples. Diferencias en diferencia. Discontinuidad en la Regresión. Matching. Variables instrumentales. Métodos de selección aleatoria.
Este documento describe cómo realizar una prueba t de varianzas combinadas para determinar si existen diferencias significativas entre las medias de dos poblaciones con varianzas iguales. Explica el estadístico de prueba t, los grados de libertad, y cómo usar los valores críticos y el p-value para decidir si rechazar o no la hipótesis nula de que las medias son iguales. También proporciona un ejemplo numérico para ilustrar el procedimiento.
El documento proporciona información sobre el análisis de varianza (ANOVA). ANOVA es un conjunto de procedimientos estadísticos para analizar respuestas cuantitativas de unidades experimentales. El documento explica los tipos básicos de ANOVA, incluidos los de un factor y dos factores, y distingue entre factores fijos y aleatorios. También presenta fórmulas comunes de ANOVA y ejemplos de diseños como bloques aleatorizados y cuadrados latinos con medidas repetidas.
Este documento describe los procedimientos para realizar pruebas de hipótesis para comparar dos medias con muestras independientes. Explica cómo formular las hipótesis nula y alternativa, calcular el estadístico de prueba, establecer una regla de decisión y tomar una decisión sobre la hipótesis nula. También cubre el uso de pruebas unilaterales cuando la hipótesis alternativa es direccional. Finalmente, presenta un ejemplo completo de cómo aplicar estos conceptos para comparar las proporciones de defectos en
Este documento presenta información sobre series cronológicas y el análisis de varianza de un factor (ANOVA). Define series cronológicas como conjuntos de observaciones de una o más variables a través del tiempo. Explica que tienen cuatro componentes principales: tendencia, variaciones estacionales, cíclicas y aleatorias. Luego, describe los supuestos y cálculos básicos del ANOVA, incluida la descomposición de la varianza total en varianza entre grupos e intragrupos.
El documento describe los diferentes tipos de gráficos para datos categóricos y nominales que se utilizarán en la tarea 4, incluyendo gráficos circulares, de barras simples, tablas cruzadas, barras 3D, barras apiladas y áreas apiladas, todos los cuales se usarán para representar datos sobre el hábito tabáquico y el sexo.
El documento describe los diferentes tipos de gráficos para datos categóricos y nominales que se utilizarán en la tarea 4, incluyendo gráficos circulares, de barras simples, tablas cruzadas, barras 3D, barras apiladas y áreas apiladas, todos los cuales se usarán para representar datos sobre el hábito tabáquico y el sexo.
Este documento presenta el módulo educativo de un curso de métodos estadísticos. Explica que el módulo fue diseñado para cumplir con los objetivos del curso relacionados con las competencias, capacidades y actitudes que los estudiantes deben alcanzar. El contenido incluye 16 semanas que cubren temas como introducción a la estadística, organización y presentación de datos, métodos estadísticos de investigación, medidas de tendencia central y dispersión, probabilidad, variables aleatorias, inferencia estadística y
Este documento presenta un ejemplo de aplicación del Teorema de Bayes. Describe una situación en la que un médico descubre las tasas de emergencias y aparente descuido en diferentes departamentos de una empresa. Luego aplica el Teorema de Bayes para calcular las probabilidades condicionales de que un caso de aparente descuido provenga de cada departamento.
Este documento presenta información sobre la distribución Ji-cuadrada y su uso en pruebas de bondad de ajuste e independencia. Explica cómo se pueden usar tablas de contingencia con la distribución Ji-cuadrada para determinar si dos variables son independientes. También introduce el análisis de varianza (ANOVA) y cómo se puede usar para comparar varianzas entre poblaciones y determinar si son iguales o diferentes.
Este documento describe cómo realizar una prueba de bondad de ajuste para determinar si los datos de una muestra se ajustan a una distribución teórica específica. Explica el procedimiento general que incluye formular la hipótesis nula de que los datos se ajustan a la distribución versus la hipótesis alternativa de que no se ajustan, establecer el nivel de significación, calcular la estadística de prueba y determinar la región crítica para decidir si se rechaza o no la hipótesis nula. Tamb
El documento trata sobre la distribución normal y su importancia en estadística. Explica que muchas variables siguen esta distribución y que permite estimar parámetros poblacionales a partir de muestras. También describe métodos como el de máxima verosimilitud y momentos para obtener estimaciones puntuales de parámetros, así como el cálculo de intervalos de confianza que contienen los valores reales con cierta probabilidad.
Este documento describe diferentes métodos para realizar pruebas de hipótesis estadísticas. Explica cómo realizar pruebas para muestras grandes y pequeñas utilizando las distribuciones Z y T de Student respectivamente. También cubre cómo realizar pruebas para proporciones poblacionales, diferencias de medias, datos apareados y la distribución chi cuadrado. El objetivo general es determinar si los resultados de una muestra son consistentes con una hipótesis planteada sobre la población.
Este documento introduce la distribución t de Student, que se utiliza para realizar inferencias estadísticas cuando la desviación estándar poblacional es desconocida y el tamaño de la muestra es menor a 30. Explica que la distribución t se aproxima a la normal a medida que aumenta el tamaño de la muestra, y que depende de los grados de libertad. También presenta la fórmula para calcular el intervalo de confianza para estimar la media poblacional usando la distribución t.
5 Planteamiento de Hipotesis en mas de 2 Poblaciones (ji cuadrada)Ana
Este documento presenta un resumen de 3 oraciones o menos sobre la distribución Ji-cuadrada y su aplicación en pruebas de hipótesis. Explica los supuestos, fórmulas y ejemplos de uso de la prueba Ji-cuadrada para comparar frecuencias observadas con las esperadas y determinar si son estadísticamente iguales. Adicionalmente, incluye ejercicios resueltos para reforzar el concepto.
Este documento describe diferentes diseños de análisis de varianza (ANOVA) como el diseño completamente aleatorizado y el diseño en bloques completamente aleatorizado. Explica los pasos para realizar la prueba de hipótesis en un diseño completamente aleatorizado y sus características principales. También cubre conceptos como diseños de mediciones repetidas y experimentos factoriales, resaltando sus ventajas y desventajas.
El documento describe el análisis de varianza (ANOVA) de dos factores, incluyendo la interacción entre factores, ejemplos, el modelo de ANOVA, grados de libertad, cuadrados medios, tablas resumen y contrastes. Explica cómo realizar un ANOVA de dos factores en SPSS y analizar los resultados, incluidas las comparaciones posteriores.
Métodos no experimentales y cuasi-experimentales. Comparación antes-después. Diferencias simples. Diferencias en diferencia. Discontinuidad en la Regresión. Matching. Variables instrumentales. Métodos de selección aleatoria.
Este documento describe cómo realizar una prueba t de varianzas combinadas para determinar si existen diferencias significativas entre las medias de dos poblaciones con varianzas iguales. Explica el estadístico de prueba t, los grados de libertad, y cómo usar los valores críticos y el p-value para decidir si rechazar o no la hipótesis nula de que las medias son iguales. También proporciona un ejemplo numérico para ilustrar el procedimiento.
El documento proporciona información sobre el análisis de varianza (ANOVA). ANOVA es un conjunto de procedimientos estadísticos para analizar respuestas cuantitativas de unidades experimentales. El documento explica los tipos básicos de ANOVA, incluidos los de un factor y dos factores, y distingue entre factores fijos y aleatorios. También presenta fórmulas comunes de ANOVA y ejemplos de diseños como bloques aleatorizados y cuadrados latinos con medidas repetidas.
Este documento describe los procedimientos para realizar pruebas de hipótesis para comparar dos medias con muestras independientes. Explica cómo formular las hipótesis nula y alternativa, calcular el estadístico de prueba, establecer una regla de decisión y tomar una decisión sobre la hipótesis nula. También cubre el uso de pruebas unilaterales cuando la hipótesis alternativa es direccional. Finalmente, presenta un ejemplo completo de cómo aplicar estos conceptos para comparar las proporciones de defectos en
Este documento presenta información sobre series cronológicas y el análisis de varianza de un factor (ANOVA). Define series cronológicas como conjuntos de observaciones de una o más variables a través del tiempo. Explica que tienen cuatro componentes principales: tendencia, variaciones estacionales, cíclicas y aleatorias. Luego, describe los supuestos y cálculos básicos del ANOVA, incluida la descomposición de la varianza total en varianza entre grupos e intragrupos.
El documento describe los diferentes tipos de gráficos para datos categóricos y nominales que se utilizarán en la tarea 4, incluyendo gráficos circulares, de barras simples, tablas cruzadas, barras 3D, barras apiladas y áreas apiladas, todos los cuales se usarán para representar datos sobre el hábito tabáquico y el sexo.
El documento describe los diferentes tipos de gráficos para datos categóricos y nominales que se utilizarán en la tarea 4, incluyendo gráficos circulares, de barras simples, tablas cruzadas, barras 3D, barras apiladas y áreas apiladas, todos los cuales se usarán para representar datos sobre el hábito tabáquico y el sexo.
Este documento presenta el módulo educativo de un curso de métodos estadísticos. Explica que el módulo fue diseñado para cumplir con los objetivos del curso relacionados con las competencias, capacidades y actitudes que los estudiantes deben alcanzar. El contenido incluye 16 semanas que cubren temas como introducción a la estadística, organización y presentación de datos, métodos estadísticos de investigación, medidas de tendencia central y dispersión, probabilidad, variables aleatorias, inferencia estadística y
Este documento presenta un ejemplo de aplicación del Teorema de Bayes. Describe una situación en la que un médico descubre las tasas de emergencias y aparente descuido en diferentes departamentos de una empresa. Luego aplica el Teorema de Bayes para calcular las probabilidades condicionales de que un caso de aparente descuido provenga de cada departamento.
El documento habla sobre la relación entre Julieta y Joaquín. Menciona que se conocieron hace un año en la universidad y desde entonces han estado saliendo juntos. Aunque al principio tuvieron algunos problemas para entenderse, con el tiempo han logrado forjar una relación sólida basada en el respeto, la confianza y el cariño mutuo.
Este documento resume los conceptos clave relacionados con los dominios de Internet. Explica que un dominio es una identificación asociada a dispositivos en la red y que el sistema de nombres de dominio traduce las direcciones IP a nombres memorizables. Los dominios pueden ser de código de país o genéricos y existen varios proveedores involucrados en su administración como IANA, ICANN y LACTLD. Finalmente, presenta una tabla con los precios típicos de registro y renovación de diferentes dominios.
Este documento presenta diferentes métodos para factorizar polinomios, incluyendo factorización por factor común, factorización utilizando fórmulas notables, factorización por agrupación y factorización de polinomios de segundo grado. Explica cada método con ejemplos y justificaciones visuales y algebraicas. El objetivo es proporcionar una introducción completa a la factorización de polinomios.
De hefbomen van een succesvolle webshop : eCommerce Kortrijk eXpo Carole Lamarque
FeWeb Connect to Digital: De hefbomen van een succesvolle webshop
Wat maakt dat een bezoeker van uw webshop overgaat tot de aankoop tot en met de betaling? Welke factoren spelen een bepalende rol? Wat kan u doen om uw webshop aantrekkelijker te maken. Deze FeWeb “Connect to Digital” sessie geeft u concrete tips over het verbeteren van uw webshop via praktische Belgische cases.
El documento habla sobre los desafíos del comercio electrónico B2C (Business-to-Consumer). Señala que los principales retos son la creación de tráfico y la fidelización de clientes, ya que es difícil para las pequeñas empresas competir en el mercado y retener a los compradores online que son sensibles al precio. Además, cita un estudio que encontró que los principales vendedores online triplicaban el tráfico, tenían mayores tasas de conversión y ganancias en comparación con el promedio.
Este documento presenta una visita de estudios a la región de Ancash, Perú. Describe varias ciudades de la región como Huaraz, Caraz, Yungay, Recuay y Huari, así como aspectos culturales de la cultura Chavín que se desarrolló allí, incluyendo su arquitectura piramidal truncada y religión basada en animales. También divide la región geográficamente en zonas como la Yunga, Quechua, Suni, Puna y Janca, indicando las altitudes y ciudades en cada una.
La Unión Europea ha acordado un embargo petrolero contra Rusia en respuesta a la invasión de Ucrania. El embargo prohibirá la mayoría de las importaciones de petróleo ruso a la UE a partir de finales de año. Algunos países como Hungría aún dependen en gran medida del petróleo ruso y podrían obtener una exención temporal al embargo.
El documento describe los diferentes tipos de intermediarios en el comercio electrónico, como directorios, centros comerciales virtuales y agentes inteligentes. También explica cómo el comercio electrónico causa cambios en las empresas como reducir inventarios, agilizar operaciones y acceder a nuevos mercados globales. Además, los efectos del comercio electrónico incluyen brindar información sobre productos, realizar pedidos de forma inmediata y ofrecer servicios pre y posventa en línea.
Support de l'animation du jeu LeanTakeoff pour Agile Grenoble 2014. Cette présentation propose un sujet pour le jeu LeanTakeoff Rev#10+ et une présentation des 10 points clés du jean startup.
Este documento presenta conceptos básicos de estadística aplicada. Explica que la estadística se ocupa de recopilar y analizar datos para tomar decisiones. Define población, muestra, frecuencia, variable, media, mediana, varianza y desviación estándar. También introduce conceptos como distribución normal, estandarización y probabilidad. El objetivo es proporcionar las bases para realizar análisis estadísticos.
Este documento presenta conceptos básicos de estadística aplicada. Explica que la estadística se ocupa de recopilar y analizar datos para tomar decisiones. Define población, muestra, frecuencia, variable, media, mediana, varianza y desviación estándar. También introduce conceptos como distribución normal, estandarización y probabilidad. El objetivo es proporcionar las bases para realizar análisis estadísticos.
El documento presenta los conceptos básicos de las variables aleatorias y los modelos probabilísticos. Explica las funciones de probabilidad, densidad y distribución para variables discretas y continuas. Describe las distribuciones de Bernoulli, binomial, normal y Poisson, así como sus propiedades y usos. Finalmente, introduce las distribuciones asociadas a la normal como la chi cuadrada, t de Student y F de Snedecor.
Este documento presenta conceptos básicos de distribuciones de probabilidad, incluyendo variables aleatorias discretas y continuas. Explica las distribuciones binomial, de Poisson, normal y geométrica, definiendo sus funciones de probabilidad y propiedades clave como la media y varianza. También incluye un ejemplo numérico para ilustrar el cálculo de estas medidas en una variable aleatoria discreta.
Este documento presenta información sobre estadística. La estadística es una ciencia que utiliza métodos para organizar, analizar e interpretar datos sujetos a variación. Se divide en estadística descriptiva, que comprende la organización y presentación de datos, y estadística inferencial, que realiza inferencias sobre una población basadas en una muestra. La curva normal es una distribución importante en estadística que describe muchos fenómenos biológicos.
Este documento trata sobre conceptos estadísticos y de muestreo. Explica que la inferencia persigue obtener conclusiones sobre una población a partir de una muestra, y existen dos tipos: estimación puntual e intervalos de confianza. También describe distribuciones de probabilidad, tipos de muestreo como el sistemático y estratificado, y conceptos como distribuciones muestrales y los teoremas centrales del límite y de Chebyshev.
Este documento trata sobre conceptos estadísticos y de probabilidad como la inferencia, distribuciones de probabilidad, muestreo, y teoremas importantes. Explica que la inferencia persigue obtener conclusiones sobre una población a partir de una muestra, y existen dos tipos: estimación puntual e intervalos de confianza. También define conceptos como variables aleatorias discretas y continuas, y distribuciones como la normal. Finalmente, describe métodos de muestreo como el sistemático, estratificado y por conglomerados, así como teoremas como el de la
Este documento describe conceptos básicos de estimación de parámetros poblacionales a partir de muestras. Explica que los estadísticos de una muestra son estimaciones del valor real del parámetro en la población. Detalla dos tipos de estimación: puntual, que proporciona un único valor, e intervalal, que provee un rango de valores posibles expresado con un grado de confianza. Además, define conceptos como parámetro, estimador, intervalo de confianza e introduce métodos para estimar la media, varianza y proporción de una
Este documento presenta conceptos básicos de inferencia estadística como población, muestra, estadísticos muestrales, distribuciones de probabilidad de estadísticos muestrales. Explica que la media muestral tiene una distribución normal asintótica y que la varianza muestral sigue una distribución chi-cuadrado con n-1 grados de libertad. También introduce conceptos como la desigualdad de Chebychev, la ley de los grandes números y el teorema del límite central para inferir distribuciones a partir de
Este documento introduce varias distribuciones de probabilidad discretas y continuas comunes, incluidas las distribuciones binomial, Poisson, normal, gamma y t de Student. Explica los parámetros y campos de variación de cada distribución y proporciona ejemplos para ilustrar su aplicación en diferentes contextos como ensayos clínicos, procesos de producción y medición de datos.
Este documento describe conceptos básicos de estadística y epidemiología. Explica variables cualitativas y cuantitativas, medidas de posición como la media y la mediana, medidas de dispersión como la varianza y desviación estándar, y tipos de estudios observacionales como estudios transversales, de casos y controles, y de cohorte. También cubre conceptos de probabilidad e inferencia estadística.
Este documento presenta conceptos básicos de estadística y epidemiología. Explica variables estadísticas cualitativas y cuantitativas, medidas de posición como la media y la mediana, medidas de dispersión como la varianza y desviación estándar, e introduce conceptos de probabilidad. También resume diferentes tipos de estudios epidemiológicos como estudios transversales, de casos y controles, y de cohorte. Finalmente, describe medidas comúnmente usadas en epidemiología como incidencia, prevalencia, riesgo relativo y odds ratio.
Este documento presenta los conceptos básicos de estimación puntual y por intervalos de parámetros estadísticos. Explica dos tipos de estimadores, sus propiedades deseables como insesgadez y consistencia, y cómo calcular intervalos de confianza para la media cuando se conoce o no la varianza poblacional usando distribuciones normales y t de Student.
Este documento resume los métodos de estimación de parámetros para problemas con una y dos muestras en inferencia estadística. Explica cómo estimar la media de una población a partir de una muestra, incluyendo el cálculo de intervalos de confianza tanto cuando la varianza se conoce como cuando no. También cubre la estimación para muestras relacionadas y el uso de la distribución t cuando la varianza es desconocida.
Este documento discute los conceptos fundamentales de la estimación estadística. Explica que la estimación involucra asignar valores numéricos a parámetros de una población basados en datos de muestra. Detalla tres métodos de estimación: estimación puntual, estimación por intervalos, y estimación bayesiana. También describe conceptos clave como estimadores, intervalos de confianza, y error de estimación. El objetivo general es proporcionar una base para que los estadísticos puedan sacar conclusiones sobre parámetros poblacionales a partir de datos
Distribuciòn binominal y otras distribucionessarilitmaita
El documento describe varias distribuciones de probabilidad, incluyendo la binomial, de Poisson, normal, t de Student, chi-cuadrado y F. Explica que cada una se aplica a situaciones específicas como contar eventos, medir variables continuas y realizar pruebas estadísticas.
Este documento presenta conceptos clave de estadística descriptiva y probabilidad. Explica que se debe analizar datos mediante medidas de tendencia central como la media, mediana y moda, y medidas de dispersión como la varianza y desviación estándar. También cubre tipos de variables, escalas de medición, y el uso de tablas y gráficos para organizar y resumir datos.
Este documento presenta conceptos básicos sobre modelos probabilísticos. Introduce las nociones de variable aleatoria, función de probabilidad para variables discretas y densidad para variables continuas. Explica distribuciones como la binomial, de Poisson y normal, dando ejemplos de cada una. Finalmente, describe el proceso de tipificación para comparar valores de distribuciones diferentes.
Este informe presenta un análisis estadístico descriptivo de cuatro variables, dos cuantitativas y dos cualitativas, de una muestra de datos. Se calculan medidas de tendencia central, dispersión y posición para las variables cuantitativas, y se muestran las frecuencias de las variables cualitativas en tablas y gráficos. Los resultados muestran que la mayoría de los participantes reportan una comunicación familiar moderada y un nivel medio de medicalización, raramente consumen hachís, y usualmente usan preservativos
Este documento introduce conceptos básicos de estadística como variables aleatorias discretas y continuas, función de distribución de probabilidad, esperanza matemática, varianza y desviación estándar. Luego describe distribuciones de probabilidad discretas como Bernoulli, binomial, geométrica y Poisson, así como distribuciones continuas como uniforme, exponencial y normal. Finalmente concluye que la estadística se divide en descriptiva e inferencial para analizar y resumir datos de poblaciones y muestras.
Reacciones Químicas en el cuerpo humano.pptxPamelaKim10
Este documento analiza las diversas reacciones químicas que ocurren dentro del cuerpo humano, las cuales son esenciales para mantener la vida y la salud.
Priones, definiciones y la enfermedad de las vacas locasalexandrajunchaya3
Durante este trabajo de la doctora Mar junto con la coordinadora Hidalgo, se presenta un didáctico documento en donde repasaremos la definición de este misterio de la biología y medicina. Proteinas que al tener una estructura incorrecta, pueden esparcir esta estructura no adecuada, generando huecos en el cerebro, de esta manera creando el tejido espongiforme.
1. Tema 1: Introducci´on al An´alisis de
datos Categ´oricos
Introducci´on
Los datos categ´oricos aparecen cuando una variable se mide en una escala que s´olo
clasifica a los encuestados en un n´umero limitado de grupos. Por ejemplo, una encuesta
donde se recoge informaci´on sobre variables como sexo, estado civil y afiliaci´on pol´ıtica.
Adem´as de distinguir una variable como categ´orica (cualitativa) o continua (cuanti-
tativa), las variables tambi´en se pueden clasificar como independientes o dependientes.
El t´ermino independiente se refiere a una variable que se puede manipular experimen-
talmente (e.g. el tipo de tratamiento que se le asigna a cada persona), pero tambi´en
se aplica a menudo a una variable que se utiliza para predecir otra variable (e.g. nivel
socio-econ´omico).
El t´ermino dependiente se refiere en general a una variable cuyo inter´es primordial
es el resultado o la respuesta. Por ejemplo, se pueden considerar como variables depen-
dientes, el resultado de un tratamiento (basado en el tipo de tratamiento) o el nivel
educativo previsto a partir de una situaci´on socio-econ´omica,.
Otro ejemplo: supongamos que se desea determinar si los colegios concertados di-
fieren de manera sustancial de los colegios privados y p´ublicos en base a ciertos datos
demogr´aficos. Por ejemplo, la ubicaci´on: urbano, suburbano o rural, tipo: p´ublica o pri-
vada, situaci´on predominante socio-econ´omica de los estudiantes: bajo, medio o alto,
etc. Para este tipo de an´alisis es necesario usar t´ecnicas de an´alisis de datos categ´oricos,
porque todas las variables involucradas son categ´oricas.
Otro ejemplo: supongamos que un investigador quiere predecir si un estudiante se
graduar´a en secundaria en base a cierta informaci´on como el n´umero de d´ıas de asisten-
cia, promedio de las calificaciones y los ingresos familiares.
En este caso, se necesita un enfoque de an´alisis categ´orico donde la graduaci´on (s´ı o
no) sirve como variable dependiente en funci´on de otras variables explicativas.
1
2. Escalas de medida
La escala de medida de una variable de respuesta categ´orica es fundamental para la
elecci´on del an´alisis estad´ıstico apropiado.
Las variables de respuesta categ´orica pueden ser
Dicot´omicas
Ordinales
Nominales
De recuento
Respuestas dicot´omicas son aquellas que tienen dos posibles resultados que a menudo
son s´ı y no. ¿Se desarrollar´a la enfermedad? ¿El votante votar´a por el candidato A o
por el B? ¿Aprobar´a el examen?
Con frecuencia, las respuestas de los datos categ´oricos representan m´as de dos re-
sultados posibles y con frecuencia en estos resultados es posible considerar alg´un orden
inherente. Estas variables tienen una escala de respuesta ordinal de medici´on. ¿El nuevo
plan de estudios gusta a los estudiantes? ¿La muestra de agua es de dureza baja, media
o alta? En el primer caso, el orden de los niveles de respuesta es clara, pero no hay
ninguna pista en cuanto a las distancias relativas entre los niveles. En el segundo caso,
hay una distancia posible entre los niveles: medio podr´ıa tener el doble de la dureza de
baja y alta podr´ıa tener tres veces la dureza de baja.
Si existen m´as de dos categor´ıas posibles de resultados y no hay un orden inherente
entre las categor´ıas, entonces se tiene una escala de medida nominal. ¿A cu´al de los
cuatro candidatos votaste en las elecciones municipales de la ciudad? ¿Prefieres la playa,
la monta˜na o la ciudad para ir de vacaciones? No existe una escala subyacente en esos
resultados y no hay una forma aparente de ordenarlos.
Las variables categ´oricas a veces contienen recuentos. En lugar de considerar las
categor´ıas que presenta cada observaci´on, (s´ı, no) (bajo, medio, alto), los resultados que
se estudian son los n´umeros mismos. El tama˜no de la camada, ¿fue de 1, 2, 3, 4 ´o 5
animales? La casa tiene ¿1, 2, 3 ´o 4 equipos de aire acondicionado?
En la metodolog´ıa cl´asica habitual se analiza la media de los recuentos, pero los
supuestos que se tienen que cumplir en un modelo lineal est´andar con datos continuos,
no se cumplen a menudo con datos discretos. En general, los recuentos no se distribuyen
seg´un una distribuci´on normal y la varianza no suele ser homog´enea.
2
3. Distribuciones de Probabilidad
Distribuci´on binomial
Habitualmente, los datos proceden de n ensayos independientes e id´enticos con dos
posibles resultados para cada uno: ´exito y fracaso, con igual probabilidad de ´exito para
cada prueba. Ensayos independientes significa que los resultados son variables aleatorias
independientes. En particular, el resultado de una prueba no afecta al resultado de otra.
Se denominan ensayos de Bernoulli.
Se denota como π a la probabilidad de ´exito para un ensayo dado e Y denota el
n´umero de ´exitos de las n pruebas:
P(y) =
n!
y! (n − y)!
πy
(1 − π)n−y
para 0, 1, 2, . . . , n.
La distribuci´on binomial para n ensayos con par´ametro π tiene como media y des-
viaci´on est´andar:
E(Y ) = µ = nπ
σ = nπ(1 − π)
Las gr´aficas de las funciones de probabilidad y distribuci´on son, respectivamente,
# Script de R
# Funcion de p r o b a b i l i d a d de una binomial
X11()
plot (0:8, dbinom (0:8 ,8 ,0.3), type="h", xlab="x",ylab="P(X=x)",
xlim=c(-1,9))
title("Funcion de probabilidad de X∼Bin(8, 0.3)")
# Funcion de d i s t r i b u c i o n de una binomial
X11()
plot (0:8, pbinom (0:8 ,8 ,0.3), type="n", xlab="x", ylab="F(x)",
xlim=c(-1,9), ylim=c(0,1))
segments (-1,0,0,0)
segments (0:8, pbinom (0:8,8,.3), 1:9, pbinom (0:8,8,.3))
lines (0:7, pbinom (0:7,8,.3), type="p", pch =16)
segments (-1,1,9,1, lty =2)
title("Funcion de distribucion de X∼Bin(8, 0.3)")
3
5. Para generar 1000 observaciones de una distribuci´on binomial Bin (n = 5, p = 0,5):
# Uso la libreria PASWR
library(PASWR)
bino.gen (1000 , 5, 0.5)
Distribuci´on Multinomial
Algunos ensayos tienen m´as de dos resultados posibles. Por ejemplo, el resultado de
un un accidente de autom´ovil se puede clasificar en varias posibles categor´ıas:
1. sin lesiones,
2. lesiones que no requieren hospitalizaci´on,
3. lesiones que requieren hospitalizaci´on,
4. muerte.
5
6. Cuando los ensayos son independientes respecto a cada categor´ıa, la distribuci´on de
los recuentos en cada categor´ıa sigue una distribuci´on multinomial.
Sea c el n´umero de posibles categor´ıas. Dados n sucesos, se puede definir la variable
aleatoria Xi (para i = 1, . . . , c) que indica el n´umero de veces que aparece el resultado
i. Se denota la probabilidad de obtener cada resultado i como {π1, π2, . . . , πc} donde
i πi = 1.
Para n observaciones independientes, la probabilidad de que n1 observaciones caigan
en la categor´ıa 1, n2 caigan en la categor´ıa 2, ..., nc caigan en la categor´ıa c, (donde
i ni = n) es igual a
P (n1, n1, . . . , nc) =
n!
n1!n2! · · · nc!
πn1
1 πn2
2 · · · πnc
c .
La distribuci´on binomial es, en realidad, un caso particular de la distribuci´on multinomial
cuando c = 2.
Ejemplos:
Se puede generar una muestra de una multinomial Mult(10, (0,1, 0,2, 0,7)), o bien
calcular la probabilidad conjunta del vector (3, 7, 2) o del vector (1, 2, 9).
# D i s t r i b u c i o n m u l t i n o m i a l con R
rmultinom (10, size =12, prob=c(0.1 , 0.2 , 0.7))
dmultinom(c(3, 7, 2), prob=c(0.1 , 0.2 , 0.7))
dmultinom(c(1, 2, 9), prob=c(0.1 , 0.2 , 0.7))
La esperanza y varianza de observar el suceso i en n ensayos es
E (Xi) = npi
V ar (Xi) = npi(1 − pi)
La covarianza entre los sucesos i y j observados en n ensayos es
Cov (Xi, Xj) = −npipj (i = j)
Inferencia para la distribuci´on binomial
El m´etodo habitual en Inferencia Estad´ıstica, desde el punto de vista cl´asico, es
la estimaci´on por m´axima verosimilitud. El estimador de m´axima verosimilitud de un
par´ametro es el valor del par´ametro, para el que la probabilidad de obtener los datos
observados es mayor. Por ejemplo, si en n = 10 ensayos se obtienen 0 ´exitos, la funci´on
6
7. de verosimilitud en este caso l(π) = (1 − π)10
alcanza el m´aximo para ˆπ = 0. Es decir el
resultado de 0 ´exitos en 10 ensayos es m´as probable que ocurra cuando π = 0 que para
cualquier otro valor.
As´ı, en general, si una variable aleatoria X se observa con x ´exitos en n ensayos, el
estimador de m´axima verosimilitud (EMV ) de la probabilidad de ´exito p es simplemente
ˆp = x/n, la proporci´on observada de ´exitos entre n ensayos. La varianza es
V ar(p) =
p(1 − p)
n
y un intervalo de confiaza al 100×(1 − α) aproximado para p es
p ± zα
s
p(1 − p)
n
que se denomina, en algunos textos, intervalo de Wald.
Una mejor alternativa es el llamado intervalo de Wilson, (o q-interval) que se calcula
como un subproducto del Teorema Central del L´ımite.
p
n
n + z2
α
s
+
1
2
z2
α
s
n + z2
α
s
±
p(1 − p)
n
n2z2
α
s
n + z2
α
s
2
+
1
4
z4
α
s
n + z2
α
s
2
Esta aproximaci´on funciona mejor que el intervalo de Wald para valores peque˜nos de n.
Estimaci´on num´erica de la funci´on de verosimilitud
En R se puede calcular de manera num´erica los estimadores de m´axima verosimilitud.
Por ejemplo:
# Funcion de v e r o s i m i l i t u d de una binomial
# Se define la funcion de v e r o s i m i l i t u d para una muestra de
# una binomial con N =10 Y =7 exitos
lklhd <- function(p){
dbinom (7,10,p)}
# Grafica de la funcion de v e r o s i m i l i t u d
plot(lklhd , 0, 1, xlab="p_i", ylab="l(p)",
main="Verosimilitud de una Binomial , N=10, Y=7")
# Estimador de maxima v e r o s i m i l t u d mediante la funcion nlm ()
optimize(lklhd ,c(0,1),maximum=TRUE)
7
8. Los intervalos de confianza exactos, o intervalos de Clopper-Pearson, se basan en el
c´alculo mediante la funci´on de distribuci´on de la distribuci´on binomial, no en aproxima-
ciones mediante la normal. Sin embargo, no son exactas en el sentido de que la funci´on de
distribuci´on binomial es discontinua en s´ı, lo que impide en la realidad el c´alculo exacto.
Estos intervalos son conservadores, es decir, suelen ser mayores que los calculados seg´un
los m´etodos asint´oticos.
Test de hip´otesis usando el m´etodo de la raz´on de verosimilitu-
des
En el m´etodo de la raz´on de verosimilitudes se compara la verosimilitud (probabilidad)
de los datos observados usando la proporci´on especificada bajo la hip´otesis nula, respecto
a la verosimilitud de los datos observados usando la estimaci´on muestral. La verosimilitud
obtenida bajo la hip´otesis nula se denota mediante L0 y la verosimilitud obtenida usando
el estimador muestral se denota como L1.
El cociente L0/L1 representa la raz´on de verosimilitudes. Si L1 (la verosimilitud
obtenida a partir de los datos observados) es mucho mayor que L0 (la verosimilitud bajo
la hip´otesis nula H0) la raz´on de verosimilitudes ser´a mucho menor que uno e indicar´a que
los datos muestran evidencia contra la hip´otesis nula.
El test de la raz´on de verosimilitudes se obtiene tomando el logaritmo (ln) de la raz´on
de verosimilitudes y multiplic´andola por –2. En concreto,
G2
= −2 ln
L0
L1
= −2 [ln (L0) − ln (L1)] .
Un valor alto de G2
(m´as positivo) indica una fuerte evidencia en contra de H0. Bajo
la hip´otesis nula y para una muestra razonablemente grande, G2
sigue una distribuci´on
χ2
con los grados de libertad igual al n´umero de par´ametros libres que existen bajo la
hip´otesis nula. En el caso de las proporciones es igual a 1.
Ejemplo
Se tiene una muestra de 2818 personas tal que el 34 % bebe la cantidad diaria de
agua recomendada (1.5 litros). Un intervalo de confianza aproximado del 95 % para la
proporci´on de toda la poblaci´on es, entonces,
0,34 ±
0,34 · 0,66
2818
= 0,34 ± 0,017 = (0,323, 0,357).
El intervalo de Wilson calculado es
8
9. p
n
n + z2
α
s
+
1
2
z2
α
s
n + z2
α
s
±
p(1 − p)
n
n2z2
α
s
n + z2
α
s
2
+
1
4
z4
α
s
n + z2
α
s
2
=
0,34 ·
2818
2818 + 1,962
+
1
2
1,962
2818 + 1,962
±
0,34 · 0,66
2818
·
28182 · 1,962
(2818 + 1,962)2 +
1
4
·
1,964
(2818 + 1,962)2 =
(0,32274, 0,35770)
Ejemplo
Uso de R para calcular intervalos de confianza para el par´ametro p de la binomial.
Supongamos un ensayo con 50 observaciones, entre los que se encuentran 46 ´exitos.
Se trata de calcular los intervalos de confianza.
# x =46 exitos
# n =50 o b s e r v a c i o n e s
res = prop.test(x=46, n=50, conf.level =0.95 , correct=F)
res
1-sample proportions test without continuity correction
data: 46 out of 50, null probability 0.5
X-squared = 35.28 , df = 1, p-value = 2.855e -09
alternative hypothesis: true p is not equal to 0.5
95 percent confidence interval:
0.8116175 0.9684505
sample estimates:
p
0.92
# A l t e r n a t i v a
library(Hmisc)
binconf (46,50, method="all")
PointEst Lower Upper
Exact 0.92 0.8076572 0.9777720
Wilson 0.92 0.8116175 0.9684505
Asymptotic 0.92 0.8448027 0.9951973
9
10. Ejemplo
Proporci´on de personas vegetarianas: Supongamos que se plantea un cuestionario a un
grupo de estudiantes donde se pregunta si son vegetarianos o no. Entre n = 25 estudian-
tes, y = 0 de ellos dicen ser vegetarianos. Aunque no es realmente una muestra aleatoria
de una poblaci´on, se puede usar como ejemplo para calcular los intervalos de confianza
al 95 % para el par´ametro p de la binomial.
lklhd <- function(p){
dbinom (0,25,p)}
# Grafica de la funcion de v e r o s i m i l i t u d
plot(lklhd , 0, 1, xlab="p_i", ylab="l(p)",
main="Verosimilitud de una Binomial , N=25, Y=0")
# Estimador de maxima v e r o s i m i l t u d mediante la funcion nlm ()
optimize(lklhd ,c(0,1),maximum=TRUE)
res = prop.test(x=0, n=25, conf.level =0.95 , correct=F)
res$conf.int
Inferencia para la distribuci´on multinomial
Los par´ametros que se tienen que estimar son (π1, . . . , πc) donde πc = 1 − c−1
i=1 πi.
Se obtiene que los estimadores por m´axima verosimilitud son
πj =
nj
n
para j = 1, . . . c.
Es decir, los estimadores son simplemente las proporciones muestrales.
Contraste para la distribuci´on de una multinomial
En 1900 Karl Pearson present´o una prueba de hip´otesis que fue uno de los prime-
ros m´etodos de inferencia que se inventaron y tuvo un gran impacto en el an´alisis de
datos categ´oricos, que hasta ese momento se hab´ıa centrado en la descripci´on de las
asociaciones entre variables.
La prueba de Pearson eval´ua si los par´ametros de una multinomial son iguales a unos
valores previos especificados.
Se considera como hip´otesis nula
H0 : πj = πj0 para j = 1, . . . , c donde j πj0 = 1
10
11. Cuando la hip´otesis nula es cierta, entonces los valores esperados de nj llamadas
frecuencias esperadas son iguales a nπj0 para j = 1, . . . , c.
Se define el siguiente estad´ıstico:
X2
=
j
(nj − nπj0)2
nπj0
.
Intuitivamente, diferencias elevadas entre lo que se espera seg´un H0 y lo observado
implica a su vez valores grandes de X2
.
Para un el tama˜no muestral no peque˜no, X2
se distribuye como una chi cuadrado χ2
con c − 1 grados de libertad.
El test es muy sensible a los tama˜nos muestrales. Si alguna categor´ıa tiene una
frecuencia esperada baja (menor que 5) el test pierde mucha potencia ya que se basa en
la aproximaci´on asint´otica a la distribuci´on χ2
.
Ejemplo
El test de Pearson se us´o en Gen´etica para contrastar las teor´ıas de Mendel so-
bre la herencia. Mendel cruz´o guisantes amarillos puros con guisantes verdes puros. Su
predicci´on era que 3/4 ten´ıan que ser amarillos y 1/4 verdes.
En un experimento se obtuvo n = 8023 guisantes, de los cuales n1 = 6022 fueron
amarillos y n2 = 2001 verdes.
Las frecuencias esperadas son, entonces,
H0 : π10 = 0,75
π20 = 0,25
de modo que
X2
=
(6022 − 8023 · 0,75)2
8023 · 0,75
+
(2001 − 8023 · 0,25)2
8023 · 0,25
= 1,59 × 10−2
Al compararlo con una distribuci´on χ2
con 1 grado de libertad, se obtiene un p-valor
igual a 0.90.
# Con R
pchisq (0.015 ,1, lower.tail=FALSE)
# D i r e c t a m e n t e con el comando chisq.test
chisq.test(x=c(6022 ,2001) ,p=c(.75 ,.25))
11
12. [1] 0.9025233
Chi -squared test for given probabilities
data: c(6022 , 2001)
X-squared = 0.015 , df = 1, p-value = 0.9025
12
13. Pero Fisher (y otros) vieron que Mendel tuvo demasiada suerte en su experimenta-
ci´on...
Fisher coment´o textualmente: “The general level of agreement between Mendel’s ex-
pectations and his reported results shows that it is closer than would be expected in the
best of several thousand repetitions... I have no doubt that Mendel was deceived by a
gardening assistant, who knew only too well what his principal expected from each trial
made.”
Con SAS se usar´ıa el siguiente programa:
OPTIONS ls =70;
DATA prueba1;
INPUT prof $ count;
DATALINES;
amarillos 6022
verdes 2001
;
PROC freq order=data;
weight count;
tables prof / binomial (p=0.75) alpha =0.05;
exact binomial;
RUN;
Se obtiene el siguiente resultado:
13
14. Procedimiento FREQ
Frecuencia Porcentaje
prof Frecuencia Porcentaje acumulada acumulado
_________________________________________________________________
amarillo 6022 75.06 6022 75.06
verdes 2001 24.94 8023 100 .00
Proporcion binomial para prof = amarillo
________________________________________
Proporcion (P) 0.7506
ASE 0.0048
95 % Limite conf. inferior 0.7411
95 % Limite conf. superior 0.7601
Limites conf. exactos
95 % Limite conf. inferior 0.7410
95 % Limite conf. superior 0.7600
Test de H0: Proporcion = 0.75
ASE bajo H0 0.0048
Z 0.1225
Pr de un lado > Z 0.4513
Pr de dos lados > |Z| 0.9025
Test exacto
Pr de un lado >= P 0.4572
Dos colas = 2 * Una cola 0.9144
Tama∼no de la muestra = 8023
14
15. Ejemplo
El departamento de instrucci´on p´ublica de Wisconsin usa cuatro categor´ıas para
medir las habilidades matem´aticas: advanced, proficient, basic y minimal.
Se considera una muestra de 71709 estudiantes de grado 10o
en 2006 y se supone que
las proporciones se mantienen en los mismos niveles que en a˜nos anteriores. Los datos
est´an en la siguiente tabla:
Nivel matem´atico Proporci´on esperada Frecuencia esperada Frecuencia observada
Advanced 15 % 10756.35 18644
Proficient 40 % 28683.60 32269
Basic 30 % 21512.70 10039
Minimal 15 % 10756.35 10757
Con R bastar´ıa escribir:
chisq.test(x=c(18644 ,32269 ,10039 ,10757) ,
p=c(0.15 ,0.40 ,0.30 ,0.15))
Con SAS se usar´ıa el siguiente programa:
OPTIONS ls =70;
DATA prueba2;
INPUT prof $ count;
DATALINES;
advanced 18644
proficient 32269
basic 10039
minimal 10757
;
PROC freq order=data;
weight count;
tables prof / testp =(0.15 0.40 0.30 0.15);
RUN;
15
16. Procedimiento FREQ
Test Frecuencia
Porcentaje
prof Frecuencia Porcentaje Porcentaje acumulada
acumulado
______________________________________________________________________
advanced 18644 26.00 15.00 18644 26.00
proficie 32269 45.00 40.00 50913 71.00
basic 10039 14.00 30.00 60952 85.00
minimal 10757 15.00 15.00 71709 100 .00
Test chi -cuadrado
para proporciones especificadas
_______________________________
Chi -cuadrado 12351 .6415
DF 3
Pr > ChiSq <.0001
Tama∼no de la muestra = 71709
16