2. • Hipótesis estadísticas.
• La toma de decisiones que continuamente hacemos en
la vida la formulamos mediante una serie de diferentes
alternativas, y estas alternativas nacen de una serie de
parámetros tomados de muestras de un conjunto
grande llamado población (no bajo la muestra) las
cuales pueden ser verdaderas o no, cuando vinculamos
dichas alternativas con parámetros estadísticos
hablamos de decisiones estadísticas.
• Es decir al tomar decisiones sobre poblaciones en base
en la información de muestras se denomina
decisiones estadísticas.
• |
4. • Hipótesis nulas
Son formulación es que se hacen
generalmente con la intención de nulificaras o
rechazarlas
• Hipótesis alternativas
cualquier hipótesis que difiera de la nula se le
conoce como alternativa
6. • Según el Acta de energía remitida al congreso en 1978, se fijó
un impuesto al fabricante de cualquier auto nuevo que diera
un promedio cuando mucho de 22.5 millas por galón de
gasolina. En consecuencia, un fabricante de autos nuevos
podía no querer estimar el millaje promedio por galón de
gasolina, sino que le interesaba determinar si dicho millaje
excedía las 22.5 millas por galón; esto es, estaba interesado
en comprobar las hipótesis:
7. A. La media del millaje no excede las 22.5 millas por
galón de gasolina.
• Contra la hipótesis
B. La media del millaje excede las 22.5 millas por galón
de gasolina.
• H0 = 22.5 millas por galon
• H1 > 22.5 millas por galon
8. • Hace tiempo se descubrió accidentalmente que la minoxilina, un
fármaco elaborado por la Upjohn Pharmaceutical Company y prescrita
para los casos severos de presión sanguínea alta, provocaba el
crecimiento del cabello; el medicamento se proporcionaba
usualmente en forma de tabletas para controlar la presión sanguínea.
Se ha estimado que el 80% de los pacientes tratados con minoxilina
experimentan engrosamiento, alargamiento y oscurecimiento del
cabello dentro de las tres a seis semanas de haber empezado el
tratamiento. Como resultado de estos efectos colaterales, Upjohn ha
estado investigando las posibilidades de usar minoxilina en forma
tópica, un fármaco llamado Rogaine, para tratar la calvicie masculina.
• Una investigadora realizó un experimento para probar los efectos de
Rogaine contra la calvicie, éste se realizó durante un periodo de seis
meses para comparar la hipótesis.
•
9. • A. La Rogaine no tiene beneficios terapéuticos
para prevenir la calvicie.
• Contra la hipótesis
• B. La Rogaine tiene beneficios terapéuticos
para prevenir la calvicie.
10. • El fabricante afirma que una medicina de
patente es 90% efectiva para reducir una
alergia durante 8 hrs. En una muestra de 200
personas con alergia, la medicina la redujo a
160 personas. Determine la afirmación del
fabricante es legitima.
11. • En la prueba de hipótesis se comienza suponiendo un valor de un parámetro que,
a juicio del investigador, sea el más adecuado de acuerdo con la información
disponible, a esta suposición se le llama hipótesis nula y se representa con Ho. A
continuación se define otra hipótesis, llamada hipótesis alternativa, que es la
opuesta de lo que se afirma en la hipótesis nula. La hipótesis alternativa se
representa como Ha. El procedimiento para probar una hipótesis comprende el
uso de datos de una muestra para probar las dos aseveraciones representadas por
Ho y Ha.
• La prueba de hipótesis se parece a un juicio penal. En éste, se parte del supuesto
de que el acusado es inocente. La hipótesis nula es de inocencia. Lo contrario de la
hipótesis nula es la hipótesis alternativa la cual expresa una creencia de
culpabilidad, Por consiguiente, las hipótesis en un juicio criminal se escribirían:
•
• Ho: El acusado es inocente
• Ha: El acusado es culpable
12. • solución
• ¿Será efectiva la medicina en realidad?
• La es prueba unilateral. ( puesto que el interés es
determinar si la porción de personas que mejoraron
con la medicina es demasiado baja)
• H0 = 90% es efectiva es legitima la afirmación.
• H1< 90% no es efectiva no es legitima la afirmación
13. • Las fuerzas de ruptura de cables producidos
por un fabricante tienen una media de 1800
lbs. y una desviación estándar de 100 lb. Por
medio de una técnica nueva en el proceso de
fabricación, se afirma que la fuerza de ruptura
puede incrementarse. Para probar esta
afirmación, una muestra de 50 cables es
probada y se encuentra que la fuerza de
ruptura es de 1850 lb ¿se puede apoyar esta
afirmación?
• ( es una prueba prueba unilateral)
14. solución
• HO = 1800 LA AFIRMACION ES FALSA NO HAY
CAMBIO DE LA FUERZA
• H1= > 1800 LA AFIRMACION ES CORRECTA SI
HAY CAMBIO EN LA FUERZA
15. • Ejercicios
• 1-Supongamos que determinado modelo de automóvil actualmente funciona con un rendimiento
promedio de 12 kilómetros por litro. Un grupo de investigación de producto ha inventado un nuevo
carburador, diseñado para aumentar el rendimiento. Para evaluar el nuevo carburador se fabricarán
varios de ellos, se instalarán en automóviles y se someterán a pruebas de manejo controladas.
Observe que el grupo de investigación de producto busca pruebas para decir que el nuevo
carburador aumenta el rendimiento de los kilómetros por litro. En este caso, la hipótesis de
investigación es que el nuevo carburador proporcionará una media del rendimiento mayor a los 12
kilómetros por litro, es decir que>12. Como lineamiento general, una hipótesis de investigación
como ésta debe formularse y proponerse como hipótesis alternativa. Por consiguiente:
• 2 - Un fabricante de bebidas considera que las botellas de 2 litros de sus productos contienen un
promedio mínimo de 1999 ml. Se seleccionará una muestra de botellas de 2 litros y se medirán sus
contenidos para investigar la afirmación del fabricante. Las hipótesis son las siguientes:
• 3-.Con base en una muestra de piezas en un embarque que se acaba de recibir, un inspector de
control de calidad debe de decidir entre aceptar todo el embarque o regresarlo al proveedor,
porque no cumple con las especificaciones. Supongamos que las especificaciones de determinada
pieza dicen que la longitud promedio debe de ser de dos pulgadas para cada pieza. Si la longitud
promedio de las partes es mayor o menor que la norma de dos pulgadas, las partes causarán
problemas de calidad en la operación de ensamblaje. En este caso, se formularan como sigue las
hipótesis:
16. soluciones
1-- Ho: 12
Ha: >12
Si los resultados de los datos de la muestra indican que no se puede rechazar Ho, los investigadores no
pueden decir que el nuevo carburador es mejor. Quizá se deban llevar a cabo más investigaciones y
pruebas. Sin embargo si los datos de la muestra indican que se puede rechazar Ho, los investigadores
pueden hacer la inferencia que el nuevo carburador aumenta el kilometraje por litro. Entonces se puede
proceder a iniciar la producción del nuevo carburador.
2-- Ho: 1999
• Ha: < 1999
• Si los resultados de la muestra indican que Ho no se puede rechazar, no se puede dudar de la afirmación
del fabricante. Sin embargo, si los datos de la muestra indican que se puede rechazar Ho, se hará la
inferencia que el contenido promedio de las botellas es menor a 1999 ml. Se puede considerar una acción
pertinente en contra del fabricante.
3-- Ho: = 2
Ha: 2
• Si los resultados de la muestra indican que no se puede rechazar Ho, el inspector de control de calidad no
tendrá razón para dudar que el embarque cumple con las especificaciones, y lo aceptará. Sin embargo si
los datos de la muestra indican que se debe rechazar Ho, la conclusión será que las piezas no cumplen con
las especificaciones. En este caso el inspector tendrá las pruebas suficientes para regresar el embarque al
proveedor.
18. • ERROR TIPO 1 Y ERORR TIPO 2
• Si se rechaza una hipótesis cuando debe aceptarse,
se dice que se cometió error tipo 1, si por el
contrario, se acepta la hipótesis cuando esta debe
rechazarse, se dice que se cometió un error tipo 2
• Nota: la única manera de reducir ambos tipos de
error es aumentando el tamaño de la muestra, lo cual
puede o no ser posible.
19. • La probabilidad de rechazar Ho, dado que Ho es verdadera, se
define como la probabilidad del error Tipo I y se denota por α.
• La probabilidad de no rechazar Ho, dado que Ho es falsa, se define
como la probabilidad del error tipo II y se denota porβ .
• Por tanto las probabilidades de los errores Tipo I y II están dadas
por las proposiciones
• P (rechazar Ho | Ho verdadera) = α
• P ( no rechazar Ho | Ho es falsa) = β
• Nótese que tanto como son probabilidades condicionales. No
pueden obtenerse las probabilidades de los errores Tipo I y II en un
sentido absoluto, debido a que el estado de la naturaleza no es
conocido. Más bien, puede calcularse la probabilidad de rechazar
Ho sólo si se asume que Ho cierta, o la probabilidad de equivocarse
el rechazar Ho, si se asume que Ho es falsa
20. 1.2 Nivel de significancia
• Cuando aprobamos una hipótesis, la
probabilidad de arriesgarnos a caer en un error
tipo 1 se le conoce como nivel de significancia.
Este esta íntimamente ligado con el manejo de
porcentaje. Es decir si hablamos de un 0.05%
de significancia entonces se dice que hay 5
posibilidades que se rechace la hipótesis y 95
posibilidades que se acepte. Esto es 95% de
aceptación y 5% de rechazo.
24. Prueba bilateral o de dos colas.
Cuando existe interés en los valores extremos del
estadístico S o de su mediación z
correspondiente a ambos lados de la media ( es
decir ambas colas de la distribución) .
Prueba unilateral.
Cuando hay interés solo en los valores extremos a
un lado de la media ( es decir a un lado de la cola
de distribución) como cuando se prueba una
hipótesis de que un proceso es mejor que otro,(
que es diferente de probar si un proceso es peor
que otro).
25. Pruebas bilaterales y pruebas unilaterales
• Un contraste bilateral adopta en general la forma:
• H0: θ = θ0 contra H1: θ ≠ θ0
• En determinadas ocasiones el experimentador
prefiere plantear directamente un contraste de la
forma:
• H0: θ = θ0 contra H1: θ > θ0
conocido como contraste unilateral derecho.
Obviamente, otra posibilidad es el unilateral
izquierdo:
• H0: θ = θ0 contra H1: θ < θ0
26. • En la mayoría de situaciones aplicadas, se
desean realmente resolver contrastes
unilaterales que comportan hipótesis
compuestas. El unilateral derecho es
entonces:
• H0: θ ≤ θ0 contra H1: θ > θ0
y el izquierdo es:
• H0: θ ≥ θ0 contra H1: θ < θ0
27.
28. Para muestreo sin reemplazamiento de una
población finita
• 1) medias . Si S= X, la media muestral; μ s = μx
= μ, , la media poblacional ; y σs = σ x= σ/√N, donde
σ es la desviación estándar poblacional y N es
el tamaño de la muestra. La medición Z esta
dada por
Z= X- μ /( σ/√N)
29. • 2) proporciones si S=P, la proporción de
éxitos en una muestra ; μ s = μp = p donde p
es las proporción poblacional de éxitos y N es
el tamaño de la muestra; y σs = σ p= √pq/N ,
donde
q= 1-p.
La medición de z esta dada por
z= (P-p) /(√pq/N )
30. • En el caso en que P= x/N , donde x es el
numero de éxitos en una muestra , la
medición z esta dada por:
• Z= (X- Np)/ (√Npq)
• μ s = μx = μ
• σs = σ p= σ/√pq/N, donde q= 1-p
• μ x = μ =Np, σx = σ = √Npq Y S = X
31. • aplicación
• 3)- Diseñe una regla de decisión para probar la hipótesis de que una
moneda es buena si se toma una muestra de 64 lanzamientos de
una moneda y se utilizan niveles de significancia de 0.05 y 0.01.
• 4)- En un experimento de percepción extrasensorial (pes), se pide a
un individuo, en una habitación , que elija correctamente el color
rojo o azul, de una carta seleccionada por otro sujeto en otra
habitación, de una baraja de 50 de naipes bien mezclada, el
individuo desconoce cuantas cartas rojas y azules hay en la baraja.
Si el individuo identifica bien 32 cartas , determine si los resultados
son significativos a los niveles de 0.05 y 0.01.
• 5)- Un fabricante afirma que una medicina de patente es 90%
efectiva para reducir una alergia durante 8 horas. En una muestra
de 200 personas con alergia, la medicina la redujo a 160 persona.
Determine si la afirmación del fabricante es legitima.
32. • En un experimento de percepción
extrasensorial (pes), se pide a un individuo,
en una habitación , que elija correctamente el
color rojo o azul, de una carta seleccionada
por otro sujeto en otra habitación, de una
baraja de 50 de naipes bien mezclada, el
individuo desconoce cuantas cartas rojas y
azules hay en la baraja. Si el individuo
identifica bien 32 cartas , determine si los
resultados son significativos a los niveles de
0.05 y 0.01.
33.
34. • Diseñe una regla de decisión para probar la
hipótesis de que una moneda es buena si se
toma una muestra de 64 lanzamientos de una
moneda y se utilizan niveles de significancia
de 0.05 y 0.01.
35.
36. • El fabricante afirma que una medicina de
patente es 90% efectiva para reducir una
alergia durante 8 hrs. En una muestra de 200
personas con alergia, la medicina la redujo a
160 personas. Determine la afirmación del
fabricante es legitima.
37.
38. Pruebas que se consideran diferencias
de muéstrales.
• Sean X1 y X2 las medias muéstrales obtenidas en
muestras grandes de tamaño N1 y N2
seleccionadas de sus poblaciones respectivas, con
medias μ1 y μ2 así como las desviaciones
estándar σ1 y σ2 . Considérese la hipótesis nula
de que no hay diferencias entre las medias
poblacionales (es decir μ1 = μ2 ), que es lo mismo
decir que las muestras se obtuvieron de dos
poblaciones con la misma media.
39.
40. DIFERENCIAS DE MEDIAS.
• Se aplico un examen en dos salones de clases
consistentes de 40 y 50 estudiantes,
respectivamente. En el primer salón la
calificación media fue de 74, con una
desviación estándar de 8, mientras que en el
segundo salón la calificación media fue de 78,
con una desviación estándar de 7. ¿ existe
una diferencia significativa entre el
desempeño de los dos salones de clases al
nivel a)0.05 y b)0.01
41. • Ho= solo es coincidencia.
• H1= existe diferencia significativa.
42. Es una prueba bilateral.
Media 74 primer salón, desviación 8
Media 78 segundo salón, desviación 7
Aplicando la formula σx1-x2= 1.60
Aplicando la formula de la variable
estandarizada Z=-2.50
43. Utilizando el nivel de significancia de 0.05.
Los valores críticos según la tabla son
Para una prueba bilateral : Z=-1.96 y Z= 1.96
como Z=-2.50 se
concluye que hay una
diferencia significativa.
(verifique para 0.01)
44. • La estatura media de 50 estudiantes hombres,
quienes mostraron una participación por
arriba del promedio de deportes
universitarios, fue de 68.2 pulg. Con una
desviación estándar de 2.5 pulg. Mientras que
50 estudiantes hombres, que no mostraron
interés en los deportes, tenían una estatura
media de 67.5, con una desviación estándar
de 2.8 pulg. Pruebe la hipótesis de que los
estudiantes hombres participan en deportes
universitarios son mas altos que otros
estudiantes varones.
45. • Ho= μ1 = μ2 no existe diferencia entre las
estaturas medias.
• H1= μ1 > μ2 la estatura del primer grupo es
mayor que la del segundo grupo
46. Aplicando la formula σx1-x2= 0.53
Aplicando la formula de la variable
estandarizada Z= 1.32
Prueba unilateral para nivel de significancia de
0.05 tenemos z= 1.645
Probar con el nivel 0.10
47. PROPORCIONES
DOS GRUPOS, A y B, CONSISTEN CADA UNO DE 100
PERSONAS ENFERMAS. SE DA UN SUERO AL GRUPO
A, PERO NO ALGRUPO B (DENOMINADO CONTROL);
SI NO ES ASI, ENTONCES LOS GRUPOS SON
TRATADOS DE MANERA IDENTICA. SE ENCUENTRA
QUE EN LOS GRUPOS A Y B, 75 Y 65 PERSONAS ,
RESPECTIVAMENTE , SE RECUPERAN DE LA
ENFERMEDAD . PRUEBE LA HIPOTESIS DE QUE EL
SUERO AYUDA A CURARA LA ENFERMEDAD CON LOS
NIVELES DE SIGNIFICANCIA DE A) 0.01, B) 0.05, C)
0.10
49. El estudio de muestras pequeñas que requieren
mayor exactitud se denomina teoría de
muestras pequeñas. Sin embargo el nombre
mas adecuado es teoría exacta del muestreo,
y que los resultados que se obtienen son
validos para muestras grandes, como
pequeñas.
Consideramos muestras pequeñas las que son
menores de 30.
50. Técnicamente se puede describir la prueba t de
Student como aquella que se utiliza en un
modelo en el que una variable explicativa
(variable independiente) dicotómica intenta
explicar una variable respuesta (variable
dependiente) dicotómica. Es decir en la
situación: dicotómica explica dicotómica
51. La prueba t de Student como todos los
estadísticos de contraste se basa en el cálculo
de estadísticos descriptivos previos: el número
de observaciones, la media y la desviación
típica en cada grupo. A través de estos
estadísticos previos se calcula el estadístico de
contraste experimental. Con la ayuda de unas
tablas se obtiene a partir de dicho estadístico.
52. la distribución t studen Se define el estadístico
V= (N-1) NUMERO DE GRADOS DE LIBERTAD
53. Intervalos de confianza
Se pueden entender como intervalos de confianza
al limite matemático probabilístico de que las
hipótesis se acepten de acuerdo a su mayor
probabilidad de ocurrencia, es decir si hablamos
de intervalos de confianza al 95% estaríamos
diciendo realmente que el 95% de que se
aceptara una determinada hipótesis ocurriera
fuera alta, y el 5% nos diría que tendría solo un
5% de probabilidad que esta ocurriera, de tal
manera que el termino rechazo realmente se
entiende como el un porcentaje mínimo de
aceptación.
54. • LA PRUEBAS DE HIPOTESIS Y Significancia O
REGLAS DE DECISIÓN PUEDEN EXTENDERSE
FACILMENTE A PROBLEMAS QUE IMPLIQUEN
MUESTRAS PEQUEÑAS. LA UNICA DIFERENCIA
ES QUE LA MEDICION Z O ESTADISTICO Z SE
SUSTITUYE POR UNA MEDICION T O
ESTADISTICO T
PRUEBA DE HIPOTESIS Y
SIGNIFICANCIA
55. MEDIAS: P ara probar la Ho de que una población normal tiene una media ( miu) se
utiliza la medición t, donde X es la media de una muestra N esto es análogo a la
medición z, para una muestra N grande, con excepción de que s se emplea en lugar de
σ
56. Diferencias de medias
• Suponga que dos muestras aleatorias, de
tamaños N1 y N2 se seleccionan de
poblaciones normales, cuyas desviaciones
estándar son iguales, Considere, además que
estas dos muestras tienen medias dadas por
X1 Y X2,, así como desviaciones estándar S1 y
S2, respectivamente, Para probar la hipótesis
Ho que asegura que las muestras provienen
de la misma población, se utiliza la medición t
57. Grados de libertad.
• Para calcular el estadístico, es necesesario
usar observaciones obtenidas de una muestra,
asi como ciertos parámetros poblacionales.
58. APLICACION
• En el pasado una maquina produjo arandelas
con un espesor de 0.05 pulg. Para determinar
si la maquina funciona bien , se selecciono
una muestra de 10 arandelas cuyo espesor
medio es de 0.053 pulg. Y la desviación
estándar es de 0.003 pulg.. Pruebe la hipótesis
de que la maquina funciona bien usando
niveles de significancia de a)0.05 y b)0.01
59. • Ho= si μ=0.050 la maquina funciona bien.
• H1 ≠ si μ es diferente de 0.050 la maquina funciona mal.
• Cálculos: t= ((x- μ)/s )√(N-1), v=N-1
• X=0.053
• μ=0.050
• S=0.003
• N=10
• Introduciendo los datos a la formula tenemos : t=3.00
• Probando con los niveles de significancia α=0.05 y α=0.01
• Entramos a la tabla con v=9 tenemos que y t1-0.025 implica que
t0.975. entrando a la tabla tenemos t=2.26 y t =-2.26
considerando que es una prueba bilateral tenemos que el valor de 3
queda fuera del rango y por lo cual se rechaza la hipótesis nula.
(verifique para el nivel de significancia de 0.01)
60.
61. • Los cocientes de inteligencia de 16
estudiantes de un área de la ciudad
mostraron una media de 107 y una desviación
estándar de 10, mientras que los coeficientes
de inteligencia de 14 estudiantes de otra área
de la ciudad mostraron una media de 112 y
una desviación estándar de 8. ¿ existe una
diferencia significativa entre los coeficientes
de inteligencia de los dos grupos a niveles de
significancia de 0.01 y 0.05?
PROBLEMA DE DIFERENCIA DE MEDIAS DE LA
T STUDENT.
62. • N1= 16
• X1=107
• S1=10
• N2=14
• X2=112
• S2=8
• Ho=no existe diferencia significativa entre los grupos (casualidad)
• H1 = si existe diferencia significativa entre los grupos.
Aplicando las formulas correspondientes.
t= (x1 – x2)/(σ√(1/N1 + 1/N2) )
σ = √((N1 S1 + N2 S2)/ (N1+N2-2))
V= N1 + N2 -2
64. Diferencias de medias
• Sea X1 y X2 las medias muéstrales obtenidas en
muestras grandes de tamaños N1 y N2
seleccionadas de sus poblaciones respectivas.
Con medias μ 1 y μ2 , así como desviaciones
estándar σ1 y σ2. considérese la hipótesis nula
que no hay diferencia entre las medias
poblacionales es decir μ 1 = μ2, que es lo mismo
que decir que las muestras se obtuvieron de dos
poblaciones con la misma media.
66. Diferencia de proporciones
• Se ha p1 y p2 las proporciones muéstrales
obtenidas en muestras grandes de tamaño N1
y N2, de sus poblaciones respectivas con
proporciones p1 y p2; considérese que la
hipótesis nula de que no hay diferencia entre
los parámetros poblacionales es decir p1=p2y,
por lo tanto, que las muestras se obtuvieron
en realidad de la misma población.
68. • En estadística, la distribución χ² (de Pearson),
donde χ² se pronuncia como ji-cuadrado, es
una distribución de probabilidad continua con
un parámetro k que representa los grados de
libertad de la variable aleatoria:
69. donde Zi son variables de distribución normal, de media cero y varianza uno. Esta distribución se
expresa habitualmente como
• La distribución ji-cuadrado tiene muchas aplicaciones en inferencia estadística, por ejemplo en la
denominada prueba χ² utilizada como prueba de independencia y como prueba de bondad de
ajuste y en la estimación de varianzas.
• La inferencia estadística o estadística inferencial es una parte de la Estadística que comprende los
métodos y procedimientos para deducir propiedades (hacer inferencias) de una población, a partir
de una pequeña parte de la misma (muestra). La bondad de estas deducciones se mide en términos
probabilísticos, es decir, toda inferencia se acompaña de su probabilidad de acierto.
La estadística inferencial comprende:
La Teoría de muestras.
La estimación de parámetros.
El Contraste de hipótesis.
El Diseño experimental.
La Inferencia bayesiana.
Los métodos no paramétricos
a
También está involucrada en el problema de estimar la media de una población normalmente
distribuida y en el problema de estimar la pendiente de una recta de regresión lineal, a través de su
papel en la distribución t de Student, y participa en todos los problemas de análisis de varianza, por
su papel en la distribución F de Snedecor, que es la distribución del cociente de dos variables
aleatorias de distribución ji-cuadrado e independientes.
70. • Se define el estadístico
X2= Ns2 /σ2 = ( (X1-X)2 + (X2 +X)2 + ….. + (XN + X)2 )/ σ2
Donde x as la letra griega chi y se lee chi cuadrada.
Se consideran muestras de tamaño N, obtenidas de una poblacion normal,
con desviacion estandar σ y si para cada muestra se calcula phi cuadrada,
entonces puede resultar una distribución muestral para phi cuadrada.
Esta distribución, se denomina chi cuadrada.
Donde sus grados de libertada están dados por v=N-1
El estadístico chi cuadrada proporciona una media de la discrepancia
existente entre la frecuencia observada y la frecuencia esperada.
71. Intervalos de confianza para chi cuadrada
Como se hizo con la distribución normal y la
distribución t estudent, se puede definir los
limites de confianza de 95% a 99% y otros,
utilizando la tabla correspondiente.
Los valores criticos se calculan de igual manera
que la t student.
72. FRECUENCIA OBSERVADA Y TEORICAS
Como se ha observado a veces los resultados
obtenidos a partir de muestras no siempre
coinciden de manera exacta con los resultados
teóricos esperados de acuerdo con las leyes
de la probabilidad.
• Frecuencia observada: es aquella que se da
como resultado de observar un experimento.
• Frecuencia teórica: es aquella que se espera
por las leyes de la probabilidad aplicada.
73. • Si phi cuadrada es =0 las frecuencias observadas y
teóricas coinciden de forma exacta.
• Si phi es > 0, luego no coinciden exactamente.
A mayor valor de phi, mayor es la discrepancia
entre la frecuencia observadas y esperadas.
V=k-1, si las frecuencias esperadas pueden
calcularse sin tener que estimar los parámetros
poblacionales a partir de estadísticos muéstrales
V=k-1-m, si las frecuencias esperadas suelen
calcularse solo estimando m parámetros de la
poblacion a partir de los estadísticos muéstrales.
74. Prueba de chi cuadrada para la bondad
de ajuste.
• La prueba chi cuadrada puede usarse para determinar distribuciones
teóricas ( como la distribución normal y binomial) se ajustan las
distribuciones empíricas ( es decir, aquellas obtenidas de datos
muéstrales). (shauw)
• La prueba se basa en que tan buen ajuste se tiene entre la frecuencia de
ocurrencia de las observaciones de una muestra y las frecuencias
observadas que se obtienen de la distribución hipotética.
• Es decir una prueba de bondad entre frecuencias observadas y esperadas
se basa en la cantidad X2 = ∑ (O i – ei )2 /ei
donde la phi cuadrada es el valor de la variable aleatoria cuya
distribución muestral se aproxima muy cercanamente a una distribución
phi cuadrada y los símbolos o representa la frecuencia observada y e la
frecuencia esperada. (pag. 358 .walpole-myers probabilidad y estadistica)
75. Tablas de contingencia
• a las tablas donde se representan las frecuencias
observadas, y teóricas y ocupan un solo renglón se
llaman tablas de clasificación simple o de una entrada.
• Cuando se extienden estas tablas donde las tablas se
clasifican dobles o de dos entradas, donde las
frecuencias observadas ocupan h renglones y k
columnas se llaman tablas de contingencia.
• Cuando queremos probar la hipótesis de dependencia
de dos variables de clasificación utilizamos las tablas de
contingencia a lo cual llamamos prueba de
independencia. . (pag. 359.walpole-myers probabilidad y estadistica)
76. • Frecuencia de celda: se les llama a las
frecuencias que ocupan cada celda de las
tablas.
• Frecuencia marginal: Se le llama la frecuencia
total en cada renglón o columna.
evento E1 E2
Frecuencia
observada
01 02
Frecuencia
esperada
e1 e2
77. Prueba de independencia
• Calcúlese X2 = ∑ (O i – ei )2 /ei donde la
sumatoria se extiende a todas las celdas
(renglón r, columna c) de la tabla de
contingencia r x c ,con v=(r-1)(c-1) grados de
libertad, se rechaza la hipótesis nula de
independencia en el nivel de significancia , de
lo contrario se acepta la hipótesis.(walpole 361)
78. aplicación
• En 200 lanzamientos de una moneda , se
observaron 115 caras y 85 cruces. Pruebe la
hipótesis de que la moneda es buena usando
el nivel de significancia de 0.05 y 0.01
79. • Frecuencias observadas o1=115 y 0=85
• Frecuencias esperadas e1= 100 y e2 = 100
• Aplicando la formula X2 = ∑ (O i – ei )2 /ei
Tenemos X2 =(O 1 – e1 )2 /e1 + (O 2 – e2 )2 /e2
X2 =(115 – 100 )2 /100 + (85 – 100 )2 /100 = 4.5
Numero de categorías o clases ( caras y cruces ) k= 2
V= k-1 = 2-1 = 1
80.
81. • Entramos a la tabla anterior con x.95 para 1
grado de libertad y tenemos que 3.84 es
menos que 4.50 por lo que se rechaza que la
moneda es buena al nivel de significancia de
0.05
82. Problema 2
De la tabla siguiente se muestran las
frecuencias observadas y esperadas al lanzar
un dado 120 veces, pruebe la hipótesis de que
el dado es bueno usando un nivel de
significancia de 0.05
Cara del dado 1 2 3 4 5 6
Frecuencia
observada
25 17 15 23 24 16
Frecuencia
esperada
20 20 20 20 20 20
83. • Aplicando la formula X2 = ∑ (O i – ei )2 /ei
• Tenemos
X2 =(25 – 20 )2 /20 + (17 – 20)2 /20 + (15 – 20 )2 /20 + (23 – 20)2 /20 +
(24 – 20 )2 /20 + (16 – 20)2 /20= 5.00
NUMERO DE CLASES K= 6 ENTONCES V=K-1 = 6-1 = 5 GRADOS DE LIBERTAD
84. • Entramos a la tabla anterior con x.95 para 5
grado de libertad y tenemos que x.95 = 11.1 es
mayor que 5.00 por lo que no se rechaza la
hipótesis al nivel de significancia de 0.05
85. Problema 3
• De la siguiente tabla muestra la distribución de los
dígitos 0,1,2,….9 en una tabla de números aleatorios
de 250 dígitos ¿ difiere significativamente la
distribución observada de la distribución esperada?.
Con el nivel significancia 0.01
Digito 0 1 2 3 4 5 6 7 8 9
Frecuencia
observada
17 31 29 18 14 20 35 30 20 36
Frecuencia
esperada
25 25 25 25 25 25 25 25 25 25
86. • Aplicando la formula X2 = ∑ (O i – ei )2 /ei
• Tenemos
X2 =(17 – 25 )2 /25 + (31 – 25)2 /25 + (29 – 25 )2 /25 + (18
– 25)2 /25 + ………….+(36 – 25 )2 /25 = 23.3
NUMERO DE CLASES K=10-1= 9 GRADOS DE LIBERTAD X2
0.99 = 21.7 DE LA
TABLA, POR LO QUE 23.3 ES MAYOR QUE 21.7 SE CONCLUYE QUE LA
DISTRIBUCION OBSERVADA DIFIERE SIGNIFICATIVAMENTE.
88. Dos grupos A y B, consisten cada una en 100
personas enfermas. Se da un suero al grupo A,
pero no al grupo B (denominado control); si no es
así, entonces los grupos son tratados de manera
idéntica, pero no al grupo B, se encuentra que los
grupos A y B, de 75 y 65 personas,
respectivamente, se recuperan de la enfermedad.
a) Bajo la hipótesis nula de que el suero no tiene
efecto, se esperaría que 70 personas en cada
grupo se curaran y 30 de cada grupo no se curan
de acuerdo ala siguiente tabla. b) Obsérvese que
la Ho es equivalente a la afirmación de que la
curación es independiente al uso del suero (es
decir las calificaciones son independientes)
91. Problema 1
• La tabla siguiente se muestra la producción por acre,
en celemines, de cierta variedad de trigo cultivado
en un tipo particular de suelo tratado con químicos
A,B,C calcule a) la producción media de los diferentes
tratamientos. B) la gran madia de todos los
tratamientos, c) la variación total, d) la variación
entre tratamientos e) la variación dentro de los
tratamientos.
92. A 48 49 50 49
B 47 49 48 48
C 49 51 50 50
A) PARA SIMPLIFICAR RESTAMOS A TODOS LOS ELEMENTOS 45 Y TENEMOS
A 3 4 5 4
B 2 4 3 3
C 4 6 5 5
93. • A) CALCULANDO LAS MEDIAS DE LOS
TRATAMIENTOS
• X1= ¼ (3+4+5+4)= 4
• X2= ¼ (2+4+3+3)= 3
• X3= ¼ (4+6+5+5)= 5 SUMELE 45 DE LO
RESTANDO ANTERIOR MENTE.
94. • B) LA GRAN MEDIA
X= 1/12(3+4+5+4+2+4+3+3+4+6+5+5) = 4
POR LO QUE 45 +4 = 49 MEDIA ORIGINAL
• C) LA VARIACION TOTAL ES: (de la tabla los valores menos la gran media)
• V=∑ (Xjk –x)2 = (3-4)2 + (4-4)2 + (5-4)2 + (4-4)2 +(2-4)2 + (4-4)2 + (3-4)2 + (3-
4)2 +(4-4)2 + (6-4)2 + (5-4)2 + (5-4)2 = 14
• D) variación entre tratamientos (las medias de cada tratamiento
menos gran media)
• VB = b∑ (Xjk –x)2 = ∑ N(Xjk –x)2 = 4( (4-4)2 + (3-4)2 + (5-4)2 )= 8
• QUE VIENE SIENDO LO MISMO QUE TENER = ( 4(4-4)2 + 4(3-4)2 + 4(5-4)2 )= 8
95. • E) la variación entre tratamientos es:
• Vw = V-VB = 14-8 = 6