2. ¿Qué hemos visto hasta hoy?
MÉTODOS DE
INVESTIGACIÓN,
USOS E
IMPORTANCIA
Cuanti Cuali
Variable
Si no
varía, no
es
variable
¿Cómo obtener
información de
nuestra(s)
variable(s)?
¿De quién obtener
información de
nuestra(s) variable(s)?
MUESTREO
Información
obtenida (base
de datos)
¿Qué hacer con
ella?
Estadística descriptiva
¿Los resultados
organizados y
presentados en la
ED permiten
SIEMPRE generalizar
hacia la población?
Estadística
inferencial
Y, ¿de qué me valgo para saberlo?
3. Cruzando el puente…
Unidad 3: Herramientas de estadística descriptiva para el análisis de datos
Resultados de aprendizaje específicos:
R2: Plantea adecuadamente el método y las herramientas a utilizar alineados a los objetivos de la investigación.
Contenidos:
1. Estadísticos resúmenes: Medidas de tendencia central, medidas de variabilidad y medidas de posición no
central.
2. Distribuciones de frecuencia.
3. Representaciones gráficas.
Unidad 4: Herramientas de estadística inferencial para el análisis de datos
Resultados de aprendizaje específicos:
R2: Plantea adecuadamente el método y las herramientas a utilizar alineados a los objetivos de la investigación.
Contenidos:
1. Distribución Muestral: Estimación.
2. Pruebas de Hipótesis: Pruebas de una muestra, pruebas de dos muestras, pruebas de más de dos muestras.
4. Puntos a tratar en esta unidad
• Distribución Muestral:
Estimación.
• Pruebas de Hipótesis: Pruebas
de una muestra, pruebas de dos
muestras, pruebas de más de
dos muestras.
5. Puntos a tratar en esta sesión
• La función de Distribución Normal y Distribución
Normal Standard.
• Distribución Muestral: Estimación.
• Pruebas de Hipótesis: Definiciones (Hipótesis,
hipótesis nula, hipótesis alternativa, nivel de
significancia, error tipo I y tipo II)
• Procedimiento para la toma de decisiones
empleando la inferencia estadística
• Pruebas de Hipótesis de una muestra (Prueba a dos
colas)
6. Resultados esperados al terminar esta
sesión
R2: Plantea adecuadamente el
método y las herramientas a utilizar
alineados a los objetivos de la
investigación.
8. ¿Qué veremos?
• Un repaso de probabilidades
• La función de Distribución Normal y Distribución Normal
Estándar.
• Funciones de densidad
• Distribución Muestral: Estimación.
• Pruebas de Hipótesis: Definiciones (Hipótesis, hipótesis
nula, hipótesis alternativa, nivel de significancia, error tipo I
y tipo II)
• Procedimiento para la toma de decisiones empleando la
inferencia estadística
• Pruebas de Hipótesis de una muestra (Prueba a dos colas)
9. Repasemos el conocimiento
acumulado
• Estadística: conjunto de métodos enfocados a la obtención,
presentación y análisis de observaciones numéricas.
• Estadística descriptiva: tiene como fin de describir al conjunto
de datos obtenidos de manera resumida y organizada
• Estadística inferencial: se enfoca en la toma de decisiones o
realización de generalizaciones acerca de las características de
una población con base en información parcial o incompleta
(es decir, una muestra)
10. ACTIVIDAD RÁPIDA
Dado este comportamiento previo de la cotización del dólar del sistema bancario que provee el BCRP,
¿qué evento crees que es más probable? Fundamenta tu respuesta. ¿En qué te fijaste para dar la
respuesta?
3.15
3.2
3.25
3.3
3.35
3.4
3.45
3.5
3.55
3.6
02Ene20
06Ene20
08Ene20
10Ene20
14Ene20
16Ene20
20Ene20
22Ene20
24Ene20
28Ene20
30Ene20
03Feb20
05Feb20
07Feb20
11Feb20
13Feb20
17Feb20
19Feb20
21Feb20
25Feb20
27Feb20
02Mar20
04Mar20
06Mar20
10Mar20
12Mar20
16Mar20
18Mar20
20Mar20
24Mar20
26Mar20
30Mar20
01Abr20
03Abr20
07Abr20
13Abr20
15Abr20
17Abr20
21Abr20
23Abr20
27Abr20
29Abr20
04May20
06May20
11. ¿Qué debemos considerar para
trabajar con la estadística inferencial?
• Que la realidad es una sucesión de eventos
aleatorios, en donde una variable o más
muestran algunos valores o categorías del
total que puede tener.
• Es decir, estos eventos suelen darse al azar,
por lo que nunca tendremos certeza de lo que
realmente ocurrirá en cuanto al valor de la
variable.
12. Pero…
• Pero, lo que sí podemos hacer, en
base a INFORMACIÓN PREVIA ( para
ello debemos ver cómo se comporta
la variable en base a la información
que sí proporcionó) asignar
probabilidades de ocurrencia para
cada uno de los valores
13. ¿Y qué hacemos con las
probabilidades?
• Podemos establecer hipótesis de los posibles
valores y relaciones entre variables que pueden
darse en la población, y rechazarlas o no, en base
a la información que tenemos en la muestra.
• En otras palabras, podemos saber si los
resultados de una muestra (estadísticos) SON
FACTIBLES DE EXTRAPOLAR A LA POBLACIÓN
(parámetro), con un nivel de confianza y margen
de error determinado.
14. Recordemos lo que es una probabilidad
Los valores de
probabilidad se
expresen como
fracción o
decimales y
encuentran en una
escala de 0 a 1.
Valores cercanos a 0
indican que la
probabilidad de que
ocurra un evento son
muy pocas.
Valores cercanos a 1
indican que es casi
seguro que ocurra un
evento
15. Hay tres tipos de probabilidades, pero es importante conocer
LA PROBABILIDAD FRECUENCIA RELATIVA DE OCURRENCIA
•Hay probabilidades que no las podemos definir a priori, sin
que se realice algo de experimentación, sino que necesitamos
conocer sobre la frecuencia de ocurrencia de dichas
probabilidades
16. La frecuencia relativa observada de un evento durante un gran
número de intentos, o,
La fracción de veces que un evento se presenta a la larga,
cuando las condiciones son estables.
¿CÓMO SE CALCULA LA PROBABILIDAD FRECUENCIA RELATIVA DE
OCURRENCIA?
En otras palabras….
Se determina qué tan frecuentemente ha sucedido algo en el pasado y
se emplea esta cifra para predecir la probabilidad de ocurrencia de ese
evento en el futuro.
La frecuencia relativa se vuelve estable a medida que se eleva el numero
de experimentos realizados (en las mismas condiciones).
¡Checa!: https://media.giphy.com/media/l0Ex4ZhCqwy1Oqd8I/giphy.gif
17. Variable Fija.- Porque su valor o realización es conocido.
Variable Aleatoria.- Es un resumen numérico de un
resultado aleatorio (de un experimento).
Una variable es aleatoria porque su valor o realización es
incierto (no es conocido) hasta que el experimento se lleve a
cabo
Volvamos a una vieja conocida: VARIABLE
Es la característica cuantificable o cualificable de la muestra o población que se está
observando o analizando, puede tomar diferentes valores
18. VARIABLE ALEATORIA DISCRETA
Cuando el conjunto de realizaciones es finito o infinito pero numerable
Ejemplos:
- Inspeccionar un envío
de 50 productos
- Vender un automóvil
- Número de productos
que tienen algún
defecto.
- Sexo del cliente
0, 1, 2, …, 50
0 si hombre, 1 si mujer.
Experimento V.A. (x) valores posibles
para x
19. VARIABLE ALEATORIA CONTINUA
Ejemplos:
- Llenar una lata de refresco
(máx 12.5 onzas)
- Medir la contaminación de
un río a causa de una
mina.
- Cantidad de onzas
- Nivel tolerable de
contaminación del agua.
0≤ x ≤ 12.5
10≤ x≤ 30.
Experimento V.A. (x) valores posibles
para x
• Cuando el conjunto de realizaciones es infinitamente indivisible y, por lo tanto. no es
numerable
• La variable puede asumir cualquier valor dentro de un determinado intervalo o
colección de intervalos
20. La distribución de probabilidad de una V.A. describe cómo se
distribuyen las probabilidades entre los valores de una V.A. Es un
conjunto de los valores xi (resultados de un experimento) tomados de una
V.A. X y sus probabilidades o chances de ocurrencia asociadas.
DISTRIBUCIONES DE PROBABILIDAD
Son expresiones matemáticas que están regidas por las
leyes del azar y cumplen ciertas condiciones.
21. En el caso de una V.A. discreta: La distribución de
probabilidad está definida por una Función de
probabilidad [f(x)], que da la probabilidad de cada valor
de una V.A.
DISTRIBUCIONES DE PROBABILIDAD DISCRETA
Condiciones requeridas para una Función de
Probabilidad discreta:
f(x) ≥ 0
f(x) = 1.
23. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA
f(x) da la probabilidad de que la V.A. tome cualquier
valor dentro de un intervalo dado
24. Llamada también función de densidad de probabilidad o
ley de probabilidad de una variable aleatoria continua [f(x)],
para lo cual deberá cumplir las siguientes condiciones:
f(x) ≥ 0 valor de x
f(xi) dx = 1
DISTRIBUCIONES DE PROBABILIDAD CONTINUA
1
dx
x
f i
x
a
f(x)
b
f(x)
La probabilidad es el área bajo la función de densidad de probab.
b
Prob[a X b] = f(x)dx
a
25. Función de densidad
• Sea x el valor de una VA continua X, una
función real f, definida en un subconjunto de
valores reales, será función de densidad si:
R
,
0
)
(
D
x
todo
para
x
f
1
)
(
dx
x
f
28. • Una VA X se dice que se distribuye
normalmente si su función de densidad está
definida por:
x
x
todo
para
e
x
f
x
:
,
2
1
)
(
2
2
2
)
(
2
¿cuántos parámetros tiene esta función?
29. Función de distribución: representación
gráfica
)
(x
f
x
Gauss
de
curva
Simétrica
Acampanada
Asintótica a x
30. Función de distribución normal: características
La probabilidad al lado derecho de la media poblacional es igual a
0.5
La probabilidad al lado izquierdo de la media poblacional es igual a
0.5
2
1
)
(
X
P
2
1
)
(
X
P
La VA X sigue una distribución de la siguiente manera
)
;
(
~ 2
N
X
)
(X
E 2
)
(
X
V
En la distribución normal coinciden la media, la moda y la mediana
31. Función de distribución normal: importancia
• Muchas de las variables aleatorias que se definen a partir de las
observaciones se distribuyen normalmente.
• Muchas de las técnicas que se utilizan en la estadística aplicada se
encuentran basadas en la distribución normal.
• Existen otras variables aleatorias que se distribuyen
aproximadamente como la distribución normal.
• Existen otras distribuciones como la Poisson, binomial, t-student que
tienden a la distribución normal bajo determinadas circunstancias.
• En el empleo de la estadística inferencial, el empleo de ciertas
distribuciones se definen a partir de supuestos de normalidad como
la distribución chi-cuadrado, t-student y F
33. Función normal estandarizada: definición
Si )
;
(
~ 2
N
X
La función de densidad de esta distribución es:
X
Z
z
z
todo
para
e
z
f
z
:
,
2
1
)
( 2
2
Estandarizar significa que cada valor de la variable x de un
proceso puede ser convertido en un valor z, el cual
depende de la Media y de la Desviación Estándar de la
distribución
34. Función de distribución estandarizada:
representación gráfica
)
(z
f
1
0 1
z
Gauss
de
curva
Simétrica
Acampanada
Asintótica a x
35. Función de distribución normal estandarizada:
características
La probabilidad al lado derecho de la media poblacional es igual a
0.5
La probabilidad al lado izquierdo de la media poblacional es igual a
0.5
2
1
)
(
Z
P
2
1
)
(
Z
P
Si la VA Z sigue una distribución normal estándar de la siguiente
manera )
1
;
0
(
~ N
X 0
)
(
Z
E 1
)
(
Z
V
En la distribución normal estandarizada la media, la moda y la
mediana coinciden Y SON IGUALES A CERO
El área bajo la curva de Gauss de la función de densidad de la
distribución normal estandarizada es igual a uno 1
)
(
dz
z
f
36. Función de distribución normal estandarizada :
utilidad
• Mediante el valor z se pueden comparar los
resultados de muchos procesos, aunque tengan
magnitudes diferentes.
• Podemos comparar si en una empresa las ventas
mensuales del producto A son mejores o peores
que las correspondientes al Producto B en el
mismo mes del año.
37. Función de distribución normal estandarizada :
ejemplos
Ejemplo 1: Si en la distribución de los pesos de los sacos de comida para
perros se encuentra que el promedio es 61.6 Kg y la DE es 3.1 Kg ¿Cuál sería el
valor z que corresponde a un saco que pesa 66.2 Kg?
El valor z no tiene medidas
Indica cuántas DE se separa el valor x observado del promedio
del proceso.
El peso del saco de 66.2 Kg es 1.94 DE mayor que el promedio
de todos los sacos
Interpretación
z = ( 66.2 - 61.6) / 3.1 = 1.94
38. Función de distribución: representación
gráfica
)
(x
f
61.6kg 61.6 𝑘𝑔 + 3.1 𝑘𝑔
x
Gauss
de
curva
Simétrica
Acampanada
Asintótica a x
61.6 𝑘𝑔 − 3.1 𝑘𝑔 66.2kg
39. Función de distribución estandarizada:
representación gráfica
)
(z
f
1
0 1
z
Gauss
de
curva
Simétrica
Acampanada
Asintótica a x
1.94
40. Función de distribución normal estandarizada :
ejemplos
Ejemplo 2: Hallar los valores Z de las ventas mensuales (millones de soles) en
la Empresa D3 Inc en el mes de junio del 2010
Producto A: x (A) = 385 Promedio histórico= 374, DE = 8.4
Producto B: x (B)= 28.43 Promedio histórico= 27.16 , DE= 0.86
En junio del 2010, las ventas del Producto B han aumentado más
respecto a su promedio histórico que el aumento obtenido por el
Producto A respecto a su propio promedio histórico de ese mes.
Interpretación
Producto A: valor z(A) = ( 385 - 374 ) / 8.4 = 1.31
Producto B: valor z(B) = ( 28.43 -27.16) / 0.86 = 1.48
41. Tabla normal estandarizada
La distribución normal se caracteriza por ser una
distribución simétrica (los mismos valores hacia ambos
lados de la campana y las mismas probabilidades)
Para valores de z, encontrar el área comprendida debajo
de la curva de Gauss es equivalente a encontrar la
probabilidad asociada a los valores de Z
)
(
)
(
)
( 1
1
1
z
F
dz
z
z
Z
P
z
42. Tabla normal estandarizada: calentando
•¿A qué es igual el área que se encuentra por debajo de la campana
(y que representa la probabilidad de ocurrencia)?
•¿Qué pasaría si ahora sombreamos el lado izquierdo de la campana
y ya no el lado derecho? ¿Cómo se hallaría?
58
.
1
Prob
1
58
.
1
Prob
Z
Z
0 58
.
1
Preguntas
58
.
1
Prob
1
Z
43. Tabla normal estandarizada: calentando
•¿Hallar la probabilidad de que Z sea menor a -0.01 es equivalente
a hallar la probabilidad de que Z sea mayor que 0.01? ¿Cómo se
hallaría?
Preguntas
0
01
.
0
0 01
.
0
)
01
.
0
Prob(Z
01
.
0
Prob
Z
)
01
.
0
Prob(Z
1
)
01
.
0
Prob(Z
1
)
01
.
0
Prob(Z
• ¿Sólo se cumple porque esta distribución es simétrica?
45. )
(s
X
Xi
I. Hallar valores de Z dado un
valor Xi:
II. Hallar Área en Porcentajes
(Tabla)
III. Hallar el rango percentil de un
valor Xi y/o un valor Z dado.
IV. Hallar los valores Xi dada un
Área.
s
X
Xi
Z
Variable Normalizada (recordando)
46. Aplicación I
a) Hallar las puntuaciones Z de las calificaciones 88 y 120
88 μ 120
- 0.75 y + 1.25
16
y
100
s
X
50. Dispersión en la distribución normal
-3s -2s -1s X 1s 2s 3s
Para distribuciones normales:
s
X
s
X 2
y
2
b) El 95,45% de los casos están comprendidos entre:
a) El 68.26% de los casos están comprendidos entre:
s
X
s
X 3
y
3
c) El 99,73% de los casos están comprendidos entre
s
X
s
X
y
51. Para distribuciones moderadamente asimétricas, los porcentajes
anteriores pueden mantenerse aproximados
X - 2 s X X + 2s
95,45%
X - 3 s X X + 3s
99,73%
Dispersión en la distribución normal
X - s X X + s
68,27%
52. Es un conjunto de técnicas que permiten
calcular un valor aproximado de
un parámetro (característica poblacional) a
partir de los datos proporcionados por una
muestra
Estimación
53. Estimaciones de Parámetros
Si se está interesado en estimar la media de la
población (µ), el método más obvio resultaría servirse
del propio valor muestral y tomarlo como su
estimador (recuerden el ejemplo del Esperado en la
sesión anterior).
En caso de que coincidan se tratará de una estimación
insesgada del parámetro. Este valor se reconoce
como punto estimado de la media poblacional.
54. Tipo de estimación 1: Estimación puntual
Consiste en estimar el parámetro θ a partir de la
muestra obtenida
Consiste en encontrar un determinado estadístico
que deberá de constituir una buena aproximación
del valor de un parámetro desconocido .
Al estadístico se le denomina estimador del
parámetro desconocido .
55. En general, al punto estimado de cualquier parámetro (Pµ) se le
conoce como estimación puntual
Lo que ocurre: es muy improbable que un punto
estimado coincida con el parámetro específico.
Problema: la estimación puntual de un parámetro es
incorrecta desde el punto de vista de la variabilidad
de muestreo.
Solución: en lugar de estimar un valor puntual para µ
(Pµ), se estimará un rango de valores, llamado
intervalo, dentro del cual es probable que fluctúe el
verdadero parámetro
Tipo de estimación 1: Estimación puntual
56. • Consiste en estimar un rango de valores con una alta probabilidad
dada de cubrir el verdadero valor de la población, sobre todas las
muestras de tamaño n.
• A diferencia de la estimación puntual ,la estimación paramétrica
encuentra un intervalo que se denomina intervalo de confianza; esta
debe de contener al parámetro con una probabilidad dada
denominada nivel de confianza, basada en una muestra aleatoria y
el correspondiente estadístico
F
I L
L
I ,
)
1
(
Nivel de confianza
Intervalos y límites
1
F
I L
L
P
Tipo de estimación 2: Estimación por intervalos
57. • Se usa el estadístico como punto de partida para
dar una estimación por intervalo alrededor de la
estimación muestral, dentro de ciertos márgenes
de confiabilidad.
• En la estimación de parámetros por intervalos de
confianza interviene como un poderoso
instrumento el valor del error estándar
Tipo de estimación 2: Estimación por intervalos
59. Cuando tenemos una muestra aleatoria se pueden calcular los límites
del intervalo y, posteriormente, podemos decir que se tiene un nivel de
confianza del
IC: Interpretación
)%
1
(
*
100
de que el intervalo contenga al valor del parámetro desconocido
Otra forma de interpretar el intervalo de confianza es decir que de cada
cien intervalos aleatorios, noventa y cinco de ellos contendrán el
parámetro y cinco de ellos no lo contendrán.
60. En teoría, pueden calcularse estimaciones por intervalos para cualquier
nivel de probabilidad llamado “Nivel de Confianza”.
Sin embargo, son convencionales los niveles de 90%, 95% y 99% de
confianza, porque tienen mejores probabilidades de hacer una
estimación que incluya al valor poblacional.
EN RESUMEN, la estimación por intervalos es aquella que se
calcula dando dos límites (superior e inferior) y considerando
un cierto margen de error dado por la magnitud del error
estándar y un cierto nivel de confianza específico.
Tipo de estimación 2: Estimación por intervalos
61. La interpretación de un intervalo de confianza de 95% para un parámetro, es que se
encuentra en algún punto del intervalo calculado y que este enunciado se hace con
un coeficiente de confianza del 95%.
El parámetro es un valor único, fijo pero desconocido. Y que, son los intervalos los
que varían de una muestra a otra.
Un intervalo de confianza del 95% significa estimar el verdadero valor poblacional
sabiendo que 95 de cada 100 valores muestrales están dentro del intervalo de
estimación del parámetro.
Tipo de estimación 2: Estimación por intervalos
62. Estimación del Intervalo de Confianza para la Media (µ).
Tener como base la media muestral
Estimar el valor del error estándar de la media.
Decidir el nivel de confianza que deseamos. Esta decisión determina
los límites de confianza dentro de los que puede estar la media de la
población.
El intervalo de confianza viene dado por:
donde el valor de Zc depende del nivel de confianza que se desee y se obtiene a
partir de la tabla de áreas bajo la curva normal.
X Zc X n
X
63. Estimación del Intervalo de Confianza para la Media
Así como la media poblacional (µ) suele ser desconocida, rara vez se conoce la
desviación estándar real de la población (σ).
Asimismo, si se trata de muestras chicas (menores o iguales a 30 casos), se requiere
usar el estadístico T de Student, en lugar de Z, que usa a la desviación muestral (s)
como una estimación de sigma (σ):
Puede aparecer que la distribución t es muy similar a la distribución normal
estandarizada de puntajes Z.
Ambas distribuciones tienen forma simétrica. La diferencia está en que la
distribución t se extiende más en los extremos y se concentra menos en el centro en
comparación con la normal Z.
X
tc
X
64. Estimación IC: Ejemplo
Suponga que la edad promedio de una muestra al azar de
100 estudiantes fue de 19.5 años con una desviación
estándar de 3.7 años. Como la muestra es grande se
puede asumir que la distribución de muestreo de la
media es normal.
La estimación de la media poblacional al 95% y al 99% de
confianza es:
69. ACTIVIDAD DE DISCUSIÓN - ¿Qué necesitan
recordar para la prueba de hipótesis?
• Función de distribución: expresión funcional que resume el comportamiento de una
variable numérica (“la forma” de la distribución)
• Función de densidad y función de probabilidad: expresión funcional que asocia cada
valor de una variable con su probabilidad de ocurrencia (el área debajo de la forma de
la distribución)
• Hipótesis nula (siempre contiene la igualdad) e hipótesis alternativa (siempre contiene
la diferencia): ambas son mutuamente excluyentes
• El nivel de significancia: es la probabilidad de rechazar la Ho cuando es verdadera
(error tipo 1). ¿Con qué niveles de significancia se suelen trabajar?
• Las pruebas estadísticas (test estadísticos): es un valor ESTANDARIZADO que se usa
para confirmar si una hipótesis debe o no ser rechazada.
– Se suelen usar las pruebas t (cuando el n es pequeño y/o cuando la varianza de la población es
desconocida y Z (cuando n es mayor a 30 y/o cuando la varianza poblacional es conocida).
– Para una decisión más rápida, el criterio a usar es la probabilidad de ocurrencia para los valores t y
Z y contrastarla con el nivel de significancia.
– Deben cumplir la condición de tener una función de distribución normal. ¿Por qué?
Usemos la base de datos “Letras” para repasar
70. OBJETIVOS
70
Definir una hipótesis y las pruebas de hipótesis
Describir el procedimiento de una prueba de una
hipótesis en cinco pasos.
Distinguir entre las pruebas de hipótesis de una
y de dos colas.
Llevar a cabo una prueba de hipótesis para una media
poblacional.
Llevar a cabo una prueba de hipótesis para una
proporción poblacional.
Definir los errores tipo I y tipo II.
Calcular la probabilidad de un error tipo II.
71. ¿Qué es una Hipótesis?
71
Una Hipótesis es una declaración relativa a un
parámetro de la población sujeta a
verificación.
Ejemplos de hipótesis hechas acerca de un
parámetro de la población son:
– El salario mensual de los analistas en sistemas es de $3,625.
– Veinte por ciento de todos los clientes del Menú Rosita
regresan por otra comida dentro de un mes.
72. ¿Qué es la prueba de hipótesis?
72
Probar una hipótesis es un
procedimiento basado en evidencia de la
muestra y la teoría de probabilidad para
determinar si la hipótesis es una afirmación
razonable y esta debería ser aceptada, o si
no es razonable y por tanto debería ser
rechazada.
73. Pasos Para Probar una Hipótesis
73
Se
establecen
las
hipótesis
nula y
alternativa
Se selecciona
un nivel de
significancia
Se identifica el
estadístico de
prueba
Se formula una
regla para tomar
decisiones
Se toma una
muestra; se llega
a una decisión.
Paso 1 Paso 2 Paso 3 Paso 4 Paso 5
No se
rechaza H0
o
se rechaza H0
y
“se acepta” H1
74. Detalles importantes a recordar acerca de H0 y H1
74
• H0: es la hipótesis nula y H1: es la hipótesis
alternativa.
• H0 y H1 son mutuamente excluyentes.
• H0 se dice que es cierta a menos que se
demuestre lo contrario.
• Se usa una muestra aleatoria (n) para “rechazar
a H0”
75. Detalles importantes a recordar acerca de H0 y H1
75
• El hecho de no rechazar una hipótesis no prueba
que H0 sea verdadera sino que no rechazamos H0.
La hipótesis alternativa se “acepta” si la información de la
muestra ofrece evidencia estadística para rechazar la
hipótesis nula.
• La hipótesis nula H0 siempre incluirá el signo igual
(e.j. “=” , “≥” , “≤”).
• La hipótesis alternativa H1 no contiene el signo
igual y contendrá los siguientes símbolos“≠” “<” y
“>”
76. ¿Cómo escoger una hipótesis a partir de un
problema?
• La hipótesis nula H0 representa el
estado actual reportado.
• La hipótesis alternativa se refiere al
hecho de que la afirmación no es
verdadera.
76
77. ¿Cómo escoger una hipótesis a partir de un
problema?
• Cuando resuelva problemas, busque palabras
claves y conviértalas en símbolos. Algunas
palabras claves incluyen: “mejorado, mejor que,
tan efectivo como, diferente de, ha cambiado, no
es igual, es inferior, perderán, menos, aumentó,
es más alto, existe diferencia, es mayor que, es
menor que, es de, supera, se incremento,
discrepa, contradicen, una proporción mayor,
reducir, etc.”
77
78. Prueba de una cola o de dos colas (¿cómo saber
cuál usar?)
Palabras
Símbolo de
desigualdad
Parte
de:
Más grande (o más)
qué
> H1
Más pequeño (o
menor)
< H1
Ha incrementado > H1
No más que H0
Cuando menos ≥ H0
¿Existe una
diferencia?
≠ H1
No ha cambiado = H0
78
• La dirección de la prueba que envuelve
enunciados que usan las palabras “ha
sido mejorado”, “es mejor que”,
dependerá de la variable que se este
midiendo
• Si la variable se refiere a la calificación
de una prueba, las palabras “mejor”
“mejorar” o “más efectivo” son traducidas
como “>” (más grande que, como
ejemplo, “las calificaciones más altas”)
79. Prueba de Una Cola vs. Prueba de
Dos Colas
79
Dos colas
Una cola, Prueba de una cola a la izquierda
Una cola, Prueba de una cola a la derecha
80. Tipos de Errores en la Prueba de Hipótesis
80
• Error Tipo I:
– Definida como la probabilidad de rechazar la
hipótesis nula cuando esta realmente es verdadera.
– Esta probabilidad es denotada por la siguiente letra
griega “”
– Es también conocida como nivel de
significancia.
• Error Tipo II :
– Definida como la probabilidad de aceptar la
hipótesis nula cuando esta realmente es falsa
– Esta probabilidad se denota por la letra griega “β”
84. Partes de la Distribución en la Prueba de Hipótesis
84
85. ¿Valor crítico?
• La selección de un valor crítico está ligado a
la selección de un nivel de significancia
• Pero, ¡¿qué es el nivel de
significancia?!
El nivel de significancia vendría a ser el riesgo
que corremos al rechazar una hipótesis nula
cuando es cierta
85
86. ¿Valor crítico?
• Entonces, ¿me conviene trabajar con niveles
de confianza bajos? ¿Qué tan bajo o alto?
Sífilis, conviene trabajar con niveles bajos. Por
convencionalidad se trabaja con niveles de 1%, 5% o
10% como máximo
Recuerden a Levin y Rubin, hijos míos:
“Cuanto más alto sea el nivel de significancia que utilizamos
para probar una hipótesis, mayor será la probabilidad de
rechazar la hipótesis nula cuando es cierta.”
86
87. ¿Valor crítico?
• Entonces, ¿es solo trabajar con
valores asociados a los niveles de 1%,
5% o 10% ?
Nopo, primero tienes que buscar en la tabla z los valores
asociados a los niveles con los que trabajarás y luego seguir
las reglas de decición del ppt que sigue
87