SlideShare una empresa de Scribd logo
1 de 88
Métodos de Investigación
Cuantitativa
Tema
HERRAMIENTAS DE ESTADÍSTICA INFERENCIAL PARA EL
ANÁLISIS DE DATOS
¿Qué hemos visto hasta hoy?
MÉTODOS DE
INVESTIGACIÓN,
USOS E
IMPORTANCIA
Cuanti Cuali
Variable
Si no
varía, no
es
variable
¿Cómo obtener
información de
nuestra(s)
variable(s)?
¿De quién obtener
información de
nuestra(s) variable(s)?
MUESTREO
Información
obtenida (base
de datos)
¿Qué hacer con
ella?
Estadística descriptiva
¿Los resultados
organizados y
presentados en la
ED permiten
SIEMPRE generalizar
hacia la población?
Estadística
inferencial
Y, ¿de qué me valgo para saberlo?
Cruzando el puente…
Unidad 3: Herramientas de estadística descriptiva para el análisis de datos
Resultados de aprendizaje específicos:
R2: Plantea adecuadamente el método y las herramientas a utilizar alineados a los objetivos de la investigación.
Contenidos:
1. Estadísticos resúmenes: Medidas de tendencia central, medidas de variabilidad y medidas de posición no
central.
2. Distribuciones de frecuencia.
3. Representaciones gráficas.
Unidad 4: Herramientas de estadística inferencial para el análisis de datos
Resultados de aprendizaje específicos:
R2: Plantea adecuadamente el método y las herramientas a utilizar alineados a los objetivos de la investigación.
Contenidos:
1. Distribución Muestral: Estimación.
2. Pruebas de Hipótesis: Pruebas de una muestra, pruebas de dos muestras, pruebas de más de dos muestras.
Puntos a tratar en esta unidad
• Distribución Muestral:
Estimación.
• Pruebas de Hipótesis: Pruebas
de una muestra, pruebas de dos
muestras, pruebas de más de
dos muestras.
Puntos a tratar en esta sesión
• La función de Distribución Normal y Distribución
Normal Standard.
• Distribución Muestral: Estimación.
• Pruebas de Hipótesis: Definiciones (Hipótesis,
hipótesis nula, hipótesis alternativa, nivel de
significancia, error tipo I y tipo II)
• Procedimiento para la toma de decisiones
empleando la inferencia estadística
• Pruebas de Hipótesis de una muestra (Prueba a dos
colas)
Resultados esperados al terminar esta
sesión
R2: Plantea adecuadamente el
método y las herramientas a utilizar
alineados a los objetivos de la
investigación.
Bibliografía recomendada
• Levin, R. y Rubin, D. (2010). Cap. 7 y 8
¿Qué veremos?
• Un repaso de probabilidades
• La función de Distribución Normal y Distribución Normal
Estándar.
• Funciones de densidad
• Distribución Muestral: Estimación.
• Pruebas de Hipótesis: Definiciones (Hipótesis, hipótesis
nula, hipótesis alternativa, nivel de significancia, error tipo I
y tipo II)
• Procedimiento para la toma de decisiones empleando la
inferencia estadística
• Pruebas de Hipótesis de una muestra (Prueba a dos colas)
Repasemos el conocimiento
acumulado
• Estadística: conjunto de métodos enfocados a la obtención,
presentación y análisis de observaciones numéricas.
• Estadística descriptiva: tiene como fin de describir al conjunto
de datos obtenidos de manera resumida y organizada
• Estadística inferencial: se enfoca en la toma de decisiones o
realización de generalizaciones acerca de las características de
una población con base en información parcial o incompleta
(es decir, una muestra)
ACTIVIDAD RÁPIDA
Dado este comportamiento previo de la cotización del dólar del sistema bancario que provee el BCRP,
¿qué evento crees que es más probable? Fundamenta tu respuesta. ¿En qué te fijaste para dar la
respuesta?
3.15
3.2
3.25
3.3
3.35
3.4
3.45
3.5
3.55
3.6
02Ene20
06Ene20
08Ene20
10Ene20
14Ene20
16Ene20
20Ene20
22Ene20
24Ene20
28Ene20
30Ene20
03Feb20
05Feb20
07Feb20
11Feb20
13Feb20
17Feb20
19Feb20
21Feb20
25Feb20
27Feb20
02Mar20
04Mar20
06Mar20
10Mar20
12Mar20
16Mar20
18Mar20
20Mar20
24Mar20
26Mar20
30Mar20
01Abr20
03Abr20
07Abr20
13Abr20
15Abr20
17Abr20
21Abr20
23Abr20
27Abr20
29Abr20
04May20
06May20
¿Qué debemos considerar para
trabajar con la estadística inferencial?
• Que la realidad es una sucesión de eventos
aleatorios, en donde una variable o más
muestran algunos valores o categorías del
total que puede tener.
• Es decir, estos eventos suelen darse al azar,
por lo que nunca tendremos certeza de lo que
realmente ocurrirá en cuanto al valor de la
variable.
Pero…
• Pero, lo que sí podemos hacer, en
base a INFORMACIÓN PREVIA ( para
ello debemos ver cómo se comporta
la variable en base a la información
que sí proporcionó) asignar
probabilidades de ocurrencia para
cada uno de los valores
¿Y qué hacemos con las
probabilidades?
• Podemos establecer hipótesis de los posibles
valores y relaciones entre variables que pueden
darse en la población, y rechazarlas o no, en base
a la información que tenemos en la muestra.
• En otras palabras, podemos saber si los
resultados de una muestra (estadísticos) SON
FACTIBLES DE EXTRAPOLAR A LA POBLACIÓN
(parámetro), con un nivel de confianza y margen
de error determinado.
Recordemos lo que es una probabilidad
Los valores de
probabilidad se
expresen como
fracción o
decimales y
encuentran en una
escala de 0 a 1.
Valores cercanos a 0
indican que la
probabilidad de que
ocurra un evento son
muy pocas.
Valores cercanos a 1
indican que es casi
seguro que ocurra un
evento
Hay tres tipos de probabilidades, pero es importante conocer
LA PROBABILIDAD FRECUENCIA RELATIVA DE OCURRENCIA
•Hay probabilidades que no las podemos definir a priori, sin
que se realice algo de experimentación, sino que necesitamos
conocer sobre la frecuencia de ocurrencia de dichas
probabilidades
 La frecuencia relativa observada de un evento durante un gran
número de intentos, o,
 La fracción de veces que un evento se presenta a la larga,
cuando las condiciones son estables.
¿CÓMO SE CALCULA LA PROBABILIDAD FRECUENCIA RELATIVA DE
OCURRENCIA?
En otras palabras….
Se determina qué tan frecuentemente ha sucedido algo en el pasado y
se emplea esta cifra para predecir la probabilidad de ocurrencia de ese
evento en el futuro.
La frecuencia relativa se vuelve estable a medida que se eleva el numero
de experimentos realizados (en las mismas condiciones).
¡Checa!: https://media.giphy.com/media/l0Ex4ZhCqwy1Oqd8I/giphy.gif
 Variable Fija.- Porque su valor o realización es conocido.
 Variable Aleatoria.- Es un resumen numérico de un
resultado aleatorio (de un experimento).
Una variable es aleatoria porque su valor o realización es
incierto (no es conocido) hasta que el experimento se lleve a
cabo
Volvamos a una vieja conocida: VARIABLE
Es la característica cuantificable o cualificable de la muestra o población que se está
observando o analizando, puede tomar diferentes valores
VARIABLE ALEATORIA DISCRETA
Cuando el conjunto de realizaciones es finito o infinito pero numerable
 Ejemplos:
- Inspeccionar un envío
de 50 productos
- Vender un automóvil
- Número de productos
que tienen algún
defecto.
- Sexo del cliente
0, 1, 2, …, 50
0 si hombre, 1 si mujer.
Experimento V.A. (x) valores posibles
para x
VARIABLE ALEATORIA CONTINUA
 Ejemplos:
- Llenar una lata de refresco
(máx 12.5 onzas)
- Medir la contaminación de
un río a causa de una
mina.
- Cantidad de onzas
- Nivel tolerable de
contaminación del agua.
0≤ x ≤ 12.5
10≤ x≤ 30.
Experimento V.A. (x) valores posibles
para x
• Cuando el conjunto de realizaciones es infinitamente indivisible y, por lo tanto. no es
numerable
• La variable puede asumir cualquier valor dentro de un determinado intervalo o
colección de intervalos
 La distribución de probabilidad de una V.A. describe cómo se
distribuyen las probabilidades entre los valores de una V.A.  Es un
conjunto de los valores xi (resultados de un experimento) tomados de una
V.A. X y sus probabilidades o chances de ocurrencia asociadas.
DISTRIBUCIONES DE PROBABILIDAD
Son expresiones matemáticas que están regidas por las
leyes del azar y cumplen ciertas condiciones.
 En el caso de una V.A. discreta: La distribución de
probabilidad está definida por una Función de
probabilidad [f(x)], que da la probabilidad de cada valor
de una V.A.
DISTRIBUCIONES DE PROBABILIDAD DISCRETA
 Condiciones requeridas para una Función de
Probabilidad discreta:
f(x) ≥ 0
 f(x) = 1.
DISTRIBUCION DE PROBABILIDAD DISCRETA
f(x)
probabilidad
DISTRIBUCIÓN DE PROBABILIDAD CONTINUA
f(x) da la probabilidad de que la V.A. tome cualquier
valor dentro de un intervalo dado
Llamada también función de densidad de probabilidad o
ley de probabilidad de una variable aleatoria continua [f(x)],
para lo cual deberá cumplir las siguientes condiciones:
 f(x) ≥ 0  valor de x
 f(xi) dx = 1
DISTRIBUCIONES DE PROBABILIDAD CONTINUA
  1





dx
x
f i
x
a
f(x)
b
f(x)
La probabilidad es el área bajo la función de densidad de probab.
b
Prob[a X b] =  f(x)dx
a
Función de densidad
• Sea x el valor de una VA continua X, una
función real f, definida en un subconjunto de
valores reales, será función de densidad si:
R
,
0
)
( 

 D
x
todo
para
x
f
1
)
( 




dx
x
f
Funciones de distribución
DISTRIBUCIÓN NORMAL
DISTRIBUCIONES MUESTRALES
ESTIMACIÓN
DISTRIBUCIÓN
NORMAL
• Una VA X se dice que se distribuye
normalmente si su función de densidad está
definida por:








x
x
todo
para
e
x
f
x
:
,
2
1
)
(
2
2
2
)
(
2



 ¿cuántos parámetros tiene esta función?
Función de distribución: representación
gráfica
)
(x
f

   
 
x
Gauss
de
curva
Simétrica
Acampanada
Asintótica a x
Función de distribución normal: características
La probabilidad al lado derecho de la media poblacional es igual a
0.5
La probabilidad al lado izquierdo de la media poblacional es igual a
0.5
2
1
)
( 
 
X
P
2
1
)
( 
 
X
P
La VA X sigue una distribución de la siguiente manera
)
;
(
~ 2


N
X


)
(X
E 2
)
( 

X
V
En la distribución normal coinciden la media, la moda y la mediana
Función de distribución normal: importancia
• Muchas de las variables aleatorias que se definen a partir de las
observaciones se distribuyen normalmente.
• Muchas de las técnicas que se utilizan en la estadística aplicada se
encuentran basadas en la distribución normal.
• Existen otras variables aleatorias que se distribuyen
aproximadamente como la distribución normal.
• Existen otras distribuciones como la Poisson, binomial, t-student que
tienden a la distribución normal bajo determinadas circunstancias.
• En el empleo de la estadística inferencial, el empleo de ciertas
distribuciones se definen a partir de supuestos de normalidad como
la distribución chi-cuadrado, t-student y F
DISTRIBUCIÓN
NORMAL
estandarizada
Función normal estandarizada: definición
Si )
;
(
~ 2


N
X
La función de densidad de esta distribución es:




X
Z







z
z
todo
para
e
z
f
z
:
,
2
1
)
( 2
2

Estandarizar significa que cada valor de la variable x de un
proceso puede ser convertido en un valor z, el cual
depende de la Media y de la Desviación Estándar de la
distribución
Función de distribución estandarizada:
representación gráfica
)
(z
f
1
 0 1

z
Gauss
de
curva
Simétrica
Acampanada
Asintótica a x
Función de distribución normal estandarizada:
características
La probabilidad al lado derecho de la media poblacional es igual a
0.5
La probabilidad al lado izquierdo de la media poblacional es igual a
0.5
2
1
)
( 
 
Z
P
2
1
)
( 
 
Z
P
Si la VA Z sigue una distribución normal estándar de la siguiente
manera )
1
;
0
(
~ N
X 0
)
( 
Z
E 1
)
( 
Z
V
En la distribución normal estandarizada la media, la moda y la
mediana coinciden Y SON IGUALES A CERO
El área bajo la curva de Gauss de la función de densidad de la
distribución normal estandarizada es igual a uno 1
)
( 




dz
z
f
Función de distribución normal estandarizada :
utilidad
• Mediante el valor z se pueden comparar los
resultados de muchos procesos, aunque tengan
magnitudes diferentes.
• Podemos comparar si en una empresa las ventas
mensuales del producto A son mejores o peores
que las correspondientes al Producto B en el
mismo mes del año.
Función de distribución normal estandarizada :
ejemplos
Ejemplo 1: Si en la distribución de los pesos de los sacos de comida para
perros se encuentra que el promedio es 61.6 Kg y la DE es 3.1 Kg ¿Cuál sería el
valor z que corresponde a un saco que pesa 66.2 Kg?
El valor z no tiene medidas
Indica cuántas DE se separa el valor x observado del promedio
del proceso.
El peso del saco de 66.2 Kg es 1.94 DE mayor que el promedio
de todos los sacos
Interpretación
z = ( 66.2 - 61.6) / 3.1 = 1.94
Función de distribución: representación
gráfica
)
(x
f
61.6kg 61.6 𝑘𝑔 + 3.1 𝑘𝑔
x
Gauss
de
curva
Simétrica
Acampanada
Asintótica a x
61.6 𝑘𝑔 − 3.1 𝑘𝑔 66.2kg
Función de distribución estandarizada:
representación gráfica
)
(z
f
1
 0 1

z
Gauss
de
curva
Simétrica
Acampanada
Asintótica a x
1.94
Función de distribución normal estandarizada :
ejemplos
Ejemplo 2: Hallar los valores Z de las ventas mensuales (millones de soles) en
la Empresa D3 Inc en el mes de junio del 2010
Producto A: x (A) = 385 Promedio histórico= 374, DE = 8.4
Producto B: x (B)= 28.43 Promedio histórico= 27.16 , DE= 0.86
En junio del 2010, las ventas del Producto B han aumentado más
respecto a su promedio histórico que el aumento obtenido por el
Producto A respecto a su propio promedio histórico de ese mes.
Interpretación
Producto A: valor z(A) = ( 385 - 374 ) / 8.4 = 1.31
Producto B: valor z(B) = ( 28.43 -27.16) / 0.86 = 1.48
Tabla normal estandarizada
La distribución normal se caracteriza por ser una
distribución simétrica (los mismos valores hacia ambos
lados de la campana y las mismas probabilidades)
Para valores de z, encontrar el área comprendida debajo
de la curva de Gauss es equivalente a encontrar la
probabilidad asociada a los valores de Z
)
(
)
(
)
( 1
1
1
z
F
dz
z
z
Z
P
z


 


Tabla normal estandarizada: calentando
•¿A qué es igual el área que se encuentra por debajo de la campana
(y que representa la probabilidad de ocurrencia)?
•¿Qué pasaría si ahora sombreamos el lado izquierdo de la campana
y ya no el lado derecho? ¿Cómo se hallaría?
   
58
.
1
Prob
1
58
.
1
Prob 


 Z
Z
0 58
.
1
Preguntas
 
58
.
1
Prob
1 
 Z
Tabla normal estandarizada: calentando
•¿Hallar la probabilidad de que Z sea menor a -0.01 es equivalente
a hallar la probabilidad de que Z sea mayor que 0.01? ¿Cómo se
hallaría?
Preguntas
0
01
.
0
 0 01
.
0
)
01
.
0
Prob(Z 
  
01
.
0
Prob 
Z
)
01
.
0
Prob(Z
1 

)
01
.
0
Prob(Z
1
)
01
.
0
Prob(Z 




• ¿Sólo se cumple porque esta distribución es simétrica?
Estimación
)
(s
X
Xi 


I. Hallar valores de Z dado un
valor Xi:
II. Hallar Área en Porcentajes
(Tabla)
III. Hallar el rango percentil de un
valor Xi y/o un valor Z dado.
IV. Hallar los valores Xi dada un
Área.
s
X
Xi
Z


Variable Normalizada (recordando)
Aplicación I
a) Hallar las puntuaciones Z de las calificaciones 88 y 120
88 μ 120
- 0.75 y + 1.25
16
y
100 
 s
X
Aplicación II
%
89.44
25
.
1
16
100
-
120
Z 



22.66%
0.75
-
16
100
88





Z
a) ¿Qué porcentaje tiene calificaciones entre 88 y 120?
88 100 120
89.44 - 22.66 = 66.78%
%
94.06
1.56
16
100
125




Z
b) ¿Qué porcentaje de calificaciones está por debajo de 125?
100 125
c) ¿Qué porcentaje tiene calificaciones entre 123 y 135?
100 123 135
Dispersión en la distribución normal
-3s -2s -1s X 1s 2s 3s
Para distribuciones normales:
s
X
s
X 2
y
2 

b) El 95,45% de los casos están comprendidos entre:
a) El 68.26% de los casos están comprendidos entre:
s
X
s
X 3
y
3 

c) El 99,73% de los casos están comprendidos entre
s
X
s
X 
 y
Para distribuciones moderadamente asimétricas, los porcentajes
anteriores pueden mantenerse aproximados
X - 2 s X X + 2s
95,45%
X - 3 s X X + 3s
99,73%
Dispersión en la distribución normal
X - s X X + s
68,27%
Es un conjunto de técnicas que permiten
calcular un valor aproximado de
un parámetro (característica poblacional) a
partir de los datos proporcionados por una
muestra
Estimación
Estimaciones de Parámetros
Si se está interesado en estimar la media de la
población (µ), el método más obvio resultaría servirse
del propio valor muestral y tomarlo como su
estimador (recuerden el ejemplo del Esperado en la
sesión anterior).
En caso de que coincidan se tratará de una estimación
insesgada del parámetro. Este valor se reconoce
como punto estimado de la media poblacional.
Tipo de estimación 1: Estimación puntual
 Consiste en estimar el parámetro θ a partir de la
muestra obtenida
 Consiste en encontrar un determinado estadístico
que deberá de constituir una buena aproximación
del valor de un parámetro desconocido .
 Al estadístico se le denomina estimador del
parámetro desconocido .
En general, al punto estimado de cualquier parámetro (Pµ) se le
conoce como estimación puntual
Lo que ocurre: es muy improbable que un punto
estimado coincida con el parámetro específico.
Problema: la estimación puntual de un parámetro es
incorrecta desde el punto de vista de la variabilidad
de muestreo.
Solución: en lugar de estimar un valor puntual para µ
(Pµ), se estimará un rango de valores, llamado
intervalo, dentro del cual es probable que fluctúe el
verdadero parámetro
Tipo de estimación 1: Estimación puntual
• Consiste en estimar un rango de valores con una alta probabilidad
dada de cubrir el verdadero valor de la población, sobre todas las
muestras de tamaño n.
• A diferencia de la estimación puntual ,la estimación paramétrica
encuentra un intervalo que se denomina intervalo de confianza; esta
debe de contener al parámetro con una probabilidad dada
denominada nivel de confianza, basada en una muestra aleatoria y
el correspondiente estadístico
 
F
I L
L
I ,

)
1
( 
 Nivel de confianza
Intervalos y límites
  
 


 1
F
I L
L
P
Tipo de estimación 2: Estimación por intervalos
• Se usa el estadístico como punto de partida para
dar una estimación por intervalo alrededor de la
estimación muestral, dentro de ciertos márgenes
de confiabilidad.
• En la estimación de parámetros por intervalos de
confianza interviene como un poderoso
instrumento el valor del error estándar
Tipo de estimación 2: Estimación por intervalos
IC: Expresión gráfica
2

2

I
L F
L 
ˆ
)
ˆ
(
f


1

Cuando tenemos una muestra aleatoria se pueden calcular los límites
del intervalo y, posteriormente, podemos decir que se tiene un nivel de
confianza del
IC: Interpretación
)%
1
(
*
100 


de que el intervalo contenga al valor del parámetro desconocido
Otra forma de interpretar el intervalo de confianza es decir que de cada
cien intervalos aleatorios, noventa y cinco de ellos contendrán el
parámetro y cinco de ellos no lo contendrán.

En teoría, pueden calcularse estimaciones por intervalos para cualquier
nivel de probabilidad llamado “Nivel de Confianza”.
Sin embargo, son convencionales los niveles de 90%, 95% y 99% de
confianza, porque tienen mejores probabilidades de hacer una
estimación que incluya al valor poblacional.
EN RESUMEN, la estimación por intervalos es aquella que se
calcula dando dos límites (superior e inferior) y considerando
un cierto margen de error dado por la magnitud del error
estándar y un cierto nivel de confianza específico.
Tipo de estimación 2: Estimación por intervalos
La interpretación de un intervalo de confianza de 95% para un parámetro, es que se
encuentra en algún punto del intervalo calculado y que este enunciado se hace con
un coeficiente de confianza del 95%.
El parámetro es un valor único, fijo pero desconocido. Y que, son los intervalos los
que varían de una muestra a otra.
Un intervalo de confianza del 95% significa estimar el verdadero valor poblacional
sabiendo que 95 de cada 100 valores muestrales están dentro del intervalo de
estimación del parámetro.
Tipo de estimación 2: Estimación por intervalos
Estimación del Intervalo de Confianza para la Media (µ).
Tener como base la media muestral
Estimar el valor del error estándar de la media.
Decidir el nivel de confianza que deseamos. Esta decisión determina
los límites de confianza dentro de los que puede estar la media de la
población.
El intervalo de confianza viene dado por:
donde el valor de Zc depende del nivel de confianza que se desee y se obtiene a
partir de la tabla de áreas bajo la curva normal.
 
 
X Zc X n
X

 
Estimación del Intervalo de Confianza para la Media
Así como la media poblacional (µ) suele ser desconocida, rara vez se conoce la
desviación estándar real de la población (σ).
Asimismo, si se trata de muestras chicas (menores o iguales a 30 casos), se requiere
usar el estadístico T de Student, en lugar de Z, que usa a la desviación muestral (s)
como una estimación de sigma (σ):
Puede aparecer que la distribución t es muy similar a la distribución normal
estandarizada de puntajes Z.
Ambas distribuciones tienen forma simétrica. La diferencia está en que la
distribución t se extiende más en los extremos y se concentra menos en el centro en
comparación con la normal Z.
X
tc
X 
 

Estimación IC: Ejemplo
Suponga que la edad promedio de una muestra al azar de
100 estudiantes fue de 19.5 años con una desviación
estándar de 3.7 años. Como la muestra es grande se
puede asumir que la distribución de muestreo de la
media es normal.
La estimación de la media poblacional al 95% y al 99% de
confianza es:
Ejemplo
2252
.
20
7748
.
18
7252
.
0
5
.
19
100
7
.
3
96
.
1
5
.
19












 X
Zc
X n
X

 
Se tiene una probabilidad del 95% de que este intervalo
contenga el parámetro poblacional.
45275
.
20
54725
.
18
95275
.
0
5
.
19
100
7
.
3
575
.
2
5
.
19












 X
Zc
X n
X

 
Al 99%, lo que se gana en confianza se pierde en precisión
porque el intervalo se amplia.
Ejemplo
Pruebas de hipótesis
68
PRUEBA DE HIPÓTESIS DE
UNA MUESTRA
ACTIVIDAD DE DISCUSIÓN - ¿Qué necesitan
recordar para la prueba de hipótesis?
• Función de distribución: expresión funcional que resume el comportamiento de una
variable numérica (“la forma” de la distribución)
• Función de densidad y función de probabilidad: expresión funcional que asocia cada
valor de una variable con su probabilidad de ocurrencia (el área debajo de la forma de
la distribución)
• Hipótesis nula (siempre contiene la igualdad) e hipótesis alternativa (siempre contiene
la diferencia): ambas son mutuamente excluyentes
• El nivel de significancia: es la probabilidad de rechazar la Ho cuando es verdadera
(error tipo 1). ¿Con qué niveles de significancia se suelen trabajar?
• Las pruebas estadísticas (test estadísticos): es un valor ESTANDARIZADO que se usa
para confirmar si una hipótesis debe o no ser rechazada.
– Se suelen usar las pruebas t (cuando el n es pequeño y/o cuando la varianza de la población es
desconocida y Z (cuando n es mayor a 30 y/o cuando la varianza poblacional es conocida).
– Para una decisión más rápida, el criterio a usar es la probabilidad de ocurrencia para los valores t y
Z y contrastarla con el nivel de significancia.
– Deben cumplir la condición de tener una función de distribución normal. ¿Por qué?
Usemos la base de datos “Letras” para repasar
OBJETIVOS
70
 Definir una hipótesis y las pruebas de hipótesis
 Describir el procedimiento de una prueba de una
hipótesis en cinco pasos.
 Distinguir entre las pruebas de hipótesis de una
y de dos colas.
 Llevar a cabo una prueba de hipótesis para una media
poblacional.
 Llevar a cabo una prueba de hipótesis para una
proporción poblacional.
 Definir los errores tipo I y tipo II.
 Calcular la probabilidad de un error tipo II.
¿Qué es una Hipótesis?
71
Una Hipótesis es una declaración relativa a un
parámetro de la población sujeta a
verificación.
Ejemplos de hipótesis hechas acerca de un
parámetro de la población son:
– El salario mensual de los analistas en sistemas es de $3,625.
– Veinte por ciento de todos los clientes del Menú Rosita
regresan por otra comida dentro de un mes.
¿Qué es la prueba de hipótesis?
72
Probar una hipótesis es un
procedimiento basado en evidencia de la
muestra y la teoría de probabilidad para
determinar si la hipótesis es una afirmación
razonable y esta debería ser aceptada, o si
no es razonable y por tanto debería ser
rechazada.
Pasos Para Probar una Hipótesis
73
Se
establecen
las
hipótesis
nula y
alternativa
Se selecciona
un nivel de
significancia
Se identifica el
estadístico de
prueba
Se formula una
regla para tomar
decisiones
Se toma una
muestra; se llega
a una decisión.
Paso 1 Paso 2 Paso 3 Paso 4 Paso 5
No se
rechaza H0
o
se rechaza H0
y
“se acepta” H1
Detalles importantes a recordar acerca de H0 y H1
74
• H0: es la hipótesis nula y H1: es la hipótesis
alternativa.
• H0 y H1 son mutuamente excluyentes.
• H0 se dice que es cierta a menos que se
demuestre lo contrario.
• Se usa una muestra aleatoria (n) para “rechazar
a H0”
Detalles importantes a recordar acerca de H0 y H1
75
• El hecho de no rechazar una hipótesis no prueba
que H0 sea verdadera sino que no rechazamos H0.
 La hipótesis alternativa se “acepta” si la información de la
muestra ofrece evidencia estadística para rechazar la
hipótesis nula.
• La hipótesis nula H0 siempre incluirá el signo igual
(e.j. “=” , “≥” , “≤”).
• La hipótesis alternativa H1 no contiene el signo
igual y contendrá los siguientes símbolos“≠” “<” y
“>”
¿Cómo escoger una hipótesis a partir de un
problema?
• La hipótesis nula H0 representa el
estado actual reportado.
• La hipótesis alternativa se refiere al
hecho de que la afirmación no es
verdadera.
76
¿Cómo escoger una hipótesis a partir de un
problema?
• Cuando resuelva problemas, busque palabras
claves y conviértalas en símbolos. Algunas
palabras claves incluyen: “mejorado, mejor que,
tan efectivo como, diferente de, ha cambiado, no
es igual, es inferior, perderán, menos, aumentó,
es más alto, existe diferencia, es mayor que, es
menor que, es de, supera, se incremento,
discrepa, contradicen, una proporción mayor,
reducir, etc.”
77
Prueba de una cola o de dos colas (¿cómo saber
cuál usar?)
Palabras
Símbolo de
desigualdad
Parte
de:
Más grande (o más)
qué
> H1
Más pequeño (o
menor)
< H1
Ha incrementado > H1
No más que  H0
Cuando menos ≥ H0
¿Existe una
diferencia?
≠ H1
No ha cambiado = H0
78
• La dirección de la prueba que envuelve
enunciados que usan las palabras “ha
sido mejorado”, “es mejor que”,
dependerá de la variable que se este
midiendo
• Si la variable se refiere a la calificación
de una prueba, las palabras “mejor”
“mejorar” o “más efectivo” son traducidas
como “>” (más grande que, como
ejemplo, “las calificaciones más altas”)
Prueba de Una Cola vs. Prueba de
Dos Colas
79
Dos colas
Una cola, Prueba de una cola a la izquierda
Una cola, Prueba de una cola a la derecha
Tipos de Errores en la Prueba de Hipótesis
80
• Error Tipo I:
– Definida como la probabilidad de rechazar la
hipótesis nula cuando esta realmente es verdadera.
– Esta probabilidad es denotada por la siguiente letra
griega “”
– Es también conocida como nivel de
significancia.
• Error Tipo II :
– Definida como la probabilidad de aceptar la
hipótesis nula cuando esta realmente es falsa
– Esta probabilidad se denota por la letra griega “β”
81
ELEMENTOS PARA EL TEST
DE HIPÓTESIS
82
Tipo de Errores
83
Tipo de Errores
Investigador
Hipótesis
Nula
H0 es verdadera
H0 es falsa
No se rechaza H0 Se rechaza
H0
Decisión
Correcta
Decisión
Correcta
Error
Tipo I
Error
Tipo II
Partes de la Distribución en la Prueba de Hipótesis
84
¿Valor crítico?
• La selección de un valor crítico está ligado a
la selección de un nivel de significancia
• Pero, ¡¿qué es el nivel de
significancia?!
El nivel de significancia vendría a ser el riesgo
que corremos al rechazar una hipótesis nula
cuando es cierta
85
¿Valor crítico?
• Entonces, ¿me conviene trabajar con niveles
de confianza bajos? ¿Qué tan bajo o alto?
Sífilis, conviene trabajar con niveles bajos. Por
convencionalidad se trabaja con niveles de 1%, 5% o
10% como máximo
Recuerden a Levin y Rubin, hijos míos:
“Cuanto más alto sea el nivel de significancia que utilizamos
para probar una hipótesis, mayor será la probabilidad de
rechazar la hipótesis nula cuando es cierta.”
86
¿Valor crítico?
• Entonces, ¿es solo trabajar con
valores asociados a los niveles de 1%,
5% o 10% ?
Nopo, primero tienes que buscar en la tabla z los valores
asociados a los niveles con los que trabajarás y luego seguir
las reglas de decición del ppt que sigue
87
Pruebas para la media de una población ()
88

Más contenido relacionado

Similar a MIC_Unidad 4 - Sesión 6 (1).pptx

Manual práctico de quimiometría 2011 v2
Manual práctico de quimiometría 2011 v2Manual práctico de quimiometría 2011 v2
Manual práctico de quimiometría 2011 v2Germán Tortosa
 
Estimar con estadística v1
Estimar con estadística v1Estimar con estadística v1
Estimar con estadística v1Xavi Barber
 
Trabajo: Selección de muestras
Trabajo: Selección de muestrasTrabajo: Selección de muestras
Trabajo: Selección de muestrasWilarRivera
 
Estadistica basica I .doc
Estadistica basica I .docEstadistica basica I .doc
Estadistica basica I .docguestbf8866d8
 
Estadistica basica Ijhvc
Estadistica basica IjhvcEstadistica basica Ijhvc
Estadistica basica Ijhvcguestbf8866d8
 
Métodos cuantitativos_2020_2 (2).pptx
Métodos cuantitativos_2020_2 (2).pptxMétodos cuantitativos_2020_2 (2).pptx
Métodos cuantitativos_2020_2 (2).pptxLaalpacaARoxhzeeraFl
 
Hipotesis estadistica
Hipotesis estadisticaHipotesis estadistica
Hipotesis estadisticaerix ruiz
 
Unidad 3.5 población y muestra
Unidad 3.5 población y muestraUnidad 3.5 población y muestra
Unidad 3.5 población y muestraJessica Ferreira
 
MARCO METODOLOGICO.pptx
MARCO METODOLOGICO.pptxMARCO METODOLOGICO.pptx
MARCO METODOLOGICO.pptxssuser74cd56
 
Estadística-Inferencial.ppt
Estadística-Inferencial.pptEstadística-Inferencial.ppt
Estadística-Inferencial.pptJulioVargas19409
 
Estadística-Inferencial INGENIERIA IND.ppt
Estadística-Inferencial INGENIERIA IND.pptEstadística-Inferencial INGENIERIA IND.ppt
Estadística-Inferencial INGENIERIA IND.ppterick492359
 
Estadidtica descriptiva graficos
Estadidtica descriptiva graficos Estadidtica descriptiva graficos
Estadidtica descriptiva graficos Paula Diaz
 
Curso metodologia de la investigacion
Curso metodologia de la investigacionCurso metodologia de la investigacion
Curso metodologia de la investigacionirenashh
 
Semana 1 Conceptos Básicos y Muestreo.pptx
Semana 1 Conceptos Básicos y Muestreo.pptxSemana 1 Conceptos Básicos y Muestreo.pptx
Semana 1 Conceptos Básicos y Muestreo.pptxsonic72
 

Similar a MIC_Unidad 4 - Sesión 6 (1).pptx (20)

Manual práctico de quimiometría 2011 v2
Manual práctico de quimiometría 2011 v2Manual práctico de quimiometría 2011 v2
Manual práctico de quimiometría 2011 v2
 
Estimar con estadística v1
Estimar con estadística v1Estimar con estadística v1
Estimar con estadística v1
 
Trabajo: Selección de muestras
Trabajo: Selección de muestrasTrabajo: Selección de muestras
Trabajo: Selección de muestras
 
Estadistica basica I .doc
Estadistica basica I .docEstadistica basica I .doc
Estadistica basica I .doc
 
Estadistica basica Ijhvc
Estadistica basica IjhvcEstadistica basica Ijhvc
Estadistica basica Ijhvc
 
Métodos cuantitativos_2020_2 (2).pptx
Métodos cuantitativos_2020_2 (2).pptxMétodos cuantitativos_2020_2 (2).pptx
Métodos cuantitativos_2020_2 (2).pptx
 
Clase01 conceptos generales
Clase01   conceptos generalesClase01   conceptos generales
Clase01 conceptos generales
 
Hipotesis estadistica
Hipotesis estadisticaHipotesis estadistica
Hipotesis estadistica
 
Pruebas de hipótesis e inferencia estadística
Pruebas de hipótesis e inferencia estadísticaPruebas de hipótesis e inferencia estadística
Pruebas de hipótesis e inferencia estadística
 
Unidad 3.5 población y muestra
Unidad 3.5 población y muestraUnidad 3.5 población y muestra
Unidad 3.5 población y muestra
 
Inferencia tema4
Inferencia tema4Inferencia tema4
Inferencia tema4
 
MARCO METODOLOGICO.pptx
MARCO METODOLOGICO.pptxMARCO METODOLOGICO.pptx
MARCO METODOLOGICO.pptx
 
Estadística-Inferencial.ppt
Estadística-Inferencial.pptEstadística-Inferencial.ppt
Estadística-Inferencial.ppt
 
Estadística-Inferencial INGENIERIA IND.ppt
Estadística-Inferencial INGENIERIA IND.pptEstadística-Inferencial INGENIERIA IND.ppt
Estadística-Inferencial INGENIERIA IND.ppt
 
Estadidtica descriptiva graficos
Estadidtica descriptiva graficos Estadidtica descriptiva graficos
Estadidtica descriptiva graficos
 
Pruebas hipotesis 1_pob2
Pruebas hipotesis 1_pob2Pruebas hipotesis 1_pob2
Pruebas hipotesis 1_pob2
 
CRITERIOS DE SELECCIÓN DE LA MUESTRA.pptx
CRITERIOS DE SELECCIÓN DE LA MUESTRA.pptxCRITERIOS DE SELECCIÓN DE LA MUESTRA.pptx
CRITERIOS DE SELECCIÓN DE LA MUESTRA.pptx
 
Curso metodologia de la investigacion
Curso metodologia de la investigacionCurso metodologia de la investigacion
Curso metodologia de la investigacion
 
Semana 1 Conceptos Básicos y Muestreo.pptx
Semana 1 Conceptos Básicos y Muestreo.pptxSemana 1 Conceptos Básicos y Muestreo.pptx
Semana 1 Conceptos Básicos y Muestreo.pptx
 
Análisis de datosdsdsa
Análisis de datosdsdsaAnálisis de datosdsdsa
Análisis de datosdsdsa
 

Último

PPT DIAGNOSTICO DAFO Y CAME MEGAPUERTO CHANCAY
PPT DIAGNOSTICO DAFO Y CAME MEGAPUERTO CHANCAYPPT DIAGNOSTICO DAFO Y CAME MEGAPUERTO CHANCAY
PPT DIAGNOSTICO DAFO Y CAME MEGAPUERTO CHANCAYCarlosAlbertoVillafu3
 
CULTURA EN LA NEGOCIACIÓN CONCEPTOS Y DEFINICIONES
CULTURA EN LA NEGOCIACIÓN CONCEPTOS Y DEFINICIONESCULTURA EN LA NEGOCIACIÓN CONCEPTOS Y DEFINICIONES
CULTURA EN LA NEGOCIACIÓN CONCEPTOS Y DEFINICIONESMarielaAldanaMoscoso
 
Clima-laboral-estrategias-de-medicion-e-book-1.pdf
Clima-laboral-estrategias-de-medicion-e-book-1.pdfClima-laboral-estrategias-de-medicion-e-book-1.pdf
Clima-laboral-estrategias-de-medicion-e-book-1.pdfConstructiva
 
ANÁLISIS CAME, DIAGNOSTICO PUERTO DEL CALLAO
ANÁLISIS CAME, DIAGNOSTICO  PUERTO DEL CALLAOANÁLISIS CAME, DIAGNOSTICO  PUERTO DEL CALLAO
ANÁLISIS CAME, DIAGNOSTICO PUERTO DEL CALLAOCarlosAlbertoVillafu3
 
ISO 45001-2018.pdf norma internacional para la estandarización
ISO 45001-2018.pdf norma internacional para la estandarizaciónISO 45001-2018.pdf norma internacional para la estandarización
ISO 45001-2018.pdf norma internacional para la estandarizaciónjesuscub33
 
LIC-ZIEGLER-Planificación y Control de Gestión
LIC-ZIEGLER-Planificación y Control de GestiónLIC-ZIEGLER-Planificación y Control de Gestión
LIC-ZIEGLER-Planificación y Control de GestiónBahamondesOscar
 
Clase 2 Ecosistema Emprendedor en Chile.
Clase 2 Ecosistema Emprendedor en Chile.Clase 2 Ecosistema Emprendedor en Chile.
Clase 2 Ecosistema Emprendedor en Chile.Gonzalo Morales Esparza
 
TIPOS DE PLANES administracion una perspectiva global - KOONTZ.pptx
TIPOS DE PLANES administracion una perspectiva global - KOONTZ.pptxTIPOS DE PLANES administracion una perspectiva global - KOONTZ.pptx
TIPOS DE PLANES administracion una perspectiva global - KOONTZ.pptxKevinHeredia14
 
instrumentos de mercados financieros para estudiantes
instrumentos de mercados financieros  para estudiantesinstrumentos de mercados financieros  para estudiantes
instrumentos de mercados financieros para estudiantessuperamigo2014
 
Buenas Practicas de Almacenamiento en droguerias
Buenas Practicas de Almacenamiento en drogueriasBuenas Practicas de Almacenamiento en droguerias
Buenas Practicas de Almacenamiento en drogueriasmaicholfc
 
gua de docente para el curso de finanzas
gua de docente para el curso de finanzasgua de docente para el curso de finanzas
gua de docente para el curso de finanzassuperamigo2014
 
Presentación Final Riesgo de Crédito.pptx
Presentación Final Riesgo de Crédito.pptxPresentación Final Riesgo de Crédito.pptx
Presentación Final Riesgo de Crédito.pptxIvnAndres5
 
MARKETING SENSORIAL -GABRIELA ARDON .pptx
MARKETING SENSORIAL -GABRIELA ARDON .pptxMARKETING SENSORIAL -GABRIELA ARDON .pptx
MARKETING SENSORIAL -GABRIELA ARDON .pptxgabyardon485
 
Presentacion III ACTIVIDADES DE CONTROL. IV UNIDAD..pdf
Presentacion III ACTIVIDADES DE CONTROL. IV UNIDAD..pdfPresentacion III ACTIVIDADES DE CONTROL. IV UNIDAD..pdf
Presentacion III ACTIVIDADES DE CONTROL. IV UNIDAD..pdfLuisAlbertoAlvaradoF2
 
DELITOS CONTRA LA GESTION PUBLICA PPT.pdf
DELITOS CONTRA LA GESTION PUBLICA PPT.pdfDELITOS CONTRA LA GESTION PUBLICA PPT.pdf
DELITOS CONTRA LA GESTION PUBLICA PPT.pdfJaquelinRamos6
 
EGLA CORP - Honduras Abril 27 , 2024.pptx
EGLA CORP - Honduras Abril 27 , 2024.pptxEGLA CORP - Honduras Abril 27 , 2024.pptx
EGLA CORP - Honduras Abril 27 , 2024.pptxDr. Edwin Hernandez
 
Gestion de rendicion de cuentas viaticos.pptx
Gestion de rendicion de cuentas viaticos.pptxGestion de rendicion de cuentas viaticos.pptx
Gestion de rendicion de cuentas viaticos.pptxignaciomiguel162
 
Contabilidad universitaria Septima edición de MCGrawsHill
Contabilidad universitaria Septima edición de MCGrawsHillContabilidad universitaria Septima edición de MCGrawsHill
Contabilidad universitaria Septima edición de MCGrawsHilldanilojaviersantiago
 
modulo+penal+del+16+al+20+hhggde+enero.pdf
modulo+penal+del+16+al+20+hhggde+enero.pdfmodulo+penal+del+16+al+20+hhggde+enero.pdf
modulo+penal+del+16+al+20+hhggde+enero.pdfmisssusanalrescate01
 

Último (20)

PPT DIAGNOSTICO DAFO Y CAME MEGAPUERTO CHANCAY
PPT DIAGNOSTICO DAFO Y CAME MEGAPUERTO CHANCAYPPT DIAGNOSTICO DAFO Y CAME MEGAPUERTO CHANCAY
PPT DIAGNOSTICO DAFO Y CAME MEGAPUERTO CHANCAY
 
CULTURA EN LA NEGOCIACIÓN CONCEPTOS Y DEFINICIONES
CULTURA EN LA NEGOCIACIÓN CONCEPTOS Y DEFINICIONESCULTURA EN LA NEGOCIACIÓN CONCEPTOS Y DEFINICIONES
CULTURA EN LA NEGOCIACIÓN CONCEPTOS Y DEFINICIONES
 
Tarea-4-Estadistica-Descriptiva-Materia.ppt
Tarea-4-Estadistica-Descriptiva-Materia.pptTarea-4-Estadistica-Descriptiva-Materia.ppt
Tarea-4-Estadistica-Descriptiva-Materia.ppt
 
Clima-laboral-estrategias-de-medicion-e-book-1.pdf
Clima-laboral-estrategias-de-medicion-e-book-1.pdfClima-laboral-estrategias-de-medicion-e-book-1.pdf
Clima-laboral-estrategias-de-medicion-e-book-1.pdf
 
ANÁLISIS CAME, DIAGNOSTICO PUERTO DEL CALLAO
ANÁLISIS CAME, DIAGNOSTICO  PUERTO DEL CALLAOANÁLISIS CAME, DIAGNOSTICO  PUERTO DEL CALLAO
ANÁLISIS CAME, DIAGNOSTICO PUERTO DEL CALLAO
 
ISO 45001-2018.pdf norma internacional para la estandarización
ISO 45001-2018.pdf norma internacional para la estandarizaciónISO 45001-2018.pdf norma internacional para la estandarización
ISO 45001-2018.pdf norma internacional para la estandarización
 
LIC-ZIEGLER-Planificación y Control de Gestión
LIC-ZIEGLER-Planificación y Control de GestiónLIC-ZIEGLER-Planificación y Control de Gestión
LIC-ZIEGLER-Planificación y Control de Gestión
 
Clase 2 Ecosistema Emprendedor en Chile.
Clase 2 Ecosistema Emprendedor en Chile.Clase 2 Ecosistema Emprendedor en Chile.
Clase 2 Ecosistema Emprendedor en Chile.
 
TIPOS DE PLANES administracion una perspectiva global - KOONTZ.pptx
TIPOS DE PLANES administracion una perspectiva global - KOONTZ.pptxTIPOS DE PLANES administracion una perspectiva global - KOONTZ.pptx
TIPOS DE PLANES administracion una perspectiva global - KOONTZ.pptx
 
instrumentos de mercados financieros para estudiantes
instrumentos de mercados financieros  para estudiantesinstrumentos de mercados financieros  para estudiantes
instrumentos de mercados financieros para estudiantes
 
Buenas Practicas de Almacenamiento en droguerias
Buenas Practicas de Almacenamiento en drogueriasBuenas Practicas de Almacenamiento en droguerias
Buenas Practicas de Almacenamiento en droguerias
 
gua de docente para el curso de finanzas
gua de docente para el curso de finanzasgua de docente para el curso de finanzas
gua de docente para el curso de finanzas
 
Presentación Final Riesgo de Crédito.pptx
Presentación Final Riesgo de Crédito.pptxPresentación Final Riesgo de Crédito.pptx
Presentación Final Riesgo de Crédito.pptx
 
MARKETING SENSORIAL -GABRIELA ARDON .pptx
MARKETING SENSORIAL -GABRIELA ARDON .pptxMARKETING SENSORIAL -GABRIELA ARDON .pptx
MARKETING SENSORIAL -GABRIELA ARDON .pptx
 
Presentacion III ACTIVIDADES DE CONTROL. IV UNIDAD..pdf
Presentacion III ACTIVIDADES DE CONTROL. IV UNIDAD..pdfPresentacion III ACTIVIDADES DE CONTROL. IV UNIDAD..pdf
Presentacion III ACTIVIDADES DE CONTROL. IV UNIDAD..pdf
 
DELITOS CONTRA LA GESTION PUBLICA PPT.pdf
DELITOS CONTRA LA GESTION PUBLICA PPT.pdfDELITOS CONTRA LA GESTION PUBLICA PPT.pdf
DELITOS CONTRA LA GESTION PUBLICA PPT.pdf
 
EGLA CORP - Honduras Abril 27 , 2024.pptx
EGLA CORP - Honduras Abril 27 , 2024.pptxEGLA CORP - Honduras Abril 27 , 2024.pptx
EGLA CORP - Honduras Abril 27 , 2024.pptx
 
Gestion de rendicion de cuentas viaticos.pptx
Gestion de rendicion de cuentas viaticos.pptxGestion de rendicion de cuentas viaticos.pptx
Gestion de rendicion de cuentas viaticos.pptx
 
Contabilidad universitaria Septima edición de MCGrawsHill
Contabilidad universitaria Septima edición de MCGrawsHillContabilidad universitaria Septima edición de MCGrawsHill
Contabilidad universitaria Septima edición de MCGrawsHill
 
modulo+penal+del+16+al+20+hhggde+enero.pdf
modulo+penal+del+16+al+20+hhggde+enero.pdfmodulo+penal+del+16+al+20+hhggde+enero.pdf
modulo+penal+del+16+al+20+hhggde+enero.pdf
 

MIC_Unidad 4 - Sesión 6 (1).pptx

  • 1. Métodos de Investigación Cuantitativa Tema HERRAMIENTAS DE ESTADÍSTICA INFERENCIAL PARA EL ANÁLISIS DE DATOS
  • 2. ¿Qué hemos visto hasta hoy? MÉTODOS DE INVESTIGACIÓN, USOS E IMPORTANCIA Cuanti Cuali Variable Si no varía, no es variable ¿Cómo obtener información de nuestra(s) variable(s)? ¿De quién obtener información de nuestra(s) variable(s)? MUESTREO Información obtenida (base de datos) ¿Qué hacer con ella? Estadística descriptiva ¿Los resultados organizados y presentados en la ED permiten SIEMPRE generalizar hacia la población? Estadística inferencial Y, ¿de qué me valgo para saberlo?
  • 3. Cruzando el puente… Unidad 3: Herramientas de estadística descriptiva para el análisis de datos Resultados de aprendizaje específicos: R2: Plantea adecuadamente el método y las herramientas a utilizar alineados a los objetivos de la investigación. Contenidos: 1. Estadísticos resúmenes: Medidas de tendencia central, medidas de variabilidad y medidas de posición no central. 2. Distribuciones de frecuencia. 3. Representaciones gráficas. Unidad 4: Herramientas de estadística inferencial para el análisis de datos Resultados de aprendizaje específicos: R2: Plantea adecuadamente el método y las herramientas a utilizar alineados a los objetivos de la investigación. Contenidos: 1. Distribución Muestral: Estimación. 2. Pruebas de Hipótesis: Pruebas de una muestra, pruebas de dos muestras, pruebas de más de dos muestras.
  • 4. Puntos a tratar en esta unidad • Distribución Muestral: Estimación. • Pruebas de Hipótesis: Pruebas de una muestra, pruebas de dos muestras, pruebas de más de dos muestras.
  • 5. Puntos a tratar en esta sesión • La función de Distribución Normal y Distribución Normal Standard. • Distribución Muestral: Estimación. • Pruebas de Hipótesis: Definiciones (Hipótesis, hipótesis nula, hipótesis alternativa, nivel de significancia, error tipo I y tipo II) • Procedimiento para la toma de decisiones empleando la inferencia estadística • Pruebas de Hipótesis de una muestra (Prueba a dos colas)
  • 6. Resultados esperados al terminar esta sesión R2: Plantea adecuadamente el método y las herramientas a utilizar alineados a los objetivos de la investigación.
  • 7. Bibliografía recomendada • Levin, R. y Rubin, D. (2010). Cap. 7 y 8
  • 8. ¿Qué veremos? • Un repaso de probabilidades • La función de Distribución Normal y Distribución Normal Estándar. • Funciones de densidad • Distribución Muestral: Estimación. • Pruebas de Hipótesis: Definiciones (Hipótesis, hipótesis nula, hipótesis alternativa, nivel de significancia, error tipo I y tipo II) • Procedimiento para la toma de decisiones empleando la inferencia estadística • Pruebas de Hipótesis de una muestra (Prueba a dos colas)
  • 9. Repasemos el conocimiento acumulado • Estadística: conjunto de métodos enfocados a la obtención, presentación y análisis de observaciones numéricas. • Estadística descriptiva: tiene como fin de describir al conjunto de datos obtenidos de manera resumida y organizada • Estadística inferencial: se enfoca en la toma de decisiones o realización de generalizaciones acerca de las características de una población con base en información parcial o incompleta (es decir, una muestra)
  • 10. ACTIVIDAD RÁPIDA Dado este comportamiento previo de la cotización del dólar del sistema bancario que provee el BCRP, ¿qué evento crees que es más probable? Fundamenta tu respuesta. ¿En qué te fijaste para dar la respuesta? 3.15 3.2 3.25 3.3 3.35 3.4 3.45 3.5 3.55 3.6 02Ene20 06Ene20 08Ene20 10Ene20 14Ene20 16Ene20 20Ene20 22Ene20 24Ene20 28Ene20 30Ene20 03Feb20 05Feb20 07Feb20 11Feb20 13Feb20 17Feb20 19Feb20 21Feb20 25Feb20 27Feb20 02Mar20 04Mar20 06Mar20 10Mar20 12Mar20 16Mar20 18Mar20 20Mar20 24Mar20 26Mar20 30Mar20 01Abr20 03Abr20 07Abr20 13Abr20 15Abr20 17Abr20 21Abr20 23Abr20 27Abr20 29Abr20 04May20 06May20
  • 11. ¿Qué debemos considerar para trabajar con la estadística inferencial? • Que la realidad es una sucesión de eventos aleatorios, en donde una variable o más muestran algunos valores o categorías del total que puede tener. • Es decir, estos eventos suelen darse al azar, por lo que nunca tendremos certeza de lo que realmente ocurrirá en cuanto al valor de la variable.
  • 12. Pero… • Pero, lo que sí podemos hacer, en base a INFORMACIÓN PREVIA ( para ello debemos ver cómo se comporta la variable en base a la información que sí proporcionó) asignar probabilidades de ocurrencia para cada uno de los valores
  • 13. ¿Y qué hacemos con las probabilidades? • Podemos establecer hipótesis de los posibles valores y relaciones entre variables que pueden darse en la población, y rechazarlas o no, en base a la información que tenemos en la muestra. • En otras palabras, podemos saber si los resultados de una muestra (estadísticos) SON FACTIBLES DE EXTRAPOLAR A LA POBLACIÓN (parámetro), con un nivel de confianza y margen de error determinado.
  • 14. Recordemos lo que es una probabilidad Los valores de probabilidad se expresen como fracción o decimales y encuentran en una escala de 0 a 1. Valores cercanos a 0 indican que la probabilidad de que ocurra un evento son muy pocas. Valores cercanos a 1 indican que es casi seguro que ocurra un evento
  • 15. Hay tres tipos de probabilidades, pero es importante conocer LA PROBABILIDAD FRECUENCIA RELATIVA DE OCURRENCIA •Hay probabilidades que no las podemos definir a priori, sin que se realice algo de experimentación, sino que necesitamos conocer sobre la frecuencia de ocurrencia de dichas probabilidades
  • 16.  La frecuencia relativa observada de un evento durante un gran número de intentos, o,  La fracción de veces que un evento se presenta a la larga, cuando las condiciones son estables. ¿CÓMO SE CALCULA LA PROBABILIDAD FRECUENCIA RELATIVA DE OCURRENCIA? En otras palabras…. Se determina qué tan frecuentemente ha sucedido algo en el pasado y se emplea esta cifra para predecir la probabilidad de ocurrencia de ese evento en el futuro. La frecuencia relativa se vuelve estable a medida que se eleva el numero de experimentos realizados (en las mismas condiciones). ¡Checa!: https://media.giphy.com/media/l0Ex4ZhCqwy1Oqd8I/giphy.gif
  • 17.  Variable Fija.- Porque su valor o realización es conocido.  Variable Aleatoria.- Es un resumen numérico de un resultado aleatorio (de un experimento). Una variable es aleatoria porque su valor o realización es incierto (no es conocido) hasta que el experimento se lleve a cabo Volvamos a una vieja conocida: VARIABLE Es la característica cuantificable o cualificable de la muestra o población que se está observando o analizando, puede tomar diferentes valores
  • 18. VARIABLE ALEATORIA DISCRETA Cuando el conjunto de realizaciones es finito o infinito pero numerable  Ejemplos: - Inspeccionar un envío de 50 productos - Vender un automóvil - Número de productos que tienen algún defecto. - Sexo del cliente 0, 1, 2, …, 50 0 si hombre, 1 si mujer. Experimento V.A. (x) valores posibles para x
  • 19. VARIABLE ALEATORIA CONTINUA  Ejemplos: - Llenar una lata de refresco (máx 12.5 onzas) - Medir la contaminación de un río a causa de una mina. - Cantidad de onzas - Nivel tolerable de contaminación del agua. 0≤ x ≤ 12.5 10≤ x≤ 30. Experimento V.A. (x) valores posibles para x • Cuando el conjunto de realizaciones es infinitamente indivisible y, por lo tanto. no es numerable • La variable puede asumir cualquier valor dentro de un determinado intervalo o colección de intervalos
  • 20.  La distribución de probabilidad de una V.A. describe cómo se distribuyen las probabilidades entre los valores de una V.A.  Es un conjunto de los valores xi (resultados de un experimento) tomados de una V.A. X y sus probabilidades o chances de ocurrencia asociadas. DISTRIBUCIONES DE PROBABILIDAD Son expresiones matemáticas que están regidas por las leyes del azar y cumplen ciertas condiciones.
  • 21.  En el caso de una V.A. discreta: La distribución de probabilidad está definida por una Función de probabilidad [f(x)], que da la probabilidad de cada valor de una V.A. DISTRIBUCIONES DE PROBABILIDAD DISCRETA  Condiciones requeridas para una Función de Probabilidad discreta: f(x) ≥ 0  f(x) = 1.
  • 22. DISTRIBUCION DE PROBABILIDAD DISCRETA f(x) probabilidad
  • 23. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA f(x) da la probabilidad de que la V.A. tome cualquier valor dentro de un intervalo dado
  • 24. Llamada también función de densidad de probabilidad o ley de probabilidad de una variable aleatoria continua [f(x)], para lo cual deberá cumplir las siguientes condiciones:  f(x) ≥ 0  valor de x  f(xi) dx = 1 DISTRIBUCIONES DE PROBABILIDAD CONTINUA   1      dx x f i x a f(x) b f(x) La probabilidad es el área bajo la función de densidad de probab. b Prob[a X b] =  f(x)dx a
  • 25. Función de densidad • Sea x el valor de una VA continua X, una función real f, definida en un subconjunto de valores reales, será función de densidad si: R , 0 ) (    D x todo para x f 1 ) (      dx x f
  • 26. Funciones de distribución DISTRIBUCIÓN NORMAL DISTRIBUCIONES MUESTRALES ESTIMACIÓN
  • 28. • Una VA X se dice que se distribuye normalmente si su función de densidad está definida por:         x x todo para e x f x : , 2 1 ) ( 2 2 2 ) ( 2     ¿cuántos parámetros tiene esta función?
  • 29. Función de distribución: representación gráfica ) (x f        x Gauss de curva Simétrica Acampanada Asintótica a x
  • 30. Función de distribución normal: características La probabilidad al lado derecho de la media poblacional es igual a 0.5 La probabilidad al lado izquierdo de la media poblacional es igual a 0.5 2 1 ) (    X P 2 1 ) (    X P La VA X sigue una distribución de la siguiente manera ) ; ( ~ 2   N X   ) (X E 2 ) (   X V En la distribución normal coinciden la media, la moda y la mediana
  • 31. Función de distribución normal: importancia • Muchas de las variables aleatorias que se definen a partir de las observaciones se distribuyen normalmente. • Muchas de las técnicas que se utilizan en la estadística aplicada se encuentran basadas en la distribución normal. • Existen otras variables aleatorias que se distribuyen aproximadamente como la distribución normal. • Existen otras distribuciones como la Poisson, binomial, t-student que tienden a la distribución normal bajo determinadas circunstancias. • En el empleo de la estadística inferencial, el empleo de ciertas distribuciones se definen a partir de supuestos de normalidad como la distribución chi-cuadrado, t-student y F
  • 33. Función normal estandarizada: definición Si ) ; ( ~ 2   N X La función de densidad de esta distribución es:     X Z        z z todo para e z f z : , 2 1 ) ( 2 2  Estandarizar significa que cada valor de la variable x de un proceso puede ser convertido en un valor z, el cual depende de la Media y de la Desviación Estándar de la distribución
  • 34. Función de distribución estandarizada: representación gráfica ) (z f 1  0 1  z Gauss de curva Simétrica Acampanada Asintótica a x
  • 35. Función de distribución normal estandarizada: características La probabilidad al lado derecho de la media poblacional es igual a 0.5 La probabilidad al lado izquierdo de la media poblacional es igual a 0.5 2 1 ) (    Z P 2 1 ) (    Z P Si la VA Z sigue una distribución normal estándar de la siguiente manera ) 1 ; 0 ( ~ N X 0 ) (  Z E 1 ) (  Z V En la distribución normal estandarizada la media, la moda y la mediana coinciden Y SON IGUALES A CERO El área bajo la curva de Gauss de la función de densidad de la distribución normal estandarizada es igual a uno 1 ) (      dz z f
  • 36. Función de distribución normal estandarizada : utilidad • Mediante el valor z se pueden comparar los resultados de muchos procesos, aunque tengan magnitudes diferentes. • Podemos comparar si en una empresa las ventas mensuales del producto A son mejores o peores que las correspondientes al Producto B en el mismo mes del año.
  • 37. Función de distribución normal estandarizada : ejemplos Ejemplo 1: Si en la distribución de los pesos de los sacos de comida para perros se encuentra que el promedio es 61.6 Kg y la DE es 3.1 Kg ¿Cuál sería el valor z que corresponde a un saco que pesa 66.2 Kg? El valor z no tiene medidas Indica cuántas DE se separa el valor x observado del promedio del proceso. El peso del saco de 66.2 Kg es 1.94 DE mayor que el promedio de todos los sacos Interpretación z = ( 66.2 - 61.6) / 3.1 = 1.94
  • 38. Función de distribución: representación gráfica ) (x f 61.6kg 61.6 𝑘𝑔 + 3.1 𝑘𝑔 x Gauss de curva Simétrica Acampanada Asintótica a x 61.6 𝑘𝑔 − 3.1 𝑘𝑔 66.2kg
  • 39. Función de distribución estandarizada: representación gráfica ) (z f 1  0 1  z Gauss de curva Simétrica Acampanada Asintótica a x 1.94
  • 40. Función de distribución normal estandarizada : ejemplos Ejemplo 2: Hallar los valores Z de las ventas mensuales (millones de soles) en la Empresa D3 Inc en el mes de junio del 2010 Producto A: x (A) = 385 Promedio histórico= 374, DE = 8.4 Producto B: x (B)= 28.43 Promedio histórico= 27.16 , DE= 0.86 En junio del 2010, las ventas del Producto B han aumentado más respecto a su promedio histórico que el aumento obtenido por el Producto A respecto a su propio promedio histórico de ese mes. Interpretación Producto A: valor z(A) = ( 385 - 374 ) / 8.4 = 1.31 Producto B: valor z(B) = ( 28.43 -27.16) / 0.86 = 1.48
  • 41. Tabla normal estandarizada La distribución normal se caracteriza por ser una distribución simétrica (los mismos valores hacia ambos lados de la campana y las mismas probabilidades) Para valores de z, encontrar el área comprendida debajo de la curva de Gauss es equivalente a encontrar la probabilidad asociada a los valores de Z ) ( ) ( ) ( 1 1 1 z F dz z z Z P z      
  • 42. Tabla normal estandarizada: calentando •¿A qué es igual el área que se encuentra por debajo de la campana (y que representa la probabilidad de ocurrencia)? •¿Qué pasaría si ahora sombreamos el lado izquierdo de la campana y ya no el lado derecho? ¿Cómo se hallaría?     58 . 1 Prob 1 58 . 1 Prob     Z Z 0 58 . 1 Preguntas   58 . 1 Prob 1   Z
  • 43. Tabla normal estandarizada: calentando •¿Hallar la probabilidad de que Z sea menor a -0.01 es equivalente a hallar la probabilidad de que Z sea mayor que 0.01? ¿Cómo se hallaría? Preguntas 0 01 . 0  0 01 . 0 ) 01 . 0 Prob(Z     01 . 0 Prob  Z ) 01 . 0 Prob(Z 1   ) 01 . 0 Prob(Z 1 ) 01 . 0 Prob(Z      • ¿Sólo se cumple porque esta distribución es simétrica?
  • 45. ) (s X Xi    I. Hallar valores de Z dado un valor Xi: II. Hallar Área en Porcentajes (Tabla) III. Hallar el rango percentil de un valor Xi y/o un valor Z dado. IV. Hallar los valores Xi dada un Área. s X Xi Z   Variable Normalizada (recordando)
  • 46. Aplicación I a) Hallar las puntuaciones Z de las calificaciones 88 y 120 88 μ 120 - 0.75 y + 1.25 16 y 100   s X
  • 47. Aplicación II % 89.44 25 . 1 16 100 - 120 Z     22.66% 0.75 - 16 100 88      Z a) ¿Qué porcentaje tiene calificaciones entre 88 y 120? 88 100 120 89.44 - 22.66 = 66.78%
  • 48. % 94.06 1.56 16 100 125     Z b) ¿Qué porcentaje de calificaciones está por debajo de 125? 100 125
  • 49. c) ¿Qué porcentaje tiene calificaciones entre 123 y 135? 100 123 135
  • 50. Dispersión en la distribución normal -3s -2s -1s X 1s 2s 3s Para distribuciones normales: s X s X 2 y 2   b) El 95,45% de los casos están comprendidos entre: a) El 68.26% de los casos están comprendidos entre: s X s X 3 y 3   c) El 99,73% de los casos están comprendidos entre s X s X   y
  • 51. Para distribuciones moderadamente asimétricas, los porcentajes anteriores pueden mantenerse aproximados X - 2 s X X + 2s 95,45% X - 3 s X X + 3s 99,73% Dispersión en la distribución normal X - s X X + s 68,27%
  • 52. Es un conjunto de técnicas que permiten calcular un valor aproximado de un parámetro (característica poblacional) a partir de los datos proporcionados por una muestra Estimación
  • 53. Estimaciones de Parámetros Si se está interesado en estimar la media de la población (µ), el método más obvio resultaría servirse del propio valor muestral y tomarlo como su estimador (recuerden el ejemplo del Esperado en la sesión anterior). En caso de que coincidan se tratará de una estimación insesgada del parámetro. Este valor se reconoce como punto estimado de la media poblacional.
  • 54. Tipo de estimación 1: Estimación puntual  Consiste en estimar el parámetro θ a partir de la muestra obtenida  Consiste en encontrar un determinado estadístico que deberá de constituir una buena aproximación del valor de un parámetro desconocido .  Al estadístico se le denomina estimador del parámetro desconocido .
  • 55. En general, al punto estimado de cualquier parámetro (Pµ) se le conoce como estimación puntual Lo que ocurre: es muy improbable que un punto estimado coincida con el parámetro específico. Problema: la estimación puntual de un parámetro es incorrecta desde el punto de vista de la variabilidad de muestreo. Solución: en lugar de estimar un valor puntual para µ (Pµ), se estimará un rango de valores, llamado intervalo, dentro del cual es probable que fluctúe el verdadero parámetro Tipo de estimación 1: Estimación puntual
  • 56. • Consiste en estimar un rango de valores con una alta probabilidad dada de cubrir el verdadero valor de la población, sobre todas las muestras de tamaño n. • A diferencia de la estimación puntual ,la estimación paramétrica encuentra un intervalo que se denomina intervalo de confianza; esta debe de contener al parámetro con una probabilidad dada denominada nivel de confianza, basada en una muestra aleatoria y el correspondiente estadístico   F I L L I ,  ) 1 (   Nivel de confianza Intervalos y límites         1 F I L L P Tipo de estimación 2: Estimación por intervalos
  • 57. • Se usa el estadístico como punto de partida para dar una estimación por intervalo alrededor de la estimación muestral, dentro de ciertos márgenes de confiabilidad. • En la estimación de parámetros por intervalos de confianza interviene como un poderoso instrumento el valor del error estándar Tipo de estimación 2: Estimación por intervalos
  • 58. IC: Expresión gráfica 2  2  I L F L  ˆ ) ˆ ( f   1 
  • 59. Cuando tenemos una muestra aleatoria se pueden calcular los límites del intervalo y, posteriormente, podemos decir que se tiene un nivel de confianza del IC: Interpretación )% 1 ( * 100    de que el intervalo contenga al valor del parámetro desconocido Otra forma de interpretar el intervalo de confianza es decir que de cada cien intervalos aleatorios, noventa y cinco de ellos contendrán el parámetro y cinco de ellos no lo contendrán. 
  • 60. En teoría, pueden calcularse estimaciones por intervalos para cualquier nivel de probabilidad llamado “Nivel de Confianza”. Sin embargo, son convencionales los niveles de 90%, 95% y 99% de confianza, porque tienen mejores probabilidades de hacer una estimación que incluya al valor poblacional. EN RESUMEN, la estimación por intervalos es aquella que se calcula dando dos límites (superior e inferior) y considerando un cierto margen de error dado por la magnitud del error estándar y un cierto nivel de confianza específico. Tipo de estimación 2: Estimación por intervalos
  • 61. La interpretación de un intervalo de confianza de 95% para un parámetro, es que se encuentra en algún punto del intervalo calculado y que este enunciado se hace con un coeficiente de confianza del 95%. El parámetro es un valor único, fijo pero desconocido. Y que, son los intervalos los que varían de una muestra a otra. Un intervalo de confianza del 95% significa estimar el verdadero valor poblacional sabiendo que 95 de cada 100 valores muestrales están dentro del intervalo de estimación del parámetro. Tipo de estimación 2: Estimación por intervalos
  • 62. Estimación del Intervalo de Confianza para la Media (µ). Tener como base la media muestral Estimar el valor del error estándar de la media. Decidir el nivel de confianza que deseamos. Esta decisión determina los límites de confianza dentro de los que puede estar la media de la población. El intervalo de confianza viene dado por: donde el valor de Zc depende del nivel de confianza que se desee y se obtiene a partir de la tabla de áreas bajo la curva normal.     X Zc X n X   
  • 63. Estimación del Intervalo de Confianza para la Media Así como la media poblacional (µ) suele ser desconocida, rara vez se conoce la desviación estándar real de la población (σ). Asimismo, si se trata de muestras chicas (menores o iguales a 30 casos), se requiere usar el estadístico T de Student, en lugar de Z, que usa a la desviación muestral (s) como una estimación de sigma (σ): Puede aparecer que la distribución t es muy similar a la distribución normal estandarizada de puntajes Z. Ambas distribuciones tienen forma simétrica. La diferencia está en que la distribución t se extiende más en los extremos y se concentra menos en el centro en comparación con la normal Z. X tc X    
  • 64. Estimación IC: Ejemplo Suponga que la edad promedio de una muestra al azar de 100 estudiantes fue de 19.5 años con una desviación estándar de 3.7 años. Como la muestra es grande se puede asumir que la distribución de muestreo de la media es normal. La estimación de la media poblacional al 95% y al 99% de confianza es:
  • 65. Ejemplo 2252 . 20 7748 . 18 7252 . 0 5 . 19 100 7 . 3 96 . 1 5 . 19              X Zc X n X    Se tiene una probabilidad del 95% de que este intervalo contenga el parámetro poblacional.
  • 66. 45275 . 20 54725 . 18 95275 . 0 5 . 19 100 7 . 3 575 . 2 5 . 19              X Zc X n X    Al 99%, lo que se gana en confianza se pierde en precisión porque el intervalo se amplia. Ejemplo
  • 68. 68 PRUEBA DE HIPÓTESIS DE UNA MUESTRA
  • 69. ACTIVIDAD DE DISCUSIÓN - ¿Qué necesitan recordar para la prueba de hipótesis? • Función de distribución: expresión funcional que resume el comportamiento de una variable numérica (“la forma” de la distribución) • Función de densidad y función de probabilidad: expresión funcional que asocia cada valor de una variable con su probabilidad de ocurrencia (el área debajo de la forma de la distribución) • Hipótesis nula (siempre contiene la igualdad) e hipótesis alternativa (siempre contiene la diferencia): ambas son mutuamente excluyentes • El nivel de significancia: es la probabilidad de rechazar la Ho cuando es verdadera (error tipo 1). ¿Con qué niveles de significancia se suelen trabajar? • Las pruebas estadísticas (test estadísticos): es un valor ESTANDARIZADO que se usa para confirmar si una hipótesis debe o no ser rechazada. – Se suelen usar las pruebas t (cuando el n es pequeño y/o cuando la varianza de la población es desconocida y Z (cuando n es mayor a 30 y/o cuando la varianza poblacional es conocida). – Para una decisión más rápida, el criterio a usar es la probabilidad de ocurrencia para los valores t y Z y contrastarla con el nivel de significancia. – Deben cumplir la condición de tener una función de distribución normal. ¿Por qué? Usemos la base de datos “Letras” para repasar
  • 70. OBJETIVOS 70  Definir una hipótesis y las pruebas de hipótesis  Describir el procedimiento de una prueba de una hipótesis en cinco pasos.  Distinguir entre las pruebas de hipótesis de una y de dos colas.  Llevar a cabo una prueba de hipótesis para una media poblacional.  Llevar a cabo una prueba de hipótesis para una proporción poblacional.  Definir los errores tipo I y tipo II.  Calcular la probabilidad de un error tipo II.
  • 71. ¿Qué es una Hipótesis? 71 Una Hipótesis es una declaración relativa a un parámetro de la población sujeta a verificación. Ejemplos de hipótesis hechas acerca de un parámetro de la población son: – El salario mensual de los analistas en sistemas es de $3,625. – Veinte por ciento de todos los clientes del Menú Rosita regresan por otra comida dentro de un mes.
  • 72. ¿Qué es la prueba de hipótesis? 72 Probar una hipótesis es un procedimiento basado en evidencia de la muestra y la teoría de probabilidad para determinar si la hipótesis es una afirmación razonable y esta debería ser aceptada, o si no es razonable y por tanto debería ser rechazada.
  • 73. Pasos Para Probar una Hipótesis 73 Se establecen las hipótesis nula y alternativa Se selecciona un nivel de significancia Se identifica el estadístico de prueba Se formula una regla para tomar decisiones Se toma una muestra; se llega a una decisión. Paso 1 Paso 2 Paso 3 Paso 4 Paso 5 No se rechaza H0 o se rechaza H0 y “se acepta” H1
  • 74. Detalles importantes a recordar acerca de H0 y H1 74 • H0: es la hipótesis nula y H1: es la hipótesis alternativa. • H0 y H1 son mutuamente excluyentes. • H0 se dice que es cierta a menos que se demuestre lo contrario. • Se usa una muestra aleatoria (n) para “rechazar a H0”
  • 75. Detalles importantes a recordar acerca de H0 y H1 75 • El hecho de no rechazar una hipótesis no prueba que H0 sea verdadera sino que no rechazamos H0.  La hipótesis alternativa se “acepta” si la información de la muestra ofrece evidencia estadística para rechazar la hipótesis nula. • La hipótesis nula H0 siempre incluirá el signo igual (e.j. “=” , “≥” , “≤”). • La hipótesis alternativa H1 no contiene el signo igual y contendrá los siguientes símbolos“≠” “<” y “>”
  • 76. ¿Cómo escoger una hipótesis a partir de un problema? • La hipótesis nula H0 representa el estado actual reportado. • La hipótesis alternativa se refiere al hecho de que la afirmación no es verdadera. 76
  • 77. ¿Cómo escoger una hipótesis a partir de un problema? • Cuando resuelva problemas, busque palabras claves y conviértalas en símbolos. Algunas palabras claves incluyen: “mejorado, mejor que, tan efectivo como, diferente de, ha cambiado, no es igual, es inferior, perderán, menos, aumentó, es más alto, existe diferencia, es mayor que, es menor que, es de, supera, se incremento, discrepa, contradicen, una proporción mayor, reducir, etc.” 77
  • 78. Prueba de una cola o de dos colas (¿cómo saber cuál usar?) Palabras Símbolo de desigualdad Parte de: Más grande (o más) qué > H1 Más pequeño (o menor) < H1 Ha incrementado > H1 No más que  H0 Cuando menos ≥ H0 ¿Existe una diferencia? ≠ H1 No ha cambiado = H0 78 • La dirección de la prueba que envuelve enunciados que usan las palabras “ha sido mejorado”, “es mejor que”, dependerá de la variable que se este midiendo • Si la variable se refiere a la calificación de una prueba, las palabras “mejor” “mejorar” o “más efectivo” son traducidas como “>” (más grande que, como ejemplo, “las calificaciones más altas”)
  • 79. Prueba de Una Cola vs. Prueba de Dos Colas 79 Dos colas Una cola, Prueba de una cola a la izquierda Una cola, Prueba de una cola a la derecha
  • 80. Tipos de Errores en la Prueba de Hipótesis 80 • Error Tipo I: – Definida como la probabilidad de rechazar la hipótesis nula cuando esta realmente es verdadera. – Esta probabilidad es denotada por la siguiente letra griega “” – Es también conocida como nivel de significancia. • Error Tipo II : – Definida como la probabilidad de aceptar la hipótesis nula cuando esta realmente es falsa – Esta probabilidad se denota por la letra griega “β”
  • 81. 81 ELEMENTOS PARA EL TEST DE HIPÓTESIS
  • 83. 83 Tipo de Errores Investigador Hipótesis Nula H0 es verdadera H0 es falsa No se rechaza H0 Se rechaza H0 Decisión Correcta Decisión Correcta Error Tipo I Error Tipo II
  • 84. Partes de la Distribución en la Prueba de Hipótesis 84
  • 85. ¿Valor crítico? • La selección de un valor crítico está ligado a la selección de un nivel de significancia • Pero, ¡¿qué es el nivel de significancia?! El nivel de significancia vendría a ser el riesgo que corremos al rechazar una hipótesis nula cuando es cierta 85
  • 86. ¿Valor crítico? • Entonces, ¿me conviene trabajar con niveles de confianza bajos? ¿Qué tan bajo o alto? Sífilis, conviene trabajar con niveles bajos. Por convencionalidad se trabaja con niveles de 1%, 5% o 10% como máximo Recuerden a Levin y Rubin, hijos míos: “Cuanto más alto sea el nivel de significancia que utilizamos para probar una hipótesis, mayor será la probabilidad de rechazar la hipótesis nula cuando es cierta.” 86
  • 87. ¿Valor crítico? • Entonces, ¿es solo trabajar con valores asociados a los niveles de 1%, 5% o 10% ? Nopo, primero tienes que buscar en la tabla z los valores asociados a los niveles con los que trabajarás y luego seguir las reglas de decición del ppt que sigue 87
  • 88. Pruebas para la media de una población () 88