Sistema de Control Interno aplicaciones en nuestra legislacion
PROBABILIDAD_Y_ESTADISTICA
1. TEMA 5: ESTADÍSTICA INFERENCIAL
(INTERVALOS DE CONFIANZA Y PRUEBA DE
HIPÓTESIS)
Ma. Isabel Chávez Castro
2. CONTENIDOS GENERALES
Técnicas de Muestreo: Introducción y
clasificación
Distribuciones Muestrales: Definición,
media muestral de la media y error
típico
Teorema del Límite Central
3. TÉCNICAS DE MUESTREO
INTRODUCCIÓN
En este capítulo se comienza el estudio de la
Estadística Inferencial que es la segunda parte de
la estadística como ciencia.
El principal propósito de la inferencia estadística
es hacer estimaciones y pruebas de hipótesis
acerca de parámetros poblacionales usando la
información que proporciona la muestra.
Es así que debemos recapitular estas dos
definiciones: población y muestra.
4. TÉCNICAS DE MUESTREO
Se conoce como población a todos los elementos
que han sido escogidos para un estudio, mientras
que muestra es una porción de esta población.
En muchas ocasiones el usar la muestra es más
factible que utilizar toda la población para el
análisis, es así que se detallan algunas razones
importantes para muestrear:
1. Establecer contacto con toda la población
requeriría mucho tiempo.
5. TÉCNICAS DE MUESTREO
2. El costo de estudiar a toda la población resultaría
prohibitivo.
3. Es imposible verificar de manera física todos los
elementos de la población (existe poblaciones que
son consideradas infinitas).
4. Algunas pruebas son de naturaleza destructiva.
5. Los resultados de la muestra se consideran
apropiados.
El muestreo es una herramienta que se utiliza en la
investigación para poder obtener una o más muestras de
la población.
6. TÉCNICAS DE MUESTREO
Existen dos técnicas para poder muestrear: el
muestreo no aleatorio (o de juicio) y el
muestreo aleatorio (o de probabilidad). Estos
a su vez se subclasifican en:
7. TÉCNICAS DE MUESTREO
En el muestreo de probabilidad, todos los
elementos de la población tienen la
oportunidad de ser escogidos para la muestra
mientras que en el muestreo de juicio, se
emplea el conocimiento y la opinión personal
para identificar a los elementos de la población
que deben incluirse en la muestra.
El muestreo estadístico utilizas el muestreo
probabilístico o de probabilidad en su
desarrollo.
8. TÉCNICAS DE MUESTREO
Se describe a continuación brevemente cada uno de estas
técnicas:
a) Muestreo Aleatorio Simple: Es uno de los
métodos más comunes que se utilizan para
muestrear y consiste en considerar que cada
elemento de la muestra tengan las mismas
posibilidades que se le incluya.
Se utiliza las llamadas tablas de números aleatorios
para poder seleccionar a los elementos. Estos números
aleatorios son generados por un proceso aleatorio
(normalmente una computadora en la actualidad).
.
9. TÉCNICAS DE MUESTREO
b) Muestreo sistemático: En el muestreo
sistemático los elementos son
seleccionados de la población dentro de un
intervalo uniforme que se mide con respecto
al tiempo, al orden o al espacio.
Se diferencia del muestreo aleatorio simple en
que cada elemento tiene igual oportunidad de
ser seleccionado, «pero cada muestra no
tiene una posibilidad igual de ser
seleccionada.»
10. TÉCNICAS DE MUESTREO
En esta técnica se selecciona un punto aleatorio
de inicio y posteriormente se elige cada k-ésimo
miembro de la población (de ahí que sea un
intervalo constante).
c) Muestreo Aleatorio Estratificado: Cuando la
población se divide en grupos a partir de
ciertas características se utiliza el muestreo
estratificado con el fin de garantizar de que
todos los grupos se encuentren representados
en la muestra. Estos grupos se llaman
«estratos»
11. TÉCNICAS DE MUESTREO
La ventaja de las muestras estratificadas es que,
cuando se diseñan adecuadamente, reflejan de
manera más precisa las características de la
población de la cual fueron elegidas, en
comparación con otro tipo de muestras.
d) Muestreo por conglomerados (o de racimo):
La población se divide en conglomerados a
partir de los límites naturales geográficos o de
otra clase. A continuación se seleccionan los
conglomerados al azar y se toma una muestra
de forma aleatoria con elementos de cada
grupo.
12. TÉCNICAS DE MUESTREO
Tanto en el muestreo estratificado como en el de
racimo, la población se divide en grupos bien
definidos. Usamos el muestreo estratificado
cuando cada grupo tiene una pequeña
variación dentro de sí mismo, pero hay una
amplia variación de un grupo a otro.
Usamos el muestreo de racimo en el caso
opuesto, cuando hay una variación
considerable dentro de cada grupo, pero los
grupos son esencialmente similares entre sí.
13. DISTRIBUCIONES MUESTRALES
Para poder definir que es una distribución muestral,
debemos recordar que la media muestral (𝑥) es el
estimador puntual de la media poblacional (µ), y que
la proporción muestral (𝑝) es el estimador puntual de
la proporción poblacional (p). Estos valores
muestrales van a depender de las muestras que
puedan tomarse de una población y tendrán
variaciones entre sí.
Entonces podemos definir como distribución muestral
al conjunto de los valores que se obtienen de analizar
todas estas muestras aleatoriamente escogidas.
14. DISTRIBUCIONES MUESTRALES
De manera general el estadístico que más se
estudia es la media muestral, por lo tanto, al
conjunto de los distintos valores que toma la
media muestral como resultado de distintas
muestras aleatorias simples se lo conoce como
DISTRIBUCION MUESTRAL DE LA MEDIA.
Conocer esta distribución muestral y sus
propiedades permitirá hacer declaraciones de
probabilidad de qué tan cerca está la media
muestral de la media poblacional μ.
15. DISTRIBUCIONES MUESTRALES
Una definición más formal para la distribución
muestral de la media sería:
«La distribución muestral de 𝒙 es la
distribución de probabilidad de todos los
valores de la media muestral 𝒙».
Como otras distribuciones de probabilidad, la
distribución muestral de la media tiene su valor
esperado, su desviación estándar y su forma
característica.
16. DISTRIBUCIONES MUESTRALES
a) Valor esperado: Como la variable aleatoria
puede tener muchos valores diferentes, suele ser
de interés conocer la media de todos los valores
de 𝑥 que se obtienen con diferentes muestras
aleatorias simples.
La media de la variable aleatoria 𝑥 es el valor
esperado de 𝑥, y se lo conoce como media de media
muestrales, su ecuación es:
𝑋 =
𝑥𝑖
𝑛
donde 𝑥𝑖 son las medias de cada muestra y n el
número de muestras que se escogieron.
17. DISTRIBUCIONES MUESTRALES
Es importante mencionar que si E(𝑥) es el valor
esperado de 𝑥 y μ es la media de la población de
la que se selecciona una muestra aleatoria
simple, se puede demostrar que cuando se
emplea el muestreo aleatorio simple E(𝑥) y μ son
iguales.
Por ejemplo, dada la población 12,12,14 y 16:
- Hallar todas las muestras de tamaño dos que
puedan formarse.
- Graficar la distribución muestral de la media.
- Encontrar la media de medias muestrales y la
media población. ¿Qué puede decir al
respecto?
18. DISTRIBUCIONES MUESTRALES
Paso 1: Analizar si debo usar una
combinación o permutación para encontrar las
muestras de 2 posibles
En este caso como no me importa el orden del
proceso utilizo una combinación:
𝑛𝐶𝑟 =
𝑛!
𝑛 − 𝑟 ! 𝑟!
n=4, r=2
19. DISTRIBUCIONES MUESTRALES
4𝐶2 =
4!
4 − 2 ! 2!
=
4!
2! 2!
=
4 × 3 × 2 × 1
2 × 1 × 2 × 1
= 6
Se pueden formar 6 parejas, las mismas que
son (con esto se responde a la primera
inquietud del ejercicio)
20. DISTRIBUCIONES MUESTRALES
Para la segunda parte, que nos pide graficar la
distribución muestral, calcular la media muestral
en cada una de las parejas que se formaron y
determinar la probabilidad para cada una de ellas.
La media muestral es la semisuma de los valores
de cada pareja:
22. DISTRIBUCIONES MUESTRALES
Para la parte tres
calcularemos primero la
media de medias
muestrales:
𝑋 =
𝑥𝑖
𝑛
𝑋 =
𝑥𝑖
𝑛
=
12 + 13 + 14 + 13 + 14 + 15
6
𝑋 =
𝑥𝑖
𝑛
=
81
6
= 𝟏𝟑, 𝟓
Calculamos la media
poblacional:
𝜇 =
𝑥1 + 𝑥2 + ⋯ + 𝑥𝑛
𝑛
𝜇 =
12 + 12 + 14 + 16
4
𝜇 =
54
4
= 𝟏𝟑, 𝟓
Podemos concluir entonces
que se cumple que la media
de medias muestrales es
igual a la media población.
23. DISTRIBUCIONES MUESTRALES
b) Desviación estándar: Se la denota como:
𝜎𝑥
Se lo calcula utilizando las siguientes fórmulas
en función de si hablamos de poblaciones finitas
o poblaciones infinitas:
24. DISTRIBUCIONES MUESTRALES
Sin embargo, el término
𝑁−𝑛
𝑁−1
(que se llama factor de
corrección para una población finita) es un factor
que se considera despreciable si se sabe que se tiene
una población finita grande pero la muestra es pequeña
( 𝑛 𝑁 ≤ 0,05) , por lo cual para ambos casos de
poblaciones puede ocuparse:
𝜎𝑥 =
𝜎
𝑛
donde n es el número de elementos que conforman la
muestra y σ es la desviación estándar de la población.
25. DISTRIBUCIONES MUESTRALES
Para poder recalcar la diferencia entre la
desviación estándar de la media muestral (𝜎𝑥) y
de la desviación estándar de la población (σ), a la
primera se la conoce como ERROR ESTÁNDAR O
TÍPICO.
El término error estándar se refiere a la
desviación estándar de un estimador puntual. El
valor del error estándar de la media ayuda a
determinar qué tan lejos puede estar la media
muestral de la media poblacional.
26. DISTRIBUCIONES MUESTRALES
c) Forma de la distribución muestral de 𝒙: Para
analizar la forma de esta distribución, podemos
considerar dos casos:
- La población tiene forma normal.
- La población no tiene forma normal.
La población tiene distribución normal: En muchas
circunstancias es razonable suponer que la población
de la que se seleccionó la muestra aleatoria simple
tenga distribución normal o casi normal. Cuando la
población tiene distribución normal, la distribución
muestral de 𝒙 de está distribuida normalmente sea cual
sea el tamaño de la muestra.
27. DISTRIBUCIONES MUESTRALES
La población no tiene distribución normal: Cuando
la población de la que se tomó la muestra aleatoria
simple no tiene distribución normal, el TEOREMA DEL
LÍMITE CENTRAL ayuda a determinar la forma de la
distribución muestral de 𝒙. El enunciado del teorema
del límite central aplicado a la distribución muestral de
𝒙 dice lo siguiente:
«Cuando se seleccionan muestras aleatorias
simples de tamaño n de una población, la
distribución muestral de la media muestral puede
aproximarse mediante una distribución normal a
medida que el tamaño de la muestra se hace
grande»
28. TEOREMA DEL LÍMITE CENTRAL
El gráfico a
continuación nos
permite observar
como la distribución
muestral se va
aproximando a una
distribución normal
mientras más
grande es la
muestra:
Resultados del Teorema del
Límite Central:
29. TEOREMA DEL LÍMITE CENTRAL
La mayoría de especialistas consideran que con una
muestra de 30 (o más) es lo bastante grande para
aplicar el teorema del límite central.
Gracias a esta aproximación se puede utilizar las
tablas de distribución normal para calcular las
probabilidades cuando se habla de situaciones en las
cuales se consideran las muestras de la población.
En este caso para normalizar a la variable se usa la
relación:
𝑧 =
𝑥 − 𝜇
𝜎
𝑛
30. TEOREMA DEL LÍMITE CENTRAL
Por ejemplo:
Usted a aceptado un empleo en Estados Unidos,
específicamente en el sur de California, en donde
la renta de un departamento con una recámara
tiene una distribución normal con una media de
$2 200 mensuales y una desviación estándar de
$150 mensuales.
¿Cuál es la probabilidad que al seleccionar una
muestra de 150 departamentos de una recámara
la media es menor a $2195 mensuales?
31. TEOREMA DEL LÍMITE CENTRAL
Paso 1: Identificar los datos que nos
proporciona el ejercicio
µ=2200 usd
σ=150 usd
n=150
P(𝑥 < 2195)=?
Paso 2: Como nos da informe de que se toma una
muestra debo normalizar con 𝑧 =
𝑥−𝜇
𝜎
𝑛
32. TEOREMA DEL LÍMITE CENTRAL
𝑧 =
𝑥 − 𝜇
𝜎
𝑛
=
2195 − 2220
150
150
=
−25
150
12,2474
𝑧 =
−25
12,2474
= −𝟐, 𝟎𝟒
Paso 3: Indicar que valor de la curva estamos
buscando
Paso 4: Usando la tabla de normalidad
encontrar el valor de z
33. TEOREMA DEL LIMITE CENTRAL
Paso 3: Parte amarilla
es lo que busco
Paso 4: Recuerde que la
curva normal es simétrica.
34. TEOREMA DEL LÍMITE CENTRAL
Lo que se tiene es:
Lo que necesito es:
Paso 5: Encontrar la
probabilidad buscada
P(𝑥 < 2195) =0,5-0,4793
P(𝑥 < 2195) =0,0207
O en forma porcentual
2,07%.