Actividad de 20% de Distribucion Muestral realizada por el grupo numero 6, cuyos integrantes son: Felipe Salazar, Greylen Acuña, Katherine Malave, Andres Maica, Mayerling Vargas.
Desarrollo y Aplicación de la Administración por Valores
Distribución Muestral
1. REPÚBLICA BOLIVARIANA DE VENEZUELA
MINISTERIO DEL PODER POPULAR PARA LA EDUCACIÓN
INSTITUTO UNIVERSITARIO POLITECNICO “SANTIAGO MARIÑO”
SEDE BARCELONA
Distribución muestrales
y de estimación
Bachilleres:
Felipe Salazar ci:26037400
Greylen Acuña ci:28647294
Andrés Maica ci:28550600
Katherine Malave ci:28255836
Mayerling Vargas ci:27396717
2. Introducción
Se denomina muestreo al proceso por el que generamos las muestras. Una
muestra es una parte (un subconjunto) de la población, y se desea que la
muestra sea lo más representativa posible de la población de la que procede.
Sin embargo, por muy cuidadosa que sea la selección de la muestra
difícilmente será una representación exacta de la población. Esto significa que
su tendencia central, variabilidad, etc., aproximarán las de la población, pero
habrá cierta diferencia, que interesa sea lo menor posible. Un concepto clave
de muestreo es el de representatividad: Los procedimientos de muestreo
tienen por objeto generar muestras lo más representativas posible de las
poblaciones dados los objetivos de la investigación y las circunstancias que
afectan al muestreo.
Desde un punto de vista aplicado, se denomina muestreo el proceso de
selección de la muestra o muestras a utilizar para la investigación. Esto
supone generar una o pocas muestras. Actualmente es de interés la selección
de muestras para la simulación informática de los procesos de muestreo,
particularmente para la obtención de distribuciones muestrales.
4. Distribución de estimación: LA ESTIMACION , como
proceso, consiste en que dada una población que siga una distribución de cierto
tipo con función de probabilidad (de cuantía o de densidad) f( X, ) dependiente
de un parámetro o varios desconocido(s) " ", aventurar en base a los datos
muestrales el valor que toma o puede tomar el parámetro o parámetros.
7. Estimación puntual
Se llama estimación al conjunto de técnicas que permiten dar un valor aproximado
de un parámetro de una población a partir de los datos proporcionados por una
muestra. Por ejemplo, una estimación de la media de una determinada
característica de una población de tamaño N podría ser la media de esa misma
característica para una muestra de tamaño
8.
9. Estimación por intervalos de la media en muestras grandes y
en muestras pequeñas:
Estimación de muestras pequeñas:
Si la media (x con barra) y S son la media y la desviación estándar de una muestra
aleatoria de una población normal con varianza 𝜎^2, desconocida un intervalo de confianza
de (1 -a) 100% para u es:
Se hace una distribución entre los casos de 𝜎 conocida y 𝜎
desconocida al calcular las estimaciones del intervalo de confianza.
Se debe enfatizar que para el primer caso se utiliza el teorema del
limite central, mientras que para 𝜎 desconocida se hace uso de la
distribución muestral de la variable aleatoria t.
10. sin embargo, el uso de la distribución t se basa en la premisa de que el muestreo se realiza de una
distribución normal. en tanto que la distribución tenga forma aproximada de campana, los intervalos de
confianza pueden calcular cuando la varianza se desconoce mediante el uso de la distribución.
Estimación de muestras grandes:
Bajo ciertas condiciones de regularidad, es posible construir intervalos de confianza asintóticos de una
manera bastante general.
Si suponemos que un parámetro θ tiene una estimación máximo verosímil θ*, la distribución asintótica del
estimador, bajo condiciones generales de regularidad, es Normal, de media el valor verdadero del
parámetro θ y varianza igual a la cota de Cramer-Rao σ2(θ*).
Bajo las suposiciones anteriores, es posible construir un intervalo de confianza asintótico y con nivel de
confianza (1 − α) · 100 % a partir de:
11. El intervalo de confianza aproximado que resulta es:
Distribución normal:
La distribución normal (en ocasiones llamada distribución gaussiana) es la distribución continua
que se utiliza más comúnmente en estadística. La distribución normal es de vital importancia en
estadística por tres razones principales: Muchas variables continuas comunes en el mundo de
los negocios tienen distribuciones que se asemejan estrechamente a la distribución normal. La
distribución normal sirve para acercarse a diversas distribuciones de probabilidad discreta, como
la distribución binomial y la distribución de Poisson. La distribución normal proporciona la base
para la estadística inferencial clásica por su relación con el teorema de límite central.
Distribución normal La distribución normal tiene importantes propiedades teóricas:
12. • Tiene una apariencia de forma de campana (y, por ende, es simétrica).
• Sus medidas de tendencia central (media, mediana y moda) son todas idénticas.
• Su “50% central” es igual a 1.33 desviaciones estándar. Esto significa que el rango Inter cuartil
está contenido dentro de un intervalo de dos tercios de una desviación estándar por debajo de la
media y de dos tercios de una desviación estándar por encima de la media.
• Su variable aleatoria asociada tiene un rango infinito (-∞ < X < ∞).
Ejemplo. determinar la probabilidad de que el tiempo de descarga para una página principal en un
navegador de la Web esté entre 7 y 10 segundos o que la probabilidad de que el tiempo de
descarga esté entre 8 y 9 segundos
Distribución T de Student
Las distribuciones t de Student fueron descubiertas por William S. Gosset (1876-1937)
en 1908 cuando trabajaba para la compañía de cervezas Guinness en Dublín (Irlanda).
No pudo publicar sus descubrimientos usando su propio nombre porque Guinness
había prohibido a sus empleados que publicaran información confidencial. Gosset firmó
sus publicaciones usando el nombre de "Student". Gosset tenía buena relación con
Karl Pearson que había sido su maestro. Necesitaba una distribución que pudiera usar
cuando el tamaño de la muestra fuera pequeño y la varianza desconocida y tenía que
ser estimada a partir de los datos.
13. Las distribuciones t se usan para tener en cuenta la incertidumbre añadida que resulta por esta
estimación. Fisher comprendió la importancia de los trabajos de Gosset para muestras pequeñas.
Si el tamaño de la muestra es n entonces decimos que la distribución t tiene n-1 grados de
libertad. Hay una distribución t diferente para cada tamaño de la muestra. Estas distribuciones son
una familia de distribuciones de probabilidad continuas. Las curvas de densidad son simétricas y
con forma de campana como la distribución normal estándar. Sus medias son 0 y sus varianzas
son mayores que 1 (tienen colas más pesadas). Las colas de las distribuciones t disminuyen más
lentamente que las colas de la distribución normal. Si los grados de libertad son mayores más
próximas a 1 es la varianza y la función de densidad es más parecida a la densidad normal.
14. Cuando n es mayor que 30, la diferencia entre la normal y la distribución t de Student
no suele ser muy importante. En la imagen podemos ver varios ejemplos de funciones
de distribución acumulada. En Probabilidades en Distribuciones t-Student puedes ver
una comparación más precisa entre las distribuciones t-Student y la normal estándar.
Estimación de proporciones
Sea X una variable binomial de parámetros n y p (una variable binomial es el
número de éxitos en n ensayos; en cada ensayo la probabilidad de éxito (p) es la
misma, por ejemplo: número de diabéticos en 2000 personas).
Si n es grande y p no está próximo a 0 ó 1 (np 5) X es aproximadamente normal
con media np y varianza npq (siendo q = 1 - p) y se puede usar el
estadístico (proporción muestral), que es también aproximadamente normal,
con error típico dado por
en consecuencia, un IC para p al 100(1 - )% será
es decir, la misma estructura que antes:
15. Obsérvese que para construirlo, ¡se necesita conocer p!. Si n es grande (>30) se
pueden substituir p y q por sus estimadores sin mucho error, en cualquier caso
como pq £ 0,25 si se substituye pq por 0,25 se obtiene un intervalo más
conservador (más grande).
Ejemplo: En una muestra de 100 pacientes sometidos a un cierto tratamiento se
obtienen 80 curaciones. Calcular el intervalo de confianza al 95% de la eficacia del
tratamiento.
¿Qué significa este intervalo? La verdadera proporción de curaciones está
comprendida entre, aproximadamente, 72% y 88% con un 95% de probabilidad.
¿Es suficientemente preciso? Habrá que juzgarlo con criterios clínicos.
Ejemplo:
En una muestra aleatoria de 90 pacientes se mide el nivel de glucosa en sangre en
ayunas. Se obtiene = 132 mg/dl y s2
=109. Construir el IC al 95% para ¿Qué
asunción se ha hecho?
Solución
Usando la fórmula general para cuando 2
es desconocida
16. podemos, o bien mirar a las tablas de la t (o en un programa de ordenador) el valor
de t0,025 que para 89 grados de libertad (los grados de libertad son n - 1) es 1,99, o
bien como n > 30 aproximar a la z y usar el valor 1,96.
Para poder usar esta fórmula es necesario que la variable sea normal. ¿es abusiva
esta asunción? Ver, por ejemplo The normal distribution. Altman &
Bland. BMJ 1995; 310:298.
2º Para evaluar una vacuna para la gripe se selecciona un grupo de 200 individuos
de riesgo. Se eligen aleatoriamente a 100 de ellos y se les suministra la vacuna; de
ellos 10 pasan la gripe. Construir un IC al 95% para la probabilidad de pasar la
gripe si se está vacunado. En los otros 100 pacientes sin vacunar la pasan 20. ¿Hay
evidencia de que la vacuna es eficaz?
17. Solución
La fórmula para calcular IC para proporciones es
y aproximando p y q por sus estimaciones
es decir, hay una probabilidad del 95% de que la probabilidad de pasar la gripe si
se está vacunado esté comprendida entre el 4% y el 16%. Para los no vacunados
Existe solapamiento, aunque pequeño, entre ambos intervalos; por tanto no
podemos asegurar que la vacuna sea eficaz.
Tamaño de la muestra
El tamaño de una muestra es el número de individuos que contiene.
Una fórmula muy extendida que orienta sobre el cálculo del tamaño de la muestra para
datos globales es la siguiente:
18. N: es el tamaño de la población o universo (número total de posibles
encuestados).
Zα: es una constante que depende del nivel de confianza que asignemos. El
nivel de confianza indica la probabilidad de que los resultados de nuestra
investigación sean ciertos: un 95,5 % de confianza es lo mismo que decir que
nos podemos equivocar con una probabilidad del 4,5%. Los valores de Zα se
obtienen de la tabla de la distribución normal estándar N(0,1).
Los valores de Zα más utilizados y sus niveles de confianza son:
19. Conclusión
Si una muestra aleatoria se elige de tal forma que todos los elementos de la
población tengan la misma probabilidad de ser seleccionados, se les denomina
muestra aleatoria simple. Es imprescindible estudiar las características de
poblaciones grandes, se utilizan muestras por muchas razones; una
enumeración completa de la población, llamada censo, puede ser
económicamente imposible, o no se cuenta con el tiempo suficiente.
Las muestras aleatorias son necesarias para la industria que permita reconocer
muestras de los productos de una línea de ensamble sirve para controlar la
calidad y así como también muestras de medidas de azúcar en la sangre de
pacientes diabéticos prueban la eficacia de una técnica o de un fármaco nuevo.
20. Bibliografía
Otamendi,L. (2019).Distribución Muestral. Recuperado en Julio del 2020 de
https://www.slideshare.net/LeonardoOtamendy/distribucin-muestral-y-de-
estimacin?qid=c47c36b9-effd-426a-be3c-bc54bb1f9b5f&v=&b=&from_search=2
Goncalves,E. (2019).Distribución Muestral. Recuperado en Julio del 2020 de
https://www.slideshare.net/EliasGoncalves4/estadistica-ii-distribucion-
muestral?qid=c47c36b9-effd-426a-be3c-bc54bb1f9b5f&v=&b=&from_search=1
Gerencia. (2016).Probabilidad de Probabilidades. Recuperado en Julio del 2020 de
https://www.slideshare.net/GERENCIAMTTO3ERCORTE/distribucion-de-
probabilidades-estadistica?qid=c47c36b9-effd-426a-be3c-
bc54bb1f9b5f&v=&b=&from_search=4
Palomino,J.(2018).Distribución Muestral. Recuperado en Julio del 2020 de
https://www.monografias.com/trabajos94/distribucion-muestral/distribucion-
muestral.shtml