4.1 Teorema Central de Límite

11.092 visualizaciones

Publicado el

0 comentarios
0 recomendaciones
Estadísticas
Notas
  • Sé el primero en comentar

  • Sé el primero en recomendar esto

Sin descargas
Visualizaciones
Visualizaciones totales
11.092
En SlideShare
0
De insertados
0
Número de insertados
84
Acciones
Compartido
0
Descargas
144
Comentarios
0
Recomendaciones
0
Insertados 0
No insertados

No hay notas en la diapositiva.

4.1 Teorema Central de Límite

  1. 1. Instituto Tecnológico Superior de Zacapoaxtla Departamento de Desarrollo AcadémicoMaría del Consuelo Valle Espinosa
  2. 2. El objetivo principal de la Inferencia Estadística consiste enextraer conclusiones a partir de un conjunto de datosobservados. Por lo general estos datos proceden de unamuestra de individuos de una población, y el objetivo seráutilizar esta muestra para sacar conclusiones sobre lapoblación total. Si X1, … , Xn son variables aleatorias independientes siguiendo una misma distribución de probabilidad, se dicen que constituyen una muestra procedente de la misma distribución.En concreto, los datos de la muestra son variablesaleatorias que tienen una misma distribución deprobabilidad común.
  3. 3. En la mayor parte de las aplicaciones, los parámetrospoblacionales no serán completamente conocidas, y se intentaráutilizar la muestra para hacer inferencia sobre ellosLos valores µ y  2 se denominarán media poblacional yvarianza poblacional. Sean X1, X2, … , Xn los valores de una muestra extraída de una población . La media muestral se define como:  X 1  ...  X n X  nSe puede demostrar que el valor esperado de la mediamuestral es igual a la media poblacional, esto es:  E[ X ]  
  4. 4. También se puede demostrar que la varianza de la distribución defrecuencias de medias muestrales es:   2  Var ( X )  2 S nEstos dos últimos resultados son importantísimos para laInferencia Estadística debido a que la distribución de todas lasmedias muestrales está centrada en la media poblacional, perosu dispersión disminuye más y más a medida que el tamaño demuestra aumenta. La desviación estándar de la distribución de medias muestrales es igual a la desviación estándar de la población dividida por la raíz cuadrada del tamaño de la muestra    2 S  SD ( X )   n n
  5. 5. Teorema Central de LímiteSean X1, X2, … Xn una muestra aleatoriaprocedente de una población con media µ ydesviación estándar σ, la suma (y porconsiguiente también la media) X1 + X2 + … + XnSigue aproximadamente una distribuciónnormal con: media µ  y desviación estándar n
  6. 6. El Teorema Central de Límite ayuda a explicar el hechoobservable de que las frecuencias empíricas de un grannúmeros de poblaciones existentes en la naturaleza exhibenuna forma gaussiana Francis Galton (1889): "Difícilmente conozco algo tanto que alimente mi imaginación como el maravilloso orden cósmico que se deriva de la LEY DE FRECUENCIAS DE LOS ERRORES. Si los griegos hubieran conocido esta ley seguro que la habrían endiosado. Reina con seguridad en completa auto- modestia entre la confusión más salvaje. Cuando más vigentes están la ley de la calle y la aparente anarquía, más perfecto es su balanceo. Es la ley suprema de la sinrazón".
  7. 7. En esta dirección de Internet se puede simular ladistribución de frecuencia de las medias muestrales,tomado como base una población normal, uniforme osesgada. Para 10,000 repeticiones de extracción demuestras de tamaño 20.http://onlinestatbook.com/stat_sim/sampling_dist/index.html
  8. 8. Distribución Chi- cuadrada
  9. 9. Si Z1, … , Zn son variables aleatorias normales estándar eindependientes (con media 0 y desviación estándar 1), lavariable aleatoria n Z 2 i i 1Se dice que es una variable aleatoria Chi-cuadrado con ngrados de libertad
  10. 10. Supongamos ahora que se tiene una muestra X1, … , Xnprocedente de una población normal con media µ y desviaciónestándar σ.Consideremos la varianza muestral: 2    n  Xi  X  i 1    2 S n 1 Entonces: 2    n  n  1 S 2   X i X  i 1      2 2 Sigue una distribución Chi-cuadrado con n -1 grados de libertad
  11. 11. Cuando se decide cuantificar sólo una parte de las unidadesde una población y a partir de esta información estimar sus parámetros, entonces decimos que se ha planteado un problema de muestreo
  12. 12. El muestreo es una herramienta de la investigacióncientífica, su función básica es determinar qué parte de larealidad en estudio (población o universo) debe deexaminarse con la finalidad de hacer inferencias sobre elTODO de la que procede. Error de muestreoEs el error que se comete debido al hecho de que se sacanconclusiones sobre cierta realidad, a partir de la observaciónde sólo una parte de ella
  13. 13. Se considera que el método de selección de la muestra tieneun carácter estadísticamente riguroso cuando su diseñocumplen las siguientes condiciones: A cada elemento de la población, se le otorgue una probabilidad conocida de integrar la muestra. Y por supuesto, esta probabilidad no sea nula.
  14. 14. La nociones de muestra representativa y de muestraprobabilística suelen identificarse erróneamente, hay quetener cuidado pues no son los mismos conceptos.La noción de representatividad sólo tiene un alcanceintuitivo y se sintetiza de la manera siguiente: “ lo que debe procurarse es que la muestra exhiba internamente el mismo grado de diversidad que la población”
  15. 15. Cuando las muestras, habiendo sido planificadasprobabílisticamente, pierden ese carácter en la fase del terreno.En este caso puede introducirse un fuerte sesgo que descalifiquelos resultados.Situaciones que se presentan cuando se pretende detectardiferencias, asociaciones, etcétera. En estos casos, el énfasisdebe ponerse en la comparatividad de los grupos, más que en larepresentatividad que unos y otros exhiban en relación con lasrespetivas poblaciones.Cuando no se tiene acceso a una población de la cual extraerla muestra, sino que se trabaja con los datos que se hanpodido obtener y el proceso se invierte en cierto sentido: lasinferencias recaen sobre aquella población de la que sesupone que la muestra es representativa.
  16. 16. Suponiendo que se tiene una población bien definida de la que se va a obtener una muestra, pueden mencionarse tres formas básicas de selección no probabilística:a) Muestreo semiprobabilístico: Es un procedimiento de tal manera que el carácter probabilístico se mantiene sólo hasta un punto del proceso de selección.b) Muestreo por cuotas: La muestra debe de estar dispersa por toda la población y ha de contener la misma proporción de objetos o individuos con ciertas características que en la población entera se han detectado o seleccionado.c) Selección según criterio de autoridad: La muestra es determinada mediante el criterio razonado de autoridades en la materia que se estudia. En la aplicación de este método, el investigador sopesa cuidadosamente los elementos de la población (de los cuales debe de tener suficiente información) para elegir aquellos que ha su juicio pueden conformar el modelo de la realidad en estudio dados los objetivos del trabajo a desarrollar.
  17. 17. Se dice que el procedimiento de selección es un muestreosimple aleatorio si el proceso que se sigue otorga a todosubconjunto (muestra) de tamaño n de la población la mismaposibilidad de selección; en otras palabras, ningunacombinación de n elementos tenga mayor probabilidad de serelegida que otra del mismo tamaño. Para seleccionar aletoriamente los objetos que hay queintegrar a la muestra, primero hay que numerar los todos losobjetos de la población en forma secuencial desde 1 hasta N,y con tablas de números aleatorios o software seleccionar n deellos.
  18. 18. Supongamos que en la población bajo estudio puedenidentificarse diferentes grupos cuya representación en lamuestra quisiera asegurarseLa manera natural de lograrlo es hacer listados separados paradichos grupos y proceder a seleccionar submuestras en cadauno de ellos. Con el marco muestral dividido, dentro de lossubconjuntos se seleccionan aleatoriamente las unidades deanálisis que formarán cada uno de ellos
  19. 19. Supongamos que se tiene una población finita de Nelementos (unidades de análisis), la cual se ha dividido enM subconjuntos (o conglomerados) cuyos tamaños sonDe manera que:
  20. 20. Una muestra simple aleatoria por conglomeradosmonoetápica de tamaño m de los M conglomeradosqueda integrada por todas las unidades de análisiscontenidas en esos m subconjuntos. Si llamamos n altamaño de la muestra, se tiene que:
  21. 21. Conocido también con el nombre de submuestreo. Donde setrata de seleccionar aleatoriamente un cierto número m desubconjuntos (o conglomerados) y, dentro de cada uno deellos elegir aleatoriamente unidades de análisis.
  22. 22. Referencias: INTRODUCCIÓN A LA ESTADÍSTICA ROSS, SHELDON M. Editorial REVERTE ISBN: 978-84-291-5039-1 MUESTREO PARA LA INVESTIGACION EN CIENCIA DE LA SALUD LUIS CARLOS SILVA AYÇAGUER, DIAZ DE SANTOS, 1993 ISBN 9788479780982

×