Estimar	con	
Estadística
Conceptos	Previos
Tipos	de	Muestreo
Estimación por	Intervalos
Xavier	Barber	
Estadística	en	investigación	
experimental	y	clínica
Conceptos	Previos
Definiciones
Población Es el conjunto de elementos o individuos que reúnen las
características que se pretenden estudiar. Cuando se conoce el número de
individuos que la componen, se habla de «población finita» y, cuando no se
conoce su número, de «poblacióninfinita».
Existen tres niveles de población, según su tamaño y accesibilidad: la «población
diana» es el conjunto de elementos o individuos al cual se pretenden inferir los
resultados obtenidos; generalmente, es muy numerosa y no está al alcance de
los investigadores. La «población accesible» es la que reúne las mismas
características que la anterior, pero con menor número de individuos, y por
tanto susceptible de estudio; es la que delimita el investigador con los criterios
de inclusión y exclusión. La «población de estudio» es de la que realmente se
recogen los datos; suele ser la muestra de estudio.
Cálculo	del	tamaño	de	la	muestra.	C.	Fuentelsaz Gallego
www.uib.cat/.../303729_2014_animaleslaboratorio_num62_31_33.pdf
Definiciones
Muestra Es el grupo de individuos que realmente se estudiarán, es un
subconjunto de la población. Para que se puedan generalizar a la población los
resultados obtenidos en la muestra, ésta ha de ser «representativa» de dicha
población. Para ello, se han de definir con claridad los criterios de inclusión y
exclusión y, sobre todo, se han de utilizar las técnicas de muestreo apropiadas
para garantizar dicha representatividad.
Individuo Es cada uno de los integrantes de la población o muestra en los que se
estudiarán las características de interés determinadas por los objetivos del
estudio. Normalmente, el número de individuos de la muestra se representa con
la letra «n» y el número de sujetos de la población por la «N». Tras la definición
de las características de la población a través de los criterios de inclusión y
exclusión, se ha de decidir si se estudia a toda la población o –en caso de que
ésta sea demasiado grande– a un número de sujetos representativo, que no han
de ser ni pocos ni demasiados, sino simplemente los necesarios.
Definiciones
Estimar un parámetro es proponer un valor para el mismo a partir de la
muestra; un estimador del porcentaje poblacional sería el porcentaje de
diabéticas –al que se hacía mención anteriormente– de una muestra; a este tipo
de estimación se le llama «estimación puntual». Es bastante probable que el
valor que se obtiene no sea realmente el valor del parámetro en la población.
El error estándar mide la variabilidad entre las diferentes medias de las
muestras; es decir, mide la dispersión imaginaria que presentarían las distintas
medias obtenidasen las muestras estudiadas.
6
Introducción
Existen	dos	formas	de	hacer	Inferencia	Estadística:	
◦ La	estimación	de	parámetros	
◦ Las	pruebas	de	hipótesis.	
En la Inferencia Estadística hay varios métodos, pero en cualquier caso es
necesario utilizar una muestra que represente a la población, esto se consigue con
las Técnicas de muestreo.
A	partir	de	una	muestra	nos	proponemos	dos	objetivos:	
◦ Obtener	valores	aproximados	de	parámetros	poblacionales:	Estimación	puntual.	
◦ La estimación por intervalos de confianza tiene por objeto proporcionar, a
partir de la información recogida en la muestra, un intervalo que contenga con
alto nivel de confianza (probabilidad), al parámetro objeto de nuestro
interés. A partir de dicho intervalo obtendremos una medida del error máximo
cometido al aproximar puntualmenteel parámetro.
XAVIER	BARBER	2009/2010 7
Introducción
En particular, nos centraremos en extraer
conclusiones específicas sobre parámetros de
esta población, como pueden ser la media, la
varianza o la proporción de individuos que
verifican una cierta propiedad.
EL VERDADERO VALOR DEL PARÁMETRO ES
DESCONOCIDO, Y EL OBJETIVO SERÁ
ESTIMARLO.
La principal razón para estudiar una muestra en
lugar de la población completa es el hecho de
que la recogida de toda la información será, en
la mayoría de las ocasiones, exageradamente
cara, e inclusoimposible de realizar.
Tipos	de	Muestreo
M.	C.	Irma	Nancy	Larios	Rodríguez	http://goo.gl/PvVf7
Muestreo	Aleatorio	Simple
El procedimiento empleado es el siguiente: 1) se asigna un número a cada
individuo de la población y 2) a través de algún medio mecánico (bolas dentro
de una bolsa, tablas de números aleatorios, números aleatorios generados con
una calculadora u ordenador, etc.) se eligen tantos sujetos como sea necesario
para completar el tamaño de muestra requerido. Este procedimiento, atractivo
por su simpleza, tiene poca o nula utilidad práctica cuando la población que
estamos manejando es muy grande.
Muestreo	aleatorio	sistemático
Este procedimiento exige, como el anterior, numerar todos los elementos de la
población, pero en lugar de extraer n números aleatorios sólo se extrae uno. Se
parte de ese número aleatorio i, que es un número elegido al azar, y los
elementos que integran la muestra son los que ocupa los lugares i, i+k, i+2k,
i+3k,...,i+(n-1)k, es decir se toman los individuos de k en k, siendo k el resultado
de dividir el tamaño de la población entre el tamaño de la muestra: k= N/n. El
número i que empleamos como punto de partida será un número al azar entre 1
y k.
El riesgo este tipo de muestreo está en los casos en que se dan periodicidades
en la población ya que al elegir a los miembros de la muestra con una
periodicidad constante (k) podemos introducir una homogeneidad que no se da
en la población. Imaginemos que estamos seleccionando una muestra sobre
listas de 10 individuos en los que los 5 primeros son varones y los 5 últimos
mujeres, si empleamos un muestreo aleatorio sistemático con k=10 siempre
seleccionaríamos o sólo hombres o sólo mujeres, no podría haber una
representación de los dos sexos.
Muestreo	Aleatorio	Estratificado
Trata de obviar las dificultades que presentan los anteriores ya que simplifican
los procesos y suelen reducir el error muestral para un tamaño dado de la
muestra. Consiste en considerar categorías típicas diferentes entre sí (estratos)
que poseen gran homogeneidad respecto a alguna característica (se puede
estratificar, por ejemplo, según la profesión, el municipio de residencia, el sexo,
el estado civil, etc.). Lo que se pretende con este tipo de muestreo es asegurarse
de que todos los estratos de interés estarán representados adecuadamente en
la muestra. Cada estrato funciona independientemente, pudiendo aplicarse
dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los
elementos concretos que formarán parte de la muestra. En ocasiones las
dificultades que plantean son demasiado grandes, pues exige un conocimiento
detallado de la población.(Tamaño geográfico, sexos, edades,...).
Métodos	de	muestreo	no	probabilísticos
ØMuestreo	por	cuotas
ØMuestreo	intencional	o	de	conveniencia
ØBola	de	nieve
ØMuestreo	Discrecional
Distribución Muestral
El estudio de determinadas características de una población se efectúa a través de
diversas muestras que pueden extraerse de ella.
El muestreo puede hacerse con o sin reposición, y la población de partida puede ser infinita
o finita. Una población finita en la que se efectúa muestreo con reposición puede
considerarse infinita teóricamente. También, a efectos prácticos, una población muy grande
puede considerarse como infinita. En todo nuestro estudio vamos a limitarnos a una
población de partida infinita o a muestreo con reposición.
Consideremos todas las posibles muestras de tamaño n en una población. Para cada
muestra podemos calcular un estadístico (media, desviación típica, proporción,...) que
variará de una a otra. Así obtenemos una distribución del estadístico que se
llama distribución muestral.
Las dos medidas fundamentales de esta distribución son la media y la desviación típica,
también denominada error típico.
Hay que hacer notar que si el tamaño de la muestra es lo suficientemente grande las
distribuciones muestrales son normales y en esto se basarán todos los resultados que
alcancemos.
http://recursostic.educacion.es/descartes
Distribución Muestral de	la	MEDIA
Cada muestra de tamaño n que podemos extraer de una población proporciona una
media. Si consideramos cada una de estas medias como valores de una variable
aleatoria podemos estudiar su distribución que llamaremos distribución muestral
de medias.
Si tenemos una población normal N(µ,σ) y extraemos de
ella muestras de tamaño n, la distribución muestral de
medias sigue también una distribución normal
Si la población no sigue una distribución normal pero n>30, aplicando el
llamado Teorema central del límite la distribución muestral de medias se aproxima
también a la normal anterior.
𝑁 𝜇,
𝜎
𝑛
Distribución Normal	de	Proporciones
En numerosas ocasiones se plantea estimar una proporción o porcentaje. En estos
casos la variable aleatoria toma solamente dos valores diferentes (éxito o fracaso), es
decir sigue una distribución binomial y cuando la extensión de la población es grande la
distribución binomial B(n,p) se aproxima a la normal
Para muestras de tamaño n>30, la distribución muestral de proporciones sigue una
distribución normal
donde p es la proporción de uno de los valores que
presenta la variable estadística en la población y q=1-p.
Estimación por	
intervalos
ESTIMACIÓN	DE	PARÁMETROS
En una población cuya distribución es conocida pero desconocemos algún parámetro, podemos
estimar dicho parámetro a partir de una muestra representativa.
Un estimador es un valor que puede calcularse a partir de los datos muestrales y que
proporciona información sobre el valor del parámetro. Por ejemplo la media muestral es un
estimador de la media poblacional, la proporción observada en la muestra es un estimador de la
proporción en la población.
Una estimación es puntual cuando se obtiene un sólo valor para el parámetro. Los estimadores
más probables en este caso son los estadísticos obtenidos en la muestra, aunque es necesario
cuantificar el riesgo que se asume al considerarlos. Recordemos que la distribución
muestral indica la distribución de los valores que tomará el estimador al seleccionar distintas
muestras de la población. Las dos medidas fundamentales de esta distribución son la media que
indica el valor promedio del estimador y la desviación típica, también denominada error típico
de estimación, que indica la desviación promedio que podemos esperar entre el estimador y el
valor del parámetro.
ESTIMACIÓN	DE	PARÁMETROS
Más útil es la estimación por intervalos en la que calculamos dos valores entre
los que se encontrará el parámetro, con un nivel de confianza fijado de
antemano.
Llamamos Intervalo de confianza al intervalo que con un cierto nivel de
confianza, contiene al parámetro que se está estimando.
Nivel de confianza es la "probabilidad" de que el intervalo calculado contenga al
verdadero valor del parámetro. Se indica por 1-α y habitualmente se da en
porcentaje (1-α)100%. Hablamos de nivel de confianza y no de probabilidad ya
que una vez extraída la muestra, el intervalo de confianza contendrá al
verdadero valor del parámetro o no, lo que sabemos es que si repitiésemos el
proceso con muchas muestras podríamos afirmar que el (1-α)% de los intervalos
así construidos contendríaal verdadero valor del parámetro.
Estimar con estadística v1

Estimar con estadística v1

  • 1.
  • 2.
  • 3.
    Definiciones Población Es elconjunto de elementos o individuos que reúnen las características que se pretenden estudiar. Cuando se conoce el número de individuos que la componen, se habla de «población finita» y, cuando no se conoce su número, de «poblacióninfinita». Existen tres niveles de población, según su tamaño y accesibilidad: la «población diana» es el conjunto de elementos o individuos al cual se pretenden inferir los resultados obtenidos; generalmente, es muy numerosa y no está al alcance de los investigadores. La «población accesible» es la que reúne las mismas características que la anterior, pero con menor número de individuos, y por tanto susceptible de estudio; es la que delimita el investigador con los criterios de inclusión y exclusión. La «población de estudio» es de la que realmente se recogen los datos; suele ser la muestra de estudio. Cálculo del tamaño de la muestra. C. Fuentelsaz Gallego www.uib.cat/.../303729_2014_animaleslaboratorio_num62_31_33.pdf
  • 4.
    Definiciones Muestra Es elgrupo de individuos que realmente se estudiarán, es un subconjunto de la población. Para que se puedan generalizar a la población los resultados obtenidos en la muestra, ésta ha de ser «representativa» de dicha población. Para ello, se han de definir con claridad los criterios de inclusión y exclusión y, sobre todo, se han de utilizar las técnicas de muestreo apropiadas para garantizar dicha representatividad. Individuo Es cada uno de los integrantes de la población o muestra en los que se estudiarán las características de interés determinadas por los objetivos del estudio. Normalmente, el número de individuos de la muestra se representa con la letra «n» y el número de sujetos de la población por la «N». Tras la definición de las características de la población a través de los criterios de inclusión y exclusión, se ha de decidir si se estudia a toda la población o –en caso de que ésta sea demasiado grande– a un número de sujetos representativo, que no han de ser ni pocos ni demasiados, sino simplemente los necesarios.
  • 5.
    Definiciones Estimar un parámetroes proponer un valor para el mismo a partir de la muestra; un estimador del porcentaje poblacional sería el porcentaje de diabéticas –al que se hacía mención anteriormente– de una muestra; a este tipo de estimación se le llama «estimación puntual». Es bastante probable que el valor que se obtiene no sea realmente el valor del parámetro en la población. El error estándar mide la variabilidad entre las diferentes medias de las muestras; es decir, mide la dispersión imaginaria que presentarían las distintas medias obtenidasen las muestras estudiadas.
  • 6.
    6 Introducción Existen dos formas de hacer Inferencia Estadística: ◦ La estimación de parámetros ◦ Las pruebas de hipótesis. Enla Inferencia Estadística hay varios métodos, pero en cualquier caso es necesario utilizar una muestra que represente a la población, esto se consigue con las Técnicas de muestreo. A partir de una muestra nos proponemos dos objetivos: ◦ Obtener valores aproximados de parámetros poblacionales: Estimación puntual. ◦ La estimación por intervalos de confianza tiene por objeto proporcionar, a partir de la información recogida en la muestra, un intervalo que contenga con alto nivel de confianza (probabilidad), al parámetro objeto de nuestro interés. A partir de dicho intervalo obtendremos una medida del error máximo cometido al aproximar puntualmenteel parámetro.
  • 7.
    XAVIER BARBER 2009/2010 7 Introducción En particular,nos centraremos en extraer conclusiones específicas sobre parámetros de esta población, como pueden ser la media, la varianza o la proporción de individuos que verifican una cierta propiedad. EL VERDADERO VALOR DEL PARÁMETRO ES DESCONOCIDO, Y EL OBJETIVO SERÁ ESTIMARLO. La principal razón para estudiar una muestra en lugar de la población completa es el hecho de que la recogida de toda la información será, en la mayoría de las ocasiones, exageradamente cara, e inclusoimposible de realizar.
  • 8.
  • 9.
    Muestreo Aleatorio Simple El procedimiento empleadoes el siguiente: 1) se asigna un número a cada individuo de la población y 2) a través de algún medio mecánico (bolas dentro de una bolsa, tablas de números aleatorios, números aleatorios generados con una calculadora u ordenador, etc.) se eligen tantos sujetos como sea necesario para completar el tamaño de muestra requerido. Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad práctica cuando la población que estamos manejando es muy grande.
  • 10.
    Muestreo aleatorio sistemático Este procedimiento exige,como el anterior, numerar todos los elementos de la población, pero en lugar de extraer n números aleatorios sólo se extrae uno. Se parte de ese número aleatorio i, que es un número elegido al azar, y los elementos que integran la muestra son los que ocupa los lugares i, i+k, i+2k, i+3k,...,i+(n-1)k, es decir se toman los individuos de k en k, siendo k el resultado de dividir el tamaño de la población entre el tamaño de la muestra: k= N/n. El número i que empleamos como punto de partida será un número al azar entre 1 y k. El riesgo este tipo de muestreo está en los casos en que se dan periodicidades en la población ya que al elegir a los miembros de la muestra con una periodicidad constante (k) podemos introducir una homogeneidad que no se da en la población. Imaginemos que estamos seleccionando una muestra sobre listas de 10 individuos en los que los 5 primeros son varones y los 5 últimos mujeres, si empleamos un muestreo aleatorio sistemático con k=10 siempre seleccionaríamos o sólo hombres o sólo mujeres, no podría haber una representación de los dos sexos.
  • 11.
    Muestreo Aleatorio Estratificado Trata de obviarlas dificultades que presentan los anteriores ya que simplifican los procesos y suelen reducir el error muestral para un tamaño dado de la muestra. Consiste en considerar categorías típicas diferentes entre sí (estratos) que poseen gran homogeneidad respecto a alguna característica (se puede estratificar, por ejemplo, según la profesión, el municipio de residencia, el sexo, el estado civil, etc.). Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de interés estarán representados adecuadamente en la muestra. Cada estrato funciona independientemente, pudiendo aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los elementos concretos que formarán parte de la muestra. En ocasiones las dificultades que plantean son demasiado grandes, pues exige un conocimiento detallado de la población.(Tamaño geográfico, sexos, edades,...).
  • 12.
  • 13.
    Distribución Muestral El estudiode determinadas características de una población se efectúa a través de diversas muestras que pueden extraerse de ella. El muestreo puede hacerse con o sin reposición, y la población de partida puede ser infinita o finita. Una población finita en la que se efectúa muestreo con reposición puede considerarse infinita teóricamente. También, a efectos prácticos, una población muy grande puede considerarse como infinita. En todo nuestro estudio vamos a limitarnos a una población de partida infinita o a muestreo con reposición. Consideremos todas las posibles muestras de tamaño n en una población. Para cada muestra podemos calcular un estadístico (media, desviación típica, proporción,...) que variará de una a otra. Así obtenemos una distribución del estadístico que se llama distribución muestral. Las dos medidas fundamentales de esta distribución son la media y la desviación típica, también denominada error típico. Hay que hacer notar que si el tamaño de la muestra es lo suficientemente grande las distribuciones muestrales son normales y en esto se basarán todos los resultados que alcancemos. http://recursostic.educacion.es/descartes
  • 14.
    Distribución Muestral de la MEDIA Cadamuestra de tamaño n que podemos extraer de una población proporciona una media. Si consideramos cada una de estas medias como valores de una variable aleatoria podemos estudiar su distribución que llamaremos distribución muestral de medias. Si tenemos una población normal N(µ,σ) y extraemos de ella muestras de tamaño n, la distribución muestral de medias sigue también una distribución normal Si la población no sigue una distribución normal pero n>30, aplicando el llamado Teorema central del límite la distribución muestral de medias se aproxima también a la normal anterior. 𝑁 𝜇, 𝜎 𝑛
  • 15.
    Distribución Normal de Proporciones En numerosasocasiones se plantea estimar una proporción o porcentaje. En estos casos la variable aleatoria toma solamente dos valores diferentes (éxito o fracaso), es decir sigue una distribución binomial y cuando la extensión de la población es grande la distribución binomial B(n,p) se aproxima a la normal Para muestras de tamaño n>30, la distribución muestral de proporciones sigue una distribución normal donde p es la proporción de uno de los valores que presenta la variable estadística en la población y q=1-p.
  • 16.
  • 17.
    ESTIMACIÓN DE PARÁMETROS En una poblacióncuya distribución es conocida pero desconocemos algún parámetro, podemos estimar dicho parámetro a partir de una muestra representativa. Un estimador es un valor que puede calcularse a partir de los datos muestrales y que proporciona información sobre el valor del parámetro. Por ejemplo la media muestral es un estimador de la media poblacional, la proporción observada en la muestra es un estimador de la proporción en la población. Una estimación es puntual cuando se obtiene un sólo valor para el parámetro. Los estimadores más probables en este caso son los estadísticos obtenidos en la muestra, aunque es necesario cuantificar el riesgo que se asume al considerarlos. Recordemos que la distribución muestral indica la distribución de los valores que tomará el estimador al seleccionar distintas muestras de la población. Las dos medidas fundamentales de esta distribución son la media que indica el valor promedio del estimador y la desviación típica, también denominada error típico de estimación, que indica la desviación promedio que podemos esperar entre el estimador y el valor del parámetro.
  • 18.
    ESTIMACIÓN DE PARÁMETROS Más útil esla estimación por intervalos en la que calculamos dos valores entre los que se encontrará el parámetro, con un nivel de confianza fijado de antemano. Llamamos Intervalo de confianza al intervalo que con un cierto nivel de confianza, contiene al parámetro que se está estimando. Nivel de confianza es la "probabilidad" de que el intervalo calculado contenga al verdadero valor del parámetro. Se indica por 1-α y habitualmente se da en porcentaje (1-α)100%. Hablamos de nivel de confianza y no de probabilidad ya que una vez extraída la muestra, el intervalo de confianza contendrá al verdadero valor del parámetro o no, lo que sabemos es que si repitiésemos el proceso con muchas muestras podríamos afirmar que el (1-α)% de los intervalos así construidos contendríaal verdadero valor del parámetro.