1. 1.1 ¿Qué es la estadística?
OBJETIVO DE APRENDIZAJE
Comprender los dos significados del término estadística
y las ideas básicas que respaldan cualquier
investigación estadística, incluyendo las relaciones
entre la población de estudio, la muestra, la muestra
estadística y los parámetros de la población.
2. Slide 1.1- 2
Definiciones de estadística y
estadísticas
• Estadística es la ciencia que recolecta, organiza e
interpreta datos.
• Estadísticas son los datos (números y otras partes
de información) que describen o resumen algo.
3. Slide 1.1- 3
Cómo funciona la estadística
• ¿Cuál es el objetivo de la investigación?
• En realidad ¿qué se obtiene con los estudios?
Definiciones
La población en un estudio estadístico es el
conjunto completo de personas u objetos a estudiar.
Los parámetros de la población son las
características específicas de la población.
4. Slide 1.1- 4
EJEMPLO 1 Poblaciones y parámetros de la población
Para cada una de las situaciones siguientes, describa la
población que se estudiará e identifique algunos de los
parámetros de la población que serían de interés.
a. Usted trabaja para Seguros del Agricultor y ha
investigado para determinar el monto promedio pagado
a víctimas de accidente en automóviles sin bolsas de
aire para impactos laterales.
Solución:
La población consiste en las personas que han recibido
pagos de seguro por accidentes en automóviles que
carecen de bolsas de aire para impactos laterales. El
parámetro de la población relevante es la media
(promedio) del monto pagado a estas personas.
5. Slide 1.1- 5
EJEMPLO 1 Poblaciones y parámetros de la población
Para cada una de las situaciones siguientes, describa la
población que se estudiará e identifique algunos de los
parámetros de la población que serían de interés.
b. Has sido contratado por McDonald’s para determinar
los pesos de las papas enviadas cada semana para
producir las papas fritas.
Solución:
La población consiste en todas las papas enviadas cada
semana para hacer papas fritas. Los parámetros
relevantes de la población incluyen el peso medio de
las papas y la variación de los pesos (por ejemplo, ¿la
mayoría de ellos son cercanos o lejanos a la media?)
7. Slide 1.1- 7
Definiciones
Una muestra es un subconjunto de la población del
cual se obtienen datos.
Las medidas u observaciones reales recolectadas de
la muestra constituyen los datos.
Las estadísticas muestrales son características de
la muestra encontradas mediante la consolidación o
resumen de los datos.
8. Slide 1.1- 8
EJEMPLO 2 Encuesta de desempleo
El Departamento del Trabajo de Estados Unidos define
la fuerza de trabajo civil como todas aquellas personas
que están empleadas o bien de manera activa buscan un
empleo. Cada mes este departamento informa la tasa de
desempleo, que es el porcentaje de personas que están
activamente buscando un empleo dentro de toda la
fuerza de trabajo civil. Con el fin de determinar la tasa
de desempleo, este departamento encuesta 60 000
hogares. Para los informes de desempleo, describe
a. población b. muestra c. los datos
d. estadísticas muestrales e. parámetros de la población
9. Slide 1.1- 9
EJEMPLO 2 Encuesta de desempleo
Solución:
La población es el grupo del que el Departamento del
Trabajo quiere aprender, todas las personas que
conforman la fuerza de trabajo civil.
a. población
10. Slide 1.1- 10
EJEMPLO 2 Encuesta de desempleo
Solución:
La muestra consiste en todas las personas de los 60 000
hogares encuestados.
b. muestra
11. Slide 1.1- 11
EJEMPLO 2 Encuesta de desempleo
Solución:
Los datos consisten en toda la información recolectada
de la encuesta.
c. Los datos
12. Slide 1.1- 12
EJEMPLO 2 Encuesta de desempleo
Solución:
Las estadísticas muestrales resumen los datos de la
muestra. En este caso, la estadística muestral relevante
es el porcentaje de personas en la muestra que están
buscando de manera activa trabajo.
d. Estadísticas muestrales
13. Slide 1.1- 13
EJEMPLO 2 Encuesta de desempleo
Solución:
Los parámetros de la población son las características
de toda la población que corresponden a las
estadísticas muestrales. En este caso, el parámetro
poblacional relevante es la tasa real de desempleo.
e. Parámetros de la población
14. Slide 1.1- 14
Cómo funciona la estadística
• ¿Cómo se relacionan las estadísticas
muestrales con los parámetros de la
población?
15. Slide 1.1- 15
UN MOMENTO DE REFLEXIÓN
Suponga que Nielsen concluye que 30% de los
estadounidenses vieron el Súper Tazón. ¿Cuántas
personas representan esto? (La población de Estados
Unidos es aproximadamente 300 millones).
16. Slide 1.1- 16
Definición
El margen de error en una investigación estadística sirve para
describir el rango de valores, o intervalo de confianza, que
probablemente contenga al parámetro de la población. Este
intervalo de confianza lo determinamos al sumar y restar el
margen de error a la estadística muestral obtenida en el
estudio. Es decir, el rango de valores que probablemente
contengan el parámetro de la población es
desde (estadística muestral – margen de error)
hasta (estadística muestral + margen de error)
Por lo común el margen de error es definido paqra que
proporcione un intervalo de 95% de confianza, esto quiere decir
que 95% de las muestras del tamaño utilizado en el estudio
contendrían el paámetro real de la población (y 5% no lo
contendrían).
17. Slide 1.1- 17
EJEMPLO 3 ¿Vida en Marte?
El Centro de Investigación Pew para la Gente y Prensa
encuestó a 1 546 adultos estadounidenses acerca de sus
actitudes hacia el futuro. Les preguntó si el hombre
llegaría a Marte en los próximos 50 años, 76% de estas
1 546 personas dijeron definitivamente sí o
probablemente sí. El margen de error para la encuesta
fue de 3 puntos porcentuales. Describa la población y
la muestra para esta encuesta, y explique el significado
del estadístico muestral de 76%. ¿Qué puede concluir
acerca del procentaje de la población que piensa que el
hombre llegará a Marte en los próximos 50 años?
18. Slide 1.1- 18
EJEMPLO 3 ¿Vida en Marte?
Solución:
La población son todos los adultos estadounidenses y la
muestra consiste en las 1,546 personas que fueron encuestadas.
El estadístico muestral de 76% es el porcentaje real de personas
en la muestra que respondió que el hombre definitiva o
probablemente llegaría a Marte en los próximos 50 años. El
estadístico muestral de 76% y el margen de error de 3 puntos
porcentuales nos dicen que el rango de valores
desde 76% – 3% = 73%
hasta 76% + 3% = 79%
es probable (con un 95% de confianza) que contenga el
parámetro de la población, que en este caso es el porcentaje
verdadero de todos los adultos estadounidenses que piensan que
el hombre definitivamente o probablemente llegará a pisar
Marte en los próximos 50 años.
19. Slide 1.1- 19
EJEMPLO 4 ¿Clonación de humanos?
La misma encuesta Pew preguntó a las personas si
creían que los humanos serían clonados en los
siguientes 50 años. A esta pregunta , 51% respondió
definitivamente sí o probablemente sí. De nueva
cuenta, el margen de error fue de 3 puntos
porcentuales. ¿Podemos estar seguros que una mayoría
de los adultos estadounidenses piensan que los
humanos serán clonados en los próximos 50 años?
20. Slide 1.1- 20
EJEMPLO 4 ¿Clonación de humanos?
Solución :
No. Para determinar el rango de valores que
probablemente contenga el porcentaje de todos los
adultos estadounidenses quienes piensan que la
clonación humana definitiva o probablemente ocurra,
sumamos y restamos el margen de error de 3 puntos
porcentuales de la estadística muestral de 51%. Esto
proporciona un rango de valores de 48% a 54%.
Puesto que este rango incluye valores a ambos lados
de 50%, no podemos estar seguros que la mayoría (es
decir, más de 50%) de los adultos estadounidenses
piense que los humanos serán clonados en los
siguientes 50 años.
21. Slide 1.1- 21
Cómo reunir las partes:
El proceso de una investigación
estadística
22. Slide 1.1- 22
Pasos básicos en una investigación estadística
Paso 1. Indique con precisión el objetivo de su estudio, esto es,
determine la población que quiere estudiar y lo que quiere saber
de ella.
Paso 2. Seleccione una muestra de la población. (Asegúrese de utilizar
una técnica apropiada de muestreo)
Paso 3. Recolecte datos de la muestra y resuma esos datos
determinando las estadísticas muestrales de interés.
Paso 4. Utilice las estadísticas muestrales para realizar inferencias
acerca de la población.
Paso 5. Obtenga conclusiones, determine lo que aprendió y si alcanzó
su objetivo.
23. Slide 1.1- 23
INICIO
POBLACIÓN MUESTRA
ESTADÍSTICAS
MUESTRALES
PARÁMETROS
POBLACIONALES
EL PROCESO DE UNA INVESTIGACIÓN ESTADÍSTICA
24. Slide 1.1- 24
EJEMPLO 5 Identificación de los pasos
Considere la encuesta del Centro de Investigación Pew que se
describió en los ejemplos 3 y 4. Ahora identifique cómo los
investigadores aplican los cinco pasos básicos en una
investigación estadística.
Solución: Los pasos se aplican como se indica a continuación.
1. Los investigadores tenían como objetivo aprender acerca de
las actitudes específicas que los estadounidenses tienen sobre
el futuro. Ellos seleccionaron a los adultos estadounidenses
como la población, dejaron intencionalmente fuera a los
niños.
2. Seleccionaron 1,546 adultos estadounidenses como su
muestra. Aunque no dijeron cómo tomaron la muestra,
supondremos que fueron elegidos de modo que los 1,546
adultos estadounidenses son representativos de toda la
población de adultos estadounidenses.
25. Slide 1.1- 25
EJEMPLO 5 Identificación de los pasos
Solución: Los pasos se aplican como se indica a
continuación.
3.Ellos recolectaron los datos pidiendo a las personas
en la muestra respuestas a las preguntas
cuidadosamente seleccionadas. Los datos son las
respuestas individuales a las preguntas. Ellos
resumieron estos datos con estadísticas muestrales, tal
como los porcentajes globales de personas, en la
muestra, que respondieron sí o no a cada pregunta.
4.Las técnicas de la ciencia estadística permitieron a los
investigadores inferir características de la población.
En este caso, la inferencia consistió en la estimación
de ciertos parámetros de la población y el cálculo de
los márgenes de error.
26. Slide 1.1- 26
EJEMPLO 5 Identificación de los pasos
Solución: Los pasos se aplican como se indica a
continuación.
5. Seguros de que el estudio fue realizado
adecuadamente e interpretando las estimaciones de
los parámetros de la población, los investigadores
sacaron conclusiones globales sobre las actitudes de
los estadounidenses acerca del futuro.
27. Slide 1.1- 27
Estadística: decisiones para un
mundo incierto
Propósito de la estadística
La estadística tiene muchos usos, pero quizás el
más importante es ayudarnos a tomar buenas
decisiones en situaciones que incluyen
incertidumbre.
28. 1.2 Muestreo
OBJETIVO DE APRENDIZAJE
Entender la importancia de seleccionar una muestra
representativa y familiarizarse con los diversos métodos
comunes de muestreo.
29. Slide 1.2- 29
Definición
Un censo es una recolección de datos de cada uno de
los miembros de una población.
Definición
Una muestra representativa es una muestra en la
cual las características relevantes de los elementos de
la muestra generalmente son las mismas que las
características de la población.
30. Slide 1.2- 30
EJEMPLO 1 Una muestra representativa para alturas
Suponga que quiere determinar la altura media de todos los
estudiantes de su escuela ¿Cuál podría ser una muestra más
representativa para este estudio: los integrantes del equipo
varonil de básquetbol o los estudiantes de su curso de
estadística?
Solución:
Los integrantes del equipo varonil de básquetbol no son una
muestra representativa para un estudio de altura, ya que sólo
está formada por hombres y, segundo, los jugadores de
básquetbol tienden a ser más altos que el promedio. La altura
media de los estudiantes en su curso de estadística, tal vez, es
mucho más cercana a la altura media de todos los estudiantes,
de modo que su clase forma una muestra más representativa que
los integrantes del equipo varonil de básquetbol.
31. Slide 1.2- 31
Sesgo
Definición
Una investigación estadística sufre de sesgo si su
diseño o realización tiende a favorecer ciertos
resultados.
32. Slide 1.2- 32
EJEMPLO 2 ¿Por qué usar Nielsen?
Nielsen Media Research cobra a las redes y estaciones de
televisiones por sus servicios. Por ejemplo, NBC paga a
Nielsen por proporcionar índices de audiencia de sus
programas de televisión. ¿Por qué NBC no hace sus
propios índices de audiencia, en lugar de pagar a una
compañía por hacerlos?
Solución:
El costo de publicidad en un programa de televisión depende
del índice de audiencia del show. Entre mayor sea, más puede
cobrar la red por un anuncio, lo que significa que NBC podría
tener un claro sesgo si hace sus propios índices de audiencia.
Por tanto, los anunciantes no confiarían en estos índices. Al
contratar una fuente independiente, tal como Nielsen, NBC
proporciona información más creíble para los anunciantes.
33. Slide 1.2- 33
UN MOMENTO DE REFLEXIÓN
El hecho que NBC pague a Nielsen por sus servicios
podría dar a Nielsen un incentivo financiero para hacer
que NBC salga bien en los índices de audiencia. El
hecho de que Nielsen también proporciona índices de
audiencia para otras cadenas, ¿cómo ayuda a
prevenir de un posible sesgo hacia NBC?
34. Slide 1.2- 34
Métodos de muestreo
•Muestras aleatorias simples
Una muestra aleatoria simple es aquélla
en la cual cada elemento de la población
tiene igual oportunidad de ser seleccionado
como parte de la muestra.
Con un muestreo aleatorio simple,
cualquier muestra posible de un tamaño
particular tiene igual oportunidad de ser
seleccionada.
35. Slide 1.2- 35
UN MOMENTO DE REFLEXIÓN
Busque la tecla de números aleatorios en una
calculadora ¿qué sucede cuando la oprime? ¿cómo
podría utilizar la tecla de números aleatorios para
seleccionar una muestra de 100 estudiantes?
36. Slide 1.2- 36
EJEMPLO 3 Muestreo en un directorio telefónico
Usted podría llevar a cabo una encuesta de opinión en la cual la
población sean todos los residentes en una ciudad. ¿Podría
seleccionar una muestra aleatoria simple escogiendo nombres
aleatoriamente del directorio telefónico local?
Solución:
Una muestra extraída de un directorio telefónico no es una muestra
aleatoria simple de la población de la ciudad, ya que en los
directorios invariablemente no hay muchos nombres y alguien que
no aparezca no tiene oportunidad de ser elegido. Por ejemplo, el
directorio telefónico no tendrá los nombres de dos o más personas
que comparten el mismo número telefónico, sólo una de ellas está
en la lista, o cuando una persona elige que su número telefónico no
aparezca, o cuando dependen exclusivamente de un teléfono
celular, o cuando una persona (tal como los vagabundos) no tienen
teléfono.
37. Slide 1.2- 37
Métodos de muestreo
•Muestreo sistemático
Este tipo de muestreo, en el que utilizamos
un sistema, tal como la elección de cada 50
miembros de la población, se denomina
muestreo sistemático.
Slide 1.1- 37
38. Slide 1.2- 38
EJEMPLO 5 Cuando el muestreo sistemático no funciona
Usted está realizando una encuesta de estudiantes en un
dormitorio de una escuela mixta en el que los hombres
tienen asignadas habitaciones con número impar y las
mujeres habitaciones con número par. ¿puede obtener una
muestra representativa cuando elige cada 10 habitaciones?
Solución:
No. Si usted inicia con una habitación con número impar,
cada 10 habitaciones también será una con número impar
(tal como las habitaciones con número 3, 13, 23…). De
forma análoga, si inicia con una habitación con número
par, cada 10 habitaciones también tendrá número par. Por
tanto, obtendrá habitaciones con sólo hombres o con sólo
mujeres, ninguna de ellas es representativa de la
población de la escuela mixta. Slide 1.1- 38
39. Slide 1.2- 39
UN MOMENTO DE REFLEXIÓN
Suponga que en el ejemplo 5 elige cada 5
habitaciones, en lugar de cada 10, ahora ¿la muestra
sería representativa?
40. Slide 1.2- 40
Métodos de muestreo
•Muestreo de conveniencia
Este tipo de muestra selecciona por
conveniencia en lugar de hacerlo por un
procedimiento más complejo.
Slide 1.1- 40
41. Slide 1.2- 41
EJEMPLO 6 Prueba del sabor de una salsa
Un supermercado necesita decidir si tener una nueva marca de
salsa, por lo que ofrece una prueba gratis en un puesto en la
tienda y pregunta a las personas si les gusta. ¿Qué tipo de
muestreo se utiliza? ¿Es probable que la muestra sea
representtiva de la población de todos los clientes?
Solución:
La muestra de clientes que se paran a probar la salsa es un
muestreo de conveniencia, ya que estas personas se
encuentran en la tienda y son voluntarios para probar el
producto nuevo. (Este tipo de muestreo de conveniencia,
en el que las personas eligen o no ser parte de la muestra,
también se denomina muestreo de autoselección).
Slide 1.1- 41
42. Slide 1.2- 42
EJEMPLO 6 Prueba del sabor de una salsa
Solución: cont.
Tal muestra no es probable que sea representativa de la
población de todos los clientes, ya que distintos tipos de
personas podrían hacer sus compras en diferentes
momentos (por ejemplo, los padres que están en casa es
más probable que hagan las compras a medio día que
los padres que trabajan) y sólo las personas a quienes
les gusta la salsa es probable que participen. Aun así, la
información podría ser muy útil, ya que las opiniones
de las personas que les gusta la salsa quizá serían más
importantes en este caso.
Slide 1.1- 42
43. Slide 1.2- 43
Métodos de muestreo
• Muestreo por conglomerado
El muestreo por conglomerado incluye la
selección de todos los miembros de grupo
(o conglomerados) seleccionados
aleatoriamente.
Slide 1.1- 43
44. Slide 1.2- 44
EJEMPLO 7 Precios de gasolina
Usted quiere conocer el precio medio de la gasolina en las
gasolinerías localizadas en un radio de una milla de la
ubicación de rentas de automóviles en los aeropuertos.
Explique cómo podría utilizar el muestreo por
conglomerados en este caso.
Solución:
Podría seleccionar aleatoriamente unos cuantos
aeropuertos en todo el país. Para estos aeropuertos
verificaría los precios de la gasolina en cada gasolinería
en un radio de una milla de la ubicación de la renta de
automóviles.
Slide 1.1- 44
45. Slide 1.2- 45
Métodos de muestreo
• Muestreo estratificado
El muestreo estratificado consiste en
seleccionar aleatoriamente a los miembros
de un estrato.
Slide 1.1- 45
46. Slide 1.2- 46
EJEMPLO 8 Datos de desempleo
El Departamento del Trabajo de Estados Unidos encuesta
cada mes 60 000 hogares para compilar su reporte de
desempleo. Para seleccionar estos hogares este
departamento primero agrupa las ciudades y condados en
alrededor 2 000 áreas geográficas. Luego, de forma
aleatoria, selecciona hogares en cada una de estas áreas
geográficas para encuestarlos. ¿Es un ejemplo de
muestreo estratificado? ¿Cuáles son los estratos? ¿Por qué
el muestreo estratificado es importante en este caso?
Slide 1.1- 46
47. Slide 1.2- 47
EJEMPLO 8 Datos de desempleo
Solución:
La encuesta de desempleo es un ejemplo de muestreo
estratificado ya que primero divide la población en
subgrupos. Los subgrupos, o estratos, son las personas
en las 2 000 regiones geográficas. En este caso el
muestreo estratificado es importante, porque las tasas
de desempleo en la parte rural de Kansas podrían ser
muy diferentes que en Silicon Valley. Al utilizar
muestreo estratificado, el Departamento del Trabajo
asegura que su muestra representa adecuadamente a
todas las regiones geográficas.
Slide 1.1- 47
48. Slide 1.2- 48
Resumen de los métodos de muestreo
Sin importar cómo se elija una muestra,
tenga en mente las tres ideas clave
siguientes:
• Un estudio puede tener éxito sólo si la muestra
es representativa de la población.
• Una muestra sesgada no es probable que sea
una muestra representativa.
• Aunque una muestra sea bien elegida, puede
resultar no representativa, por mala suerte, al
sacar la muestra.
Slide 1.1- 48
49. Slide 1.2- 49
Métodos comunes de muestreo
• Muestreo aleatorio simple: elegimos una muestra de elementos
de tal manera que cualquier muestra del mismo tamaño tenga
igual oportunidad de ser seleccionada.
• Muestreo sistemático: utilizamos un sistema sencillo para
seleccionar la muestra, tal como elegir a cada 10 o cada 50
elementos de la población.
• Muestreo por conveniencia: utilizamos una muestra que pueda
ser conveniente de seleccionar.
• Muestreo por conglomerados: primero dividimos la población en
grupos, o conglomerados, y seleccionamos al azar algunos de
estos conglomerados. Luego obtenemos la muestra mediante la
selección de todos los miembros en cada uno de los
conglomerados seleccionados.
• Muestreo estratificado: utilizamos este método cuando nos
interesan las diferencias entre subgrupos, o estratos, dentro de
una población. Primero identificamos los estratos y luego
sacamos una muestra aleatoria en cada uno de los estratos. La
muestra total consiste en todas las muestras de cada uno de los
estratos individuales.
50. Slide 1.2- 50
Muestreo aleatorio simple:
Cada muestra del mismo tamaño tiene igual oportunidad de ser
elegida. Con frecuencia las computadoras son utilizadas para
generar números aleatorios.
Slide 1.1- 50
52. Slide 1.2- 52
Muestreo por conveniencia:
Utiliza resultados que son fácilmente
disponibles.
Slide 1.1- 52
53. Slide 1.2- 53
Muestreo por conglomerados:
Divide la población en conglomerados, selecciona algunos de esos
conglomerados y luego toma a todos los elementos de los
conglomerados seleccionados.
Slide 1.1- 53
54. Slide 1.2- 54
Muestreo estratificado:
Divide la población en al menos dos estratos, luego se saca
una muestra de cada uno de ellos.
Slide 1.1- 54