1. 0
Métodos estadísticos
Centro de Ciencias de la Salud
Departamento de Optometría
Maestría en Rehabilitación Visual
Actividad 4 - C
Usando herramientas
de estimación Profesor:
Dr. Rogelio Salinas Gutiérrez
Alumna:
Opt. Melissa P. García Félix
2 de Abril del 2014
3. 2
INTRODUCCION
Estimación por intervalos
Con la estimación puntual se estima el valor del parámetro poblacional desconocido, a partir de
una muestra. Para cada muestra se tendrá un valor que estima el parámetro. Esta estimación no
es muy útil si desconocemos el grado de aproximación de la estimación al parámetro. Es deseable
conocer un método que nos permita saber dónde se encuentra el parámetro con un cierto grado
de certeza. Este método va a ser la determinación de un intervalo donde estará el parámetro con
un nivel de confianza.
El intervalo se construye a partir de una muestra, entonces, para cada muestra se tendrá un
intervalo distinto. Llamaremos a al error que se permite al dar el intervalo y el nivel de confianza
será 1- . Un intervalo tiene un nivel de confianza 1- cuando el 100·(1- )% de los intervalos que se
construyen para el parámetro lo contienen.
Es deseable para un intervalo de confianza que tenga la menor amplitud posible, esta amplitud
dependerá de:
El tamaño de la muestra, mientras mayor sea el tamaño mejor será la estimación, aunque se
incurre en un aumento de costes
Nivel de confianza, si se pide mayor nivel de confianza, el intervalo será mayor.
OBJETIVO
Realizar estimaciones por intervalo a través de un conjunto de datos reales y del uso de software.
4. 3
CONTENIDO
1. Visite la página web cuya dirección aparece enseguida.
http://www.umass.edu/statdata/statdata/stat-desc.html
2. Consulte el archivo de descripción para el estudio “Low Birthweight” y descargue a su
computadora el archivo de datos presentado en formato de Excel.
3. En base a la descripción del estudio “Low Birthweight”, conteste las siguientes preguntas:
(a) ¿Con qué intención fueron recabados los datos?
Para iidentificar los factores de riesgo asociados con dar a luz a un bebé con bajo peso al nacer.
(b) ¿Cuántos bebés participaron en el estudio?
Se recopilaron datos sobre 189 mujeres, 59 de las cuales tenían bebés con bajo peso al nacer
y 130 de los cuales tenían bebés de peso normal al nacer (1 bebe por cada mujer).
(c) ¿Cuánto debe pesar un bebé para ser considerado de bajo peso?
Inferior a 2500 gramos.
(d) ¿Cuáles son los nombres de las variables que forman parte del estudio?
Bajo peso al nacer = LOW
Edad de la madre en años = AGE
Peso en el último periodo menstrual = LWT
Raza = RACE
Fumo durante el embarazo (SI = 1, NO = 0) SMOKE
Hipertensión (SI = 1, NO = 0) HT
Presencia de Irritabilidad (SI = 1, NO = 0) UI
Número de visitas al médico durante el primer trimestre (0 = No, 1 = Uno, 2 = dos, etc.) FTV
Peso al nacer en gramos BWT
5. 4
(e) ¿Cuáles de las variables pueden considerarse cualitativas? Argumente su respuesta
La escala de valores es nominal Los valores son “categorías” por lo tanto seria raza, fumar,
hipertensión, presencia de irritabilidad, núm. ero de visitas al médico.
Una variable cualitativa expresan distintas cualidades, características o modalidad. Cada
modalidad que se presenta se denomina atributo o categoría, y la medición consiste en una
clasificación de dichos atributos. Las variables cualitativas pueden ser dicotómicas cuando sólo
pueden tomar dos valores posibles, como sí y no, hombre y mujer o ser politómicas cuando
pueden adquirir tres o más valores. Dentro de ellas podemos distinguir:
Variable cualitativa ordinal o variable cuasicuantitativa: La variable puede tomar distintos valores
ordenados siguiendo una escala establecida, aunque no es necesario que el intervalo entre
mediciones sea uniforme, por ejemplo: leve, moderado, fuerte.
Variable cualitativa nominal: En esta variable los valores no pueden ser sometidos a un criterio de
orden, como por ejemplo los colores.
(f) ¿Cuáles de las variables pueden considerarse cuantitativas? Argumente su respuesta
Son las variables que toman como argumento, cantidades numéricas, son variables matemáticas
como el peso, la edad en años, peso de último periodo, peso en gramos.
Variable discreta: Es la variable que presenta separaciones o interrupciones en la escala de valores
que puede tomar. Estas separaciones o interrupciones indican la ausencia de valores entre los
distintos valores específicos que la variable pueda asumir.
Ejemplo: El número de hijos (1, 2, 3, 4, 5).
Variable continua: Es la variable que puede adquirir cualquier valor dentro de un intervalo
especificado de valores. Por ejemplo la masa (2,3 kg, 2,4 kg, 2,5 kg,...) o la altura (1,64 m, 1,65 m,
1,66 m,...), o el salario. Solamente se está limitado por la precisión del aparato medidor, en teoría
permiten que exista un valor entre dos variables.
(g) ¿Qué significa el valor de 0 en la variable con abreviación LOW?
LOW = Bajo peso al nacer, donde 0 equivale a menos de 2500 g
(h) ¿En qué unidades están registrados los valores de la variable con abreviación BWT?
Gramos
6. 5
4. Cambie el formato del archivo de datos de Excel a formato CSV, para ello consulte cómo
hacerlo en el vídeo cuyo enlace aparece en el Foro “Cuatro Vídeos”.
7. 6
5. Obtenga mediante el uso del software R un intervalo de confianza para estimar el peso
promedio poblacional de los niños recién nacidos. Para ello consulte cómo hacerlo en el vídeo
cuyo enlace aparece en el Foro “Cuatro Vídeos”. Utilice un nivel de confianza del 90%.
6. Obtenga un intervalo de confianza para estimar el peso promedio poblacional de los niños
recién nacidos. Utilice un nivel de confianza del 95%.
8. 7
7. Obtenga un intervalo de confianza para estimar el peso promedio poblacional de los niños
recién nacidos. Utilice un nivel de confianza del 99%.
8. ¿Qué le pasa a la anchura de los intervalos obtenidos en los tres incisos anteriores al
aumentar el nivel de confianza? ¿Se mantiene la anchura del intervalo sin cambios? ¿Aumenta?
¿Disminuye? Explique su respuesta.
El grado de confiabilidad aumenta, por lo tanto la anchura se comporta de la siguiente manera:
90 = 2857.000 – 3032.312
95 = 2840.049 – 3049.264
99 = 2806.663 – 3082.649
El promedio no cambia: 2944.656
Esto se debe a que la variable analizada es BWT en los 3 ejemplos solo con diferente confiabilidad.
9. 8
9. Separe los datos de los bebés en dos archivos de tal forma que uno de los archivos se
encuentren los datos de los bebés de bajo peso y en otro archivo se encuentren los datos de los
bebés que no tienen bajo peso.
Bajo peso:
11. 10
10. Obtenga un intervalo de confianza para estimar el peso promedio poblacional de los niños
recién nacidos con bajo peso Utilice un nivel de confianza del 95%.
11. Obtenga un intervalo de confianza para estimar el peso promedio poblacional de los niños
recién nacidos que no tienen bajo peso Utilice un nivel de confianza del 95%.
12. 11
12. Compare los intervalos obtenidos en los dos incisos anteriores, ¿Considera que sea posible
afirmar que el peso promedio es diferente entre los bebés de bajo peso y los bebés que no tienen
bajo peso? Argumente su respuesta.
El peso promedio es diferente en ambos casos, porque a pesar de que forman parte de la misma
muestra “BWT” estos fueron separados en bajo peso y peso normal, por lo tanto existe un
subclasificación y a pesar de que tenemos la misma confiabilidad los datos cambian.
13. 12
CONCLUSIONES
Una estimación es puntual cuando se usa un solo valor extraído de la muestra para estimar
el parámetro desconocido de la población. Al valor usado se le llama estimador.
La media de la población se puede estimar puntualmente mediante la media de la muestra:
La proporción de la población se puede estimar puntualmente mediante la proporción de la
muestra:
La desviación típica de la población se puede estimar puntualmente mediante la desviación típica
de la muestra, aunque hay mejores estimadores:
A veces es conveniente obtener unos límites entre los cuales se encuentre el parámetro con un
cierto nivel de confianza, en este caso hablamos de estimación por intervalos.
La estadística descriptiva trabaja con todos los individuos de la población. La estadística
inferencial, sin embargo, trabaja con muestras, subconjuntos formados por algunos individuos de
la población. A partir del estudio de la muestra se pretende inferir aspectos relevantes de toda la
población. Cómo se selecciona la muestra, cómo se realiza la inferencia, y qué grado de confianza
se puede tener en ella son aspectos fundamentales de la estadística inferencial, para cuyo estudio
se requiere un alto nivel de conocimientos de estadística, probabilidad y matemáticas.
La estadística inferencial Provee conclusiones o inferencias, basándose en los datos simplificados y
analizados; detectando las interrelaciones que pueden unirlos, las leyes que los rigen y eliminando
las influencias del azar; llegando más allá de las verificaciones físicas posibles. Sobre la base de la
muestra estudiada saca conclusiones, o sea, hace inferencia o inducción, en cuanto al universo o
población, de donde se obtuvo dicha muestra.
14. 13
REFERENCIAS
Material Didáctico Maestría en Rehabilitación Visual
Materia Métodos Estadísticos
Biostatistics whit R.
An introduction to statistics.
Through Biological Data
Biblioteca Virtual UAA.
Google académico
http://www.umass.edu/statdata/statdata/stat-desc.html
http://www.umass.edu/statdata/statdata/data/lowbwt.txt
https://www.youtube.com/watch?v=_PJ44LzEOOM
https://www.youtube.com/watch?v=RgCUj7mMKhM
https://www.youtube.com/watch?v=IlrNG3LtRS0
https://www.youtube.com/watch?v=rZfgQbHmeJU
MIL GRACIAS POR LOS VIDEOS!
ME FACILITARON MUCHISIMO LA TAREA!