SlideShare una empresa de Scribd logo
1 de 254
Descargar para leer sin conexión
BIOESTADÍSTICA
HELÍ MARIANO SANTIAGO
HUÁNUCO 2019
I
H. Mariano. s
Agradecimiento
Agradezco primero a la Universidad Nacional Hermilio Valdizan de Huánuco y a sus
autoridades Dr. Reynaldo Marcial OSTOS MIRAVAL Rector, Dr. Ewer PORTOCARRERO
MERINO Vicerrector Académico y Dr. Javier G. LOPEZ Y MORALES Vicerrector de
Investigación por darme la oportunidad y facilidades para la elaboración del presente libro.
Agradecer a las autoridades, docentes y alumnos de la Facultad Ingeniería Civil y Arquitectura
donde se brinda un proceso de enseñanza aprendizaje, basado en la construcción del
conocimiento, la crítica y el sentido humano, por el apoyo que me han brindado cada uno de
ellos amablemente compartiendo su punto de vista sobre el tema y me motivaron a escribir el
libro.
Este libro no hubiera sido posible sin el interés y ánimo de mi familia: Inés, Helí, Gelí
Melquiades, Coquí, Diana, y Linlly y mis nietos Alexander, Guadalupe, Gael y Adriel.
II
H. Mariano. s
Dedicatoria
A la memoria de mis padres
Isidoro y Anastasia
Helí
A la memoria de mi esposa Catalina Bravo Cajas (1956 – 2019)
Dicen que cuando tienes a alguien que amas en el cielo, tienes un pedacito de cielo en tu casa,
para siempre.
Yo te tengo a ti Caty, pero una parte de ti vive conmigo, tu recuerdo sigue en nuestro hogar y
estas presentes en mi vida.
todo lo que me rodea tiene la huella de tu sacrificio y entrega, tu cariño y tu amor infinito que
tenías para toda la familia.
Aunque te fuiste, sigues conmigo Caty , aquí en mi corazón.
Helí
A mi familia: Inés, Helí, Gelí. M. Coquí, Diana, Linlly , Alexander, Guadalupe A., Gael H. y
Adriel. M
Helí
III
H. Mariano. s
Introducción
El desarrollo y el nivel de aplicación que la Bioestadística, como herramienta útil y
rigurosa en el campo de la investigación en todas las ciencias sociales, ingeniería, salud, etc. ha
experimentado en los últimos años, ha sido trascendental. Es indudable que este progreso ha
venido estrechamente vinculado al que ha experimentado el área de la informática.
Un segundo aspecto asociado a este progreso del conocimiento en el ámbito estadístico,
ha sido el cambio de actitud experimentado por todo el profesional de las diferentes áreas o
especialidades, especialmente en el área de la salud. De una sociedad en la que los roles y el
desempeño de la profesión estaban ajustados a la mera aplicación de los conocimientos
adquiridos, hemos evolucionado a una sociedad científica donde la investigación ha pasado a
formar parte esencial de su labor diaria. El interés por descubrir nuevos procedimientos a través
de la experiencia acumulada, ha sido determinante en la necesidad de que todos estos
profesionales se vean inmerso en la formación y aprendizaje de técnicas básicas de la
metodología de la investigación y de algunas más concretas como el análisis de datos.
Este cambio en la dimensión del ejercicio profesional, determina que los planes de
estudio de todas las licenciaturas y diplomaturas incluyan la Bioestadística para el ámbito de
salud y biología, como materia troncal como necesidad. Se pretende, con ello, que un
profesional de salud, o de cualquier otra área, que se apoye en la cuantificación y en el estudio
empírico de la que observa a diario, entienda y conozca los conceptos básicos de la estadística
que le va permitir, abandonando conductas pragmáticas, profundizar y comprender el
fundamento científico de su área de trabajo.
En muy distinta situación se encuentra los alumnos de posgrado que han comenzado su
vida profesional y han tenido, por tanto, ocasión de darse cuenta de qué manera la Bioestadística
les puede resultar útil y necesaria. Aunque no sea su deseo adentrarse en el mundo de la
investigación, una parte muy importante en la transmisión de los nuevos hallazgos y
conocimientos de otros colegas de su ámbito profesional, es el lenguaje estadístico. Es por ello
que han de estar absolutamente familiarizados con dicha terminología si se pretende tener una
actitud crítica y objetiva ante la lectura de cualquier literatura científica.
Fruto de la experiencia en el sector de estudiantes e investigadores en nuestra labor de
docente universitario, que nos ha animado a escribir el presente libro que podría ser un Manual
de Estadística Básica aplicada a el área de salud. su contenido abarca desde los aspectos más
básicos de la Estadística Descriptiva presentado en el Capítulo I, II, III en su función de resumir,
presentar y comunicar los resultados de cualquier estudio a las diferentes técnicas de
extrapolación de las conclusiones de una población, a partir de lo verificado en una muestra
aleatoria representativa de ésta. Obviamente, para ello, se hace necesario revisar las nociones
más básicas de aspectos de probabilidad presentado en el Capítulo IV, variables aleatorias,
Distribución de Probabilidad, en el Capítulo V se presenta los elementos imprescindibles de la
Inferencia Estadística: Estimaciones puntuales intervalo de confianza y contrastación de ipótesis
más importantes de la Estadística Un variante.
IV
H. Mariano. s
INDICE
Iintroducción ............................................................................ ¡Error! Marcador no definido.
Capitulo I...................................................................................................................................10
1. Intoduccion.........................................................................................................................10
1.1. Modelo matematico ................................................................................................... 12
1.2. La investigación y la estadistica ................................................................................ 13
1.3. Las base de datos se pueden utilizar siguiendo dos estrategias: .............................. 15
1.4. Recoleccion de datos.................................................................................................. 16
1.5. Fuentes de recoleccion de datos................................................................................. 18
1.6. Preparacion de las mediciones para su procesamiento y analisis. ......................... 20
1.7. Procesamiento de datos.............................................................................................. 21
1.8. Organización y presentacion de datos........................................................................ 23
1.9. Escala de medicion de las variables........................................................................... 24
1.10. Variables ..................................................................................................................... 27
1.11. Presentación de datos mediante tablas y graficos estadisticos............................... 28
1.11.1. Tablas estadísticas........................................................................................... 28
1.11.2. Gráficas de frecuencias................................................................................... 30
1.11.3. Tipos de grafico .............................................................................................. 33
CAPITULO II............................................................................................................................37
2. PRINCIPIO BASICOS DEL MUESTREO ......................................................................37
2.1. Conceptos basicos del muestreo. ............................................................................... 37
2.2. Tipos de muestreo...................................................................................................... 42
2.2.1. Muestreó no Probabilístico................................................................................. 42
2.2.2. Muestreo Probabilístico...................................................................................... 43
2.3. Diseño muestral ......................................................................................................... 44
2.4. Tamaño de muestra.................................................................................................... 44
2.4.1. Tamaño de muestra para estimar una media poblacional µ en una población finita.
46
2.4.2. Tamaño de muestra para estimar una proporción Poblacional π........................ 47
2.5. Método de selección de la muestra ............................................................................ 49
2.5.1. Tipos de muestreo Probabilístico ....................................................................... 49
V
H. Mariano. s
CAPITULO III ..........................................................................................................................60
3. CONSTRUCCION E INTERPRETACION DE TABLAS Y GRAFICOS
ESTADISTICOS .......................................................................................................................60
3.1. Tabla de frecuencias .................................................................................................. 60
3.2. Sumatorias.................................................................................................................. 62
3.3. Distribución de frecuencias con intervalos................................................................ 70
3.4. Construcción de la distribución de frecuencias ......................................................... 71
3.5. Medidas de tendencia central..................................................................................... 77
3.5.1. Media Aritmética: (µ, x )................................................................................... 78
3.5.2. Media Geométrica .............................................................................................. 82
3.5.3. La Mediana......................................................................................................... 85
3.5.4. Comparación de tres indicadores de posición .................................................... 91
3.6. Medidas de dispersión................................................................................................ 92
3.7. Coeficiente de variación ............................................................................................ 97
CAPITULO IV ........................................................................................................................117
4. INTRODUCCION AL CALCULO DE PROBABILIDAES..........................................117
4.1. Conceptos básicos de probabilidad.......................................................................... 118
4.1.1. Definición de Probabilidad............................................................................... 119
4.1.2. Modelo axiomático de probabilidad................................................................. 121
4.2. Definición axiomática de Probabilidad.................................................................... 123
4.2.1. Consistencia entre probabilidad y frecuencia relativa...................................... 124
4.3. Probabilidad Condicional......................................................................................... 129
4.4. Eventos Independientes ........................................................................................... 134
4.5. Regla de la multiplicación de probabilidades .......................................................... 137
4.5.1. Regla de la multiplicación de eventos dependientes ........................................ 137
4.5.2. Regla de multiplicación de eventos independientes......................................... 137
4.6. Regla de la probabilidad total y regla de Bayes....................................................... 138
4.7. Aplicación de probabilidades para el cálculo de Indicadores Epidemiológicas. ..... 142
4.8. Variables aleatorias y Distribución de Probabilidad................................................ 148
4.8.1. Variables aleatorias........................................................................................... 148
4.8.2. Algunas Distribuciones Importantes ................................................................ 151
VI
H. Mariano. s
4.9. Algunas Distribuciones importantes de variable Aleatorias Discretas .................... 151
4.9.1. Experimento de Bernoulli................................................................................. 151
4.9.2. Distribución Binomial ...................................................................................... 152
4.9.3. Distribución de Poissón.................................................................................... 157
4.10. Distribución de Probabilidades Continuas ........................................................... 160
4.10.1. Distribución Normal ..................................................................................... 161
4.11. Algunas distribuciones de Muestreo Importantes ................................................ 166
4.11.1. Distribución de la media de la muestral ( X ) ................................................ 166
4.11.2. Distribuciones de la diferencia entre las dos Medias Muestrales ................. 169
4.11.3. Distribución de la Proporción de la Muestra p

..................................... 170
CAPITULO V..........................................................................................................................204
5. INFERENCIA ESTADISTICA.......................................................................................204
5.1. Intervalo de Confianza para la media µ de una Población...................................... 206
5.2. Intervalo de confianza para la diferencia entre las medias de dos poblaciones....... 213
5.3. Intervalo de confianza para la proporción de una Población................................... 216
5.4. Intervalo de confianza para la diferencia entre las Proporciones de dos Poblaciones.
218
5.5. Prueba de Hipótesis.................................................................................................. 220
5.5.1. Hipótesis Estadística......................................................................................... 221
5.5.2. Tipos de Errores................................................................................................ 223
5.5.3. Procedimiento General para contrastar Hipótesis ............................................ 225
5.6. Hipótesis de independencia y homogeneidad.......................................................... 238
5.6.1. Hipótesis de Independencia.............................................................................. 239
5.6.2. Hipótesis de homogeneidad.............................................................................. 242
BIBLIOGRAFÍA.....................................................................................................................253
VII
H. Mariano. s
INDICE DE TABLAS
Tabla 1 Modelo de libro de código.......................................................................................... 21
Tabla 2 Ejemplo ilustrativo de diseño de base de datos.......................................................... 22
Tabla 3 Perú: Población de 5 y más años que asiste a un Centro educativo de enseñanza
regular, por sexo, según áreas urbana y rural Censo Nacional de 1993 ..................... 29
Tabla 4 Personas con cáncer pulmonar del Hospital regional "Hermilio Valdizán” en 2008. 32
Tabla 5 Pacientes con cáncer pulmonar según lugar de residencia: Hospital Regional “Hermilio
Valdizán”- Huánuco-2013........................................................................................................ 32
Tabla 6 Tabla de números aleatorios....................................................................................... 51
Tabla 7 Encuesta socio económica en el asentamiento humano “san Luis” distribución de
hogares según genero del jefe de familia – amarilis - Huánuco 2008.................................... 64
Tabla 8 Encuesta socio económica en el asentamiento humano “san Luis” distribución de
hogares según número de hijos por jefe de familia – amarilis - Huánuco - 2014 .................. 67
Tabla 9 Límites nominales....................................................................................................... 73
Tabla 10 Encuesta socio económica en el asentamiento humano “san Luís” distribuido por
edad de los jefe de familia – amarilis - Huánuco - 2008 ..................................................... 74
Tabla 11 agrupación de 350 obreros según su salario ............................................................ 77
Tabla 12 Encuesta distribuido por edad de los jefes de familia-amarilis-2008....................... 82
Tabla 13 Datos sin intervalos .................................................................................................. 88
Tabla 14 Ejemplo distribución de frecuencias......................................................................... 88
Tabla 15 Distribución de frecuencias con intervalos............................................................... 89
Tabla 16 Ejemplo, Cálculo de la moda sin intervalos ............................................................. 90
Tabla 17 Ejemplo, Cálculo de la moda con intervalos........................................................... 91
Tabla 18 Hijos de trabajadores por edad ................................................................................. 93
Tabla 19 Ingresos quinquenales de 45 encuestados ......................................................... 96
Tabla 20 clasificación de 900 adultos que culminaron sus estudios superiores................... 130
Tabla 21 Resultados de una encuesta a personas adultas respecto a una ley del gobierno ... 132
Tabla 22 Resultado del diagnóstico nutricional de 100 niños ............................................... 137
VIII
H. Mariano. s
Tabla 23 Estudio: Papanicolaou y Detección de cáncer cervical en una población de mujeres
................................................................................................................................................ 143
Tabla 24 Tablas de contingencia 2x2 para presentar resultados de tamizaje ........................ 144
Tabla 25 Situaciones de la realidad y decisiones posibles en los contrastes de hipótesis ..... 224
Tabla 26 Probabilidad de error al rechazar una hipótesis que es cierta................................. 227
Tabla 27 Tabla de contingencia............................................................................................ 240
Tabla 28 Casos de anemia en niños de 6 – 59 meses por tipo de anemia y Área de residencia
................................................................................................................................................ 245
IX
H. Mariano. s
INDICE DE FIGURAS
Figura 1 interrelación de áreas temáticas ............................................................................... 11
Figura 2 Esquema del proceso de decisión............................................................................. 12
Figura 3 Instrumentos de recolección de datos ...................................................................... 19
Figura 4 Técnica para la recolección de datos........................................................................ 19
Figura 5 Ejemplos de variables tipo nominal......................................................................... 24
Figura 6 Ejemplos de variables tipo ordinal........................................................................... 25
Figura 7 Ejemplos de variables medidos en escala racional .................................................. 26
Figura 8 Clasificación de variables ........................................................................................ 27
Figura 9 pacientes con cáncer según lugar de procedencia Hospital Regional “Hermilio
Valdizán”-Huánuco-2008......................................................................................................... 33
Figura 10 Gráfico de barras de pacientes con cáncer según lugar de procedencia ................ 34
Figura 11 Pacientes con cáncer según Procedencia Hospital Regional "Hermilio Valdizán"-
huánuco-2008 ........................................................................................................................... 35
Figura 12 Pacientes con cáncer según lugar de procedencia: Hospital Regional “Hermilio
Valdizán”- 2013........................................................................................................................ 36
Figura 13 Ejemplo de muestreo estratificado......................................................................... 54
Figura 14 Tabla de frecuencias para una variable categórica................................................ 60
Figura 15 Distribución de los hogares según género del jefe de familia del Asentamiento
Humano de “San Luís” – Amarilis Huanuco-2008 .................................................................. 65
Figura 16 Distribución de los hogares según número de hijos por jefe de familia del
Asentamiento Humano de “San Luís” – Amarilis Huanuco-2008........................................... 68
Figura 17 Tabla de frecuencia ............................................................................................... 68
figura 18 Polígono de frecuencias .......................................................................................... 69
Figura 19 Curva normal.......................................................................................................... 69
Figura 20 Esquema de distribución de frecuencias con intervalos........................................ 71
Figura 21 Distribución de la edad de los jefes de familia del Asentamiento Humano de “San
Luís” – Amarilis Huanuco-2008............................................................................................... 75
Figura 22 Fórmulas para calcular la media aritmética ........................................................... 80
Figura 23 Fórmulas para calcular la media geométrica.......................................................... 83
Figura 24 Partición de espacio muestral-regla de Bayes...................................................... 138
Figura 25 Ilustración de variable aleatoria ........................................................................... 149
Figura 26 Distribución normal ............................................................................................ 162
Figura 27 Región crítica (región de rechazo o aceptación).................................................. 228
Figura 28 toma de decisión basado en la estadística de prueba y región crítica ................. 230
Figura 29 Región crítica (Z positivo)................................................................................... 231
Figura 30 Región crítica (Z negativo) .................................................................................. 231
Figura 31 región crítica (Ejemplo de una Prueba de hipótesis de Independencia) .............. 244
10
H. Mariano. s
CAPITULO I
1. INTODUCCION
El conocimiento de los principios y métodos de la matemática y la estadística, y la
competencia en su aplicación son de gran importancia para el estudio de la estructura y
dinámica de la población. Estas dos disciplinas están íntimamente relacionadas con otras
disciplinas más, pues le proveen de las técnicas necesarias para obtener datos, organizar,
modelar y analizar y estudiar científicamente la población en estudio.
La asignatura de matemáticas y estadística descriptiva tiene como propósito que los
estudiantes de las diferentes carreras profesionales afianzan los conocimientos básicos de
la matemática y adquieren las destrezas necesarias para el uso y la interpretación de la
estadística descriptiva.
Para una mejor comprensión del texto, se sigue una metodología activa que consiste
fundamentalmente en: interiorizar los conceptos, analizar los ejemplos y casos y resolver
ejercicios.
Se relaciona 3 áreas temáticas: La investigación científica, la matemática y la
estadística, las cuales están muy ligadas.
El siguiente cuadro presenta esta interrelación. El hecho es que necesitamos
información para conocer la realidad y poder tomar mejores decisiones. Pero de nada sirve
tener una gran cantidad de información si no la podemos organizar, integrar y estructurar
en un modelo formal que represente la situación real.
11
H. Mariano. s
Figura 1
interrelación de áreas temáticas
Fuente: Elaborado por el autor
La matemática es una herramienta que nos permitirá pasar los modelos mentales intuitivos
a modelos formales con los cuales se trabaja.
El proceso de decisión lo podemos esquematizar así:
12
H. Mariano. s
Figura 2
Esquema del proceso de decisión
Fuente: Elaborado por el autor
1.1. MODELO MATEMATICO
Un modelo es una representación de la realidad, en la práctica primero nos formamos un
modelo mental de una situación, pero, cuando ésta es compleja es necesario
esquematizarla en un modelo formal que pueda ser analizado objetivamente ycomunicado
posteriormente.
Todo sistema tiene objetos – llámese entidad, como: población, recursos, que pueden
clasificarse en grupos o clases: profesores, médicos, alumnos de secundaria, población de
0 a 4 años etc.
Dichos objetos tienen características – llámese atributos, como: cantidad, edad, sexo –
que pueden ser fijos o variables. Por ejemplo, consideramos la entidad: población de 0
años, sus atributos son: población total, total de hombres, total de mujeres, peso al nacer,
13
H. Mariano. s
color de ojos, mortalidad etc. Seleccionamos sólo aquellos atributos variables pertinentes
al estudio, por ejemplo, sean las variables:
total de 0 a 4 años en el tiempo t
N t
M l de niños de 0 a 4 años muertos en el año t
t
t
t
X Población
Nacimiento en el año
Tota



Las relaciones funcionales describen las interacciones entre variables y parámetros.
Continuando con el ejemplo, podemos representar la población de 0 a 4 años por medio
de la relación:
1 1
0.25
t t t t t
X X N M X
 
   
Donde:
1
1
: 0 4
: de 0 a 4 del periódo t-1
N : en el periódo t
: en el periódo t
0, 25 : Pr de sobrevivientes del periódo
t
t
t
t
t
X Población de a años en el periódo t
X Población
Nacimiento
M Defunciones
oporción X
que cumpl


5 años en el periódo
ió
La ecuación que describe esta relación entre variables se expresa matemáticamente como:
1
X ( , N , , )
t t t t
F X M p


1.2. LA INVESTIGACIÓN Y LA ESTADISTICA
Una investigación comienza con saber qué es lo que se desea indagar. En muchas
ocasiones se tiene una idea vaga e imprecisa de lo que se desea investigar, lo cual lleva a
realizar un trabajo poco organizado y sin objetivos claros. Antes de emprender cualquier
investigación y en particular la investigación cuantitativa, es importante saber a dónde se
quiere llegar, para determinar:
a) La información que se debe obtener
b) Los procedimientos de recolección de datos
14
H. Mariano. s
c) Las técnicas de análisis estadístico
d) La interpretación de la información obtenida.
Por lo tanto, se requiere de un método que permita al investigador ordenar sus ideas y
establecer una secuencia de pasos a seguir, para realizar su investigación.
El uso del método científico es característico de la investigación cuantitativa. En este
tipo de abordaje metodológico, la preocupación del investigador es el rigor científico, la
construcción de instrumentos, la precisión estadística y la observación de manifestaciones
fenomenológicas que deben ser controlados. El uso de este método en la investigación
tanto teórica como aplicada, asegura la objetividad al recopilar hechos y evaluar las
alternativas de solución propuestas para resolver un problema.
En la investigación básica la evaluación de conceptos o hipótesis previas, la realización
de inferencias y las conclusiones a las que se llegue sobre los hechos o fenómenos
estudiados conducen al establecimiento de leyes generales acerca de lo estudiado.
La investigación científica incluye una secuencia de actividades que se relacionan entre
sí (metodología), y la estadística juega un rol muy importante en cada uno de los pasos,
pues permite organizar la información, analizarla para luego tomar decisiones a partir del
conocimiento del fenómeno en cuestión.
Las actividades llamados también protocolos involucradas en cada uno de los pasos,
varían de acuerdo al campo de la investigación, pero en general podemos mencionar las
siguientes:
 Planeamiento del problema de investigación
 Elaboración del marco teórico
 Formulación de hipótesis
 Diseño de investigación
 Método de obtención de datos
15
H. Mariano. s
 Análisis de los datos
 Presentación de resultados, informe final.
Estos pasos o protocolos que se han planteado es materia de estudio en los tópicos
propiamente de Investigación, en este trabajo solo queda mencionado.
1.3. LAS BASE DE DATOS SE PUEDEN UTILIZAR SIGUIENDO DOS
ESTRATEGIAS:
A. Generar ideas de investigación a partir de la información de una base de datos
llamados también minería de datos.
Esta estrategia, parte de una base de datos o minería de datos que puede haber sido poco
explotada, esta es estudiada y se formulan preguntas de investigación. Los pasos que se
sugieren en este caso son:
1. Elegir una base de datos que puede contener datos de interés
2. Familiarizarse con las variables contenidas en la base de datos
3. Formular las preguntas o hipótesis que pueden ser objeto de estudio
4. Revisar la literatura para conocer el estado dela cuestión a investigar
5. Elaborar la hoja (fichas) de registro para la obtención de los datos para el estudio
elegido.
Hacer una lista de las variables de la base de datos e intentar agruparlas según posibles
asociaciones (tomando en cuenta los objetivos y la hipótesis de la investigación).
B. Partir de un problema de investigación, formular las preguntas o hipótesis y buscar
la respuesta en la base de datos
Esta es la estrategia que hemos planteado al inicio del capítulo, con la única diferencia
que para responder a las preguntas o probar las hipótesis, el investigador no va a tener
16
H. Mariano. s
que realizar la recolección de datos en el campo, sino que tratará de obtener la
información que requiere en la base de datos.
En este caso se sugiere seguir los pasos siguientes:
1 Formular el problema de investigación
2 Revisar la bibliografía de manera exhaustiva
3 Identificar la variable establecer las definiciones conceptuales
4 Identificar y acceder a la base de datos de interés
5 Familiarizarse con la base de datos
6 Elaborar la hoja de registro de datos
El uso de base de datos existentes tiene ventajas tales como la rapidez con que se puede
disponer de la información y el bajo costo. La economía de tiempo y recursos permite
concentrar la atención en el análisis de la información de acuerdo a los objetivos y/o
hipótesis. Pero también tiene limitaciones como, por ejemplo, que las variables van a tener
que ser operacional izadas de acuerdo a la disponibilidad de datos en la base seleccionada,
esto puede llevar a una baja calidad en los resultados. Por otro lado, la base de datos
seleccionada no siempre contendrá toda la información requerida para la investigación.
1.4. RECOLECCION DE DATOS
La recolección de los datos es uno de los pasos más importantes dentro del proceso de
investigación, pero también, es uno de los más descuidados por una gran cantidad de
investigadores. Todo el celo puesto durante el planeamiento de la investigación está
orientado a medir el fenómeno en cuestión con la mayor fidelidad posible, si esto no
ocurre, no importando que tan sofisticado sea la técnica de análisis estadístico, utilizado
no nos estaremos aproximando a la realidad que queremos estudiar.
17
H. Mariano. s
Si bien es cierto que en la etapa de recolección de datos el instrumento de medición ya
debería estar validado y listo para ser utilizado, esto no siempre ocurre, cuando la
investigación es emprendida por personas que tienen poca experiencia en investigación,
por lo que en este capítulo trataremos brevemente sobre las tareas a realizar antes de pasar
a obtener los datos necesarios para cumplir con los objetivos de la investigación.
La selección del instrumento utilizado para la medición de las variables depende
de los objetivos de la investigación, de las características del informante y del método de
obtención de los datos. Esto es, los instrumentos deberán ser adaptados al contexto donde
van a ser utilizados teniendo en cuenta características que pueden condicionar la respuesta
(Ej. Una población analfabeta, o con características culturales particulares). Por ejemplo,
los cuestionarios preparados para realizar las encuestas demográficas y de Salud Familiar
(ENDES) tienen los mismos objetivos a nivel mundial, pero, han tenido que ser adoptados
a cada país debido a que las características culturales de las mujeres varían de una región
a otra.
Durante la recolección de datos se realizan tres actividades importantes y
vinculantes entre sí:
a. Evaluar el instrumento de medición diseñado durante el proceso de planeamiento
de la investigación. El instrumento debe ser válido y confiable, pues de eso depende
la calidad de la información obtenida. Si bien es cierto que en la etapa de recolección
de datos el instrumento de medición ya debería estar evaluado y listo para ser
utilizado, esto no siempre ocurre cuando la investigación es emprendida por
investigadores inexpertos.
b. Aplicar el instrumento de medición (trabajo de campo). Es decir, obtener las
observaciones de las variables que son de interés para el estudio.
c. Preparar las mediciones obtenidas para que puedan analizar correctamente (critica,
codificación y digitación de datos).
18
H. Mariano. s
1.5. FUENTES DE RECOLECCION DE DATOS
a) Fuentes Primarias.
Son aquellos que el investigador obtiene directamente de la realidad, recolectándolos con
sus propios instrumentos. En otras palabras, son los que el investigador o sus auxiliares
recogen por vez primera por sí mismos, en contacto con los hechos, ocurrencias o
fenómenos que se investigan.
Siendo los datos primarios aquellos que surgen del contacto directo con la realidad
empírica. Las técnicas encaminadas a recogerlos reflejarán, necesariamente, toda la
compleja variedad de situaciones que se presentan en la vida real.
b) Fuentes Secundarias.
Por otra parte, son registros escritos que proceden también de un contacto con la práctica,
pero que ya han sido recogidos y muchas veces procesados por otros investigadores, que
posteriormente pasa formar parte de la biblioteca, Registros Civiles, Banco de Datos,
páginas Web, otros etc.
Los datos primarios y los secundarios no son dos clases esencialmente diferentes de
información, sino son partes de una misma secuencia: todo dato secundario ha sido
primario en sus orígenes y todo dato primario, a partir del momento en que el investigador
concluye su trabajo, se convierte en dato secundario para los demás.
INSTRUMENTOS DE RECOLECCIÓN DE DATOS
19
H. Mariano. s
Figura 3
Instrumentos de recolección de datos
INSTRUMENTO
DE RECOLECCION
DE DATOS:
Medios que permiten
al investigador registrar
la información
Test Inventario
Guía de
entrevista
Ficha
de
Investigación
Cuestionario
Guía de
Observación
Fuente: Elaborado por el autor
TECNICA DE RECOLECCION DE DATOS
Figura 4
Técnica para la recolección de datos
Procedimientos para recolectar
La información requerida
Entrevista
Observación
Encuesta
Técnicas
de
Evaluación Fichaje
Análisis
Documental
20
H. Mariano. s
Fuente: Elaborado por el autor
1.6. PREPARACION DE LAS MEDICIONES PARA SU PROCESAMIENTO Y
ANALISIS.
Crítica o edición. - Durante el proceso de elaboración del cuestionario o algún
instrumento de recolección de datos se prepara un plan de crítica y codificación, con el
fin de establecer las acciones a tomar en caso de detectar omisiones, duplicaciones e
inconsistencias en las respuestas en el momento del registro.
Durante la etapa de crítica o edición se tratará de detectarlos y corregirlos siguiendo las
instrucciones del plan de crítica.
Otro momento en el cual es posible que se cometan errores es durante el proceso de
transcripción de los datos a una computadora para su procesamiento posterior. Durante el
proceso de registro o transcripción se pueden introducir los errores de diversos tipos (de
registro, de observación, digitación, etc.). Durante la etapa de críticas o edición se tratará
de detectarlos y corregirlos.
Codificación. - Consiste en la asignación de claves numéricas o códigos a las respuestas
proporcionadas por los entrevistados. Por ejemplo, los datos sobre ocupación, lugar de
nacimiento, estado civil, grado de instrucción, sexo, etc. Son variables medidas en escala
nominal y ordinal así que deberá asignárseles códigos (de preferencia numéricos). Por
otro lado, aquellas variables como edad, número de hijos, número de abortos, número de
camas en un hospital no requieren códigos especiales pues las respuestas son numéricas.
Preparación del Libro de Códigos. - es un documento que describe la estructura de los
datos en la computadora (base de datos). Contiene los nombres internos de las variables
(Código de 8 a 10 caracteres), la descripción de los códigos asignados a las categorías de
respuesta, yel espacio que ocupa la respuesta (tamaño del campo). Este documento servirá
como guía para localizar las variables e interpretarlas durante el proceso de preparación
de la base de datos y el análisis estadístico.
21
H. Mariano. s
Los resultados del instrumento de medición se transfieren a la matriz de datos en la
computadora usando la estructura establecida en el libro de códigos.
Para ilustrar la construcción e interpretación de tablas, gráficos e indicadores estadísticos
utilizaremos los datos de una encuesta realizada en el distrito de Amarilis – Huánuco. El
objetivo de la investigación es averiguar el nivel socioeconómico de las familias del
asentamiento humano “San Luís”. Se seleccionó una muestra de 65 jefes de familia
residentes en un asentamiento humano y se preparó cuestionario para averiguar entre
otras cosas: edad, género, grado de instrucción y número de hijos.
Libro de código
Tabla 1
Modelo de libro de código
Etiqueta Código Tipo de
variable
Categorías Tamaño del
campo
Identificación
Edad
Género
Grado de
Instrucción
Fuente: Elaborado por el autor
1.7. PROCESAMIENTO DE DATOS
Antes de proceder al vaciado de la información en la computadora necesitamos copiar
el libro de códigos en el programa computacional a usarse, este proceso es denominado
preparación de la estructura de la base de datos, luego se procederá a ingresar los datos en
22
H. Mariano. s
la computadora. El siguiente paso será verificar la consistencia de los datos, esto es,
verificar si los datos han sido digitados correctamente, etc.
El diseño de la base de datos para el ejemplo ilustrativo Encuesta Socio Demográfico
en el Asentamiento Humano “San Luís”.
Tabla 2
Ejemplo ilustrativo de diseño de base de datos
IDEN EDAD SEXO Gra. de Inst. Hijos
1
2
…….
65
Fuente: Elaborado por el autor
Los programas computacionales como el SPSS, SAS; STATA, EPI INFO etc. Solicitan
que el usuario especifique el tipo de variable (numérico o categórico) antes de ingresar
los datos.
Ilustraremos los conceptos vertidos utilizando la encuesta demográfica en el asentamiento
humano “San Luis”. Una vez identificado el tipo de cada una de las variables estudiadas
completamos la información del libro de códigos.
Ejercicios propuestos
1.- ¿Qué otro instrumento de recolección de datos conoce?
2. Ha tenido la oportunidad de diseñar un instrumento de recolección de información?
3. Elabore un cuestionario, tomando en consideración los criterios, características y
recomendaciones proporcionadas para el ejemplo de investigación que se propuso.
4. Las fichas de registro de estadísticas vitales constituyen un ejemplo de instrumento de
recolección de datos, así tenemos por ejemplo las fichas de registro de nacimiento.
Tomando en cuenta esta conteste las siguientes interrogantes.
23
H. Mariano. s
a) ¿Cuál es el objetivo de esta ficha?
b) ¿Qué institución es la encargada de recabar esta información?
c) Identifique las variables estadísticas que contiene la ficha
d) Describa la escala de medición y el tipo de cada variable
e) Diseñe un libro de códigos
f) diseñe la base de datos
5. obtenga el cuestionario utilizado en la ENDES 2000. Seleccione la sección
ANTICONCEPCIÓN Y LACTANCIA y describa las variables (escala de medición,
categoría de las variables, tipo de variables). Prepare un libro de códigos y diseñe una
base de datos.
1.8. ORGANIZACIÓN Y PRESENTACION DE DATOS
La aplicación del instrumento de medición va a producir un conjunto de datos, pero, tal
como se encuentran al ser recolectados (datos crudos) serán poco informativos y
difícilmente interpretables, así que, para realizar el análisis estadístico será necesario
organizarlos y presentarlos de manera resumida.
Esta tarea es muy importante porque va a dar una visión de las características generales
del fenómeno estudiado y permitirá explorar comportamientos sistemáticos y tendencias
de la población en estudio.
La elección de la técnica estadística, para analizar los datos, está íntimamente relacionada
con los objetivos de la investigación, la cantidad de datos disponibles y la escala de
medición. Pero, en todos los casos la primera tarea será explorar y describir las
observaciones mediante tablas y gráficos.
24
H. Mariano. s
1.9. ESCALA DE MEDICION DE LAS VARIABLES
Como resultado de la Operacionalización de las variables podemos medir una variable de
investigación a través de uno o más indicadores estadísticos. Estos indicadores
constituyen las variables en el contexto de la estadística. Por ejemplo, el número de hijos,
edad, estado civil, lugar de nacimiento, número de pacientes, madres gestantes, etc.
De acuerdo al tipo de respuesta las variables estadísticas se clasifican en nominal,
ordinal, de intervalo y razón. Veamos en que consiste cada una de ellas.
A. Escala Nominal
Cuando la operación de medir la variable consiste simplemente en la asignación de
nombres o números a distintas categorías de respuesta. La función del número en este
nivel de medición es muy elemental, solamente es utilizado para clasificar, pero no es
posible realizar operaciones aritméticas.
Algunos ejemplos de variables con este nivel de medición son:
Figura 5
Ejemplos de variables tipo nominal
a) Género:
Masculino…………. 1
Femenino…………… 2
c) Estado Civil
Casado(a)…………… 1
Soltero(a)…………… 2
Divorciado(a)………. 3
Otro………………… 4
b) Lugar de Nacimiento Código
……………………
……………………
……………………
……………………
Fuente: Elaborado por el autor
25
H. Mariano. s
Las variables medidas en escala nominal pueden incluir dos categorías de respuesta
(variables dicotómicas o binarias). Por ejemplo el género, o pueden tener varias
categorías como en el caso del lugar de nacimiento o el estado civil (politómicas).
B. Escala Ordinal
En esta escala de medición podemos distinguir entre las diferentes categorías de
respuesta, las cuales indican si un sujeto posee en mayor o menor grado el atributo que
estamos midiendo. Ejemplos de este nivel de medición son:
Figura 6
Ejemplos de variables tipo ordinal
a) Grado de instrucción:
Ningún Nivel……… 0
Primaria……………. 1
Secundaria………….. 2
Superior………… . 3
b)Estado de la anemia de la madre
Sin anemia……………… 0
Leve……………………. 1
Moderada……………… 2
Severa…………………. 3
b) Estrato Socioeconómico
Bajo……………… … 1
Medio …………… … 2
Alto……………… … 3
c) Orden de nacimiento del hijo
Primero………………… 1
Segundo……………….. 2
Tercero………………… 3
Fuente: Elaborado por el autor
C) Escala de Intervalo
Cuando además del orden o jerarquía entre las categorías de la variable se pueden
establecer intervalos de igual amplitud en la medición. Las distancias entre las categorías
son las mismas a lo largo de toda la escala. El cero (0) en la medición es arbitrario y no
indica ausencia del atributo.
26
H. Mariano. s
Un ejemplo clásico de esta escala es la que resulta de medir la temperatura (grados
centígrados o Fahrenheit). En este caso el cero es referencial y es diferente para las dos
escalas.
D) Escala Racional (o de razón)
Cuando una variable es medida con esta escala se puede determinar la cantidad del
atributo poseída por el individuo.
Esta es la escala de medición de variables ideal en la investigación, pues, permite
establecer diferencias entre cualquier par de sujetos (u objetos) con un máximo de
presión. El cero es real e indica ausencia del atributo. (Con las variables así medidas se
puede realizar las operaciones aritméticas básicas y sus derivaciones).
A esta escala pertenece el sistema métrico, el sistema de pesos, todos los atributos que
son tomados a través de una unidad de medida.
Ejemplos de variables medidas con esta escala.
Figura 7
Ejemplos de variables medidos en escala racional
a) ¿Cuántos hijos nacidos vivos
tiene?
……………………….
b) ¿Cuántos años tiene?
……………………
c) ¿Cuál fue el peso del recién
nacido?
……………………….
d) ¿Cuál es la tasa de natalidad de
este distrito?
……………………………
Fuente: Elaborado por el autor
Es importante resaltar que, la posibilidad de utilizar determinadas técnicas de análisis de
datos depende en gran parte de la escala en que ha sido medida la variable. Por ejemplo,
no es posible calcular la media aritmética o la varianza de una variable medida en escala
nominal como el género.
27
H. Mariano. s
1.10. VARIABLES
Fuente: Elaborado por el autor
LAS VARIABLES
Definición de las
variables
Conceptualmente
Operacionalmente
Es cualquier característica, cualidad o propiedad de
un fenómeno o hecho que tiende a variar y que es
susceptible de ser medido y evaluado, o también
CARACTERISTICAS
Están contenidas necesariamente en el título del problema, el
objetivo y la hipótesis de investigación
Son aspectos que varían o adoptan distintos valores
Orienta el establecimiento de indicadores
Ayuda a descubrir las fuentes de información
CLASIFICACION DE VARIABLES
POR SU
NATURALEZA
POR SU
RELACION
POR SU NUMERO
DE VALORES
CUANTITATIVA
CUALITATIVA
DEPENDIENTE
INDEPENDIENTE
I
N
T
E
R
V
I
N
I
E
N
T
E
DICOTOMICAS POLITOMICAS
DISCRETAS CONTINUAS
Figura 8
Clasificación de variables
28
H. Mariano. s
1.11. PRESENTACIÓN DE DATOS MEDIANTE TABLAS Y GRAFICOS
ESTADISTICOS.
Una vez digitados los datos se tiene un conjunto de números en un arreglo (base de datos)
pero tal como estos se encuentran no es posible extraer la información necesaria, por lo
que se hace necesario organizarla y presentarla en tablas y gráficos estadísticos que
permitirán analizar la información contenida en los datos.
1.11.1. Tablas Estadísticas.
Las tablas (o cuadros) estadísticas constituyen un primer resumen de los datos. Pueden
referirse a una sola variable (tablas de frecuencia), a dos o más variables (tablas de
contingencia o tablas cruzadas o tabla doble entrada). Pero, ¿cómo decidimos que tablas
de contingencia o de frecuencias elaborar? . En el momento que Ud. Se haga esta pregunta,
recuerde los objetivos de la investigación. Las tablas que se diseñan deben de servir para
obtener información que permita responder a sus preguntas y a los objetivos de la
investigación.
Recuerde que la investigación científica debe ser organizada, entonces lo lógico es que
primero se diseñen las tablas de acuerdo a sus objetivos.
Una tabla estadística adecuadamente diseñada debe tener las siguientes partes.
29
H. Mariano. s
Tabla 3
Perú: Población de 5 y más años que asiste a un Centro educativo de enseñanza
regular, por sexo, según áreas urbana y rural Censo Nacional de 1993
Fuente: Instituto Nacional de Estadística e Informática
1. Número. - Cuando se tiene más de una tabla es importante asignarle un
número que permitirá hacer referencia a cada uno de ellos en el proceso de análisis
de resultados
2. Título. - Es un resumen de la información contenida en la tabla, debe de ser claro,
conciso y debe de tratar de responder a las preguntas, ¿Cuál es la población o grupo
de estudio?, ¿Cómo está organizado la tabla?, la referencia temporal y la referencia
espacial.
3. Encabezamiento. – Esta en la primera fila y contiene la descripción de las columnas
de la tabla
4. Cuerpo. – Es la parte central de la tabla, aquí se encuentran la información numérica
que resume el comportamiento del fenómeno estudiado.
5. Notas explicativas o pie de tabla. - Se coloca debajo de la línea de cierre, en ella se
colocan aclaraciones en relación a la tabla, fuente de donde proviene los datos, etc.
La presentación de una tabla deberá cumplir con los requisitos siguientes:
Área
Género Total
Masculino Femenino
Urbana
Rural
Total
Título
Encabezamiento
Cuerpo
Pie de tabla
30
H. Mariano. s
 Antes de elaborarla es importante establecer algún criterio de ordenamiento de
los datos (diseño de la tabla).
 Ninguna casilla debe quedar en blanco, si el dato no es aplicable o no hay
información deberá colocarse un guion o algún otro símbolo en la casilla
correspondiente.
 Las unidades de medida de las variables deben estar claramente especificadas.
 La tabla debe ser sencilla y explicativa. En algunos casos es mejor usar dos o
más tablas sencillas en lugar de una sola muy compleja.
 La tabla debe explicarse por sí misma, para ello:
o El título de la tabla debe ser claro, conciso y exacto.
o Si se usan abreviatura o símbolos deben aclararse en las notas explicativas.
o Cada fila y columna deben ser tituladas de manera clara y concisa.
o Deberán consignarse totales, los que se puede colocar de diferentes formas
según se desee o no hacer énfasis los totales.
o Si los datos consignados en la tabla no son originales deberá mencionarse
la fuente al pie de la tabla.
1.11.2. Graficas de frecuencias
Las tablas estadísticas son por sí misma resúmenes de datos, sin embargo, puede
ocurrir que estas sean, inevitablemente, demasiado amplias o complejas, en
consecuencias se dificulta la visualización de algunas características importantes, por
lo que necesitamos otro modo de resumir la información.
Los gráficos o representación pictóricos son formas de resumir la información que son
más fáciles de entender que las tablas, la información contenida (en términos numéricos)
es mejor, y, es entendible en comprensión de los datos.
Es importante recordar que:
“La característica principal de un buen gráfico es que; debe ser explicativo por sí
mismo”
31
H. Mariano. s
Un gráfico adecuado y que se explique por sí mismo debe contener:
 Número de gráfico. - Cuando se tiene más de uno es importante asignarle un número
que permitirá referirse a ellos en el proceso de análisis de resultados.
 Título. - El título es un resumen de la información contenida en el gráfico y debe
tratar de responder a las preguntas, la población de referencia ¿Qué es….? o ¿Quiénes
son…?, ¿Cómo está organizado?, la referencia temporal ¿Cuándo? y la referencia
espacial ¿Dónde?.
 Cuerpo del gráfico. - Es la figura que resume el comportamiento del fenómeno
estudiado. La elección del tipo de gráfico a usar dependerá del tipo de variable (numérica
o categórica) y de los objetivos de la investigación.
 Leyenda. - Contiene aclaraciones con respecto al gráfico
 Notas explicativas. - Van al final del gráfico, en ella se coloca información relativa a
la fuente, aclaraciones referida a las cifras, a los encabezados, etc.
Al seleccionar un gráfico para representar los datos, el investigador debe:
 Tener claridad con respecto a la información que se quiere resaltar, es decir, el
mensaje que se desea transmitir
 Conocer los diferentes tipos de gráficos y las situaciones en las cuales son
aplicables, con el fin de hacer la elección correcta
 Tener en cuenta el público al que va dirigida la información.
 Recordar que el gráfico más efectivo es el más sencillo
Ejemplo. - A continuación, se presenta los resultados de 30 personas con cáncer pulmonar
de Hospital Regional “Hermilio Valdizan” en 2008. Estos datos servirán para el desarrollo
de este tema. Los enfermos se clasifican según ciudad de residencia (A, B, C, D), edad
(años) y sexo (M=masculino y F= femenino). Los resultados fueron:
32
H. Mariano. s
Tabla 4
Personas con cáncer pulmonar del Hospital regional "Hermilio Valdizán” en 2008
Paciente Ciudad Edad Sexo Paciente Ciudad Edad Sexo
1 A 30 M B 46 F
2 A 43 M A 69 M
3 B 58 F A 44 M
4 C 61 M C 59 F
5 A 70 M D 62 M
6 D 42 F D 66 M
7 C 58 F C 71 M
8 A 39 M A 70 F
9 B 60 F C 65 M
10 B 55 M D 39 M
11 C 57 M A 40 F
12 A 49 M A 61 F
13 A 61 F B 65 M
14 D 69 M B 56 M
15 D 43 M C 38 M
Fuente: Unidad Estadística del Hospital
Tabla 5
Pacientes con cáncer pulmonar según lugar de residencia: Hospital Regional
“Hermilio Valdizán”- Huánuco-2013.
Ciudad fi hix100
A 11 36,67
B 6 20,0
C 7 23,3
D 6 20,0
Total 30 100,0
Fuente: Unidad Estadística del Hospital
33
H. Mariano. s
Figura 9
pacientes con cáncer según lugar de procedencia Hospital Regional
“Hermilio Valdizán”-Huánuco-2008
Fuente. - Datos de la Unidad Estadística del Hospital
1.11.3. TIPOS DE GRAFICO
La elección de un gráfico para representar los datos está sujeta a ciertos principios. Sin
embargo, la creatividad ha dado lugar a nuevos tipos de gráficos y variaciones de los ya
existentes.
Algunos gráficos comúnmente usados son:
a) Gráficos de barras. - representa hechos o fenómenos sin continuidad. Las
categorías pueden ser colocadas en cualquier orden, pueden representar distintos
aspectos, no ordenados de una característica. Se presenta los pacientes con cáncer
según lugar de procedencia. Este tipo de barras es simple. Se sugiere que el espacio
Número
Cuerpo
Título
34
H. Mariano. s
de barra a barra no debe ser menor a la mitad del ancho de la barra, ni sobre pasar al
ancho de la misma.
Figura 10
Gráfico de barras de pacientes con cáncer según lugar de procedencia
Fuente: Elaborado por el autor
b) Gráficos Lineales.- Llamaremos polígonos de frecuencia absoluta simple a la unión
de los puntos medios del lado superior (el opuesto a la base) de cada rectángulo del
histograma, formándose de esta manera líneas rectas.
35
H. Mariano. s
Figura 11
Pacientes con cáncer según Procedencia Hospital Regional "Hermilio Valdizán"-
huánuco-2008
D
C
B
A
12
10
8
6
4
2
0
Ciudad
Count
Chart of Ciudad
Fuente: Elaborado por el autor
36
H. Mariano. s
c) Grafico circular. - Para su elaboración se utiliza la circunferencia, siendo necesario
que los valores absolutos y/o porcentajes sean traducidos a grados, los 360º se
reparten en proporción a los respectivos porcentajes. Correspondiendo a cada sector
de la circunferencia la magnitud de cada categoría de la variable.
Figura 12
Pacientes con cáncer según lugar de procedencia: Hospital Regional “Hermilio
Valdizán”- 2013
Fuente: Elaborado por el autor
37
H. Mariano. s
CAPITULO II
2. PRINCIPIO BASICOS DEL MUESTREO
2.1. CONCEPTOS BASICOS DEL MUESTREO.
La experiencia con el muestreo es un hecho corriente que ocurre cotidianamente, basta
observar como un cocinero verifica el sabor de un plato que está preparado, como alguien
verifica la temperatura de un humeante plato de sopa, o como un médico detecta las
condiciones de un paciente a través de una serie de exámenes clínicos. Se pueden
mencionar otros ejemplos que usan procedimientos muéstrales más complejos, pero,
todos tienen el mismo objetivo: obtener información sobre el todo basados en el
conocimiento de una parte.
El uso inadecuado de un procedimiento muestral puede llevar a un sesgo (error) de
interpretación del resultado. Por ejemplo, no mover bien la sopa antes de tomar una
cucharada para probarla puede llevar a una subvaloración de la temperatura del plato y la
consecuencia puede ser que la persona se queme. Aun cuando el deseo del investigador,
Parámetros
Población Probabilidad
Muestra
Estadísticas
MUESTREO
38
H. Mariano. s
es usar muestras que produzcan resultados confiables y libres de sesgos, en estudios
sofisticados donde la información es obtenida a través de las técnicas de muestreo, es
común que el investigador quede tan entusiasmado por la prisa y la interpretación de los
datos que olvide verificar posibles sesgos originarios del diseño de la muestra (protocolo
de elección de la muestra).
Cuando se toma una decisión en base a la información de una muestra siempre existe
riesgos de cometer un error (error de muestreo). Por ejemplo, supongamos que, se está
experimentando con dos tipos de medicamentos para tratar la artritis reumatoide. Uno de
los medicamentos es el que tradicionalmente se ha estado utilizando y el otro es nuevo.
Se selecciona una muestra de 40 pacientes con características similares y se asigna
aleatoriamente 20 pacientes al tratamiento tradicional, los otros 20 son tratados con un
medicamento nuevo. Luego, estos pacientes son evaluados y se observa que 70% de los
pacientes asignados al medicamento tradicional y el 74% de los que recibieron el nuevo
medicamento muestran una mejoría. Entonces, la conclusión podría ser que el nuevo
medicamento es mejor que el tradicional, pero, también podría ocurrir que ambos sean
igualmente efectivos y que la diferencia observada sea debido a la casualidad o a
fluctuaciones muéstrales. Este riesgo de conclusiones erradas puede ser medido siempre
que el muestreo sea probabilístico.
La teoría del muestreo describe las características, ventajas y desventajas de los
diferentes diseños muéstrales. Los conceptos no son triviales y es importante que sean
establecidos para el uso científico de los procedimientos muéstrales.
La teoría del muestreo utiliza un conjunto de términos que tienen un significado
particular dentro de este contexto, por lo que, es importante que nos familiarizamos con
39
H. Mariano. s
la terminología utilizada. Para ilustrar los conceptos que vamos a mencionar, enunciamos
un ejemplo.
Ejemplo
Estamos interesados en averiguar cuál es la prevalencia de asma en niños de 5 a 15 años
en el distrito de Amarilis – Huánuco.
Unidad de análisis (elemento).- Llamado también unidad estadística un elemento es un
objeto o sujeto en el cual se realizan las mediciones. Un niño entre 5 a 15 años que vive
en el distrito de Amarilis es un elemento o unidad de análisis.
En ciertos estudios existen dos o más unidades de análisis; ejemplo, madre e hijo menor
de 5 años. Entre otros ejemplos se tiene: un paciente, una familia, un animal experimental
etc.
Población. - denominado también universo, se refiere al conjunto de individuos u objetos,
que tiene la característica de interés. La población en una investigación estadística se
define siempre arbitrariamente nombrando sus propiedades particulares (criterios de
inclusión). Usualmente, el número de individuos u objetos que conforman la población se
denota con la letra “N”. Por ejemplo, la población está constituida por todos los niños
entre 5 y 15 años que vive en el distrito de Amarilis. Para determinar cuántos niños entre
5 y 15 años viven actualmente en el distrito (N), podemos recurrir a las publicaciones del
Instituto nacional de Estadística (INEI).
Muestra. - Es una parte o subconjunto representativo de la población. El número de
individuos u objetos que conforman la muestra se suele denotar con la letra “n”. Por
ejemplo, el estudio que vamos a realizar tiene un presupuesto bastante limitado, además
disponemos de poco tiempo, por lo que decidimos realizar el estudio a partir de una
40
H. Mariano. s
muestra de hogares (n). Dentro del hogar entrevistaremos a todos los niños que cumplan
con el criterio de inclusión (edad entre 5 y 15 años).
Unidad de Muestreo. - Es una unidad del marco de muestreo. En algunos estudios es
igual a la unidad de análisis Son colecciones no traslapados de elementos que cubren la
población completa. En nuestro ejemplo; la unidad de muestreo en este caso en el hogar.
Podemos citar otro ejemplo en un estudio en que se dispone de la relación de escolares de
donde se seleccionara una muestra de ellos para observar el estado de salud de cada
escolar seleccionado, la unidad de muestreo es igual a la unidad de análisis; un escolar.
Sin embargo, si se quiere estudiar en una comunidad desnutrición de menores de 5 años
u solo se dispone de un plano dividido en manzanas y viviendas ( lotes ) y se va muestrear
esta para llegar a los niños menores de 5 años, la unidad de muestreo es una vivienda y la
unidad de análisis un niño menor de 5 años. Otros ejemplos de unidad de muestreo: una
historia clínica, una radiografía, etc.
Marco Muestral.- Es una lista de unidades de muestreo. El marco muestral estará
constituido por la relación de hogares del Distrito de Amarilis con sus respectivas
direcciones domiciliarias y nombres del jefe del Hogar. Esta información la podemos
obtener en el INEI. Otros ejemplos una lista de nombres, el cuaderno de citas de
enfermería, disco duro de una computadora, un plano, archivo clínico, archivo del
servicio, etc. En algunos estudios no se dispone del marco muestra, en tal caso habrá que
proceder a su confección.
Parámetro. - Es una medida descriptiva calculada a partir de los datos de la población.
Algunos parámetros de interés en el análisis estadístico son:
41
H. Mariano. s
2
: in o promedio poblacional.
: de variabilidad denominado varianza poblacional
:Indicador de variabilidad denominado desviación estándar poblacional
: Pro
Indicador de posición denom ado media
Indicador



 porción poblacional (o prevalencia poblacional)
En el ejemplo el parámetro de interés es la prevalencia de asma en el distrito.
 : Prevalencia de asma en niños con edades entre 5 y 15 años en Amarilis.
Estadística. - Es una medida descriptiva calculada a partir de los datos de una muestra,
son calculadas para estimar parámetros poblacionales desconocidos. Las estadísticas más
frecuentemente utilizadas son:
2
:
: muestral
S: Desviación estándar muestral
P: Proporción muestral (prevalencia muestral)
x Media muestral
S Varianza
El parámetro a ser estimado es la prevalencia (proporción) poblacional, luego la
estadística que utilizaremos para estimar la prevalencia será la proporción muestra.
P: Prevalencia de asma en la muestra de niños entre 5 y 15 años del distrito de Amarilis.
Muestras aleatorias. - Es un término utilizado para determinar a las muestras
seleccionadas utilizando mecanismos que garanticen que cada uno de las unidades de
muestreo tenga la misma probabilidad de formar parte de la muestra. Por ejemplo, al tener
la lista completa de todos los hogares del distrito de amarilis, con la dirección y nombre
del jefe de hogar podemos utilizar algún mecanismo que nos garantice que todos los
hogares tengan la misma probabilidad de ser elegidos para la muestra. Este mecanismo
puede ser una tabla de números aleatorios u otro como el baloteo en una urna en la que
debe garantizarse la aleatoriedad.
42
H. Mariano. s
Muestreo. - Este término se refiere a una serie de técnicas utilizadas para seleccionar
muestras.
2.2. TIPOS DE MUESTREO
El muestreo puede ser: Probabilístico o no probabilístico. La determinación de cuál de los
dos tipos de muestreo será utilizado en una investigación va a depender de los objetivos
del estudio y el alcance de sus contribuciones. Veamos en que consiste cada uno de los
tipos de muestreo.
2.2.1. Muestreó no Probabilístico
Este tipo de muestreo también denominado muestreo intencional o muestreo dirigido, se
caracteriza por que el procedimiento de selección de la muestra se realiza de manera un
poco informal y arbitraria. Esto conduce a que algunos elementos de la población no
tengan ninguna probabilidad de ser seleccionados.
La ventaja del muestreo no probabilístico es su utilidad para ciertos estudios; en los cuales
no es indispensable que las muestras sean representativas de la población, si no que reúnan
ciertas características previamente especificadas. Este tipo de muestreo tiene muchas
desventajas. La primera es que: cuando las muestras son NO probabilística, no podemos
evaluar el riesgo de decisiones y conclusiones erradas. Por lo tanto, las inferencias
realizadas con este tipo de muestras no tienen validez estadística.
Los tipos más comunes de muestras no probabilísticas son:
a) Muestras de sujetos voluntarios.
Son frecuentes en los estudios, donde los sujetos acceden voluntariamente participar en
el estudio. Por ejemplo, supongamos que un investigador ha descubierto un medicamento
que el asegura que cura el SIDA. Un grupo de personas con la enfermedad se ofrecen para
recibir tratamiento en este nuevo medicamento.
43
H. Mariano. s
b) Muestra de expertos
Cuando es necesaria la opinión de personas que son expertas en un tema, son muy
frecuentes en estudios cualitativos y exploratorios. Este tipo de muestreo se utiliza por
ejemplo para validar cuestionarios.
c) La muestra por cuotas
Utilizado en estudios de opinión y de mercados. Los encuestadores reciben instrucciones
de entrevistar individuos hasta completar un cierto número.
d) Estudio de casos
Este diseño muestral es muy utilizado en el área médica, donde el investigador interesado
en un tema particular, va registrando los casos que van llegando a su servicio.
2.2.2. Muestreo Probabilístico
En este tipo de muestreo cada unidad de muestreo tiene una probabilidad conocida e
igual; de ser seleccionada para la muestra. Dado que la probabilidad de seleccionar cada
elemento de la población es conocida, el investigador puede utilizar las diversas reglas y
leyes de la probabilidad para evaluar la confiabilidad de las conclusiones que se
obtengan a partir de muestras probabilísticas. En otras palabras, cuando una muestra es
probabilística el riesgo de decisiones y conclusiones incorrectas (errores de muestreo)
puede ser cuantificado.
El riesgo de decisiones y conclusiones incorrectas es inherente al muestreo, pero puede
ser controlado si se planea cuidadosamente el muestreo (diseño muestral) y se respetan
las reglas del muestreo probabilístico. Por ejemplo, en nuestra investigación acerca de la
prevalencia de asma en niños de 5 a 15 años en el distrito de Amarilis, garantizamos la
validez externa de nuestro estudio si obtenemos una muestra probabilística. Obtendremos
la información diseñando una encuesta por muestreo probabilístico.
44
H. Mariano. s
2.3. DISEÑO MUESTRAL
Cuando decidimos seleccionar una muestra aleatoria de inmediato surgen dos preguntas:
1. ¿Cuántos individuos son necesarios para que la muestra represente a la población?
2. ¿Cómo se debe seleccionar los individuos que conformarán la muestra?
Las respuestas a ambas preguntas deben estar contenidas en el diseño muestral,
en el cual se establece el tamaño de la muestra (n) y método de selección de las unidades
de muestreo. Muy brevemente trataremos de responder a las dos preguntas que
surgen de manera natural en el muestreo.
2.4. TAMAÑO DE MUESTRA
La pregunta que surge de inmediato, cuando se decide hacer una investigación por
muestreo es ¿Cuántos sujetos debo considerar en la muestra? O ¿cuál es el tamaño de
muestra adecuado………?. La respuesta es ¡Depende…...!
. De pende, de aspectos prácticos como: ¿cuál es el presupuesto para realizar el estudio?,
¿de cuánto tiempo disponemos para realizarlo y presentar los resultados?, ¿qué tan grande
es la población sobre la cual queremos hacer las inferencias?
. Depende de aspectos estadísticos como: ¿qué tan rara es la característica que
pretendemos investigar?, ¿qué tanta confianza estamos dispuestos a depositar en los
resultados de la muestra?, ¿cuál es el grado de variabilidad de la característica principal
de nuestro estudio?
Comentaremos brevemente los aspectos estadísticos:
i) El grado de variabilidad de la población con respecto a la característica de interés (
2
 ).
45
H. Mariano. s
Si la población es homogénea (varianza pequeña), bastará una muestra pequeña para
captar la variabilidad de la población. Por el contrario, si la población es muy heterogénea
(varianza grande), se requerirá una muestra grande para capturar toda la variabilidad de
la población.
ii) El margen de error que estamos dispuesto a cometer al hacer las inferencias de la
muestra hacia la población (  ).
El parámetro desconocido que estamos estudiante tiene un valor, el cual va a ser
aproximado a partir de una estadística (estimación). Lo ideal sería que el valor de la
estadística sea igual al valor del parámetro, pero como estamos considerando una muestra,
solamente, vamos a obtener un valor aproximado.
Antes de determinar el tamaño de muestra; es necesario establecer la máxima discrepancia
(error) entre los variables muestral y poblacional que estamos dispuestos a tolerar, es
decir,
Error: - Estadística
Parámetro
 
iii) El nivel de significación ( )

El parámetro cuyo valor estamos investigando es desconocido, por lo que el error (  )
sólo puede ser establecido en términos probabilísticos. Sólo podemos decir con que
probabilidad esperamos cometer el error que fijamos
Las fórmulas para determinar el tamaño de muestra varían de acuerdo al método de
selección de los elementos de la muestra (tipo de muestreo probabilístico).
Una vez respondidas estas cuestiones, se puede recurrir a la teoría del muestreo las que nos
proporcionara las fórmulas matemáticas para determinar el tamaño adecuado de muestra.
46
H. Mariano. s
2.4.1. Tamaño de muestra para estimar una media poblacional µ en una
población finita.
En el muestreo aleatorio simple el tamaño de la muestra es necesario para estimar la
media, está dado por la expresión.
2 2
1
2
2 2 2
1
2
( 1)
z N
n
N z



 



 
Donde
N: Tamaño de la población
2
1
2
z 

: Coeficiente de confianza cuyo valor depende del nivel de confianza de la
estimación de la media poblacional.
ε : Precisión deseada de la estimación de la media poblacional. ( También se le
denomina error absoluto o error máximo permisible )
2
 : Varianza poblacional que es objeto de estudio. En esta fórmula cuando no se
conoce la varianza, se debe recurrir a una encuesta piloto con el fin de hacer la
estimación correspondiente.
Nota 1.- En caso de no conocer el tamaño de la población porque ésta es demasiado
grande, se empleará la siguiente fórmula para determinar el tamaño de la muestra:
2 2
1
2
2
z
n
 



47
H. Mariano. s
Las ecuaciones más frecuente para el cálculo del tamaño de muestra ( n )
2 2
1
2
2 2 2
1
2
( 1)
z S N
n
N z S






 
S: La desviación estándar estimada, la que puede obtenerse de alguna de las tres maneras
siguientes:
 En la revisión bibliográfica
 En estudios pilotos
 Si la variable de estudio tiene distribución normal y se conoce el valor máximo y el
valor mínimo.
6
Valor máx Valor mín
X X
S


En caso de no conocer el tamaño de la población porque ésta es demasiado grande, se
empleará la siguiente fórmula que es más frecuente es decir la varianza estimada a través
de los criterios mencionados para la formula anterior para determinar el tamaño de la
muestra:
2 2
1
2
2
z S
n




2.4.2. Tamaño de muestra para estimar una proporción Poblacional π
Cuando se desea estimar alguna proporción en la población de estudio, una prevalencia
o incidencia de alguna enfermedad, etc., se puede usar para el cálculo de n, la siguiente
ecuación:
48
H. Mariano. s
2
1
2
2 2
1
2
(1 )
( 1) (1 )
z P P N
n
N z P P







  
N: Tamaño de la población
2
1
2
z 

: Coeficiente de confianza cuyo valor depende del nivel de confianza de la
estimación de la proporción poblacional.
ε : Precisión deseada de la estimación de la media poblacional. (También se le
denomina error absoluto o error máximo permisible)
P: Proporción de elementos o unidades de la población que poseen el atributo en
cuestión. Proporción estimada de alguna de las tres maneras siguientes:
 Revisión bibliográfica
 Estudio piloto
 Asumiendo P = 0,50 y Q = 0,50
La otra fórmula alternativa cuando se ha estimado la proporción poblacional es:
2
1
2
2 2
1
2
(1 )
( 1) (1 )
z P P N
n
N z P P







  
Nota 2.- En caso de no conocer el tamaño de la población porque ésta es demasiado grande,
se empleará la siguiente fórmula para determinar el tamaño de la muestra.
2
1
2
2
(1 )
z
n
  




Cuando se estima la proporción poblacional la otra fórmula alternativa es:
49
H. Mariano. s
2
1
2
2
(1 )
z P P
n





2.5. METODO DE SELECCIÓN DE LA MUESTRA
Ahora la pregunta que necesitamos responder es: ¿Cómo seleccionar las unidades que
conforman la muestra? Esta cuestión se refiere a la forma de llegar a las unidades de
muestreo y proceder a medir u observar las características (variables) de interés.
La elección del tipo de muestreo probabilístico, también va a depender, de la forma como
se encuentran organizadas geográficamente, o administrativamente, las unidades de
muestreo. Por ejemplo, si deseamos encuestar familias, las buscaremos en los hogares,
pero si deseamos estudiar enfermos de asma, podemos entrevistarlos en los servicios de
salud.
La teoría del muestreo nos proporciona varios tipos de diseños muestrales probabilísticos,
los cuales son tratados en temas apartes. Aquí solo se va presentar de una manera general
que su profundidad del estudio pertenece a un tema aparte.
2.5.1. Tipos de muestreo Probabilístico
A. Muestreo Aleatorio Simple (MAS)
Es el método más simple y más importante para la selección de una muestra.
Operacionalmente podemos definir este tipo de muestreo como:
Dada una lista der N unidades elementales (población), se sortean con igual probabilidad
n unidades (muestra). El plan muestral es el siguiente:
1. Confeccionar una lista completa de todos los individuos de la población al cual
denominaremos marco muestra. El marco muestra puede ser una lista de direcciones,
50
H. Mariano. s
un directorio telefónico, los registros de pacientes internados durante la semana, una
relación de los servicios de salud del país, etc.
2. Determinar el tamaño de la muestra n, utilizando las fórmulas correspondientes.
3. Utilizando un mecanismo aleatorio (tabla de números aleatorios, urnas, etc.)
sortear con igual probabilidad una unidad de muestreo la que pasará a formar
parte de la muestra
4. Se repite el proceso hasta que sean sorteadas la n unidades que conformarán la
muestra.
B. Muestreo Sistemático
Este procedimiento exige, como el anterior método (MAS), numerar todos los elementos
de la población, pero en lugar de extraer n números aleatorios solo se extrae uno.
Se parte de ese número aleatorio i llamado arranque aleatorio, que es un número
elegido al azar, y los elementos que integran la muestra son los que los lugares: i, i+k,
i+2k, i+3k,…..,, i+(n-1)k, es decir se toman los individuos de k en k, siendo k el resultado
de dividir el tamaño de la población entre el tamaño de la muestra
N
k
n
 . El numero i
llamado también arranque aleatorio que empleamos como punto de partida será un
número al azar entre 1 y k.
51
H. Mariano. s
Tabla 6
Tabla de números aleatorios
Fuente: Elaborado por el autor
Ejemplo
Supongamos que la población estudiada está compuesta por 360 familias, además el
tamaño de la muestra (muestreo aleatorio simple) es de 30 familias; con esta información
se determina el valor de k.
52
H. Mariano. s
360
12
30
N
k
n
  
Utilizando la tabla de números aleatorios hallamos el punto de arranque (i) que debe de
variar para este caso 1 12
i
  , como el valor de k es de dos dígitos recurrimos a la tabla
de números aleatorios y elegimos el valor de 10, en consecuencia i = 10, a partir de ella
generamos los números sumando el valor de k hasta obtener treinta números.
10, 22, 34, 46, 58, 70, 82, 94, 106, 118, 130, 142, 154, 166, 178, 190, 202, 214, 226,
238, 250, 262, 274, 286, 298, 310, 322, 334, 346, 358 .
Una vez determinados los valores, identificamos a las familias en el listado de la población
y de acuerdo al tema de investigación se aplicará los instrumentos que permita obtener la
información.
C) Muestreo Estratificado
Consiste en la división previa de la población de estudio en grupos o clases que se suponen
homogéneos respecto a característica a estudiar. A cada uno de estos estratos se le
asignaría una cuota que determinaría el número de miembros del mismo que compondrán
la muestra. Dentro de cada estrato el muestreo se realizaría mediante m.a.s.
Según la cantidad de elementos de la muestra que se han de elegir de cada uno
de los estratos, existen dos técnicas de muestreo estratificado:
 Asignación proporcional: el tamaño de cada estrato en la muestra es proporcional a su
tamaño en la población.
 Asignación óptima: la muestra recogerá más individuos de aquellos estratos que tengan
más variabilidad. Para ello es necesario un conocimiento previo de la población.
53
H. Mariano. s
Para aplicar este diseño, se precisa que la población esté dividida en subpoblaciones,
estratos, que no se solapen. Se selecciona una muestra probabilística en cada estrato y
se trabaja de manera independiente entre estratos.
Razones de la popularidad de este método:
Permite realizar estimaciones de precisión específica en cada estrato;
En un experimento, los aspectos prácticos relacionados con la respuesta, la medida o la
información auxiliar pueden diferir considerablemente de una subpoblación a otra.
Existirán razones administrativas, división territorial, ... .Cuestiones técnicas que plantea
este muestreo:
i) Construcción de Estratos: Los objetivos del estudio y los recursos disponibles
contestarán las siguientes cuestiones ¿Qué características utilizar para dividir la
población en estratos?; ¿Cómo se identificarán los estratos?; ¿Cuántos estratos debe
haber?
En particular, los estratos deben estar constituidos por unidades lo más homogéneas
posibles; En el caso límite de estricta homogeneidad bastaría seleccionar una sola unidad
en cada estrato
ii) Elección de una muestra y métodos de estimación en cada estrato; El proceso de
muestreo se realizará de manera independiente en cada estrato
Ventajas de este diseño:
54
H. Mariano. s
i) Si las mediciones dentro de cada estrato son homogéneas, la estratificación
producirá un límite más pequeño para el error de estimación que el m.a.
ii) Se puede reducir el costo por observación al estratificar la población en grupos
convenientes.
iii) Permite obtener estimaciones de parámetros poblacionales para subgrupos de la
muestra
Figura 13
Ejemplo de muestreo estratificado
Fuente: Elaborado por el autor
55
H. Mariano. s
D) Muestreo por conglomerados
Existen cuatro técnicas de muestreo probabilístico y no podemos elegir indistintamente
cada una de ellas, sino más bien debemos elegir el muestreo aleatorio simple. En el caso
en que no podamos utilizar el muestreo aleatorio simple utilizaremos el muestreo
sistemático, para los casos en que no contamos con N, el marco muestral, el listado de
todas las unidades de estudio; pero, vamos a tener que pagar un precio: un mayor sesgo
en nuestros resultados.
La tercera opción es elegir el muestreo aleatorio estratificado con la intención de
representar a cada uno de los estratos en la muestra. Hay que aclarar que esto no lo hace
mejor que el muestreo aleatorio simple o sistemático, lo que sucede es que en la selección
de muestras existe un conjunto de sesgos de selección que pueden interferir con la
aleatorización de nuestra muestra, es por esa razón, que intentamos estratificar a los
grupos para poder representarlos al interior de la muestra, pero recuerda que el muestreo
aleatorio estratificado requiere conocer la distribución de la variable criterio de
estratificación.
Pero, si aún no cuentas con esta información y te es difícil realizar un muestreo aleatorio
simple porque tienes que estudiar, por ejemplo, a toda una región y es muy difícil que te
puedas trasladar hasta cada una de las instalaciones o a sus ubicaciones, me estoy
refiriendo a las unidades de estudio. En ese caso puedes optar por el muestreo por
conglomerados.
El muestreo por conglomerados es la cuarta técnica de muestreo probabilístico y de las
cuatro técnicas es la que más sesgo tiene. Sin embargo, está considerada dentro del
muestreo probabilístico y consiste en la identificación de grupos de unidades de estudio,
56
H. Mariano. s
de conglomerados llamados también clústeres donde cada grupo presenta toda la
variabilidad que se observa en la población.
Para ejemplificarlo, vamos a retornar nuestro ejemplo de la evaluación de la satisfacción
laboral en los trabajadores del Ministerio de Salud a nivel primario, es decir, centros y
puestos de salud. Si trabajamos únicamente en la región Arequipa, y esto ya es un
territorio bastante grande, tendríamos que trasladarnos a cada centro y puesto de salud, lo
cual representa mucho gasto, mucho tiempo y demasiada inversión.
En realidad, podríamos obtener resultados similares si hacemos un muestreo por
conglomerados; esto significa no aleatorizar a las unidades de estudio: no elegir a los
trabajadores de la salud por su número de contrato, por su número de identificación, no
realizar un muestreo aleatorio simple porque es impráctico. En este caso realizamos el
muestreo por conglomerados, que consiste en seleccionar a los centros y puestos de salud.
Una vez que hayamos seleccionado los centros y puestos de salud a evaluar y descartado
aquellos que no serán evaluados, vamos a dirigirnos hacia los seleccionados para
entrevistar a los trabajadores, a los que se encuentran en el interior de sus instalaciones.
Esto es particularmente práctico porque no vamos a tener que trasladarnos a todos los
centros y puestos de salud, teniendo en cuenta que si todos están bajo el mismo régimen;
bajo el mismo sistema; bajo la misma legislación; con los mismos sueldos; no tendría por
qué haber mucha diferencia en cuanto a la satisfacción laboral del centro de salud
Ampliación Paucarpata y el centro de salud Edificadores Misti.
Además, no hay mucha distancia entre ellos porque se encuentran en la misma cuidad:
ambos están en la zona periurbana y por tanto las circunstancias de uno y otro son muy
57
H. Mariano. s
similares. Así que, incluir a uno es casi como incluir a los dos, y digo casi porque no es
igual.
Porque nos vamos a tener que arriesgar a cometer más sesgo. Ciertamente, esta es la
técnica de muestreo probabilístico que tiene más sesgo, pero por cuestiones prácticas
tendremos que recurrir a esta forma de muestrear para poder realizar nuestro trabajo con
eficiencia.
Ya te habrás percatado de que esta técnica es muy útil cuando las unidades de estudio:
los trabajadores del Ministerio de Salud, están muy dispersos geográficamente, entonces,
vamos a ahorrar muchos recursos si utilizamos esta técnica de muestreo.
La técnica de muestreo por conglomerados se puede considerar como lo opuesto al
muestreo estratificado, porque en cada conglomerado o grupo de unidades de estudio
encontramos representados a toda la variabilidad de la población: en un centro de salud
encontramos al médico, a la enfermera, a la obstetriz, al odontólogo, al nutricionista, al
psicólogo es decir a todo el equipo de salud en la misma proporción o, por lo menos en
similares proporciones a los que se encuentran en toda la población, es decir, en todo el
Ministerio de Salud; por esta razón, a cada uno de estos grupos los consideramos como
mini poblaciones llamados también conglomerados.
Los profesionales que se encuentran al interior de un centro de salud son diferentes entre
sí, en cambio, en el muestreo estratificado los que se encuentran dentro de un estrato son
muy similares, sino acuérdate del ejemplo de los estudiantes de la facultad de Enfermería:
un estrato está conformado por mujeres; y el otro, por varones.
En cada estrato hay homogeneidad: las mujeres son homogéneas entre ellas ylos varones
son homogéneos entre ellos; pero, entre estratos hay diferencias. Por esta razón, tienen
58
H. Mariano. s
que entrar al muestreo todos los estratos; lo que no entran son todos los elementos de cada
estrato.
El muestreo se hace al interior de cada estrato ytodos ellos tienen que estar representados
en la muestra. En cambio, en el muestreo por conglomerados ocurre lo contrario: existen
muchos grupos llamados conglomerados, pero no todos los conglomerados entran a la
muestra, sino algunos de ellos y al interior de cada conglomerado entran todos los
elementos; todas las unidades de estudio.
Al interior de cada conglomerado hay la diversidad y la variabilidad que encontraríamos
en la población. Por lo tanto, cualquiera de los conglomerados podría incluirse en la
muestra y, de hecho, cuando se hace una selección aleatoria solamente uno de ellos pasara
a conformar la muestra.
Hemos visto dos etapas en el muestreo por conglomerados, porque la primera parte o la
primera etapa de la selección consiste en seleccionar qué centros y qué puestos de salud
van a ser incluidos en la muestra. Una vez que nos hayamos trasladado a cada centro y
puesto de salud tenemos dos opciones: la primera opción es que estudiemos o
entrevistemos a todos los trabajadores; a todas las unidades de estudio.
Esa es la primera opción y esa es la forma más básica de hacer un muestreo por
conglomerados, pero incluso dentro de cada conglomerado también podríamos hacer una
segunda elección, una segunda etapa de nuestro muestreo y decidir no entrevistar a todos
los trabajadores, sino solamente a una parte de ellos.
Vamos a suponer que un centro de salud tiene 50 trabajadores y decidimos no
entrevistarlos a todos, sino solamente a 25 ¿Cómo hacemos la selección de estos 25
trabajadores del grupo de 50? Pues ahí sí lo podemos hacer mediante un muestreo
59
H. Mariano. s
aleatorio simple, pero esto corresponde a una segunda etapa de nuestro muestreo
polietápico.
El muestreo por conglomerados hace referencia únicamente a la primera etapa, a la fase
de la selección de los centros y puestos de salud, cada investigador es libre de decidir qué
es lo que hará en una segunda etapa o si es que existe una segunda etapa, pero entre decidir
que exista o no una segunda etapa ya hay mucha subjetividad en cuanto a la selección de
las unidades de estudio.
Por esta razón, el muestreo por conglomerados es la técnica de muestreo probabilístico
que le infiere mayor sesgo a las mediciones y, por tanto, a las conclusiones, pero aun así
hay circunstancias, hechos, momentos en los que no se puede aplicar ninguno de estos
cuatro muestreos probabilísticos. En ese caso tendremos que recurrir a un muestreo no
probabilístico.
60
H. Mariano. s
CAPITULO III
3. CONSTRUCCION E INTERPRETACION DE TABLAS Y
GRAFICOS ESTADISTICOS
3.1. TABLA DE FRECUENCIAS
Una tabla de frecuencias es un arreglo en el cual se hace una lista exhaustiva de todos
los posibles valores o categorías de la variable en estudio (posibles respuestas), luego se
calcula la frecuencia con que se repite cada una de estos.
La utilidad inmediata de estas tablas es que permite verificar inconsistencias y errores
que pueden haberse cometido durante la digitación de los datos. Una vez realizadas las
correcciones, estas tablas permitirán explorar el comportamiento de la variable en
estudio.
Figura 14
Tabla de frecuencias para una variable categórica
Variable
Categórica xi
f
i
F
i
hi Hi
x1 f1 F1 h1 H1
x2 f2 F2 h2 H2
.. . . . .
. . . . .
XK fk Fk = n hk Hk = 1
Σfi =n 1
Fuente: Elaborado por el autor
61
H. Mariano. s
Descripción de las notaciones de la tabla
xi : La variable en estudio
Frecuencia Absoluta Simple (fi). Es el número de veces que se repite el valor de la variable
1
k
i
i
f n



Frecuencia Absoluta Acumulada (Fi)
1 1
2 1 2
3 1 2 3
1
.
.
k
i i
i
F f
F f f
F f f f
F f n


 
  
 

Frecuencia Relativa Simple (hi). Valor porcentual, obtenido al dividir la frecuencia
absoluta simple entre el tamaño de la muestra. Para su interpretación se multiplica por
100
1
1
2
2
1
.
.
1
i
i
k
i
i
f
h
n
f
h
n
f
h
n
h






62
H. Mariano. s
Frecuencia Relativa Acumulada
3.2. SUMATORIAS
Nos encontramos frecuentemente en estadística con el cálculo de números producto del
conteo, para poder reducir la operación utilizamos la sumatoria, denotando con la
siguiente simbología: (  )
Notación: La letra griega  (sigma) se emplea para indicar la suma de las
observaciones, además se coloca debajo de sigma el termino i=1 que corresponde al límite
inferior de la sumatoria; en la parte superior de sigma se coloca con la letra k,
correspondiente al límite superior y al frente de la sumatoria Xi.
1 2 3 4
1
......
k
i k
i
x x x x x x

     

Ejemplos.
 
4
1
3
2 2 2 3
1
4
1
2
3
2 2
1
1. 1 2 3 4 10
2. 1 2 3 14
3. 2 2 2 2 2 4(2) 8
4. 1 2 3 (6) 36
i
i
i
i
i
i
i




     
   
     
 
    
 
 




1 1
2 1 2
1
.
.
1
k
k i
i
H h
H h h
H h


 
 

63
H. Mariano. s
Propiedades
1. La sumatoria de una constante es igual a k veces la constante
1
k
i
c kc



2. La sumatoria de una constante multiplicado por una variable es igual al producto de
la constante por la sumatoria de la variable.
1 1
k k
i i
i i
cx c x
 

 
3. 1 2
1
.........
k
m m m m
i k
i
x x x x

   

4.
2
1 2
1
( ) ( ....... )
k
m
i k
i
x x x x

   

5. 1 1 2 2
1
..........
k
i i k k
i
x y x y x y x y

   

6. 1 2 1 2
1 1
( )( ) ( ....... )( ....... )
k k
i i k k
i i
x y x x x y y y
 
      
 
Ejemplo. - Tabla de frecuencia para una variable categórica.
Para ilustrar la construcción e interpretación de tablas, gráficos, utilizaremos los datos de
la encuesta realizada en el asentamiento humano “San Luís” – Amarilis – Huánuco. La
descripción de las variables estadísticas se presenta en el libro de códigos.
1. Hacer una lista de todos las posibles categorías de la variable
Ejemplo:
Variable: género del jefe del hogar
Niveles: 1 = Masculino
2 = Femenino
64
H. Mariano. s
2. Determinar la frecuencia absoluta y relativa con que se repite cada categoría (o valor)
de la variable (frecuencia).
Tabla 7
Encuesta socio económica en el asentamiento humano “san Luis” distribución de
hogares según genero del jefe de familia – amarilis - Huánuco 2008
Sexo Frecuencia
absoluta
simple (fi)
Frecuencia
absoluta
acumulada
(Fi)
Frecuencia
relativa
(hi)
Frecuencia
relativa
acumulada
(Hi)
Masculino f1 =44 44 67,7 67,7
Femenino f2 =21 65 32,3 100,0
Total n = 65 100,0
Fuente: Elaborado por el Investigador
Interpretación. -
Realizado la encuesta socioeconómica en el asentamiento humano “San Luís” en la tabla
se observa que 44 encuestados que representa el 67,7% del sexo masculino del total y 21
que representa el 312,3% son del sexo femenino del total.
65
H. Mariano. s
Figura 15
Distribución de los hogares según género del jefe de familia del Asentamiento
Humano de “San Luís” – Amarilis Huanuco-2008
Fuente: Elaborado por el autor
66
H. Mariano. s
Ejemplo. - Tabla de frecuencia para una variable numérica discreta sin intervalos de
clase.
Para ilustrar el procedimiento de la construcción de la tabla de frecuencias sin intervalos de
clase utilizamos la variable: número de hijos.
1. Encontrar los valores mínimo (Min) y máximo (Max) del conjunto de datos:
Número de hijos: Mínimo = 0 Máximo = 7
2. Calcular el rango de posibles valores entre el máximo y el mínimo:
Se tiene 7 posibles valores para la variable número de hijos: 0, 1, 2, 3, 4, 5, 6, 7
3. Construir la tabla, enumerando todos los posibles valores de la variable y contar el
número de veces que se repite cada valor de la variable número de hijos.
Variable
Numérica xi
f
i
F
i
hi Hi
x1 f1 F1 h1 H1
x2 f2 F2 h2 H2
.. . . . .
. . . . .
XK fk Fk = n hk Hk = 1
Σfi =n 1
67
H. Mariano. s
Tabla 8
Encuesta socio económica en el asentamiento humano “san Luis” distribución de
hogares según número de hijos por jefe de familia – amarilis - Huánuco - 2014
Número de
hijos
fi Fi hix100% Hi x100%
0 5 5 7,7 7,7
1 8 13 12,3 20,0
2 11 24 16,9 36,9
3 20 44 30,8 67,7
4 11 55 16,9 84,6
5 3 58 4,6 89,2
6 5 63 7,7 96,9
7 2 65 3,1 100,0
Total 65 100,0
Fuente: Elaborado por el investigador.
Interpretación. -
En la encuesta socio económico realizado en el Asentamiento Humano “San Luís” distrito
de Amarilis - Huánuco según número de hijos se tiene en la tabla Nº 04:
 f 3 = 11 indica de los 65 jefes de familias encuestados hay 11 familias que han
respondido que tiene dos hijos.
 F3 = 24 indica de los 65 jefes de familia encuestados hay 24 familias que tienen a
lo más 2 hijos.
 h3 = 16,9% indica de los 65 jefes de familia encuestados el 16,9% del total de
familias encuestados tienen 2 hijos.
.
68
H. Mariano. s
Figura 16
Distribución de los hogares según número de hijos por jefe de familia del
Asentamiento Humano de “San Luís” – Amarilis Huanuco-2008
7
6
5
4
3
2
1
0
20
15
10
5
0
N
úmero de hijos
Frecuencia Histograma de Frecuencias
Fuente: Elaborado por el autor
Ejemplo. - Tabla de frecuencia para una variable numérica con intervalos de clase.
Para ilustrar el procedimiento para la construcción de la tabla de frecuencias con intervalos
de clase utilizaremos la variable edad.
Figura 17
Tabla de frecuencia
7
6
5
4
3
2
1
0
35
30
25
20
15
10
5
0
Número de hijos
Porcentajes
Barras de Frecuencia
Fuente: Elaborado por el autor
69
H. Mariano. s
figura 18
Polígono de frecuencias
7
6
5
4
3
2
1
60
50
40
30
20
10
0
Número de hijos
Frecuencia Polígono de Frecuenciass
Fuente: Elaborado por el autor
Figura 19
Curva normal
6
4
2
0
20
15
10
5
0
Número de hijos
Frecuencia
Curva Normal
Fuente: Elaborado por el autor
70
H. Mariano. s
3.3. DISTRIBUCION DE FRECUENCIAS CON INTERVALOS.
La distribución de frecuencias por intervalos de clase se usa cuando la variable estadística
es continua o cuando el número de valores distintos de una variable discreta es muy
grande. Esta distribución se obtiene dividiendo el rango de variación de los datos en k
intervalos de clase y determinando el número de datos que contiene cada intervalo como
se muestra en el cuadro. Hay formas diferentes de tomar los intervalos de clase la que
mencionamos a continuación:
     
; ; ; ; La designación de intervalos va depender en algunos casos de los datos,
de la decisión del investigador y las experiencias que se tiene en los trabajos realizados.
Para construir la distribución de frecuencias por intervalos de clase hay varios
procedimientos, a continuación la recomendación:
 Se recomienda no más de 20 intervalos ni menos de 4, ya que muchos intervalos pueden
complicar innecesariamente los cálculos de las medidas de tendencia central y de las
medidas de dispersión, y pocos intervalos podían omitir características importantes de
los datos lo que no reflejaría el verdadero resultado de los datos. En este texto elegimos
un intervalo semi abierto   .
 El número de intervalos elegido, debe dar una distribución de frecuencias momo modal,
es decir, una distribución cuyas frecuencias van aumentando progresivamente hasta una
frecuencia máxima y luego va disminuyendo también progresivamente.
71
H. Mariano. s
Figura 20
Esquema de distribución de frecuencias con intervalos
Li - Ls Xi
fi
Fi
hix100
%
Hix100
%
I1 x1 f1 F1=f1 h1 H1=h1
I2 x2 f2 F2=f1+f2 h2 H2=h1+h2
I3 .. . . . .
. . . . . .
Ik
x
k
fk
Fk
=f1+…+fk
hk Hk = 100
Σfi =n 100
Fuente: Elaborado por el autor
3.4. CONSTRUCCIÓN DE LA DISTRIBUCIÓN DE FRECUENCIAS
Dados n valores de alguna variable cuantitativa X discreta o continua un procedimiento
alternativo para construir la distribución de frecuencias es:
1. Determinar el rango ( R ) de variación de los datos que se define por:
R = (Xmax – Xmin ) + k ; esto significa que si los valores máximos y mínimos
están expresados en entero se le agrega el valor 1, si esta expresado en
decimales se le agrega 0,1, si los valores están expresados en centésimos, se
agrega 0,01 y a´si sucesivamente.
72
H. Mariano. s
2. Determinar el número de intervalos (K), teniendo en cuenta la primera
recomendación.
Un valor aproximado del número de intervalos K, nos proporciona la regla de
Sturges, donde K = 1 + 3,322 Log( n ).
Alternativamente se puede utilizar K = √n , 25 ≤ n ≤ 400
Nota.- El valor obtenido de K se redondea al entero inmediato mayor, no tener en
cuenta la regla de redondeo de los decimales, eso nos permite no tener un exceso
negativo.
Además, se debe tener en cuenta que no existe una fórmula establecida en la que te
da un número exacto de K, las que se presenta son criterios que te permita tener una
idea con cuantos intervalos se puede trabajar, aún se puede usar un criterio propio
de acuerdo a los datos que se tenga y eso es válido.
3. Determinar la amplitud de clase A del intervalo de clase, dividiendo el rango entre
el número de intervalos de clase. Esto es
R
A
K
 , según Sturges la amplitud
debe redondearse, de acuerdo al número de decimales que tiene los datos.
4. Marca de clase.
Es el promedio de cada intervalo de clase:
3 4 1
1 2
1 2
, x ,.....,
2 2 2
k k
k
L L L L
L L
x x 
 

  
5. Determinar un exceso ( ε ), este exceso debe de cumplir la condición siguiente:
0
AK R
    .
a. Si el exceso es exactamente igual a cero.
El límite inferior de la primera clase es igual al valor mínimo determinado, y el
límite superior de la última clase coincide con el valor máximo determinado. Se
explica los criterios de la estructuración de los intervalos:
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms
Libro digital  hms

Más contenido relacionado

Similar a Libro digital hms

Deteccion de-factores-de-riesgo-para-cancer-de-mama-y-cancer-cervicouterino r...
Deteccion de-factores-de-riesgo-para-cancer-de-mama-y-cancer-cervicouterino r...Deteccion de-factores-de-riesgo-para-cancer-de-mama-y-cancer-cervicouterino r...
Deteccion de-factores-de-riesgo-para-cancer-de-mama-y-cancer-cervicouterino r...mercedes suarez garces
 
SYLLABUS BIOESTADISTICA.pdf
SYLLABUS BIOESTADISTICA.pdfSYLLABUS BIOESTADISTICA.pdf
SYLLABUS BIOESTADISTICA.pdfMaryhoryELFBarba
 
Programa de estadística y tic
Programa de estadística y ticPrograma de estadística y tic
Programa de estadística y ticjuliangomezbellido
 
Analisis cualitativo en salud
Analisis cualitativo en saludAnalisis cualitativo en salud
Analisis cualitativo en saludMaru Villegas
 
Manual investigacion y_redaccion
Manual investigacion y_redaccionManual investigacion y_redaccion
Manual investigacion y_redaccionnilthonmn
 
Manual metodologia de la investigacion
Manual   metodologia de la investigacionManual   metodologia de la investigacion
Manual metodologia de la investigacionJoseFrancisco437264
 
Documento recepcional. los modelos didácticos para favorecer la explicación c...
Documento recepcional. los modelos didácticos para favorecer la explicación c...Documento recepcional. los modelos didácticos para favorecer la explicación c...
Documento recepcional. los modelos didácticos para favorecer la explicación c...RiMax Rizsis
 
(5TO)PLANIFICACIÓN ANUAL 2022 CIENCIA Y TECNOLOGIA VII CICLO - 5TO GRADO.docx
(5TO)PLANIFICACIÓN ANUAL 2022 CIENCIA Y TECNOLOGIA VII CICLO - 5TO GRADO.docx(5TO)PLANIFICACIÓN ANUAL 2022 CIENCIA Y TECNOLOGIA VII CICLO - 5TO GRADO.docx
(5TO)PLANIFICACIÓN ANUAL 2022 CIENCIA Y TECNOLOGIA VII CICLO - 5TO GRADO.docxJhonChinchay1
 
investigacion blibliografica en colombia
investigacion blibliografica en colombiainvestigacion blibliografica en colombia
investigacion blibliografica en colombiaMabelPatio2
 
Importancia de la estadística en la educación
Importancia de la estadística en la educaciónImportancia de la estadística en la educación
Importancia de la estadística en la educaciónAntonio Cervantes Vargas
 
Programa Informática Médica II
Programa Informática Médica IIPrograma Informática Médica II
Programa Informática Médica IIHéctor Abraham
 
Anexo 3 - Informe de Actividad de Investigación Formativa Grupo 3.pdf
Anexo 3 - Informe de Actividad de Investigación Formativa Grupo 3.pdfAnexo 3 - Informe de Actividad de Investigación Formativa Grupo 3.pdf
Anexo 3 - Informe de Actividad de Investigación Formativa Grupo 3.pdfgiovannamunoz1
 
Anexo 3 - Informe de Actividad de Investigación Formativa Grupo 3.pdf
Anexo 3 - Informe de Actividad de Investigación Formativa Grupo 3.pdfAnexo 3 - Informe de Actividad de Investigación Formativa Grupo 3.pdf
Anexo 3 - Informe de Actividad de Investigación Formativa Grupo 3.pdfgiovannamunoz1
 
Fundamentos y metodología de la investigación cualitativa
Fundamentos y metodología de la investigación cualitativaFundamentos y metodología de la investigación cualitativa
Fundamentos y metodología de la investigación cualitativathianny cabrera
 
Nuevo silabo de derecho penal ii ucn 14 de marzo 2017
Nuevo silabo de derecho penal ii ucn 14  de marzo 2017Nuevo silabo de derecho penal ii ucn 14  de marzo 2017
Nuevo silabo de derecho penal ii ucn 14 de marzo 2017Rossana Palacios
 

Similar a Libro digital hms (20)

Deteccion de-factores-de-riesgo-para-cancer-de-mama-y-cancer-cervicouterino r...
Deteccion de-factores-de-riesgo-para-cancer-de-mama-y-cancer-cervicouterino r...Deteccion de-factores-de-riesgo-para-cancer-de-mama-y-cancer-cervicouterino r...
Deteccion de-factores-de-riesgo-para-cancer-de-mama-y-cancer-cervicouterino r...
 
SYLLABUS BIOESTADISTICA.pdf
SYLLABUS BIOESTADISTICA.pdfSYLLABUS BIOESTADISTICA.pdf
SYLLABUS BIOESTADISTICA.pdf
 
Programa de estadística y tic
Programa de estadística y ticPrograma de estadística y tic
Programa de estadística y tic
 
Analisis cualitativo en salud
Analisis cualitativo en saludAnalisis cualitativo en salud
Analisis cualitativo en salud
 
T02604064595
T02604064595T02604064595
T02604064595
 
Manual investigacion y_redaccion
Manual investigacion y_redaccionManual investigacion y_redaccion
Manual investigacion y_redaccion
 
Manual metodologia de la investigacion
Manual   metodologia de la investigacionManual   metodologia de la investigacion
Manual metodologia de la investigacion
 
Manual metodologia de la investigacion
Manual   metodologia de la investigacionManual   metodologia de la investigacion
Manual metodologia de la investigacion
 
Documento recepcional. los modelos didácticos para favorecer la explicación c...
Documento recepcional. los modelos didácticos para favorecer la explicación c...Documento recepcional. los modelos didácticos para favorecer la explicación c...
Documento recepcional. los modelos didácticos para favorecer la explicación c...
 
(5TO)PLANIFICACIÓN ANUAL 2022 CIENCIA Y TECNOLOGIA VII CICLO - 5TO GRADO.docx
(5TO)PLANIFICACIÓN ANUAL 2022 CIENCIA Y TECNOLOGIA VII CICLO - 5TO GRADO.docx(5TO)PLANIFICACIÓN ANUAL 2022 CIENCIA Y TECNOLOGIA VII CICLO - 5TO GRADO.docx
(5TO)PLANIFICACIÓN ANUAL 2022 CIENCIA Y TECNOLOGIA VII CICLO - 5TO GRADO.docx
 
Economia[1]
Economia[1]Economia[1]
Economia[1]
 
Economia[1]
Economia[1]Economia[1]
Economia[1]
 
investigacion blibliografica en colombia
investigacion blibliografica en colombiainvestigacion blibliografica en colombia
investigacion blibliografica en colombia
 
Importancia de la estadística en la educación
Importancia de la estadística en la educaciónImportancia de la estadística en la educación
Importancia de la estadística en la educación
 
Curso UIMP 2010 Herramientas e indicadores bibliometricos para la evaluacion ...
Curso UIMP 2010 Herramientas e indicadores bibliometricos para la evaluacion ...Curso UIMP 2010 Herramientas e indicadores bibliometricos para la evaluacion ...
Curso UIMP 2010 Herramientas e indicadores bibliometricos para la evaluacion ...
 
Programa Informática Médica II
Programa Informática Médica IIPrograma Informática Médica II
Programa Informática Médica II
 
Anexo 3 - Informe de Actividad de Investigación Formativa Grupo 3.pdf
Anexo 3 - Informe de Actividad de Investigación Formativa Grupo 3.pdfAnexo 3 - Informe de Actividad de Investigación Formativa Grupo 3.pdf
Anexo 3 - Informe de Actividad de Investigación Formativa Grupo 3.pdf
 
Anexo 3 - Informe de Actividad de Investigación Formativa Grupo 3.pdf
Anexo 3 - Informe de Actividad de Investigación Formativa Grupo 3.pdfAnexo 3 - Informe de Actividad de Investigación Formativa Grupo 3.pdf
Anexo 3 - Informe de Actividad de Investigación Formativa Grupo 3.pdf
 
Fundamentos y metodología de la investigación cualitativa
Fundamentos y metodología de la investigación cualitativaFundamentos y metodología de la investigación cualitativa
Fundamentos y metodología de la investigación cualitativa
 
Nuevo silabo de derecho penal ii ucn 14 de marzo 2017
Nuevo silabo de derecho penal ii ucn 14  de marzo 2017Nuevo silabo de derecho penal ii ucn 14  de marzo 2017
Nuevo silabo de derecho penal ii ucn 14 de marzo 2017
 

Más de HELIMARIANO1

Segundo trabajo métodos numericos - exposición
Segundo trabajo  métodos numericos - exposiciónSegundo trabajo  métodos numericos - exposición
Segundo trabajo métodos numericos - exposiciónHELIMARIANO1
 
Métodos numéricos método de la secante
Métodos numéricos   método de la secanteMétodos numéricos   método de la secante
Métodos numéricos método de la secanteHELIMARIANO1
 
Exposición mendoza raymundo bernardo campos
Exposición   mendoza raymundo bernardo camposExposición   mendoza raymundo bernardo campos
Exposición mendoza raymundo bernardo camposHELIMARIANO1
 
Aplicaciones de ecuaciones diferenciales en ingeniería civil exposicion
Aplicaciones de ecuaciones diferenciales en ingeniería civil exposicionAplicaciones de ecuaciones diferenciales en ingeniería civil exposicion
Aplicaciones de ecuaciones diferenciales en ingeniería civil exposicionHELIMARIANO1
 
APLICACIÓN MÉTODOS NUMÉRICOS
APLICACIÓN MÉTODOS NUMÉRICOSAPLICACIÓN MÉTODOS NUMÉRICOS
APLICACIÓN MÉTODOS NUMÉRICOSHELIMARIANO1
 
Trabajo de investigacion grupal metodos numéricos-2021 ii
Trabajo de investigacion grupal   metodos numéricos-2021 iiTrabajo de investigacion grupal   metodos numéricos-2021 ii
Trabajo de investigacion grupal metodos numéricos-2021 iiHELIMARIANO1
 
Pensamiento critico
Pensamiento criticoPensamiento critico
Pensamiento criticoHELIMARIANO1
 
Rubrica segunda crítica
Rubrica segunda críticaRubrica segunda crítica
Rubrica segunda críticaHELIMARIANO1
 
Rubrica para evaluar la primera crítica
Rubrica para evaluar la primera críticaRubrica para evaluar la primera crítica
Rubrica para evaluar la primera críticaHELIMARIANO1
 
Syllabus estadistica grupo i
Syllabus estadistica grupo iSyllabus estadistica grupo i
Syllabus estadistica grupo iHELIMARIANO1
 
Syllabus estadistica grupo i
Syllabus estadistica grupo iSyllabus estadistica grupo i
Syllabus estadistica grupo iHELIMARIANO1
 
Pensamiento critico
Pensamiento criticoPensamiento critico
Pensamiento criticoHELIMARIANO1
 
Cerebelo y sus funciones
Cerebelo y sus funcionesCerebelo y sus funciones
Cerebelo y sus funcionesHELIMARIANO1
 
Ensanchando el espacio del aula
Ensanchando el espacio del aulaEnsanchando el espacio del aula
Ensanchando el espacio del aulaHELIMARIANO1
 

Más de HELIMARIANO1 (15)

Segundo trabajo métodos numericos - exposición
Segundo trabajo  métodos numericos - exposiciónSegundo trabajo  métodos numericos - exposición
Segundo trabajo métodos numericos - exposición
 
Métodos numéricos método de la secante
Métodos numéricos   método de la secanteMétodos numéricos   método de la secante
Métodos numéricos método de la secante
 
Exposición mendoza raymundo bernardo campos
Exposición   mendoza raymundo bernardo camposExposición   mendoza raymundo bernardo campos
Exposición mendoza raymundo bernardo campos
 
Aplicaciones de ecuaciones diferenciales en ingeniería civil exposicion
Aplicaciones de ecuaciones diferenciales en ingeniería civil exposicionAplicaciones de ecuaciones diferenciales en ingeniería civil exposicion
Aplicaciones de ecuaciones diferenciales en ingeniería civil exposicion
 
APLICACIÓN MÉTODOS NUMÉRICOS
APLICACIÓN MÉTODOS NUMÉRICOSAPLICACIÓN MÉTODOS NUMÉRICOS
APLICACIÓN MÉTODOS NUMÉRICOS
 
Trabajo de investigacion grupal metodos numéricos-2021 ii
Trabajo de investigacion grupal   metodos numéricos-2021 iiTrabajo de investigacion grupal   metodos numéricos-2021 ii
Trabajo de investigacion grupal metodos numéricos-2021 ii
 
Pensamiento critico
Pensamiento criticoPensamiento critico
Pensamiento critico
 
Rubrica segunda crítica
Rubrica segunda críticaRubrica segunda crítica
Rubrica segunda crítica
 
Rubrica para evaluar la primera crítica
Rubrica para evaluar la primera críticaRubrica para evaluar la primera crítica
Rubrica para evaluar la primera crítica
 
Silabo mate iii
Silabo mate iiiSilabo mate iii
Silabo mate iii
 
Syllabus estadistica grupo i
Syllabus estadistica grupo iSyllabus estadistica grupo i
Syllabus estadistica grupo i
 
Syllabus estadistica grupo i
Syllabus estadistica grupo iSyllabus estadistica grupo i
Syllabus estadistica grupo i
 
Pensamiento critico
Pensamiento criticoPensamiento critico
Pensamiento critico
 
Cerebelo y sus funciones
Cerebelo y sus funcionesCerebelo y sus funciones
Cerebelo y sus funciones
 
Ensanchando el espacio del aula
Ensanchando el espacio del aulaEnsanchando el espacio del aula
Ensanchando el espacio del aula
 

Último

Estrategia de prompts, primeras ideas para su construcción
Estrategia de prompts, primeras ideas para su construcciónEstrategia de prompts, primeras ideas para su construcción
Estrategia de prompts, primeras ideas para su construcciónLourdes Feria
 
Estrategias de enseñanza-aprendizaje virtual.pptx
Estrategias de enseñanza-aprendizaje virtual.pptxEstrategias de enseñanza-aprendizaje virtual.pptx
Estrategias de enseñanza-aprendizaje virtual.pptxdkmeza
 
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptxSEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptxYadi Campos
 
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.Alejandrino Halire Ccahuana
 
Registro Auxiliar - Primaria 2024 (1).pptx
Registro Auxiliar - Primaria  2024 (1).pptxRegistro Auxiliar - Primaria  2024 (1).pptx
Registro Auxiliar - Primaria 2024 (1).pptxFelicitasAsuncionDia
 
Cuaderno de trabajo Matemática 3 tercer grado.pdf
Cuaderno de trabajo Matemática 3 tercer grado.pdfCuaderno de trabajo Matemática 3 tercer grado.pdf
Cuaderno de trabajo Matemática 3 tercer grado.pdfNancyLoaa
 
Qué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativaQué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativaDecaunlz
 
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptxACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptxzulyvero07
 
Imperialismo informal en Europa y el imperio
Imperialismo informal en Europa y el imperioImperialismo informal en Europa y el imperio
Imperialismo informal en Europa y el imperiomiralbaipiales2016
 
plande accion dl aula de innovación pedagogica 2024.pdf
plande accion dl aula de innovación pedagogica 2024.pdfplande accion dl aula de innovación pedagogica 2024.pdf
plande accion dl aula de innovación pedagogica 2024.pdfenelcielosiempre
 
Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...Lourdes Feria
 
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdfSELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdfAngélica Soledad Vega Ramírez
 
Programacion Anual Matemática4 MPG 2024 Ccesa007.pdf
Programacion Anual Matemática4    MPG 2024  Ccesa007.pdfProgramacion Anual Matemática4    MPG 2024  Ccesa007.pdf
Programacion Anual Matemática4 MPG 2024 Ccesa007.pdfDemetrio Ccesa Rayme
 
actividades comprensión lectora para 3° grado
actividades comprensión lectora para 3° gradoactividades comprensión lectora para 3° grado
actividades comprensión lectora para 3° gradoJosDanielEstradaHern
 
La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...JonathanCovena1
 
origen y desarrollo del ensayo literario
origen y desarrollo del ensayo literarioorigen y desarrollo del ensayo literario
origen y desarrollo del ensayo literarioELIASAURELIOCHAVEZCA1
 
LABERINTOS DE DISCIPLINAS DEL PENTATLÓN OLÍMPICO MODERNO. Por JAVIER SOLIS NO...
LABERINTOS DE DISCIPLINAS DEL PENTATLÓN OLÍMPICO MODERNO. Por JAVIER SOLIS NO...LABERINTOS DE DISCIPLINAS DEL PENTATLÓN OLÍMPICO MODERNO. Por JAVIER SOLIS NO...
LABERINTOS DE DISCIPLINAS DEL PENTATLÓN OLÍMPICO MODERNO. Por JAVIER SOLIS NO...JAVIER SOLIS NOYOLA
 
Sesión de aprendizaje Planifica Textos argumentativo.docx
Sesión de aprendizaje Planifica Textos argumentativo.docxSesión de aprendizaje Planifica Textos argumentativo.docx
Sesión de aprendizaje Planifica Textos argumentativo.docxMaritzaRetamozoVera
 
Ejercicios de PROBLEMAS PAEV 6 GRADO 2024.pdf
Ejercicios de PROBLEMAS PAEV 6 GRADO 2024.pdfEjercicios de PROBLEMAS PAEV 6 GRADO 2024.pdf
Ejercicios de PROBLEMAS PAEV 6 GRADO 2024.pdfMaritzaRetamozoVera
 

Último (20)

Estrategia de prompts, primeras ideas para su construcción
Estrategia de prompts, primeras ideas para su construcciónEstrategia de prompts, primeras ideas para su construcción
Estrategia de prompts, primeras ideas para su construcción
 
Estrategias de enseñanza-aprendizaje virtual.pptx
Estrategias de enseñanza-aprendizaje virtual.pptxEstrategias de enseñanza-aprendizaje virtual.pptx
Estrategias de enseñanza-aprendizaje virtual.pptx
 
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptxSEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
 
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
 
Registro Auxiliar - Primaria 2024 (1).pptx
Registro Auxiliar - Primaria  2024 (1).pptxRegistro Auxiliar - Primaria  2024 (1).pptx
Registro Auxiliar - Primaria 2024 (1).pptx
 
Cuaderno de trabajo Matemática 3 tercer grado.pdf
Cuaderno de trabajo Matemática 3 tercer grado.pdfCuaderno de trabajo Matemática 3 tercer grado.pdf
Cuaderno de trabajo Matemática 3 tercer grado.pdf
 
Qué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativaQué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativa
 
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptxACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
 
Imperialismo informal en Europa y el imperio
Imperialismo informal en Europa y el imperioImperialismo informal en Europa y el imperio
Imperialismo informal en Europa y el imperio
 
plande accion dl aula de innovación pedagogica 2024.pdf
plande accion dl aula de innovación pedagogica 2024.pdfplande accion dl aula de innovación pedagogica 2024.pdf
plande accion dl aula de innovación pedagogica 2024.pdf
 
Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...
 
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdfSELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
 
Programacion Anual Matemática4 MPG 2024 Ccesa007.pdf
Programacion Anual Matemática4    MPG 2024  Ccesa007.pdfProgramacion Anual Matemática4    MPG 2024  Ccesa007.pdf
Programacion Anual Matemática4 MPG 2024 Ccesa007.pdf
 
actividades comprensión lectora para 3° grado
actividades comprensión lectora para 3° gradoactividades comprensión lectora para 3° grado
actividades comprensión lectora para 3° grado
 
La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...
 
origen y desarrollo del ensayo literario
origen y desarrollo del ensayo literarioorigen y desarrollo del ensayo literario
origen y desarrollo del ensayo literario
 
LABERINTOS DE DISCIPLINAS DEL PENTATLÓN OLÍMPICO MODERNO. Por JAVIER SOLIS NO...
LABERINTOS DE DISCIPLINAS DEL PENTATLÓN OLÍMPICO MODERNO. Por JAVIER SOLIS NO...LABERINTOS DE DISCIPLINAS DEL PENTATLÓN OLÍMPICO MODERNO. Por JAVIER SOLIS NO...
LABERINTOS DE DISCIPLINAS DEL PENTATLÓN OLÍMPICO MODERNO. Por JAVIER SOLIS NO...
 
Unidad 3 | Metodología de la Investigación
Unidad 3 | Metodología de la InvestigaciónUnidad 3 | Metodología de la Investigación
Unidad 3 | Metodología de la Investigación
 
Sesión de aprendizaje Planifica Textos argumentativo.docx
Sesión de aprendizaje Planifica Textos argumentativo.docxSesión de aprendizaje Planifica Textos argumentativo.docx
Sesión de aprendizaje Planifica Textos argumentativo.docx
 
Ejercicios de PROBLEMAS PAEV 6 GRADO 2024.pdf
Ejercicios de PROBLEMAS PAEV 6 GRADO 2024.pdfEjercicios de PROBLEMAS PAEV 6 GRADO 2024.pdf
Ejercicios de PROBLEMAS PAEV 6 GRADO 2024.pdf
 

Libro digital hms

  • 2. I H. Mariano. s Agradecimiento Agradezco primero a la Universidad Nacional Hermilio Valdizan de Huánuco y a sus autoridades Dr. Reynaldo Marcial OSTOS MIRAVAL Rector, Dr. Ewer PORTOCARRERO MERINO Vicerrector Académico y Dr. Javier G. LOPEZ Y MORALES Vicerrector de Investigación por darme la oportunidad y facilidades para la elaboración del presente libro. Agradecer a las autoridades, docentes y alumnos de la Facultad Ingeniería Civil y Arquitectura donde se brinda un proceso de enseñanza aprendizaje, basado en la construcción del conocimiento, la crítica y el sentido humano, por el apoyo que me han brindado cada uno de ellos amablemente compartiendo su punto de vista sobre el tema y me motivaron a escribir el libro. Este libro no hubiera sido posible sin el interés y ánimo de mi familia: Inés, Helí, Gelí Melquiades, Coquí, Diana, y Linlly y mis nietos Alexander, Guadalupe, Gael y Adriel.
  • 3. II H. Mariano. s Dedicatoria A la memoria de mis padres Isidoro y Anastasia Helí A la memoria de mi esposa Catalina Bravo Cajas (1956 – 2019) Dicen que cuando tienes a alguien que amas en el cielo, tienes un pedacito de cielo en tu casa, para siempre. Yo te tengo a ti Caty, pero una parte de ti vive conmigo, tu recuerdo sigue en nuestro hogar y estas presentes en mi vida. todo lo que me rodea tiene la huella de tu sacrificio y entrega, tu cariño y tu amor infinito que tenías para toda la familia. Aunque te fuiste, sigues conmigo Caty , aquí en mi corazón. Helí A mi familia: Inés, Helí, Gelí. M. Coquí, Diana, Linlly , Alexander, Guadalupe A., Gael H. y Adriel. M Helí
  • 4. III H. Mariano. s Introducción El desarrollo y el nivel de aplicación que la Bioestadística, como herramienta útil y rigurosa en el campo de la investigación en todas las ciencias sociales, ingeniería, salud, etc. ha experimentado en los últimos años, ha sido trascendental. Es indudable que este progreso ha venido estrechamente vinculado al que ha experimentado el área de la informática. Un segundo aspecto asociado a este progreso del conocimiento en el ámbito estadístico, ha sido el cambio de actitud experimentado por todo el profesional de las diferentes áreas o especialidades, especialmente en el área de la salud. De una sociedad en la que los roles y el desempeño de la profesión estaban ajustados a la mera aplicación de los conocimientos adquiridos, hemos evolucionado a una sociedad científica donde la investigación ha pasado a formar parte esencial de su labor diaria. El interés por descubrir nuevos procedimientos a través de la experiencia acumulada, ha sido determinante en la necesidad de que todos estos profesionales se vean inmerso en la formación y aprendizaje de técnicas básicas de la metodología de la investigación y de algunas más concretas como el análisis de datos. Este cambio en la dimensión del ejercicio profesional, determina que los planes de estudio de todas las licenciaturas y diplomaturas incluyan la Bioestadística para el ámbito de salud y biología, como materia troncal como necesidad. Se pretende, con ello, que un profesional de salud, o de cualquier otra área, que se apoye en la cuantificación y en el estudio empírico de la que observa a diario, entienda y conozca los conceptos básicos de la estadística que le va permitir, abandonando conductas pragmáticas, profundizar y comprender el fundamento científico de su área de trabajo. En muy distinta situación se encuentra los alumnos de posgrado que han comenzado su vida profesional y han tenido, por tanto, ocasión de darse cuenta de qué manera la Bioestadística les puede resultar útil y necesaria. Aunque no sea su deseo adentrarse en el mundo de la investigación, una parte muy importante en la transmisión de los nuevos hallazgos y conocimientos de otros colegas de su ámbito profesional, es el lenguaje estadístico. Es por ello que han de estar absolutamente familiarizados con dicha terminología si se pretende tener una actitud crítica y objetiva ante la lectura de cualquier literatura científica. Fruto de la experiencia en el sector de estudiantes e investigadores en nuestra labor de docente universitario, que nos ha animado a escribir el presente libro que podría ser un Manual de Estadística Básica aplicada a el área de salud. su contenido abarca desde los aspectos más básicos de la Estadística Descriptiva presentado en el Capítulo I, II, III en su función de resumir, presentar y comunicar los resultados de cualquier estudio a las diferentes técnicas de extrapolación de las conclusiones de una población, a partir de lo verificado en una muestra aleatoria representativa de ésta. Obviamente, para ello, se hace necesario revisar las nociones más básicas de aspectos de probabilidad presentado en el Capítulo IV, variables aleatorias, Distribución de Probabilidad, en el Capítulo V se presenta los elementos imprescindibles de la Inferencia Estadística: Estimaciones puntuales intervalo de confianza y contrastación de ipótesis más importantes de la Estadística Un variante.
  • 5. IV H. Mariano. s INDICE Iintroducción ............................................................................ ¡Error! Marcador no definido. Capitulo I...................................................................................................................................10 1. Intoduccion.........................................................................................................................10 1.1. Modelo matematico ................................................................................................... 12 1.2. La investigación y la estadistica ................................................................................ 13 1.3. Las base de datos se pueden utilizar siguiendo dos estrategias: .............................. 15 1.4. Recoleccion de datos.................................................................................................. 16 1.5. Fuentes de recoleccion de datos................................................................................. 18 1.6. Preparacion de las mediciones para su procesamiento y analisis. ......................... 20 1.7. Procesamiento de datos.............................................................................................. 21 1.8. Organización y presentacion de datos........................................................................ 23 1.9. Escala de medicion de las variables........................................................................... 24 1.10. Variables ..................................................................................................................... 27 1.11. Presentación de datos mediante tablas y graficos estadisticos............................... 28 1.11.1. Tablas estadísticas........................................................................................... 28 1.11.2. Gráficas de frecuencias................................................................................... 30 1.11.3. Tipos de grafico .............................................................................................. 33 CAPITULO II............................................................................................................................37 2. PRINCIPIO BASICOS DEL MUESTREO ......................................................................37 2.1. Conceptos basicos del muestreo. ............................................................................... 37 2.2. Tipos de muestreo...................................................................................................... 42 2.2.1. Muestreó no Probabilístico................................................................................. 42 2.2.2. Muestreo Probabilístico...................................................................................... 43 2.3. Diseño muestral ......................................................................................................... 44 2.4. Tamaño de muestra.................................................................................................... 44 2.4.1. Tamaño de muestra para estimar una media poblacional µ en una población finita. 46 2.4.2. Tamaño de muestra para estimar una proporción Poblacional π........................ 47 2.5. Método de selección de la muestra ............................................................................ 49 2.5.1. Tipos de muestreo Probabilístico ....................................................................... 49
  • 6. V H. Mariano. s CAPITULO III ..........................................................................................................................60 3. CONSTRUCCION E INTERPRETACION DE TABLAS Y GRAFICOS ESTADISTICOS .......................................................................................................................60 3.1. Tabla de frecuencias .................................................................................................. 60 3.2. Sumatorias.................................................................................................................. 62 3.3. Distribución de frecuencias con intervalos................................................................ 70 3.4. Construcción de la distribución de frecuencias ......................................................... 71 3.5. Medidas de tendencia central..................................................................................... 77 3.5.1. Media Aritmética: (µ, x )................................................................................... 78 3.5.2. Media Geométrica .............................................................................................. 82 3.5.3. La Mediana......................................................................................................... 85 3.5.4. Comparación de tres indicadores de posición .................................................... 91 3.6. Medidas de dispersión................................................................................................ 92 3.7. Coeficiente de variación ............................................................................................ 97 CAPITULO IV ........................................................................................................................117 4. INTRODUCCION AL CALCULO DE PROBABILIDAES..........................................117 4.1. Conceptos básicos de probabilidad.......................................................................... 118 4.1.1. Definición de Probabilidad............................................................................... 119 4.1.2. Modelo axiomático de probabilidad................................................................. 121 4.2. Definición axiomática de Probabilidad.................................................................... 123 4.2.1. Consistencia entre probabilidad y frecuencia relativa...................................... 124 4.3. Probabilidad Condicional......................................................................................... 129 4.4. Eventos Independientes ........................................................................................... 134 4.5. Regla de la multiplicación de probabilidades .......................................................... 137 4.5.1. Regla de la multiplicación de eventos dependientes ........................................ 137 4.5.2. Regla de multiplicación de eventos independientes......................................... 137 4.6. Regla de la probabilidad total y regla de Bayes....................................................... 138 4.7. Aplicación de probabilidades para el cálculo de Indicadores Epidemiológicas. ..... 142 4.8. Variables aleatorias y Distribución de Probabilidad................................................ 148 4.8.1. Variables aleatorias........................................................................................... 148 4.8.2. Algunas Distribuciones Importantes ................................................................ 151
  • 7. VI H. Mariano. s 4.9. Algunas Distribuciones importantes de variable Aleatorias Discretas .................... 151 4.9.1. Experimento de Bernoulli................................................................................. 151 4.9.2. Distribución Binomial ...................................................................................... 152 4.9.3. Distribución de Poissón.................................................................................... 157 4.10. Distribución de Probabilidades Continuas ........................................................... 160 4.10.1. Distribución Normal ..................................................................................... 161 4.11. Algunas distribuciones de Muestreo Importantes ................................................ 166 4.11.1. Distribución de la media de la muestral ( X ) ................................................ 166 4.11.2. Distribuciones de la diferencia entre las dos Medias Muestrales ................. 169 4.11.3. Distribución de la Proporción de la Muestra p  ..................................... 170 CAPITULO V..........................................................................................................................204 5. INFERENCIA ESTADISTICA.......................................................................................204 5.1. Intervalo de Confianza para la media µ de una Población...................................... 206 5.2. Intervalo de confianza para la diferencia entre las medias de dos poblaciones....... 213 5.3. Intervalo de confianza para la proporción de una Población................................... 216 5.4. Intervalo de confianza para la diferencia entre las Proporciones de dos Poblaciones. 218 5.5. Prueba de Hipótesis.................................................................................................. 220 5.5.1. Hipótesis Estadística......................................................................................... 221 5.5.2. Tipos de Errores................................................................................................ 223 5.5.3. Procedimiento General para contrastar Hipótesis ............................................ 225 5.6. Hipótesis de independencia y homogeneidad.......................................................... 238 5.6.1. Hipótesis de Independencia.............................................................................. 239 5.6.2. Hipótesis de homogeneidad.............................................................................. 242 BIBLIOGRAFÍA.....................................................................................................................253
  • 8. VII H. Mariano. s INDICE DE TABLAS Tabla 1 Modelo de libro de código.......................................................................................... 21 Tabla 2 Ejemplo ilustrativo de diseño de base de datos.......................................................... 22 Tabla 3 Perú: Población de 5 y más años que asiste a un Centro educativo de enseñanza regular, por sexo, según áreas urbana y rural Censo Nacional de 1993 ..................... 29 Tabla 4 Personas con cáncer pulmonar del Hospital regional "Hermilio Valdizán” en 2008. 32 Tabla 5 Pacientes con cáncer pulmonar según lugar de residencia: Hospital Regional “Hermilio Valdizán”- Huánuco-2013........................................................................................................ 32 Tabla 6 Tabla de números aleatorios....................................................................................... 51 Tabla 7 Encuesta socio económica en el asentamiento humano “san Luis” distribución de hogares según genero del jefe de familia – amarilis - Huánuco 2008.................................... 64 Tabla 8 Encuesta socio económica en el asentamiento humano “san Luis” distribución de hogares según número de hijos por jefe de familia – amarilis - Huánuco - 2014 .................. 67 Tabla 9 Límites nominales....................................................................................................... 73 Tabla 10 Encuesta socio económica en el asentamiento humano “san Luís” distribuido por edad de los jefe de familia – amarilis - Huánuco - 2008 ..................................................... 74 Tabla 11 agrupación de 350 obreros según su salario ............................................................ 77 Tabla 12 Encuesta distribuido por edad de los jefes de familia-amarilis-2008....................... 82 Tabla 13 Datos sin intervalos .................................................................................................. 88 Tabla 14 Ejemplo distribución de frecuencias......................................................................... 88 Tabla 15 Distribución de frecuencias con intervalos............................................................... 89 Tabla 16 Ejemplo, Cálculo de la moda sin intervalos ............................................................. 90 Tabla 17 Ejemplo, Cálculo de la moda con intervalos........................................................... 91 Tabla 18 Hijos de trabajadores por edad ................................................................................. 93 Tabla 19 Ingresos quinquenales de 45 encuestados ......................................................... 96 Tabla 20 clasificación de 900 adultos que culminaron sus estudios superiores................... 130 Tabla 21 Resultados de una encuesta a personas adultas respecto a una ley del gobierno ... 132 Tabla 22 Resultado del diagnóstico nutricional de 100 niños ............................................... 137
  • 9. VIII H. Mariano. s Tabla 23 Estudio: Papanicolaou y Detección de cáncer cervical en una población de mujeres ................................................................................................................................................ 143 Tabla 24 Tablas de contingencia 2x2 para presentar resultados de tamizaje ........................ 144 Tabla 25 Situaciones de la realidad y decisiones posibles en los contrastes de hipótesis ..... 224 Tabla 26 Probabilidad de error al rechazar una hipótesis que es cierta................................. 227 Tabla 27 Tabla de contingencia............................................................................................ 240 Tabla 28 Casos de anemia en niños de 6 – 59 meses por tipo de anemia y Área de residencia ................................................................................................................................................ 245
  • 10. IX H. Mariano. s INDICE DE FIGURAS Figura 1 interrelación de áreas temáticas ............................................................................... 11 Figura 2 Esquema del proceso de decisión............................................................................. 12 Figura 3 Instrumentos de recolección de datos ...................................................................... 19 Figura 4 Técnica para la recolección de datos........................................................................ 19 Figura 5 Ejemplos de variables tipo nominal......................................................................... 24 Figura 6 Ejemplos de variables tipo ordinal........................................................................... 25 Figura 7 Ejemplos de variables medidos en escala racional .................................................. 26 Figura 8 Clasificación de variables ........................................................................................ 27 Figura 9 pacientes con cáncer según lugar de procedencia Hospital Regional “Hermilio Valdizán”-Huánuco-2008......................................................................................................... 33 Figura 10 Gráfico de barras de pacientes con cáncer según lugar de procedencia ................ 34 Figura 11 Pacientes con cáncer según Procedencia Hospital Regional "Hermilio Valdizán"- huánuco-2008 ........................................................................................................................... 35 Figura 12 Pacientes con cáncer según lugar de procedencia: Hospital Regional “Hermilio Valdizán”- 2013........................................................................................................................ 36 Figura 13 Ejemplo de muestreo estratificado......................................................................... 54 Figura 14 Tabla de frecuencias para una variable categórica................................................ 60 Figura 15 Distribución de los hogares según género del jefe de familia del Asentamiento Humano de “San Luís” – Amarilis Huanuco-2008 .................................................................. 65 Figura 16 Distribución de los hogares según número de hijos por jefe de familia del Asentamiento Humano de “San Luís” – Amarilis Huanuco-2008........................................... 68 Figura 17 Tabla de frecuencia ............................................................................................... 68 figura 18 Polígono de frecuencias .......................................................................................... 69 Figura 19 Curva normal.......................................................................................................... 69 Figura 20 Esquema de distribución de frecuencias con intervalos........................................ 71 Figura 21 Distribución de la edad de los jefes de familia del Asentamiento Humano de “San Luís” – Amarilis Huanuco-2008............................................................................................... 75 Figura 22 Fórmulas para calcular la media aritmética ........................................................... 80 Figura 23 Fórmulas para calcular la media geométrica.......................................................... 83 Figura 24 Partición de espacio muestral-regla de Bayes...................................................... 138 Figura 25 Ilustración de variable aleatoria ........................................................................... 149 Figura 26 Distribución normal ............................................................................................ 162 Figura 27 Región crítica (región de rechazo o aceptación).................................................. 228 Figura 28 toma de decisión basado en la estadística de prueba y región crítica ................. 230 Figura 29 Región crítica (Z positivo)................................................................................... 231 Figura 30 Región crítica (Z negativo) .................................................................................. 231 Figura 31 región crítica (Ejemplo de una Prueba de hipótesis de Independencia) .............. 244
  • 11. 10 H. Mariano. s CAPITULO I 1. INTODUCCION El conocimiento de los principios y métodos de la matemática y la estadística, y la competencia en su aplicación son de gran importancia para el estudio de la estructura y dinámica de la población. Estas dos disciplinas están íntimamente relacionadas con otras disciplinas más, pues le proveen de las técnicas necesarias para obtener datos, organizar, modelar y analizar y estudiar científicamente la población en estudio. La asignatura de matemáticas y estadística descriptiva tiene como propósito que los estudiantes de las diferentes carreras profesionales afianzan los conocimientos básicos de la matemática y adquieren las destrezas necesarias para el uso y la interpretación de la estadística descriptiva. Para una mejor comprensión del texto, se sigue una metodología activa que consiste fundamentalmente en: interiorizar los conceptos, analizar los ejemplos y casos y resolver ejercicios. Se relaciona 3 áreas temáticas: La investigación científica, la matemática y la estadística, las cuales están muy ligadas. El siguiente cuadro presenta esta interrelación. El hecho es que necesitamos información para conocer la realidad y poder tomar mejores decisiones. Pero de nada sirve tener una gran cantidad de información si no la podemos organizar, integrar y estructurar en un modelo formal que represente la situación real.
  • 12. 11 H. Mariano. s Figura 1 interrelación de áreas temáticas Fuente: Elaborado por el autor La matemática es una herramienta que nos permitirá pasar los modelos mentales intuitivos a modelos formales con los cuales se trabaja. El proceso de decisión lo podemos esquematizar así:
  • 13. 12 H. Mariano. s Figura 2 Esquema del proceso de decisión Fuente: Elaborado por el autor 1.1. MODELO MATEMATICO Un modelo es una representación de la realidad, en la práctica primero nos formamos un modelo mental de una situación, pero, cuando ésta es compleja es necesario esquematizarla en un modelo formal que pueda ser analizado objetivamente ycomunicado posteriormente. Todo sistema tiene objetos – llámese entidad, como: población, recursos, que pueden clasificarse en grupos o clases: profesores, médicos, alumnos de secundaria, población de 0 a 4 años etc. Dichos objetos tienen características – llámese atributos, como: cantidad, edad, sexo – que pueden ser fijos o variables. Por ejemplo, consideramos la entidad: población de 0 años, sus atributos son: población total, total de hombres, total de mujeres, peso al nacer,
  • 14. 13 H. Mariano. s color de ojos, mortalidad etc. Seleccionamos sólo aquellos atributos variables pertinentes al estudio, por ejemplo, sean las variables: total de 0 a 4 años en el tiempo t N t M l de niños de 0 a 4 años muertos en el año t t t t X Población Nacimiento en el año Tota    Las relaciones funcionales describen las interacciones entre variables y parámetros. Continuando con el ejemplo, podemos representar la población de 0 a 4 años por medio de la relación: 1 1 0.25 t t t t t X X N M X       Donde: 1 1 : 0 4 : de 0 a 4 del periódo t-1 N : en el periódo t : en el periódo t 0, 25 : Pr de sobrevivientes del periódo t t t t t X Población de a años en el periódo t X Población Nacimiento M Defunciones oporción X que cumpl   5 años en el periódo ió La ecuación que describe esta relación entre variables se expresa matemáticamente como: 1 X ( , N , , ) t t t t F X M p   1.2. LA INVESTIGACIÓN Y LA ESTADISTICA Una investigación comienza con saber qué es lo que se desea indagar. En muchas ocasiones se tiene una idea vaga e imprecisa de lo que se desea investigar, lo cual lleva a realizar un trabajo poco organizado y sin objetivos claros. Antes de emprender cualquier investigación y en particular la investigación cuantitativa, es importante saber a dónde se quiere llegar, para determinar: a) La información que se debe obtener b) Los procedimientos de recolección de datos
  • 15. 14 H. Mariano. s c) Las técnicas de análisis estadístico d) La interpretación de la información obtenida. Por lo tanto, se requiere de un método que permita al investigador ordenar sus ideas y establecer una secuencia de pasos a seguir, para realizar su investigación. El uso del método científico es característico de la investigación cuantitativa. En este tipo de abordaje metodológico, la preocupación del investigador es el rigor científico, la construcción de instrumentos, la precisión estadística y la observación de manifestaciones fenomenológicas que deben ser controlados. El uso de este método en la investigación tanto teórica como aplicada, asegura la objetividad al recopilar hechos y evaluar las alternativas de solución propuestas para resolver un problema. En la investigación básica la evaluación de conceptos o hipótesis previas, la realización de inferencias y las conclusiones a las que se llegue sobre los hechos o fenómenos estudiados conducen al establecimiento de leyes generales acerca de lo estudiado. La investigación científica incluye una secuencia de actividades que se relacionan entre sí (metodología), y la estadística juega un rol muy importante en cada uno de los pasos, pues permite organizar la información, analizarla para luego tomar decisiones a partir del conocimiento del fenómeno en cuestión. Las actividades llamados también protocolos involucradas en cada uno de los pasos, varían de acuerdo al campo de la investigación, pero en general podemos mencionar las siguientes:  Planeamiento del problema de investigación  Elaboración del marco teórico  Formulación de hipótesis  Diseño de investigación  Método de obtención de datos
  • 16. 15 H. Mariano. s  Análisis de los datos  Presentación de resultados, informe final. Estos pasos o protocolos que se han planteado es materia de estudio en los tópicos propiamente de Investigación, en este trabajo solo queda mencionado. 1.3. LAS BASE DE DATOS SE PUEDEN UTILIZAR SIGUIENDO DOS ESTRATEGIAS: A. Generar ideas de investigación a partir de la información de una base de datos llamados también minería de datos. Esta estrategia, parte de una base de datos o minería de datos que puede haber sido poco explotada, esta es estudiada y se formulan preguntas de investigación. Los pasos que se sugieren en este caso son: 1. Elegir una base de datos que puede contener datos de interés 2. Familiarizarse con las variables contenidas en la base de datos 3. Formular las preguntas o hipótesis que pueden ser objeto de estudio 4. Revisar la literatura para conocer el estado dela cuestión a investigar 5. Elaborar la hoja (fichas) de registro para la obtención de los datos para el estudio elegido. Hacer una lista de las variables de la base de datos e intentar agruparlas según posibles asociaciones (tomando en cuenta los objetivos y la hipótesis de la investigación). B. Partir de un problema de investigación, formular las preguntas o hipótesis y buscar la respuesta en la base de datos Esta es la estrategia que hemos planteado al inicio del capítulo, con la única diferencia que para responder a las preguntas o probar las hipótesis, el investigador no va a tener
  • 17. 16 H. Mariano. s que realizar la recolección de datos en el campo, sino que tratará de obtener la información que requiere en la base de datos. En este caso se sugiere seguir los pasos siguientes: 1 Formular el problema de investigación 2 Revisar la bibliografía de manera exhaustiva 3 Identificar la variable establecer las definiciones conceptuales 4 Identificar y acceder a la base de datos de interés 5 Familiarizarse con la base de datos 6 Elaborar la hoja de registro de datos El uso de base de datos existentes tiene ventajas tales como la rapidez con que se puede disponer de la información y el bajo costo. La economía de tiempo y recursos permite concentrar la atención en el análisis de la información de acuerdo a los objetivos y/o hipótesis. Pero también tiene limitaciones como, por ejemplo, que las variables van a tener que ser operacional izadas de acuerdo a la disponibilidad de datos en la base seleccionada, esto puede llevar a una baja calidad en los resultados. Por otro lado, la base de datos seleccionada no siempre contendrá toda la información requerida para la investigación. 1.4. RECOLECCION DE DATOS La recolección de los datos es uno de los pasos más importantes dentro del proceso de investigación, pero también, es uno de los más descuidados por una gran cantidad de investigadores. Todo el celo puesto durante el planeamiento de la investigación está orientado a medir el fenómeno en cuestión con la mayor fidelidad posible, si esto no ocurre, no importando que tan sofisticado sea la técnica de análisis estadístico, utilizado no nos estaremos aproximando a la realidad que queremos estudiar.
  • 18. 17 H. Mariano. s Si bien es cierto que en la etapa de recolección de datos el instrumento de medición ya debería estar validado y listo para ser utilizado, esto no siempre ocurre, cuando la investigación es emprendida por personas que tienen poca experiencia en investigación, por lo que en este capítulo trataremos brevemente sobre las tareas a realizar antes de pasar a obtener los datos necesarios para cumplir con los objetivos de la investigación. La selección del instrumento utilizado para la medición de las variables depende de los objetivos de la investigación, de las características del informante y del método de obtención de los datos. Esto es, los instrumentos deberán ser adaptados al contexto donde van a ser utilizados teniendo en cuenta características que pueden condicionar la respuesta (Ej. Una población analfabeta, o con características culturales particulares). Por ejemplo, los cuestionarios preparados para realizar las encuestas demográficas y de Salud Familiar (ENDES) tienen los mismos objetivos a nivel mundial, pero, han tenido que ser adoptados a cada país debido a que las características culturales de las mujeres varían de una región a otra. Durante la recolección de datos se realizan tres actividades importantes y vinculantes entre sí: a. Evaluar el instrumento de medición diseñado durante el proceso de planeamiento de la investigación. El instrumento debe ser válido y confiable, pues de eso depende la calidad de la información obtenida. Si bien es cierto que en la etapa de recolección de datos el instrumento de medición ya debería estar evaluado y listo para ser utilizado, esto no siempre ocurre cuando la investigación es emprendida por investigadores inexpertos. b. Aplicar el instrumento de medición (trabajo de campo). Es decir, obtener las observaciones de las variables que son de interés para el estudio. c. Preparar las mediciones obtenidas para que puedan analizar correctamente (critica, codificación y digitación de datos).
  • 19. 18 H. Mariano. s 1.5. FUENTES DE RECOLECCION DE DATOS a) Fuentes Primarias. Son aquellos que el investigador obtiene directamente de la realidad, recolectándolos con sus propios instrumentos. En otras palabras, son los que el investigador o sus auxiliares recogen por vez primera por sí mismos, en contacto con los hechos, ocurrencias o fenómenos que se investigan. Siendo los datos primarios aquellos que surgen del contacto directo con la realidad empírica. Las técnicas encaminadas a recogerlos reflejarán, necesariamente, toda la compleja variedad de situaciones que se presentan en la vida real. b) Fuentes Secundarias. Por otra parte, son registros escritos que proceden también de un contacto con la práctica, pero que ya han sido recogidos y muchas veces procesados por otros investigadores, que posteriormente pasa formar parte de la biblioteca, Registros Civiles, Banco de Datos, páginas Web, otros etc. Los datos primarios y los secundarios no son dos clases esencialmente diferentes de información, sino son partes de una misma secuencia: todo dato secundario ha sido primario en sus orígenes y todo dato primario, a partir del momento en que el investigador concluye su trabajo, se convierte en dato secundario para los demás. INSTRUMENTOS DE RECOLECCIÓN DE DATOS
  • 20. 19 H. Mariano. s Figura 3 Instrumentos de recolección de datos INSTRUMENTO DE RECOLECCION DE DATOS: Medios que permiten al investigador registrar la información Test Inventario Guía de entrevista Ficha de Investigación Cuestionario Guía de Observación Fuente: Elaborado por el autor TECNICA DE RECOLECCION DE DATOS Figura 4 Técnica para la recolección de datos Procedimientos para recolectar La información requerida Entrevista Observación Encuesta Técnicas de Evaluación Fichaje Análisis Documental
  • 21. 20 H. Mariano. s Fuente: Elaborado por el autor 1.6. PREPARACION DE LAS MEDICIONES PARA SU PROCESAMIENTO Y ANALISIS. Crítica o edición. - Durante el proceso de elaboración del cuestionario o algún instrumento de recolección de datos se prepara un plan de crítica y codificación, con el fin de establecer las acciones a tomar en caso de detectar omisiones, duplicaciones e inconsistencias en las respuestas en el momento del registro. Durante la etapa de crítica o edición se tratará de detectarlos y corregirlos siguiendo las instrucciones del plan de crítica. Otro momento en el cual es posible que se cometan errores es durante el proceso de transcripción de los datos a una computadora para su procesamiento posterior. Durante el proceso de registro o transcripción se pueden introducir los errores de diversos tipos (de registro, de observación, digitación, etc.). Durante la etapa de críticas o edición se tratará de detectarlos y corregirlos. Codificación. - Consiste en la asignación de claves numéricas o códigos a las respuestas proporcionadas por los entrevistados. Por ejemplo, los datos sobre ocupación, lugar de nacimiento, estado civil, grado de instrucción, sexo, etc. Son variables medidas en escala nominal y ordinal así que deberá asignárseles códigos (de preferencia numéricos). Por otro lado, aquellas variables como edad, número de hijos, número de abortos, número de camas en un hospital no requieren códigos especiales pues las respuestas son numéricas. Preparación del Libro de Códigos. - es un documento que describe la estructura de los datos en la computadora (base de datos). Contiene los nombres internos de las variables (Código de 8 a 10 caracteres), la descripción de los códigos asignados a las categorías de respuesta, yel espacio que ocupa la respuesta (tamaño del campo). Este documento servirá como guía para localizar las variables e interpretarlas durante el proceso de preparación de la base de datos y el análisis estadístico.
  • 22. 21 H. Mariano. s Los resultados del instrumento de medición se transfieren a la matriz de datos en la computadora usando la estructura establecida en el libro de códigos. Para ilustrar la construcción e interpretación de tablas, gráficos e indicadores estadísticos utilizaremos los datos de una encuesta realizada en el distrito de Amarilis – Huánuco. El objetivo de la investigación es averiguar el nivel socioeconómico de las familias del asentamiento humano “San Luís”. Se seleccionó una muestra de 65 jefes de familia residentes en un asentamiento humano y se preparó cuestionario para averiguar entre otras cosas: edad, género, grado de instrucción y número de hijos. Libro de código Tabla 1 Modelo de libro de código Etiqueta Código Tipo de variable Categorías Tamaño del campo Identificación Edad Género Grado de Instrucción Fuente: Elaborado por el autor 1.7. PROCESAMIENTO DE DATOS Antes de proceder al vaciado de la información en la computadora necesitamos copiar el libro de códigos en el programa computacional a usarse, este proceso es denominado preparación de la estructura de la base de datos, luego se procederá a ingresar los datos en
  • 23. 22 H. Mariano. s la computadora. El siguiente paso será verificar la consistencia de los datos, esto es, verificar si los datos han sido digitados correctamente, etc. El diseño de la base de datos para el ejemplo ilustrativo Encuesta Socio Demográfico en el Asentamiento Humano “San Luís”. Tabla 2 Ejemplo ilustrativo de diseño de base de datos IDEN EDAD SEXO Gra. de Inst. Hijos 1 2 ……. 65 Fuente: Elaborado por el autor Los programas computacionales como el SPSS, SAS; STATA, EPI INFO etc. Solicitan que el usuario especifique el tipo de variable (numérico o categórico) antes de ingresar los datos. Ilustraremos los conceptos vertidos utilizando la encuesta demográfica en el asentamiento humano “San Luis”. Una vez identificado el tipo de cada una de las variables estudiadas completamos la información del libro de códigos. Ejercicios propuestos 1.- ¿Qué otro instrumento de recolección de datos conoce? 2. Ha tenido la oportunidad de diseñar un instrumento de recolección de información? 3. Elabore un cuestionario, tomando en consideración los criterios, características y recomendaciones proporcionadas para el ejemplo de investigación que se propuso. 4. Las fichas de registro de estadísticas vitales constituyen un ejemplo de instrumento de recolección de datos, así tenemos por ejemplo las fichas de registro de nacimiento. Tomando en cuenta esta conteste las siguientes interrogantes.
  • 24. 23 H. Mariano. s a) ¿Cuál es el objetivo de esta ficha? b) ¿Qué institución es la encargada de recabar esta información? c) Identifique las variables estadísticas que contiene la ficha d) Describa la escala de medición y el tipo de cada variable e) Diseñe un libro de códigos f) diseñe la base de datos 5. obtenga el cuestionario utilizado en la ENDES 2000. Seleccione la sección ANTICONCEPCIÓN Y LACTANCIA y describa las variables (escala de medición, categoría de las variables, tipo de variables). Prepare un libro de códigos y diseñe una base de datos. 1.8. ORGANIZACIÓN Y PRESENTACION DE DATOS La aplicación del instrumento de medición va a producir un conjunto de datos, pero, tal como se encuentran al ser recolectados (datos crudos) serán poco informativos y difícilmente interpretables, así que, para realizar el análisis estadístico será necesario organizarlos y presentarlos de manera resumida. Esta tarea es muy importante porque va a dar una visión de las características generales del fenómeno estudiado y permitirá explorar comportamientos sistemáticos y tendencias de la población en estudio. La elección de la técnica estadística, para analizar los datos, está íntimamente relacionada con los objetivos de la investigación, la cantidad de datos disponibles y la escala de medición. Pero, en todos los casos la primera tarea será explorar y describir las observaciones mediante tablas y gráficos.
  • 25. 24 H. Mariano. s 1.9. ESCALA DE MEDICION DE LAS VARIABLES Como resultado de la Operacionalización de las variables podemos medir una variable de investigación a través de uno o más indicadores estadísticos. Estos indicadores constituyen las variables en el contexto de la estadística. Por ejemplo, el número de hijos, edad, estado civil, lugar de nacimiento, número de pacientes, madres gestantes, etc. De acuerdo al tipo de respuesta las variables estadísticas se clasifican en nominal, ordinal, de intervalo y razón. Veamos en que consiste cada una de ellas. A. Escala Nominal Cuando la operación de medir la variable consiste simplemente en la asignación de nombres o números a distintas categorías de respuesta. La función del número en este nivel de medición es muy elemental, solamente es utilizado para clasificar, pero no es posible realizar operaciones aritméticas. Algunos ejemplos de variables con este nivel de medición son: Figura 5 Ejemplos de variables tipo nominal a) Género: Masculino…………. 1 Femenino…………… 2 c) Estado Civil Casado(a)…………… 1 Soltero(a)…………… 2 Divorciado(a)………. 3 Otro………………… 4 b) Lugar de Nacimiento Código …………………… …………………… …………………… …………………… Fuente: Elaborado por el autor
  • 26. 25 H. Mariano. s Las variables medidas en escala nominal pueden incluir dos categorías de respuesta (variables dicotómicas o binarias). Por ejemplo el género, o pueden tener varias categorías como en el caso del lugar de nacimiento o el estado civil (politómicas). B. Escala Ordinal En esta escala de medición podemos distinguir entre las diferentes categorías de respuesta, las cuales indican si un sujeto posee en mayor o menor grado el atributo que estamos midiendo. Ejemplos de este nivel de medición son: Figura 6 Ejemplos de variables tipo ordinal a) Grado de instrucción: Ningún Nivel……… 0 Primaria……………. 1 Secundaria………….. 2 Superior………… . 3 b)Estado de la anemia de la madre Sin anemia……………… 0 Leve……………………. 1 Moderada……………… 2 Severa…………………. 3 b) Estrato Socioeconómico Bajo……………… … 1 Medio …………… … 2 Alto……………… … 3 c) Orden de nacimiento del hijo Primero………………… 1 Segundo……………….. 2 Tercero………………… 3 Fuente: Elaborado por el autor C) Escala de Intervalo Cuando además del orden o jerarquía entre las categorías de la variable se pueden establecer intervalos de igual amplitud en la medición. Las distancias entre las categorías son las mismas a lo largo de toda la escala. El cero (0) en la medición es arbitrario y no indica ausencia del atributo.
  • 27. 26 H. Mariano. s Un ejemplo clásico de esta escala es la que resulta de medir la temperatura (grados centígrados o Fahrenheit). En este caso el cero es referencial y es diferente para las dos escalas. D) Escala Racional (o de razón) Cuando una variable es medida con esta escala se puede determinar la cantidad del atributo poseída por el individuo. Esta es la escala de medición de variables ideal en la investigación, pues, permite establecer diferencias entre cualquier par de sujetos (u objetos) con un máximo de presión. El cero es real e indica ausencia del atributo. (Con las variables así medidas se puede realizar las operaciones aritméticas básicas y sus derivaciones). A esta escala pertenece el sistema métrico, el sistema de pesos, todos los atributos que son tomados a través de una unidad de medida. Ejemplos de variables medidas con esta escala. Figura 7 Ejemplos de variables medidos en escala racional a) ¿Cuántos hijos nacidos vivos tiene? ………………………. b) ¿Cuántos años tiene? …………………… c) ¿Cuál fue el peso del recién nacido? ………………………. d) ¿Cuál es la tasa de natalidad de este distrito? …………………………… Fuente: Elaborado por el autor Es importante resaltar que, la posibilidad de utilizar determinadas técnicas de análisis de datos depende en gran parte de la escala en que ha sido medida la variable. Por ejemplo, no es posible calcular la media aritmética o la varianza de una variable medida en escala nominal como el género.
  • 28. 27 H. Mariano. s 1.10. VARIABLES Fuente: Elaborado por el autor LAS VARIABLES Definición de las variables Conceptualmente Operacionalmente Es cualquier característica, cualidad o propiedad de un fenómeno o hecho que tiende a variar y que es susceptible de ser medido y evaluado, o también CARACTERISTICAS Están contenidas necesariamente en el título del problema, el objetivo y la hipótesis de investigación Son aspectos que varían o adoptan distintos valores Orienta el establecimiento de indicadores Ayuda a descubrir las fuentes de información CLASIFICACION DE VARIABLES POR SU NATURALEZA POR SU RELACION POR SU NUMERO DE VALORES CUANTITATIVA CUALITATIVA DEPENDIENTE INDEPENDIENTE I N T E R V I N I E N T E DICOTOMICAS POLITOMICAS DISCRETAS CONTINUAS Figura 8 Clasificación de variables
  • 29. 28 H. Mariano. s 1.11. PRESENTACIÓN DE DATOS MEDIANTE TABLAS Y GRAFICOS ESTADISTICOS. Una vez digitados los datos se tiene un conjunto de números en un arreglo (base de datos) pero tal como estos se encuentran no es posible extraer la información necesaria, por lo que se hace necesario organizarla y presentarla en tablas y gráficos estadísticos que permitirán analizar la información contenida en los datos. 1.11.1. Tablas Estadísticas. Las tablas (o cuadros) estadísticas constituyen un primer resumen de los datos. Pueden referirse a una sola variable (tablas de frecuencia), a dos o más variables (tablas de contingencia o tablas cruzadas o tabla doble entrada). Pero, ¿cómo decidimos que tablas de contingencia o de frecuencias elaborar? . En el momento que Ud. Se haga esta pregunta, recuerde los objetivos de la investigación. Las tablas que se diseñan deben de servir para obtener información que permita responder a sus preguntas y a los objetivos de la investigación. Recuerde que la investigación científica debe ser organizada, entonces lo lógico es que primero se diseñen las tablas de acuerdo a sus objetivos. Una tabla estadística adecuadamente diseñada debe tener las siguientes partes.
  • 30. 29 H. Mariano. s Tabla 3 Perú: Población de 5 y más años que asiste a un Centro educativo de enseñanza regular, por sexo, según áreas urbana y rural Censo Nacional de 1993 Fuente: Instituto Nacional de Estadística e Informática 1. Número. - Cuando se tiene más de una tabla es importante asignarle un número que permitirá hacer referencia a cada uno de ellos en el proceso de análisis de resultados 2. Título. - Es un resumen de la información contenida en la tabla, debe de ser claro, conciso y debe de tratar de responder a las preguntas, ¿Cuál es la población o grupo de estudio?, ¿Cómo está organizado la tabla?, la referencia temporal y la referencia espacial. 3. Encabezamiento. – Esta en la primera fila y contiene la descripción de las columnas de la tabla 4. Cuerpo. – Es la parte central de la tabla, aquí se encuentran la información numérica que resume el comportamiento del fenómeno estudiado. 5. Notas explicativas o pie de tabla. - Se coloca debajo de la línea de cierre, en ella se colocan aclaraciones en relación a la tabla, fuente de donde proviene los datos, etc. La presentación de una tabla deberá cumplir con los requisitos siguientes: Área Género Total Masculino Femenino Urbana Rural Total Título Encabezamiento Cuerpo Pie de tabla
  • 31. 30 H. Mariano. s  Antes de elaborarla es importante establecer algún criterio de ordenamiento de los datos (diseño de la tabla).  Ninguna casilla debe quedar en blanco, si el dato no es aplicable o no hay información deberá colocarse un guion o algún otro símbolo en la casilla correspondiente.  Las unidades de medida de las variables deben estar claramente especificadas.  La tabla debe ser sencilla y explicativa. En algunos casos es mejor usar dos o más tablas sencillas en lugar de una sola muy compleja.  La tabla debe explicarse por sí misma, para ello: o El título de la tabla debe ser claro, conciso y exacto. o Si se usan abreviatura o símbolos deben aclararse en las notas explicativas. o Cada fila y columna deben ser tituladas de manera clara y concisa. o Deberán consignarse totales, los que se puede colocar de diferentes formas según se desee o no hacer énfasis los totales. o Si los datos consignados en la tabla no son originales deberá mencionarse la fuente al pie de la tabla. 1.11.2. Graficas de frecuencias Las tablas estadísticas son por sí misma resúmenes de datos, sin embargo, puede ocurrir que estas sean, inevitablemente, demasiado amplias o complejas, en consecuencias se dificulta la visualización de algunas características importantes, por lo que necesitamos otro modo de resumir la información. Los gráficos o representación pictóricos son formas de resumir la información que son más fáciles de entender que las tablas, la información contenida (en términos numéricos) es mejor, y, es entendible en comprensión de los datos. Es importante recordar que: “La característica principal de un buen gráfico es que; debe ser explicativo por sí mismo”
  • 32. 31 H. Mariano. s Un gráfico adecuado y que se explique por sí mismo debe contener:  Número de gráfico. - Cuando se tiene más de uno es importante asignarle un número que permitirá referirse a ellos en el proceso de análisis de resultados.  Título. - El título es un resumen de la información contenida en el gráfico y debe tratar de responder a las preguntas, la población de referencia ¿Qué es….? o ¿Quiénes son…?, ¿Cómo está organizado?, la referencia temporal ¿Cuándo? y la referencia espacial ¿Dónde?.  Cuerpo del gráfico. - Es la figura que resume el comportamiento del fenómeno estudiado. La elección del tipo de gráfico a usar dependerá del tipo de variable (numérica o categórica) y de los objetivos de la investigación.  Leyenda. - Contiene aclaraciones con respecto al gráfico  Notas explicativas. - Van al final del gráfico, en ella se coloca información relativa a la fuente, aclaraciones referida a las cifras, a los encabezados, etc. Al seleccionar un gráfico para representar los datos, el investigador debe:  Tener claridad con respecto a la información que se quiere resaltar, es decir, el mensaje que se desea transmitir  Conocer los diferentes tipos de gráficos y las situaciones en las cuales son aplicables, con el fin de hacer la elección correcta  Tener en cuenta el público al que va dirigida la información.  Recordar que el gráfico más efectivo es el más sencillo Ejemplo. - A continuación, se presenta los resultados de 30 personas con cáncer pulmonar de Hospital Regional “Hermilio Valdizan” en 2008. Estos datos servirán para el desarrollo de este tema. Los enfermos se clasifican según ciudad de residencia (A, B, C, D), edad (años) y sexo (M=masculino y F= femenino). Los resultados fueron:
  • 33. 32 H. Mariano. s Tabla 4 Personas con cáncer pulmonar del Hospital regional "Hermilio Valdizán” en 2008 Paciente Ciudad Edad Sexo Paciente Ciudad Edad Sexo 1 A 30 M B 46 F 2 A 43 M A 69 M 3 B 58 F A 44 M 4 C 61 M C 59 F 5 A 70 M D 62 M 6 D 42 F D 66 M 7 C 58 F C 71 M 8 A 39 M A 70 F 9 B 60 F C 65 M 10 B 55 M D 39 M 11 C 57 M A 40 F 12 A 49 M A 61 F 13 A 61 F B 65 M 14 D 69 M B 56 M 15 D 43 M C 38 M Fuente: Unidad Estadística del Hospital Tabla 5 Pacientes con cáncer pulmonar según lugar de residencia: Hospital Regional “Hermilio Valdizán”- Huánuco-2013. Ciudad fi hix100 A 11 36,67 B 6 20,0 C 7 23,3 D 6 20,0 Total 30 100,0 Fuente: Unidad Estadística del Hospital
  • 34. 33 H. Mariano. s Figura 9 pacientes con cáncer según lugar de procedencia Hospital Regional “Hermilio Valdizán”-Huánuco-2008 Fuente. - Datos de la Unidad Estadística del Hospital 1.11.3. TIPOS DE GRAFICO La elección de un gráfico para representar los datos está sujeta a ciertos principios. Sin embargo, la creatividad ha dado lugar a nuevos tipos de gráficos y variaciones de los ya existentes. Algunos gráficos comúnmente usados son: a) Gráficos de barras. - representa hechos o fenómenos sin continuidad. Las categorías pueden ser colocadas en cualquier orden, pueden representar distintos aspectos, no ordenados de una característica. Se presenta los pacientes con cáncer según lugar de procedencia. Este tipo de barras es simple. Se sugiere que el espacio Número Cuerpo Título
  • 35. 34 H. Mariano. s de barra a barra no debe ser menor a la mitad del ancho de la barra, ni sobre pasar al ancho de la misma. Figura 10 Gráfico de barras de pacientes con cáncer según lugar de procedencia Fuente: Elaborado por el autor b) Gráficos Lineales.- Llamaremos polígonos de frecuencia absoluta simple a la unión de los puntos medios del lado superior (el opuesto a la base) de cada rectángulo del histograma, formándose de esta manera líneas rectas.
  • 36. 35 H. Mariano. s Figura 11 Pacientes con cáncer según Procedencia Hospital Regional "Hermilio Valdizán"- huánuco-2008 D C B A 12 10 8 6 4 2 0 Ciudad Count Chart of Ciudad Fuente: Elaborado por el autor
  • 37. 36 H. Mariano. s c) Grafico circular. - Para su elaboración se utiliza la circunferencia, siendo necesario que los valores absolutos y/o porcentajes sean traducidos a grados, los 360º se reparten en proporción a los respectivos porcentajes. Correspondiendo a cada sector de la circunferencia la magnitud de cada categoría de la variable. Figura 12 Pacientes con cáncer según lugar de procedencia: Hospital Regional “Hermilio Valdizán”- 2013 Fuente: Elaborado por el autor
  • 38. 37 H. Mariano. s CAPITULO II 2. PRINCIPIO BASICOS DEL MUESTREO 2.1. CONCEPTOS BASICOS DEL MUESTREO. La experiencia con el muestreo es un hecho corriente que ocurre cotidianamente, basta observar como un cocinero verifica el sabor de un plato que está preparado, como alguien verifica la temperatura de un humeante plato de sopa, o como un médico detecta las condiciones de un paciente a través de una serie de exámenes clínicos. Se pueden mencionar otros ejemplos que usan procedimientos muéstrales más complejos, pero, todos tienen el mismo objetivo: obtener información sobre el todo basados en el conocimiento de una parte. El uso inadecuado de un procedimiento muestral puede llevar a un sesgo (error) de interpretación del resultado. Por ejemplo, no mover bien la sopa antes de tomar una cucharada para probarla puede llevar a una subvaloración de la temperatura del plato y la consecuencia puede ser que la persona se queme. Aun cuando el deseo del investigador, Parámetros Población Probabilidad Muestra Estadísticas MUESTREO
  • 39. 38 H. Mariano. s es usar muestras que produzcan resultados confiables y libres de sesgos, en estudios sofisticados donde la información es obtenida a través de las técnicas de muestreo, es común que el investigador quede tan entusiasmado por la prisa y la interpretación de los datos que olvide verificar posibles sesgos originarios del diseño de la muestra (protocolo de elección de la muestra). Cuando se toma una decisión en base a la información de una muestra siempre existe riesgos de cometer un error (error de muestreo). Por ejemplo, supongamos que, se está experimentando con dos tipos de medicamentos para tratar la artritis reumatoide. Uno de los medicamentos es el que tradicionalmente se ha estado utilizando y el otro es nuevo. Se selecciona una muestra de 40 pacientes con características similares y se asigna aleatoriamente 20 pacientes al tratamiento tradicional, los otros 20 son tratados con un medicamento nuevo. Luego, estos pacientes son evaluados y se observa que 70% de los pacientes asignados al medicamento tradicional y el 74% de los que recibieron el nuevo medicamento muestran una mejoría. Entonces, la conclusión podría ser que el nuevo medicamento es mejor que el tradicional, pero, también podría ocurrir que ambos sean igualmente efectivos y que la diferencia observada sea debido a la casualidad o a fluctuaciones muéstrales. Este riesgo de conclusiones erradas puede ser medido siempre que el muestreo sea probabilístico. La teoría del muestreo describe las características, ventajas y desventajas de los diferentes diseños muéstrales. Los conceptos no son triviales y es importante que sean establecidos para el uso científico de los procedimientos muéstrales. La teoría del muestreo utiliza un conjunto de términos que tienen un significado particular dentro de este contexto, por lo que, es importante que nos familiarizamos con
  • 40. 39 H. Mariano. s la terminología utilizada. Para ilustrar los conceptos que vamos a mencionar, enunciamos un ejemplo. Ejemplo Estamos interesados en averiguar cuál es la prevalencia de asma en niños de 5 a 15 años en el distrito de Amarilis – Huánuco. Unidad de análisis (elemento).- Llamado también unidad estadística un elemento es un objeto o sujeto en el cual se realizan las mediciones. Un niño entre 5 a 15 años que vive en el distrito de Amarilis es un elemento o unidad de análisis. En ciertos estudios existen dos o más unidades de análisis; ejemplo, madre e hijo menor de 5 años. Entre otros ejemplos se tiene: un paciente, una familia, un animal experimental etc. Población. - denominado también universo, se refiere al conjunto de individuos u objetos, que tiene la característica de interés. La población en una investigación estadística se define siempre arbitrariamente nombrando sus propiedades particulares (criterios de inclusión). Usualmente, el número de individuos u objetos que conforman la población se denota con la letra “N”. Por ejemplo, la población está constituida por todos los niños entre 5 y 15 años que vive en el distrito de Amarilis. Para determinar cuántos niños entre 5 y 15 años viven actualmente en el distrito (N), podemos recurrir a las publicaciones del Instituto nacional de Estadística (INEI). Muestra. - Es una parte o subconjunto representativo de la población. El número de individuos u objetos que conforman la muestra se suele denotar con la letra “n”. Por ejemplo, el estudio que vamos a realizar tiene un presupuesto bastante limitado, además disponemos de poco tiempo, por lo que decidimos realizar el estudio a partir de una
  • 41. 40 H. Mariano. s muestra de hogares (n). Dentro del hogar entrevistaremos a todos los niños que cumplan con el criterio de inclusión (edad entre 5 y 15 años). Unidad de Muestreo. - Es una unidad del marco de muestreo. En algunos estudios es igual a la unidad de análisis Son colecciones no traslapados de elementos que cubren la población completa. En nuestro ejemplo; la unidad de muestreo en este caso en el hogar. Podemos citar otro ejemplo en un estudio en que se dispone de la relación de escolares de donde se seleccionara una muestra de ellos para observar el estado de salud de cada escolar seleccionado, la unidad de muestreo es igual a la unidad de análisis; un escolar. Sin embargo, si se quiere estudiar en una comunidad desnutrición de menores de 5 años u solo se dispone de un plano dividido en manzanas y viviendas ( lotes ) y se va muestrear esta para llegar a los niños menores de 5 años, la unidad de muestreo es una vivienda y la unidad de análisis un niño menor de 5 años. Otros ejemplos de unidad de muestreo: una historia clínica, una radiografía, etc. Marco Muestral.- Es una lista de unidades de muestreo. El marco muestral estará constituido por la relación de hogares del Distrito de Amarilis con sus respectivas direcciones domiciliarias y nombres del jefe del Hogar. Esta información la podemos obtener en el INEI. Otros ejemplos una lista de nombres, el cuaderno de citas de enfermería, disco duro de una computadora, un plano, archivo clínico, archivo del servicio, etc. En algunos estudios no se dispone del marco muestra, en tal caso habrá que proceder a su confección. Parámetro. - Es una medida descriptiva calculada a partir de los datos de la población. Algunos parámetros de interés en el análisis estadístico son:
  • 42. 41 H. Mariano. s 2 : in o promedio poblacional. : de variabilidad denominado varianza poblacional :Indicador de variabilidad denominado desviación estándar poblacional : Pro Indicador de posición denom ado media Indicador     porción poblacional (o prevalencia poblacional) En el ejemplo el parámetro de interés es la prevalencia de asma en el distrito.  : Prevalencia de asma en niños con edades entre 5 y 15 años en Amarilis. Estadística. - Es una medida descriptiva calculada a partir de los datos de una muestra, son calculadas para estimar parámetros poblacionales desconocidos. Las estadísticas más frecuentemente utilizadas son: 2 : : muestral S: Desviación estándar muestral P: Proporción muestral (prevalencia muestral) x Media muestral S Varianza El parámetro a ser estimado es la prevalencia (proporción) poblacional, luego la estadística que utilizaremos para estimar la prevalencia será la proporción muestra. P: Prevalencia de asma en la muestra de niños entre 5 y 15 años del distrito de Amarilis. Muestras aleatorias. - Es un término utilizado para determinar a las muestras seleccionadas utilizando mecanismos que garanticen que cada uno de las unidades de muestreo tenga la misma probabilidad de formar parte de la muestra. Por ejemplo, al tener la lista completa de todos los hogares del distrito de amarilis, con la dirección y nombre del jefe de hogar podemos utilizar algún mecanismo que nos garantice que todos los hogares tengan la misma probabilidad de ser elegidos para la muestra. Este mecanismo puede ser una tabla de números aleatorios u otro como el baloteo en una urna en la que debe garantizarse la aleatoriedad.
  • 43. 42 H. Mariano. s Muestreo. - Este término se refiere a una serie de técnicas utilizadas para seleccionar muestras. 2.2. TIPOS DE MUESTREO El muestreo puede ser: Probabilístico o no probabilístico. La determinación de cuál de los dos tipos de muestreo será utilizado en una investigación va a depender de los objetivos del estudio y el alcance de sus contribuciones. Veamos en que consiste cada uno de los tipos de muestreo. 2.2.1. Muestreó no Probabilístico Este tipo de muestreo también denominado muestreo intencional o muestreo dirigido, se caracteriza por que el procedimiento de selección de la muestra se realiza de manera un poco informal y arbitraria. Esto conduce a que algunos elementos de la población no tengan ninguna probabilidad de ser seleccionados. La ventaja del muestreo no probabilístico es su utilidad para ciertos estudios; en los cuales no es indispensable que las muestras sean representativas de la población, si no que reúnan ciertas características previamente especificadas. Este tipo de muestreo tiene muchas desventajas. La primera es que: cuando las muestras son NO probabilística, no podemos evaluar el riesgo de decisiones y conclusiones erradas. Por lo tanto, las inferencias realizadas con este tipo de muestras no tienen validez estadística. Los tipos más comunes de muestras no probabilísticas son: a) Muestras de sujetos voluntarios. Son frecuentes en los estudios, donde los sujetos acceden voluntariamente participar en el estudio. Por ejemplo, supongamos que un investigador ha descubierto un medicamento que el asegura que cura el SIDA. Un grupo de personas con la enfermedad se ofrecen para recibir tratamiento en este nuevo medicamento.
  • 44. 43 H. Mariano. s b) Muestra de expertos Cuando es necesaria la opinión de personas que son expertas en un tema, son muy frecuentes en estudios cualitativos y exploratorios. Este tipo de muestreo se utiliza por ejemplo para validar cuestionarios. c) La muestra por cuotas Utilizado en estudios de opinión y de mercados. Los encuestadores reciben instrucciones de entrevistar individuos hasta completar un cierto número. d) Estudio de casos Este diseño muestral es muy utilizado en el área médica, donde el investigador interesado en un tema particular, va registrando los casos que van llegando a su servicio. 2.2.2. Muestreo Probabilístico En este tipo de muestreo cada unidad de muestreo tiene una probabilidad conocida e igual; de ser seleccionada para la muestra. Dado que la probabilidad de seleccionar cada elemento de la población es conocida, el investigador puede utilizar las diversas reglas y leyes de la probabilidad para evaluar la confiabilidad de las conclusiones que se obtengan a partir de muestras probabilísticas. En otras palabras, cuando una muestra es probabilística el riesgo de decisiones y conclusiones incorrectas (errores de muestreo) puede ser cuantificado. El riesgo de decisiones y conclusiones incorrectas es inherente al muestreo, pero puede ser controlado si se planea cuidadosamente el muestreo (diseño muestral) y se respetan las reglas del muestreo probabilístico. Por ejemplo, en nuestra investigación acerca de la prevalencia de asma en niños de 5 a 15 años en el distrito de Amarilis, garantizamos la validez externa de nuestro estudio si obtenemos una muestra probabilística. Obtendremos la información diseñando una encuesta por muestreo probabilístico.
  • 45. 44 H. Mariano. s 2.3. DISEÑO MUESTRAL Cuando decidimos seleccionar una muestra aleatoria de inmediato surgen dos preguntas: 1. ¿Cuántos individuos son necesarios para que la muestra represente a la población? 2. ¿Cómo se debe seleccionar los individuos que conformarán la muestra? Las respuestas a ambas preguntas deben estar contenidas en el diseño muestral, en el cual se establece el tamaño de la muestra (n) y método de selección de las unidades de muestreo. Muy brevemente trataremos de responder a las dos preguntas que surgen de manera natural en el muestreo. 2.4. TAMAÑO DE MUESTRA La pregunta que surge de inmediato, cuando se decide hacer una investigación por muestreo es ¿Cuántos sujetos debo considerar en la muestra? O ¿cuál es el tamaño de muestra adecuado………?. La respuesta es ¡Depende…...! . De pende, de aspectos prácticos como: ¿cuál es el presupuesto para realizar el estudio?, ¿de cuánto tiempo disponemos para realizarlo y presentar los resultados?, ¿qué tan grande es la población sobre la cual queremos hacer las inferencias? . Depende de aspectos estadísticos como: ¿qué tan rara es la característica que pretendemos investigar?, ¿qué tanta confianza estamos dispuestos a depositar en los resultados de la muestra?, ¿cuál es el grado de variabilidad de la característica principal de nuestro estudio? Comentaremos brevemente los aspectos estadísticos: i) El grado de variabilidad de la población con respecto a la característica de interés ( 2  ).
  • 46. 45 H. Mariano. s Si la población es homogénea (varianza pequeña), bastará una muestra pequeña para captar la variabilidad de la población. Por el contrario, si la población es muy heterogénea (varianza grande), se requerirá una muestra grande para capturar toda la variabilidad de la población. ii) El margen de error que estamos dispuesto a cometer al hacer las inferencias de la muestra hacia la población (  ). El parámetro desconocido que estamos estudiante tiene un valor, el cual va a ser aproximado a partir de una estadística (estimación). Lo ideal sería que el valor de la estadística sea igual al valor del parámetro, pero como estamos considerando una muestra, solamente, vamos a obtener un valor aproximado. Antes de determinar el tamaño de muestra; es necesario establecer la máxima discrepancia (error) entre los variables muestral y poblacional que estamos dispuestos a tolerar, es decir, Error: - Estadística Parámetro   iii) El nivel de significación ( )  El parámetro cuyo valor estamos investigando es desconocido, por lo que el error (  ) sólo puede ser establecido en términos probabilísticos. Sólo podemos decir con que probabilidad esperamos cometer el error que fijamos Las fórmulas para determinar el tamaño de muestra varían de acuerdo al método de selección de los elementos de la muestra (tipo de muestreo probabilístico). Una vez respondidas estas cuestiones, se puede recurrir a la teoría del muestreo las que nos proporcionara las fórmulas matemáticas para determinar el tamaño adecuado de muestra.
  • 47. 46 H. Mariano. s 2.4.1. Tamaño de muestra para estimar una media poblacional µ en una población finita. En el muestreo aleatorio simple el tamaño de la muestra es necesario para estimar la media, está dado por la expresión. 2 2 1 2 2 2 2 1 2 ( 1) z N n N z           Donde N: Tamaño de la población 2 1 2 z   : Coeficiente de confianza cuyo valor depende del nivel de confianza de la estimación de la media poblacional. ε : Precisión deseada de la estimación de la media poblacional. ( También se le denomina error absoluto o error máximo permisible ) 2  : Varianza poblacional que es objeto de estudio. En esta fórmula cuando no se conoce la varianza, se debe recurrir a una encuesta piloto con el fin de hacer la estimación correspondiente. Nota 1.- En caso de no conocer el tamaño de la población porque ésta es demasiado grande, se empleará la siguiente fórmula para determinar el tamaño de la muestra: 2 2 1 2 2 z n     
  • 48. 47 H. Mariano. s Las ecuaciones más frecuente para el cálculo del tamaño de muestra ( n ) 2 2 1 2 2 2 2 1 2 ( 1) z S N n N z S         S: La desviación estándar estimada, la que puede obtenerse de alguna de las tres maneras siguientes:  En la revisión bibliográfica  En estudios pilotos  Si la variable de estudio tiene distribución normal y se conoce el valor máximo y el valor mínimo. 6 Valor máx Valor mín X X S   En caso de no conocer el tamaño de la población porque ésta es demasiado grande, se empleará la siguiente fórmula que es más frecuente es decir la varianza estimada a través de los criterios mencionados para la formula anterior para determinar el tamaño de la muestra: 2 2 1 2 2 z S n     2.4.2. Tamaño de muestra para estimar una proporción Poblacional π Cuando se desea estimar alguna proporción en la población de estudio, una prevalencia o incidencia de alguna enfermedad, etc., se puede usar para el cálculo de n, la siguiente ecuación:
  • 49. 48 H. Mariano. s 2 1 2 2 2 1 2 (1 ) ( 1) (1 ) z P P N n N z P P           N: Tamaño de la población 2 1 2 z   : Coeficiente de confianza cuyo valor depende del nivel de confianza de la estimación de la proporción poblacional. ε : Precisión deseada de la estimación de la media poblacional. (También se le denomina error absoluto o error máximo permisible) P: Proporción de elementos o unidades de la población que poseen el atributo en cuestión. Proporción estimada de alguna de las tres maneras siguientes:  Revisión bibliográfica  Estudio piloto  Asumiendo P = 0,50 y Q = 0,50 La otra fórmula alternativa cuando se ha estimado la proporción poblacional es: 2 1 2 2 2 1 2 (1 ) ( 1) (1 ) z P P N n N z P P           Nota 2.- En caso de no conocer el tamaño de la población porque ésta es demasiado grande, se empleará la siguiente fórmula para determinar el tamaño de la muestra. 2 1 2 2 (1 ) z n        Cuando se estima la proporción poblacional la otra fórmula alternativa es:
  • 50. 49 H. Mariano. s 2 1 2 2 (1 ) z P P n      2.5. METODO DE SELECCIÓN DE LA MUESTRA Ahora la pregunta que necesitamos responder es: ¿Cómo seleccionar las unidades que conforman la muestra? Esta cuestión se refiere a la forma de llegar a las unidades de muestreo y proceder a medir u observar las características (variables) de interés. La elección del tipo de muestreo probabilístico, también va a depender, de la forma como se encuentran organizadas geográficamente, o administrativamente, las unidades de muestreo. Por ejemplo, si deseamos encuestar familias, las buscaremos en los hogares, pero si deseamos estudiar enfermos de asma, podemos entrevistarlos en los servicios de salud. La teoría del muestreo nos proporciona varios tipos de diseños muestrales probabilísticos, los cuales son tratados en temas apartes. Aquí solo se va presentar de una manera general que su profundidad del estudio pertenece a un tema aparte. 2.5.1. Tipos de muestreo Probabilístico A. Muestreo Aleatorio Simple (MAS) Es el método más simple y más importante para la selección de una muestra. Operacionalmente podemos definir este tipo de muestreo como: Dada una lista der N unidades elementales (población), se sortean con igual probabilidad n unidades (muestra). El plan muestral es el siguiente: 1. Confeccionar una lista completa de todos los individuos de la población al cual denominaremos marco muestra. El marco muestra puede ser una lista de direcciones,
  • 51. 50 H. Mariano. s un directorio telefónico, los registros de pacientes internados durante la semana, una relación de los servicios de salud del país, etc. 2. Determinar el tamaño de la muestra n, utilizando las fórmulas correspondientes. 3. Utilizando un mecanismo aleatorio (tabla de números aleatorios, urnas, etc.) sortear con igual probabilidad una unidad de muestreo la que pasará a formar parte de la muestra 4. Se repite el proceso hasta que sean sorteadas la n unidades que conformarán la muestra. B. Muestreo Sistemático Este procedimiento exige, como el anterior método (MAS), numerar todos los elementos de la población, pero en lugar de extraer n números aleatorios solo se extrae uno. Se parte de ese número aleatorio i llamado arranque aleatorio, que es un número elegido al azar, y los elementos que integran la muestra son los que los lugares: i, i+k, i+2k, i+3k,…..,, i+(n-1)k, es decir se toman los individuos de k en k, siendo k el resultado de dividir el tamaño de la población entre el tamaño de la muestra N k n  . El numero i llamado también arranque aleatorio que empleamos como punto de partida será un número al azar entre 1 y k.
  • 52. 51 H. Mariano. s Tabla 6 Tabla de números aleatorios Fuente: Elaborado por el autor Ejemplo Supongamos que la población estudiada está compuesta por 360 familias, además el tamaño de la muestra (muestreo aleatorio simple) es de 30 familias; con esta información se determina el valor de k.
  • 53. 52 H. Mariano. s 360 12 30 N k n    Utilizando la tabla de números aleatorios hallamos el punto de arranque (i) que debe de variar para este caso 1 12 i   , como el valor de k es de dos dígitos recurrimos a la tabla de números aleatorios y elegimos el valor de 10, en consecuencia i = 10, a partir de ella generamos los números sumando el valor de k hasta obtener treinta números. 10, 22, 34, 46, 58, 70, 82, 94, 106, 118, 130, 142, 154, 166, 178, 190, 202, 214, 226, 238, 250, 262, 274, 286, 298, 310, 322, 334, 346, 358 . Una vez determinados los valores, identificamos a las familias en el listado de la población y de acuerdo al tema de investigación se aplicará los instrumentos que permita obtener la información. C) Muestreo Estratificado Consiste en la división previa de la población de estudio en grupos o clases que se suponen homogéneos respecto a característica a estudiar. A cada uno de estos estratos se le asignaría una cuota que determinaría el número de miembros del mismo que compondrán la muestra. Dentro de cada estrato el muestreo se realizaría mediante m.a.s. Según la cantidad de elementos de la muestra que se han de elegir de cada uno de los estratos, existen dos técnicas de muestreo estratificado:  Asignación proporcional: el tamaño de cada estrato en la muestra es proporcional a su tamaño en la población.  Asignación óptima: la muestra recogerá más individuos de aquellos estratos que tengan más variabilidad. Para ello es necesario un conocimiento previo de la población.
  • 54. 53 H. Mariano. s Para aplicar este diseño, se precisa que la población esté dividida en subpoblaciones, estratos, que no se solapen. Se selecciona una muestra probabilística en cada estrato y se trabaja de manera independiente entre estratos. Razones de la popularidad de este método: Permite realizar estimaciones de precisión específica en cada estrato; En un experimento, los aspectos prácticos relacionados con la respuesta, la medida o la información auxiliar pueden diferir considerablemente de una subpoblación a otra. Existirán razones administrativas, división territorial, ... .Cuestiones técnicas que plantea este muestreo: i) Construcción de Estratos: Los objetivos del estudio y los recursos disponibles contestarán las siguientes cuestiones ¿Qué características utilizar para dividir la población en estratos?; ¿Cómo se identificarán los estratos?; ¿Cuántos estratos debe haber? En particular, los estratos deben estar constituidos por unidades lo más homogéneas posibles; En el caso límite de estricta homogeneidad bastaría seleccionar una sola unidad en cada estrato ii) Elección de una muestra y métodos de estimación en cada estrato; El proceso de muestreo se realizará de manera independiente en cada estrato Ventajas de este diseño:
  • 55. 54 H. Mariano. s i) Si las mediciones dentro de cada estrato son homogéneas, la estratificación producirá un límite más pequeño para el error de estimación que el m.a. ii) Se puede reducir el costo por observación al estratificar la población en grupos convenientes. iii) Permite obtener estimaciones de parámetros poblacionales para subgrupos de la muestra Figura 13 Ejemplo de muestreo estratificado Fuente: Elaborado por el autor
  • 56. 55 H. Mariano. s D) Muestreo por conglomerados Existen cuatro técnicas de muestreo probabilístico y no podemos elegir indistintamente cada una de ellas, sino más bien debemos elegir el muestreo aleatorio simple. En el caso en que no podamos utilizar el muestreo aleatorio simple utilizaremos el muestreo sistemático, para los casos en que no contamos con N, el marco muestral, el listado de todas las unidades de estudio; pero, vamos a tener que pagar un precio: un mayor sesgo en nuestros resultados. La tercera opción es elegir el muestreo aleatorio estratificado con la intención de representar a cada uno de los estratos en la muestra. Hay que aclarar que esto no lo hace mejor que el muestreo aleatorio simple o sistemático, lo que sucede es que en la selección de muestras existe un conjunto de sesgos de selección que pueden interferir con la aleatorización de nuestra muestra, es por esa razón, que intentamos estratificar a los grupos para poder representarlos al interior de la muestra, pero recuerda que el muestreo aleatorio estratificado requiere conocer la distribución de la variable criterio de estratificación. Pero, si aún no cuentas con esta información y te es difícil realizar un muestreo aleatorio simple porque tienes que estudiar, por ejemplo, a toda una región y es muy difícil que te puedas trasladar hasta cada una de las instalaciones o a sus ubicaciones, me estoy refiriendo a las unidades de estudio. En ese caso puedes optar por el muestreo por conglomerados. El muestreo por conglomerados es la cuarta técnica de muestreo probabilístico y de las cuatro técnicas es la que más sesgo tiene. Sin embargo, está considerada dentro del muestreo probabilístico y consiste en la identificación de grupos de unidades de estudio,
  • 57. 56 H. Mariano. s de conglomerados llamados también clústeres donde cada grupo presenta toda la variabilidad que se observa en la población. Para ejemplificarlo, vamos a retornar nuestro ejemplo de la evaluación de la satisfacción laboral en los trabajadores del Ministerio de Salud a nivel primario, es decir, centros y puestos de salud. Si trabajamos únicamente en la región Arequipa, y esto ya es un territorio bastante grande, tendríamos que trasladarnos a cada centro y puesto de salud, lo cual representa mucho gasto, mucho tiempo y demasiada inversión. En realidad, podríamos obtener resultados similares si hacemos un muestreo por conglomerados; esto significa no aleatorizar a las unidades de estudio: no elegir a los trabajadores de la salud por su número de contrato, por su número de identificación, no realizar un muestreo aleatorio simple porque es impráctico. En este caso realizamos el muestreo por conglomerados, que consiste en seleccionar a los centros y puestos de salud. Una vez que hayamos seleccionado los centros y puestos de salud a evaluar y descartado aquellos que no serán evaluados, vamos a dirigirnos hacia los seleccionados para entrevistar a los trabajadores, a los que se encuentran en el interior de sus instalaciones. Esto es particularmente práctico porque no vamos a tener que trasladarnos a todos los centros y puestos de salud, teniendo en cuenta que si todos están bajo el mismo régimen; bajo el mismo sistema; bajo la misma legislación; con los mismos sueldos; no tendría por qué haber mucha diferencia en cuanto a la satisfacción laboral del centro de salud Ampliación Paucarpata y el centro de salud Edificadores Misti. Además, no hay mucha distancia entre ellos porque se encuentran en la misma cuidad: ambos están en la zona periurbana y por tanto las circunstancias de uno y otro son muy
  • 58. 57 H. Mariano. s similares. Así que, incluir a uno es casi como incluir a los dos, y digo casi porque no es igual. Porque nos vamos a tener que arriesgar a cometer más sesgo. Ciertamente, esta es la técnica de muestreo probabilístico que tiene más sesgo, pero por cuestiones prácticas tendremos que recurrir a esta forma de muestrear para poder realizar nuestro trabajo con eficiencia. Ya te habrás percatado de que esta técnica es muy útil cuando las unidades de estudio: los trabajadores del Ministerio de Salud, están muy dispersos geográficamente, entonces, vamos a ahorrar muchos recursos si utilizamos esta técnica de muestreo. La técnica de muestreo por conglomerados se puede considerar como lo opuesto al muestreo estratificado, porque en cada conglomerado o grupo de unidades de estudio encontramos representados a toda la variabilidad de la población: en un centro de salud encontramos al médico, a la enfermera, a la obstetriz, al odontólogo, al nutricionista, al psicólogo es decir a todo el equipo de salud en la misma proporción o, por lo menos en similares proporciones a los que se encuentran en toda la población, es decir, en todo el Ministerio de Salud; por esta razón, a cada uno de estos grupos los consideramos como mini poblaciones llamados también conglomerados. Los profesionales que se encuentran al interior de un centro de salud son diferentes entre sí, en cambio, en el muestreo estratificado los que se encuentran dentro de un estrato son muy similares, sino acuérdate del ejemplo de los estudiantes de la facultad de Enfermería: un estrato está conformado por mujeres; y el otro, por varones. En cada estrato hay homogeneidad: las mujeres son homogéneas entre ellas ylos varones son homogéneos entre ellos; pero, entre estratos hay diferencias. Por esta razón, tienen
  • 59. 58 H. Mariano. s que entrar al muestreo todos los estratos; lo que no entran son todos los elementos de cada estrato. El muestreo se hace al interior de cada estrato ytodos ellos tienen que estar representados en la muestra. En cambio, en el muestreo por conglomerados ocurre lo contrario: existen muchos grupos llamados conglomerados, pero no todos los conglomerados entran a la muestra, sino algunos de ellos y al interior de cada conglomerado entran todos los elementos; todas las unidades de estudio. Al interior de cada conglomerado hay la diversidad y la variabilidad que encontraríamos en la población. Por lo tanto, cualquiera de los conglomerados podría incluirse en la muestra y, de hecho, cuando se hace una selección aleatoria solamente uno de ellos pasara a conformar la muestra. Hemos visto dos etapas en el muestreo por conglomerados, porque la primera parte o la primera etapa de la selección consiste en seleccionar qué centros y qué puestos de salud van a ser incluidos en la muestra. Una vez que nos hayamos trasladado a cada centro y puesto de salud tenemos dos opciones: la primera opción es que estudiemos o entrevistemos a todos los trabajadores; a todas las unidades de estudio. Esa es la primera opción y esa es la forma más básica de hacer un muestreo por conglomerados, pero incluso dentro de cada conglomerado también podríamos hacer una segunda elección, una segunda etapa de nuestro muestreo y decidir no entrevistar a todos los trabajadores, sino solamente a una parte de ellos. Vamos a suponer que un centro de salud tiene 50 trabajadores y decidimos no entrevistarlos a todos, sino solamente a 25 ¿Cómo hacemos la selección de estos 25 trabajadores del grupo de 50? Pues ahí sí lo podemos hacer mediante un muestreo
  • 60. 59 H. Mariano. s aleatorio simple, pero esto corresponde a una segunda etapa de nuestro muestreo polietápico. El muestreo por conglomerados hace referencia únicamente a la primera etapa, a la fase de la selección de los centros y puestos de salud, cada investigador es libre de decidir qué es lo que hará en una segunda etapa o si es que existe una segunda etapa, pero entre decidir que exista o no una segunda etapa ya hay mucha subjetividad en cuanto a la selección de las unidades de estudio. Por esta razón, el muestreo por conglomerados es la técnica de muestreo probabilístico que le infiere mayor sesgo a las mediciones y, por tanto, a las conclusiones, pero aun así hay circunstancias, hechos, momentos en los que no se puede aplicar ninguno de estos cuatro muestreos probabilísticos. En ese caso tendremos que recurrir a un muestreo no probabilístico.
  • 61. 60 H. Mariano. s CAPITULO III 3. CONSTRUCCION E INTERPRETACION DE TABLAS Y GRAFICOS ESTADISTICOS 3.1. TABLA DE FRECUENCIAS Una tabla de frecuencias es un arreglo en el cual se hace una lista exhaustiva de todos los posibles valores o categorías de la variable en estudio (posibles respuestas), luego se calcula la frecuencia con que se repite cada una de estos. La utilidad inmediata de estas tablas es que permite verificar inconsistencias y errores que pueden haberse cometido durante la digitación de los datos. Una vez realizadas las correcciones, estas tablas permitirán explorar el comportamiento de la variable en estudio. Figura 14 Tabla de frecuencias para una variable categórica Variable Categórica xi f i F i hi Hi x1 f1 F1 h1 H1 x2 f2 F2 h2 H2 .. . . . . . . . . . XK fk Fk = n hk Hk = 1 Σfi =n 1 Fuente: Elaborado por el autor
  • 62. 61 H. Mariano. s Descripción de las notaciones de la tabla xi : La variable en estudio Frecuencia Absoluta Simple (fi). Es el número de veces que se repite el valor de la variable 1 k i i f n    Frecuencia Absoluta Acumulada (Fi) 1 1 2 1 2 3 1 2 3 1 . . k i i i F f F f f F f f f F f n           Frecuencia Relativa Simple (hi). Valor porcentual, obtenido al dividir la frecuencia absoluta simple entre el tamaño de la muestra. Para su interpretación se multiplica por 100 1 1 2 2 1 . . 1 i i k i i f h n f h n f h n h      
  • 63. 62 H. Mariano. s Frecuencia Relativa Acumulada 3.2. SUMATORIAS Nos encontramos frecuentemente en estadística con el cálculo de números producto del conteo, para poder reducir la operación utilizamos la sumatoria, denotando con la siguiente simbología: (  ) Notación: La letra griega  (sigma) se emplea para indicar la suma de las observaciones, además se coloca debajo de sigma el termino i=1 que corresponde al límite inferior de la sumatoria; en la parte superior de sigma se coloca con la letra k, correspondiente al límite superior y al frente de la sumatoria Xi. 1 2 3 4 1 ...... k i k i x x x x x x         Ejemplos.   4 1 3 2 2 2 3 1 4 1 2 3 2 2 1 1. 1 2 3 4 10 2. 1 2 3 14 3. 2 2 2 2 2 4(2) 8 4. 1 2 3 (6) 36 i i i i i i i                                    1 1 2 1 2 1 . . 1 k k i i H h H h h H h       
  • 64. 63 H. Mariano. s Propiedades 1. La sumatoria de una constante es igual a k veces la constante 1 k i c kc    2. La sumatoria de una constante multiplicado por una variable es igual al producto de la constante por la sumatoria de la variable. 1 1 k k i i i i cx c x      3. 1 2 1 ......... k m m m m i k i x x x x       4. 2 1 2 1 ( ) ( ....... ) k m i k i x x x x       5. 1 1 2 2 1 .......... k i i k k i x y x y x y x y       6. 1 2 1 2 1 1 ( )( ) ( ....... )( ....... ) k k i i k k i i x y x x x y y y            Ejemplo. - Tabla de frecuencia para una variable categórica. Para ilustrar la construcción e interpretación de tablas, gráficos, utilizaremos los datos de la encuesta realizada en el asentamiento humano “San Luís” – Amarilis – Huánuco. La descripción de las variables estadísticas se presenta en el libro de códigos. 1. Hacer una lista de todos las posibles categorías de la variable Ejemplo: Variable: género del jefe del hogar Niveles: 1 = Masculino 2 = Femenino
  • 65. 64 H. Mariano. s 2. Determinar la frecuencia absoluta y relativa con que se repite cada categoría (o valor) de la variable (frecuencia). Tabla 7 Encuesta socio económica en el asentamiento humano “san Luis” distribución de hogares según genero del jefe de familia – amarilis - Huánuco 2008 Sexo Frecuencia absoluta simple (fi) Frecuencia absoluta acumulada (Fi) Frecuencia relativa (hi) Frecuencia relativa acumulada (Hi) Masculino f1 =44 44 67,7 67,7 Femenino f2 =21 65 32,3 100,0 Total n = 65 100,0 Fuente: Elaborado por el Investigador Interpretación. - Realizado la encuesta socioeconómica en el asentamiento humano “San Luís” en la tabla se observa que 44 encuestados que representa el 67,7% del sexo masculino del total y 21 que representa el 312,3% son del sexo femenino del total.
  • 66. 65 H. Mariano. s Figura 15 Distribución de los hogares según género del jefe de familia del Asentamiento Humano de “San Luís” – Amarilis Huanuco-2008 Fuente: Elaborado por el autor
  • 67. 66 H. Mariano. s Ejemplo. - Tabla de frecuencia para una variable numérica discreta sin intervalos de clase. Para ilustrar el procedimiento de la construcción de la tabla de frecuencias sin intervalos de clase utilizamos la variable: número de hijos. 1. Encontrar los valores mínimo (Min) y máximo (Max) del conjunto de datos: Número de hijos: Mínimo = 0 Máximo = 7 2. Calcular el rango de posibles valores entre el máximo y el mínimo: Se tiene 7 posibles valores para la variable número de hijos: 0, 1, 2, 3, 4, 5, 6, 7 3. Construir la tabla, enumerando todos los posibles valores de la variable y contar el número de veces que se repite cada valor de la variable número de hijos. Variable Numérica xi f i F i hi Hi x1 f1 F1 h1 H1 x2 f2 F2 h2 H2 .. . . . . . . . . . XK fk Fk = n hk Hk = 1 Σfi =n 1
  • 68. 67 H. Mariano. s Tabla 8 Encuesta socio económica en el asentamiento humano “san Luis” distribución de hogares según número de hijos por jefe de familia – amarilis - Huánuco - 2014 Número de hijos fi Fi hix100% Hi x100% 0 5 5 7,7 7,7 1 8 13 12,3 20,0 2 11 24 16,9 36,9 3 20 44 30,8 67,7 4 11 55 16,9 84,6 5 3 58 4,6 89,2 6 5 63 7,7 96,9 7 2 65 3,1 100,0 Total 65 100,0 Fuente: Elaborado por el investigador. Interpretación. - En la encuesta socio económico realizado en el Asentamiento Humano “San Luís” distrito de Amarilis - Huánuco según número de hijos se tiene en la tabla Nº 04:  f 3 = 11 indica de los 65 jefes de familias encuestados hay 11 familias que han respondido que tiene dos hijos.  F3 = 24 indica de los 65 jefes de familia encuestados hay 24 familias que tienen a lo más 2 hijos.  h3 = 16,9% indica de los 65 jefes de familia encuestados el 16,9% del total de familias encuestados tienen 2 hijos. .
  • 69. 68 H. Mariano. s Figura 16 Distribución de los hogares según número de hijos por jefe de familia del Asentamiento Humano de “San Luís” – Amarilis Huanuco-2008 7 6 5 4 3 2 1 0 20 15 10 5 0 N úmero de hijos Frecuencia Histograma de Frecuencias Fuente: Elaborado por el autor Ejemplo. - Tabla de frecuencia para una variable numérica con intervalos de clase. Para ilustrar el procedimiento para la construcción de la tabla de frecuencias con intervalos de clase utilizaremos la variable edad. Figura 17 Tabla de frecuencia 7 6 5 4 3 2 1 0 35 30 25 20 15 10 5 0 Número de hijos Porcentajes Barras de Frecuencia Fuente: Elaborado por el autor
  • 70. 69 H. Mariano. s figura 18 Polígono de frecuencias 7 6 5 4 3 2 1 60 50 40 30 20 10 0 Número de hijos Frecuencia Polígono de Frecuenciass Fuente: Elaborado por el autor Figura 19 Curva normal 6 4 2 0 20 15 10 5 0 Número de hijos Frecuencia Curva Normal Fuente: Elaborado por el autor
  • 71. 70 H. Mariano. s 3.3. DISTRIBUCION DE FRECUENCIAS CON INTERVALOS. La distribución de frecuencias por intervalos de clase se usa cuando la variable estadística es continua o cuando el número de valores distintos de una variable discreta es muy grande. Esta distribución se obtiene dividiendo el rango de variación de los datos en k intervalos de clase y determinando el número de datos que contiene cada intervalo como se muestra en el cuadro. Hay formas diferentes de tomar los intervalos de clase la que mencionamos a continuación:       ; ; ; ; La designación de intervalos va depender en algunos casos de los datos, de la decisión del investigador y las experiencias que se tiene en los trabajos realizados. Para construir la distribución de frecuencias por intervalos de clase hay varios procedimientos, a continuación la recomendación:  Se recomienda no más de 20 intervalos ni menos de 4, ya que muchos intervalos pueden complicar innecesariamente los cálculos de las medidas de tendencia central y de las medidas de dispersión, y pocos intervalos podían omitir características importantes de los datos lo que no reflejaría el verdadero resultado de los datos. En este texto elegimos un intervalo semi abierto   .  El número de intervalos elegido, debe dar una distribución de frecuencias momo modal, es decir, una distribución cuyas frecuencias van aumentando progresivamente hasta una frecuencia máxima y luego va disminuyendo también progresivamente.
  • 72. 71 H. Mariano. s Figura 20 Esquema de distribución de frecuencias con intervalos Li - Ls Xi fi Fi hix100 % Hix100 % I1 x1 f1 F1=f1 h1 H1=h1 I2 x2 f2 F2=f1+f2 h2 H2=h1+h2 I3 .. . . . . . . . . . . Ik x k fk Fk =f1+…+fk hk Hk = 100 Σfi =n 100 Fuente: Elaborado por el autor 3.4. CONSTRUCCIÓN DE LA DISTRIBUCIÓN DE FRECUENCIAS Dados n valores de alguna variable cuantitativa X discreta o continua un procedimiento alternativo para construir la distribución de frecuencias es: 1. Determinar el rango ( R ) de variación de los datos que se define por: R = (Xmax – Xmin ) + k ; esto significa que si los valores máximos y mínimos están expresados en entero se le agrega el valor 1, si esta expresado en decimales se le agrega 0,1, si los valores están expresados en centésimos, se agrega 0,01 y a´si sucesivamente.
  • 73. 72 H. Mariano. s 2. Determinar el número de intervalos (K), teniendo en cuenta la primera recomendación. Un valor aproximado del número de intervalos K, nos proporciona la regla de Sturges, donde K = 1 + 3,322 Log( n ). Alternativamente se puede utilizar K = √n , 25 ≤ n ≤ 400 Nota.- El valor obtenido de K se redondea al entero inmediato mayor, no tener en cuenta la regla de redondeo de los decimales, eso nos permite no tener un exceso negativo. Además, se debe tener en cuenta que no existe una fórmula establecida en la que te da un número exacto de K, las que se presenta son criterios que te permita tener una idea con cuantos intervalos se puede trabajar, aún se puede usar un criterio propio de acuerdo a los datos que se tenga y eso es válido. 3. Determinar la amplitud de clase A del intervalo de clase, dividiendo el rango entre el número de intervalos de clase. Esto es R A K  , según Sturges la amplitud debe redondearse, de acuerdo al número de decimales que tiene los datos. 4. Marca de clase. Es el promedio de cada intervalo de clase: 3 4 1 1 2 1 2 , x ,....., 2 2 2 k k k L L L L L L x x        5. Determinar un exceso ( ε ), este exceso debe de cumplir la condición siguiente: 0 AK R     . a. Si el exceso es exactamente igual a cero. El límite inferior de la primera clase es igual al valor mínimo determinado, y el límite superior de la última clase coincide con el valor máximo determinado. Se explica los criterios de la estructuración de los intervalos: