SlideShare una empresa de Scribd logo
1 de 210
Descargar para leer sin conexión
Edgar Eloy Carpio Vargas
Universidad Nacional del Altiplano-Puno
CONCEPTOS PRELIMINARES
Etimología
Capitulo I
2
La palabra "estadística" proviene del latín "statisticum collegium", que significa "consejo de Estado"
o "gobierno del Estado". La palabra "statisticum" se deriva del término "status", que significa
"estado" o "condición". En la antigua Roma, los gobernantes utilizaban la estadística para recopilar
datos sobre la población y los recursos del Estado para tomar decisiones importantes.
En el siglo XVIII, la palabra "estadística" comenzó a utilizarse con su significado moderno para
referirse a la recopilación, análisis e interpretación de datos numéricos. El término fue
popularizado por el alemán Gottfried Achenwall en su libro "Staatskunde" (Ciencia del Estado)
publicado en 1749.
Desde entonces, la estadística ha evolucionado como una disciplina científica que se centra en la
recopilación, análisis e interpretación de datos numéricos y ha encontrado aplicaciones en una
amplia gama de campos, desde la investigación médica y científica hasta la toma de decisiones
empresariales y políticas.
3
Usos de la estadística.
La estadística es una disciplina científica que se ocupa de la recopilación, análisis e interpretación de
datos numéricos. Debido a su versatilidad y aplicabilidad, la estadística se utiliza en una amplia
variedad de campos y situaciones. Algunos de los usos más comunes de la estadística incluyen:
Investigación científica: La estadística se utiliza para analizar los datos recopilados en estudios
científicos, desde ensayos clínicos hasta experimentos en física, química y biología.
Negocios y finanzas: La estadística se utiliza para analizar los datos financieros y de mercado, como
el precio de las acciones, la inflación, las tasas de interés y las tendencias de los consumidores.
Gobierno y política: La estadística se utiliza para recopilar y analizar datos sobre la población, la
economía y los recursos del Estado, y para apoyar la toma de decisiones políticas.
Educación: La estadística se utiliza en la evaluación de los resultados de los exámenes y en el análisis
de los datos de la investigación educativa
Investigación de mercado: La estadística se utiliza para analizar los datos de los estudios de mercado,
como encuestas y análisis de preferencias de los consumidores.
Salud pública: La estadística se utiliza en el análisis de datos de salud para identificar tendencias,
patrones y factores de riesgo, y para evaluar la efectividad de las intervenciones médicas.
Ingeniería y tecnología: La estadística se utiliza para analizar datos en la industria manufacturera, la
ingeniería y el desarrollo de productos.
• Los términos estadísticos invaden la literatura.
• La medicina es cada vez más cuantitativa.
• Su conocimiento nos permitirá leer la bibliografía con más capacidad crítica para
detectar errores potenciales.
• Nos será útil para llegar a conclusiones correctas.
• Nos permitirá valorar protocolos de estudio e informes remitidos para su publicación
• Participar, en definitiva, en la investigación médica.
Razones por las cuales los profesionales deben conocer los fundamentos de la
estadística.
4
Errores estadísticos comunes
Errores al momento de recopilar y durante el cómputo de los mismos.
Sesgo: Es imposible ser completamente objetivo o no tener ideas preconcebidas antes de
comenzar a estudiar un problema, y existen muchas maneras en que una perspectiva o
estado mental pueda influir en la recopilación y en el análisis de la información.
Datos no comparables: es extremadamente importante que las comparaciones se hagan
entre datos que sean comparables.
Proyección descuidada de tendencias: la proyección simplista de tendencias pasadas
hacia el futuro es uno de los errores que más ha desacreditado el uso del análisis
estadístico.
Muestreo Incorrecto: el volumen de información disponible es tan inmenso que se hace
necesario estudiar muestras, para derivar conclusiones
Hay otros errores que no son tan fácilmente identificables:
5
Definición de estadística
6
La estadística es una disciplina que se encarga del diseño, análisis y la interpretación de datos. A
continuación, se presentan algunas definiciones de estadística de diferentes autores:
Ronald E. Walpole: "La estadística es la ciencia de la toma de decisiones en la presencia de
incertidumbre".
Morris H. deGroot y Mark J. Schervish: "La estadística es el estudio de los métodos para la
recolección, análisis e interpretación de datos".
David S. Moore y George P. McCabe: "La estadística es una colección de métodos para planear
experimentos, obtener datos y luego organizar, resumir, analizar, interpretar y presentar esos datos y
extraer conclusiones y tomar decisiones".
William Mendenhall y Terry Sincich: "La estadística es la ciencia que se ocupa de la toma de
decisiones en la presencia de la incertidumbre".
7
ANALISIS UNIVARIADO ANALISIS BIVARIADO ANALISIS MULTIVARIADO
EN FUNCION AL NUMERO DE VARIABLES EN ESTUDIO
Analizar una variables
independientemente
Analizar a la vez
dos variables
Analizar a la vez mas
de dos variables
ANALISIS ESTADISTICO
Estadística descriptiva o deductiva
Estadística inferencial o inductiva:
8
División de la estadística
La estadística descriptiva se enfoca en la descripción y el resumen de los datos recopilados. Esta
categoría incluye la presentación de datos en tablas, gráficos y medidas descriptivas como la media,
la mediana, la moda, la desviación estándar y la varianza. La estadística descriptiva es útil para
comprender las características básicas de un conjunto de datos y para resumir y visualizar la
información sin sacar conclusiones o inferencias.
La estadística inferencial se enfoca en hacer inferencias y predicciones sobre una población a
partir de una muestra de datos. Esta categoría incluye la estimación de parámetros, la prueba de
hipótesis y la regresión y técnicas avanzadas. La estadística inferencial se utiliza para tomar
decisiones basadas en datos y para hacer inferencias sobre una población más amplia a partir de
un conjunto de datos limitado.
La finalidad de la estadística es suministrar información y su utilidad dependerá del fin que se
proponga y de la forma como se obtenga los datos.
• Determinar la realidad de una observación o fenómeno.
• Lo típico o normal de esa observación.
• Determinar los cambios que presenta el fenómeno.
• Relacionar dos o más fenómenos.
• Determinar las causas que originan el fenómeno.
• Hacer estimativos sobre el comportamiento futuro del fenómeno.
• Obtener conclusiones de un grupo menor (muestra), para hacerlas extensivas a un grupo
mayor (población).
• La estadística facilita una serie instrumentos o técnicas que, al ser utilizadas correctamente,
permiten determinar el grado de validez y confiabilidad, ya sea de las predicciones o de las
conclusiones obtenidas a partir de muestras.
Finalidad de la estadística
9
Esta referido a un colectivo (conjunto total, completo) de individuos o elementos individuales
(mediciones o conteos) que se están estudiando y sobre los que se desean hacer inferencias.
Presentan determinada característica (propiedades comunes) de grupo.
Población
Es aquella que contiene un número limitado de individuos u objetos llamados también
elementos (se puede contar).
Es aquella que tiene un numero ilimitado de elementos (no contable), en la práctica una
población finita con un numero grande de elementos se considera una población infinita.
Población finita.
Población infinita.
La población puede estar definida por: características
de individuos, limites geográficos, grupos existentes,
limites de tiempo, etc.
10
Un cardiólogo, investiga un nuevo fármaco para disminuir los niveles de colesterol en pacientes
que consumen alimentos ricos en grasas en varones adultos mayores de 40 años.
población objeto de estudio: todos los varones adultos mayores de 40 años que consumen
alimentos ricos en grasas y que tengan colesterol.
Al momento tal como se plantea la investigación, no se conoce los elementos de la población
(relación de adultos mayores de 40 años que consumen grasas y que tengan colesterol). En este
sentido, se podría pensar en determinar la muestra por muestreo no probabilístico
determinando una muestra de 100.
Note que a pesar de que la población es finita, no es enumerable, esto se puede definir cono una
población infinita.
La muestra proporciona información sobre el objeto de estudio, la cual puede ser seleccionada
aleatoriamente o no aleatoriamente. Lo habitual en nuestro contexto es que en el procedimiento
de extracción intervenga el azar, pero muchas veces esto no es posible.
Ejemplo:
11
Se quiere analizar el tiempo que dedican al estudio (semanal) los alumnos de la EP de Medicina
humana de la Universidad Nacional del Altiplano.
La muestra para este caso si se puede determinar por muestreo probabilístico utilizando las
formulas adecuadas, supongamos que la formula reporte 120 estudiantes como muestra.
Población: Todos los estudiantes de la EP de Medicina de la Universidad Nacional del
Altiplano, 560.
Muestra: 120 estudiantes, aquí si es posible elegir los elementos de la muestra aleatoriamente
ya que se puede conformar el marco muestral (relación de alumnos) .
12
Ejemplo:
Es toda medida descriptiva de una población.
- El ingreso promedio de todos los asalariados del Perú.
- El ingreso promedio de docentes universitarios del Perú
INDICADOR: PARAMETRO (µ, P, 2, N,  )
Parámetro.
En otras palabras, son valores obtenidos de la población
13
Es una parte (o sub conjunto) representativa de la población, tomada sea por muestreo
probabilístico o no probabilístico, y, que se utiliza con el objeto de investigar las propiedades o
realizar inferencias sobre la población.
INDICADOR: ESTIMADOR ( ത
𝑋, 𝑆2
, 𝑝 𝑛, 𝑆)
Ejemplo: Cada mes el Ministerio de Trabajo calcula el ingreso promedio en una muestra de
varios miles de asalariados seleccionados entre la población total de 2 millones de trabajadores.
El promedio de esa muestra se utiliza luego como una estimación del ingreso promedio para
toda la población.
Muestra
Son valores obtenidos de la muestra
14
15
Ejemplo de población y muestra.
Un cardiólogo, que investiga un nuevo fármaco para rebajar el colesterol, desea conocer el consumo
de grasas en varones adultos mayores de 40 años.
La población objeto de estudio: todos los varones adultos mayores de 40 años.
La variable de interés: consumo de grasas.
El cardiólogo podría pensar en analizar a todos los individuos de la población. Sin embargo, esto
resulta inviable (y así ocurre en muchas otras situaciones prácticas debido al coste, al tiempo que
requiere,...) Entonces se conformará con extraer una muestra.
Ejemplo: Se quiere analizar el tiempo que dedican al estudio (semanal) los alumnos de la EP de
Medicina de esta Universidad. Para ello se pregunta a 50 alumnos.
Población: Todos los estudiantes de la EP de Medicina de esta Universidad.
Variable: Número de horas de estudio semanal.
Muestra: 50 alumnos encuestados.
16
Ejemplo: El sindicato de una industria que tiene 100 empleados desea saber cual es el
sueldo promedio, encarga una encuesta a una empresa para que entreviste a 20 operarios y
averigüe sus salarios.
Estos datos son una muestra de 20 observaciones del universo o población formado por los
salarios de todos los operarios de la industria textil.
Las razones para estudiar muestras en lugar de poblaciones son diversas y entre ellas
podemos señalar 3:
❑ Ahorrar tiempo.
❑ Ahorrar costes.
❑ Estudiar la totalidad de los pacientes o personas con una característica determinada en
muchas ocasiones puede ser una tarea inaccesible o imposible de realizar.
17
Pero,
❑ al disponer de más tiempo y recursos, las observaciones y mediciones realizadas pueden
ser más exactas, además,
❑ Reduce la heterogeneidad de una población.
Se considera dato a la cuantificación de las particularidades o peculiaridades de un
fenómeno individual que forma parte del fenómeno de masa
Se denomina marco, marco muestral o marco de referencia, a la lista, mapa o cualquier
otro material aceptable, que contenga todas las unidades perfectamente identificadas y
actualizadas, de la cual se seleccionará muestra
Dato estadístico.
Marco muestral.
Es el objeto o elemento indivisible que será estudiado en una población, sobre la cual se
obtendrán los datos de interés para la investigación. La unidad de análisis no es el
fenómeno investigado sino el que genera el fenómeno.
Unidad de análisis
18
Elementos Características
Personas salarios
personas horas de trabajo
personas cargos
hogar consumo
personas enfermedad
personas notas
Fabrica Producto
Es importante resaltar que a la estadística no le interesa el elemento o la unidad en si, sino su
característica
Características.
19
Unidad de análisis
Es el objeto o elemento indivisible que será estudiado en una población, sobre la cual se
obtendrán los datos de interés para la investigación.
POBLACION MUESTRA
PARAMETROS ESTIMADORES
INFERENCIA ESTADISTICA
20
CLASIFICACIÓN
DEL
TIPO
DE
DATOS.
DE ACUERDO A LA FUENTE.
Datos primarios.- Directamente de los encuestados
Datos secundarios.- Publicaciones o instituciones que no tienen relación directa
con el fenómeno (INEI, Oficinas, revistas, historias clínicas etc.)
Series temporales.- obtenidas en forma cronológica, Día, mes, año etc.
Corte transversal.- Se dan en un momento determinado del tiempo.
POR SU NATURALEZA
Datos Cualitativos ( Nominales y ordinales)
Datos Cuantitativos (Discretos y continuos)
POR LA FORMA DE RECOPILAR.
Encuestas.- Recopilación por sondeos
Experimento.- cuando se ejerce control sobre uno o más de sus factores
21
22
ANALISIS UNIVARIADO ANALISIS BIVARIADO ANALISIS MULTIVARIADO
EN FUNCION AL NUMERO DE VARIABLES EN ESTUDIO
Analizar una variables
independientemente
Analizar a la vez dos
variables
Analizar a la vez mas de dos
variables
ANALISIS ESTADISTICO
23
Estadísticas y recopilación de datos.
Los datos generalmente se recopilan mediante encuestas por muestreo, estudios observacionales o
experimentos.
Las encuestas por muestreo se usan normalmente cuando el propósito de la recopilación de
datos es estimar algunas propiedades de la población finita sin realizar un censo completo.
Los estudios observacionales y los experimentales, normalmente se usan para determinar la
relación entre dos o más cantidades medidas en una población conceptual.
Una población conceptual, a diferencia de una población finita, solo puede existir en nuestras
mentes.
Por ejemplo, si hubiera interés en estudiar la relación entre las futuras emisiones de gases de efecto
invernadero y la temperatura global promedio futura, la población no puede ser muestreada porque
aún no existe.
24
• En un estudio observacional, los datos se observan en su entorno natural, pero en un
experimental, el medio ambiente está controlado.
• En estudios observacionales, no se puede demostrar que las relaciones detectadas sean
causa y efecto, pero se pueden encontrar correlaciones entre dos variables observadas porque
ambas están afectadas por cambios en una tercera variable que no se observó ni registró, y
cualquier predicción futura basada en las relaciones encontradas en un estudio observacional
debe asumir las mismas interrelaciones entre las variables que existieron.
Diferencia entre estudios observacionales y experimentales
En un experimento, por otro lado, algunas variables se cambian deliberadamente mientras que
otras se mantienen constantes. De esta forma, se puede observar directamente el efecto causado por
el cambio en la variable deliberadamente variada, y se pueden hacer predicciones sobre el resultado
de los cambios futuros en la variable expresamente variada.
Son características de las personas u objetos que pueden tomar diferentes valores los cuales
pueden ser cuantificables.
Ejemplo. Un investigador está interesado en los valores de hemoglobina en sangre de los
trabajadores de un taller dedicado al mantenimiento de automóviles. Para ello, decide
estudiar a todos los trabajadores que laboran en el taller.
Variable:
Nro. Nombre sexo edad
Hemoglobina en
sangre (mg/dL)
i X Y Z
1 Miguel Masculino 45 12
2 Domitila Femenino 23 13
3 Manuel Masculino 32 11
4 Jesus Masculino 18 15
5 Sergio Masculino 21 14
Tabla 1. algunas características de trabajadores que laboran en un taller de automóviles
Variables: sexo, edad y hemoglobina
No son variables: Nro. y Nombre 25
CLASIFICACIÓN DE VARIABLES ESTADÍSTICAS
En función del tipo de dominio, las variables se clasifican en: cualitativas, cuantitativas
y cuasicuantitativas.
En función a los tipos de datos se clasifican en: cualitativos (atributos) y
cuantitativos.
Ordinales
Nominales
Cualitativas
Continuas
Discretas
Cuantitativas
Variables















26
(también llamados atributos, categorías)
Este tipo de variables representan una cualidad o atributo que clasifica a cada caso en una de varias
categorías. La situación más sencilla es aquella en la que se clasifica cada caso en uno de dos grupos
(hombre/mujer, enfermo/sano, fumador/no fumador). Son datos dicotómicos o binarios. En
muchas ocasiones este tipo de clasificación no es suficiente y se requiere de un mayor número de
categorías. Este tipo de variables no llevan clasificación numérica alguna.
- color de los ojos - grupo sanguíneo - Profesión
- clase social - color de piel - lanzar una moneda al aire
- estado civil - sexo - especie de animales
- ¿posee Ud. Actualmente bonos de gas del gobierno?
- resultado de un tratamiento, etc.
Ejemplo. Variables cualitativas
Variable cualitativa.
27
Son variables cualitativas de acuerdo al dominio y surgen cuando observamos o medimos los
datos en categorías que no mantienen una relación de orden entre sí. (no lleva ningún orden). Por
ejemplo, la variable color puede asumir las siguientes formas de clasificación:
Rojo azul verde amarillo o
Azul rojo verde amarillo o
Verde amarillo rojo azul….. etc
Variable Categoría
Color de ojos
Estado civil
Raza
Ciudad
Sexo
Profesión
Propietario de un auto?
Lanzar una moneda
Especie de peces
Factor de riesgo
Enfermedad tuberculosis
Pardos verdes azulados negros
Soltero casado viudo divorciado
Mestiza negra india amarilla
Puno Juliaca Lima Arequipa
Femenino masculino
Arquitecto ingeniero medico
Si no
Sello cara
Trucha carachi pejerrey
Presencia ausencia
Presencia ausencia
1) Nominal.
28
de acuerdo al dominio de denomina Variable cuasicuantitativa. Porque, aunque sus modalidades
son de tipo nominal, es posible establecer un orden entre ellas.
(Cuando se va más allá del nivel de clasificación y se busca ordenar sus casos en términos del grado
que poseen, Lleva un orden)
Variable Categoría
Clase social
Nivel de estudios
Categoría docente universitario
Evaluación de hostales
Dolor
Alta baja media
1ro 2do 3ro 4to 5to
Principal asociado auxiliar
5 4 3 2 estrellas
Intenso moderado leve
2) Ordinal.
29
Son aquellas variables que se obtienen como resultado de mediciones o conteos (medidas numéricas).
Estas pueden ser de dos tipos:
Son respuestas numéricas que surgen de un proceso de conteo que comprenden todas aquellas
observaciones cuyos valores son enteros (no admiten siempre una modalidad intermedia entre
dos cualesquiera de sus modalidades).
Variable Indicador
- alumnos de la FINESI
- accidentes de tránsito en una semana
- admisiones en un hospital en una semana
- hijos de una familia
- suscripciones a revistas
- lanzar un dado, ver el número que sale
- cigarrillos fumados por día
- partos en un mes
Número (300)
Número (20)
Número (220)
Número (3)
Número (3)
Número (4)
Número (6)
Número (200)
Variable cuantitativa.
1) Variable discreta.
30
(intervalar) Son respuestas numéricas que surgen de un proceso de conteo que pueden tomar
infinitos valores entre dos números discretos (admiten una modalidad intermedia entre dos
cualesquiera de sus modalidades)
Variable Indicador
- notas de evaluaciones
- edad
- talla de personas
- peso
- temperatura
- longitud de peces
- Concentración de DDT
Número ( 12.3, 18.0, ..)
Número ( 1 año 2 meses, ….)
Número (1.75, 1.60, cm)
Número (60.5, 70,1 kg)
Número (3.4º, 18.2º grados c.)
Número (0.75, 0.60, cm)
Número (3.5%, 4.2% ...)
2) Variable continua
31
Nota: Los métodos estadísticos dependen del tipo de variables consideradas. Es entonces
interesante poder transformar una variable de un tipo a otro. Por ejemplo, la edad se puede
transformar en una variable nominal o ordinal considerando como conjunto Q un conjunto
de clases de edad. Según la precisión requerida de la variable edad y los métodos utilizados
se usará la edad como variable cuantitativa (discreta , continua) u ordinal.
Variable Escala de medición
Edad de la madre (en años cumplidos)
Talla de la madre en cm.
Estado civil
Escolaridad (primaria, secundaria, superior)
Temperatura en grados C.
Ocupación
Exposición al tabaco durante el embarazo (no
fumadora, fumadora pasiva, fumadora activa)
Hemoglobina mg/dL
Número de consultas prenatales
Discreta, cuantitativa
Continua, cuantitativa
Nominal, Cualitativa
Ordinal, Cualitativa
Continua, Cuantitativa Nominal,
Cualitativa
Ordinal. Cualitativa
Continua, Cuantitativa
Discreta, Cuantitativa
Algunas características de mujeres durante el embarazo
32
33
Categorización de variables cualitativas
Ejercicios
1) En las variables que se presentan a continuación, indique de qué tipo de variable se trata mediante
las siguientes abreviaturas: N para una variable cualitativa nominal, O para una variable cualitativa
ordinal, D para una variable cuantitativa discreta y C para una variable cuantitativa continua.
1. Concentración de triglicéridos en sangre (mg/dl) ( )
2. Diabetes (si, no) ( )
3. Colesterol total (mg/dl) ( )
4. Creatinina (mol/L) ( )
5. Numero de cigarrillos fumados el día anterior ( )
6. Índice de masa corporal (peso/talla2) ( )
7. Numero de consultorios en la clínica ( )
8. Presión arterial diastólica (mm Hg) ( )
34
9. Intensidad del dolor (escala de 0 a 10) ( )
10. Opinión del servicio (bueno, regular, malo) ( )
11. Edad en años cumplidos ( )
12. Uso de drogas antihipertensivas (si, no) ( )
13. Presencia de cefalea (si, no) ( )
14. Sexo (masculino, femenino) ( )
15. Porcentaje de grasa corporal ( )
16. Deposito de agua (aljibe, balde, alberca, tina, otro) ( )
2) Los datos que contiene la siguiente tabla, se refieren a las características de seis pacientes.
Primero identifique la variable IMC con la letra W, la variable Colesterol-HDL con la
letra X, la variable glucosa en sangre con la letra Y, y la variable Fumador con la letra Z.
Luego escriba cuáles son los valores individuales que representan las siguientes
referencias:
Identificación
Índice de masa
corporal (IMC) Colesterol HDL
Glucosa en
sangre Fumador
1 24 52 110 si
2 27 50 95 no
3 25 57 103 no
4 27 48 115 si
5 26 49 100 no
6 29 56 120 no
referencia valor referencia valor
W1 ( ) Y3 ( )
W2 ( ) Y4 ( )
W3 ( ) Y5 ( )
X2 ( ) Z4 ( )
X3 ( ) Z5 ( )
X4 ( ) Z6 ( )
35
3) Describa con sus propios términos la diferencia entre;
a) una población y una muestra
b) un parámetro y un estadístico.
c) Una variable cuantitativa y una variable cualitativa
d) Una variable continua y una variable discreta.
4) La revista Forbes reporto datos sobre las condiciones y estilos de vida en varias ciudades de
Estados Unidos. Algunos de esos datos se presentan seguidamente.
a. Identifique las variables cualitativas y cuantitativas
b. Identifique las variables discreta y continuas
c. Identifique las variables ordinales y nominales 36
Ciudad Población
en
millones
Mediana del
ingreso por
hogar
Mejor
negocio
hotelero
Atracción
mas visitada
Tasa de
criminalidad x
cada 100,000
Atlanta 3.5 43,249 Ritz-Carlton Stone Montain
Patk
846.2
Baltimore 2.5 43,291 Harbor Count Harborplace 1296.5
St.Louis 2.5 39,079 Hyatt Regency Gateway Arch 263.4
Philadelphia 5.0 43,576 Bellevue Liberty Bell 693.1
Raleigh-Durham 1.0 40,990 Radisson plaza State fair 634.9
Recolección y revisión de datos
Los datos se obtienen directamente de los elementos en estudio mediante la observación
(observación directa, medición física, medición química) o el interrogatorio (entrevistas personales,
cuestionarios autoadministrados, diarios). Cuando éste es el caso, se dice que los datos proceden de
fuente primaria. Los datos de fuente secundaria son los que se toman de registros previos,
generalmente elaborados con propósitos diferentes a los de nuestra investigación.
Su utilidad para el análisis dependerá de la calidad de la información y de su accesibilidad
administrativa.
Los datos que proceden de una fuente primaria tienen que ser registrados por el investigador.
Ocasionalmente, los datos de fuente secundaria están disponibles en archivos de cómputo y se
capturaron de tal manera que están listos para su tabulación, pero lo más frecuente es que el
investigador también tenga que buscarlos y registrarlos.
37
Forma de registro de datos
Antes de empezar a diseñar un instrumento, es necesario que el investigador enumere todas las
variables de interés. En cada una de ellas se deberán definir tres aspectos:
• Su naturaleza, debe ser específica (que distinga la variable de interés de posibles
confusores) y sensitiva (que incluya todas las maneras en que el sujeto se encuentra con
la variable de interés).
• La dosis, en sus diferentes expresiones: dosis acumulada, tasa de exposición, exposición
promedio, dosis pico.
• El tiempo, o periodo relevante en que se presentó la característica de interés
38
39
Estos tres aspectos de las variables deberán ser interpretadas por el investigador y traducidos en
preguntas, que en conjunto integrarán la forma de registro de datos. Para algunas variables estas
definiciones son muy sencillas y generalmente pueden ser exploradas con una pregunta (sexo,
edad en años cumplidos) o medir directamente en el sujeto en estudio (talla, peso, presión
arterial). Otras son engañosamente sencillas, como el alcoholismo, la escolaridad o la ocupación.
En algunos casos, el proceso puede ser muy complejo y la medición se tiene que realizar de
manera indirecta por medio de varias preguntas cuyas respuestas se resumen en un índice. A este
grupo pertenecen las mediciones de la calidad de vida, el estrés, la depresión y la inteligencia.
Al utilizar ahorramos tiempo y recursos; además, la comparación de nuestros resultados con
los de otros estudios puede ser más sencilla cuando en ambos trabajos se utilizó el mismo
instrumento. Sin embargo, es necesario tener cuidado porque un instrumento utilizado
previamente no necesariamente es el mejor para una nueva investigación, aunque ya estuviera
probado y validado.
1) Utilizar uno ya existente (estandarizado)
Diseño de un instrumento
40
Esta es una opción muy útil cuando ya existe un instrumento previo, pero tiene alguno de los
siguientes inconvenientes:
2) Adaptar uno ya existente.
• El instrumento es muy extenso para el estudio. Puede ser que el instrumento original se
haya diseñado para una entrevista, pero se desea utilizar en un cuestionario
autocontestado, o que el tiempo en que se contesta excede el tiempo que se dispone para
captar los datos.
• La población es diferente. Un instrumento desarrollado para un grupo de población
urbana puede no ser adecuado para una población rural, sobre todo si los niveles de
escolaridad o el uso del lenguaje son diferentes.
• El instrumento está escrito en otra lengua. En estos casos, el instrumento deberá ser
traducido.
• Es necesario extender, reordenar o realizar otros cambios en la manera en que los datos
se colectan. Esto es necesario cuando el investigador considera que al instrumento se le
deben agregar más preguntas, cuando el orden de éstas debe ser cambiado o cuando el
instrumento original fue diseñado para una entrevista y las preguntas se aplicarán por
medio de un equipo de cómputo.
41
Muchos investigadores lo hacen, pero no es un trabajo sencillo que pueda realizarse en poco
tiempo. Con frecuencia el desarrollo de un nuevo instrumento toma tiempo y requiere conceptos
teóricos, prácticos y experiencia en el tema.
3) Desarrollar un instrumento propio.
Sin importar que adoptemos un instrumento ya existente, que lo adaptemos o que desarrollemos uno
propio, en términos generales, el instrumento que utilicemos estará compuesto por preguntas y
respuestas.
De alguna manera, la forma en que queramos registrar la respuesta determinará el tipo de pregunta.
42
Las preguntas
La selección y el fraseo de las preguntas están determinados por el contexto de la investigación, por
lo que es muy importante tener claridad en los diferentes componentes de este contexto antes de
decidir qué forma de registro de datos utilizar. El contexto de la investigación que determina el
instrumento incluye los siguientes aspectos:
• Identificar el objetivo general y los específicos de la investigación.
• Definir con claridad las variables en estudio.
• Recordar que las preguntas se realizan en un contexto social, cultural y económico.
• Conocer a los encuestados, es decir, quién responde.
• Identificar a los encuestadores, es decir, quién pregunta.
• Estandarizar las preguntas, es decir, cómo se pregunta.
• Estandarizar el formato de las respuestas, es decir, cómo se responde.
• Conciliar lo que se quiere preguntar con el tiempo que se dispone para hacerlo.
43
Recomendaciones para redactar y seleccionar preguntas:
• Realizar preguntas útiles, relacionadas con la investigación.
• Hacer preguntas concretas utilizando un lenguaje convencional.
• Utilizar oraciones completas. En español, la sintaxis de la oración tiene la siguiente estructura:
primero va el sujeto, luego un verbo conjugado y termina con un complemento (Cohen, 2010).
• Utilizar un lenguaje fácil de comprender para los entrevistados o para quien llene el
instrumento. Para ello, conviene no utilizar abreviaturas, expresiones coloquiales o en jerga o
expresiones técnicas.
• Utilizar periodos de tiempo pertinentes a la importancia de la pregunta.
• Preguntas y respuestas cortas cuando se quiera ahorrar tiempo, pero sin sacrificar su claridad.
44
• En caso de temas sensibles al entrevistado, se pueden utilizar preguntas cargadas. Por
ejemplo, si existe interés en preguntar sobre consumo de drogas ilegales, podríamos redactar
una pregunta en los siguientes términos: “Algunas personas, por experimentar, han probado
la mariguana. ¿Usted ha probado la mariguana en alguna oportunidad de su vida?”. Al
plantear la pregunta de esta manera, facilitamos que los entrevistados la contesten, pero es
necesario tener cuidado, porque la redacción puede ser tan compleja que llega a dificultar su
interpretación por el entrevistado.
• Evitar frases y palabras sesgadas. Éstas son las que orientan la respuesta. Por ejemplo, la
pregunta “¿Verdad que usted quiere a sus hijos?” anticipa la respuesta que queremos
escuchar.
• Evitar preguntas con dos respuestas.
• Evitar preguntas en negativo.
• Hacer que las preguntas sean revisadas por expertos y por respondientes potenciales.
• Las preguntas son precisas y sin ambigüedades cuando dos o más personas entrevistadas
potenciales están de acuerdo con las palabras usadas para contestarla.
• Recordar que se pueden adoptar o adaptar preguntas que ya han sido utilizadas
satisfactoriamente por otros investigadores.
45
se refiere a que el instrumento realmente mida lo que se se quiere medir. Por ejemplo, si
queremos medir la grasa corporal de una persona, tendríamos varias opciones: podríamos
pesarla (sabemos que a mayor grasa corporal mayor peso corporal, pero también la masa
muscular aumenta el peso, por lo que el peso total no sería la mejor opción), calcular el índice
de masa corporal (peso/talla2), medir pliegues cutáneos o medir la impedancia. El último
tendría mayor validez que los anteriores.
• La objetividad
• La confiabilidad
se refiere a la consistencia en los resultados. Es decir, que cada vez que se mida lo mismo se
obtenga el mismo resultado. Por ejemplo, si nos pesamos en una báscula y registramos 70 kg,
nos bajamos de la misma y luego nos pesamos nuevamente, esperamos que la segunda lectura
sea igual (o muy cercana) a 70 kg. Si éste es el caso, hablamos de una lectura confiable. En caso
contrario (que la segunda lectura sea, por ejemplo, de 80 kg), las lecturas no son confiables.
• La validez
Se refiere al grado potencial en que los resultados pueden ser influenciados o sesgados por el
investigador o quien registra el dato.
46
Las respuestas
Las respuestas se clasifican en cerradas o abiertas según sea la forma en que las registramos. En el
caso de las respuestas cerradas, el que llena la forma de registro de datos selecciona una o varias
opciones entre una lista limitada de respuestas posibles. En las respuestas abiertas, estas opciones
predefinidas no existen, por lo que quien responde deberá utilizar sus propias palabras.
Respuestas cerradas.
Entre las respuestas cerradas podemos encontrar varios modelos; las más frecuentes pueden
clasificarse en dicotómicas, múltiples nominales y múltiples ordinales.
• Las respuestas dicotómicas. presuponen sólo dos opciones posibles. Las más frecuentes en esta
categoría son SÍ o NO. Por ejemplo:
¿Ha tenido usted tres o más evacuaciones líquidas en las últimas 24 horas?
No ( )
Si ( )
47
• Las respuestas múltiples nominales presuponen más de dos opciones posibles, sin que exista
entre ellas una relación de orden, por lo que la secuencia en que se anotan generalmente no tiene
tanto impacto en la respuesta. Sin embargo, no es raro que algunas opciones tengan que situarse
después de otras, como es el caso de la opción “otro”. Por ejemplo:
Ayer que regresó del trabajo a su casa, ¿qué medio de transporte utilizó?
Automóvil o camioneta
Autobús o minibús
Motocicleta
Otro vehículo menor
Bicicleta
Otro vehículo
Ninguno de los anteriores
48
• Las respuestas múltiples ordinales presuponen varias opciones posibles que mantienen una
relación de orden entre ellas.
Por ejemplo:
¿Qué tan de acuerdo o en desacuerdo está usted con el siguiente enunciado?: Los accidentes son
causados por el destino.
Completamente de acuerdo
Casi de acuerdo
No sabe
Casi en desacuerdo
Completamente en desacuerdo
49
¿Dentro de que intervalo se encuentra su edad actual?¡
( ) 12 a 18
( ) 19 a 25
( ) 25 a 30
( ) mas de 30
c) Balancear las respuestas.
d) Usar escalas de 5 o 7 categorías.
e) Poner las categorías negativas al principio de la escala.
f) Mantener las escalas en la misma página y fáciles de completar.
g) Usar escalas sólo cuando los encuestados pueden ver o recordar con facilidad todas
a) Utilizar escalas que tengan sentido con los objetivos.
Al considerar el uso de esta opción, es necesario tomar en cuenta las siguientes consideraciones:
b) Considerar cinco tipos de respuestas:
Aprobación: Definitivamente cierto, cierto, no sé, falso, definitivamente falso.
Frecuencia: Siempre, frecuentemente, regularmente, algunas veces, casi nunca, nunca.
Intensidad: Nada, muy poco, regular, moderado, severo.
Influencia: Gran problema, problema regular, problema pequeño, casi sin problema, sin
problema.
Comparación: Mucho más que los otros, poco más que los otros, aproximadamente igual
que los otros, algo menos que los otros, mucho menos que los otros.
50
Para el caso de cualquiera de los tres modelos de respuestas anteriores (dicotómicas, múltiples
nominales, múltiples ordinales), siempre es necesario considerar la opción “otra”. Es preciso
tener cuidado, porque no es raro que la opción “otra” resulte la respuesta más frecuente. Por otra
parte, también es necesario tomar en cuenta las respuestas “no sé”, “sin datos”, “no aplica” o “no
quiso contestar” que llegan a ser importantes durante el análisis aunque no sean categorías de la
variable en estudio.
51
52
Respuestas abiertas.
Con frecuencia se afirma que las respuestas abiertas no son adecuadas para el análisis
estadístico, pero esto no es cierto para el caso de las variables cuantitativas que deben registrarse
mediante respuestas abiertas, ni para algunas respuestas que cuentan con sistemas de
codificación ya establecidos.
• En el caso de las variables cuantitativas, la mejor opción es la respuesta abierta. De esta
manera, el investigador, o quien responde, podrá registrar el número que corresponda a la
pregunta. Por ejemplo:
¿Cuál es su edad en años cumplidos? …………
Antes de que tuviéramos las facilidades de cómputo que nos brindan los ordenadores, las
tabulaciones tenían que hacerse manualmente y se acostumbraba agrupar las posibles respuestas
numéricas.
Así, para la edad las opciones de respuesta podrían haber sido las siguientes:
( ) menores de 1 año
( ) 1 a 4 años
( ) 5 a 9 años,
( ) 10 a 14 años.
Pero desde que tenemos acceso a computadoras y paquetes estadísticos, lo mejor es registrar el
dato como tal para después agruparlo durante el análisis, si es que así lo queremos presentar.
53
54
• Hay un grupo de variables que ya han sido codificadas con anticipación, para las que incluso
existen acuerdos internacionales, tal es el caso para la codificación de las enfermedades que está
normada por la Clasificación Internacional de Enfermedades, actualmente en su décima revisión.
En este tipo de respuestas también se incluyen la descripción de los eventos en que los sujetos
resultan lesionados por causa externa, las intervenciones quirúrgicas y las ocupaciones laborales.
Al registrar estas variables, no es raro que sea necesario contestar a dos o más preguntas, como
en el caso de la ocupación
Tomando en cuenta las respuestas anteriores, y con el auxilio del catálogo de ocupaciones que
esté utilizando, se podrán asignar códigos específicos a las diferentes ocupaciones laborales de los
sujetos que se estudien.
En su trabajo, usted es: (seleccione solo una alternativa)
Empleado, obrero, jornalero o peón
Trabaja por su cuenta
Patrón o empresario
¿A que se dedica el negocio, empresa o institución donde trabaja?
¿Cuál es el oficio, puesto o cargo que tienen en el trabajo?
55
• Desde una perspectiva cuantitativa, las respuestas abiertas deben evitarse cuando no existan
criterios claros de codificación, porque consumen mucho tiempo durante el llenado del
instrumento, su manejo posterior es muy complejo y generalmente no son adecuadas para el
tratamiento estadístico.
Mixta
¿Dónde bota la basura?
En el camión recolector ( )
En el basural ( )
En contenedor ( )
Otro: …………………..
56
Clases de escalas:
57
Escalas básica Escalas comparativas Escalas no comparativas Escalas
estandarizadas
• Nominal
• Ordinal
• De intervalo
• De razón
• De comparaciones pareadas
• De clasificación
• De suma constante
• De Guttman
• De clases o similitudes
• De protocoles verbales
• De clasificación continua
• Likert
• Diferencial semántico
• Stapel
• Thurstone
• Cetscale
• Lov
• Markov
• Serperf
• Servqual
• Vals
• otros
O escala de medición grafica, los encuestados califican a los objetos al otorgar una marca en la
posición apropiada en una línea que va de un extremo a otro de la variable criterio. Una vez que el
encuestado proporciona las calificaciones, el investigador divide la línea en tantas categorías como
desee y asigna las puntuaciones con base en las categorías en las que caen las calificaciones. Por lo
general son datos que se tratan con datos de intervalo.
Diseñadas para medir opinión de entrevistados, presentando un elevado número de alternativas
de respuesta a través de un continuo. También puede usarse clasificaciones numéricas.
Ejemplo:
Indique por favor, marcando sobre esta línea, cual es su opinión respecto a la amabilidad del
personal que trabaja en este restaurante:
58
De clasificación o medición continua.
Es una escala de medición por reactivos que requiere que los encuestados indiquen el grado de
acuerdo o desacuerdo con cada una de las series de afirmaciones sobre los objetos de estimulo.
En general, cada reactivo de la escala tiene 5 categorías de respuesta que van de «muy en
desacuerdo» a «muy de acuerdo».
Empleada habitualmente para medir actitudes.
Por ejemplo una escala de 5 categorías puede ser:
59
Escala Likert.
Las categorías también pueden ser; 3,5,7,9 u 11.
Indique su grado de acuerdo o desacuerdo con las afirmaciones brindadas por el ministro sobre el
uso de protectores faciales
Muy de acuerdo (-2) De acuerdo (-1) Indiferente (0) En desacuerdo (1) Muy en desacuerdo (2)
(1) (2) (3) (4) (5)
La Compañía de Seguros “Bolivar “ indica que ofrece respaldo inmediato al asegurado en el momento del
siniestro
Completamente de acuerdo ____
De acuerdo ____
Ni de acuerdo, ni en desacuerdo ____
En desacuerdo ____
Completamente en desacuerdo ____
60
Los motores de
dos tiempos son
Muy de acuerdo
(5)
De acuerdo (4) Indiferente (3) Desacuerdo
(2)
Muy en desacuerdo
(1)
Sencillos de
mantener
Potentes
Económicos
Por favor, indique su grado de acuerdo o desacuerdo respecto a las siguientes afirmaciones en
relación al gran almacén X:
Totalment
e de
acuerdo
Bastante
de
acuerdo
Ni de acuerdo ni
en desacuerdo
Bastante en
desacuerdo
Totalmente en
desacuerdo
se pueden encontrar las
últimas novedades
2 1 0 -2 -3
no es únicamente un sitio
para ir de compras
2 1 0 -2 -3
cambiar un producto en
X es una odisea
2 1 0 -2 -3
en X siempre tienen en
cuenta las necesidades
del cliente
2 1 0 -2 -3
en X si no quedas
satisfecho te devuelven el
dinero
2 1 0 -2 -3
61
❑ Es una escala de medición por reactivos de 7 categorías de respuesta con etiquetas bipolares
(ejemplo: «frio» y «caliente») que tienen significado semántico.
❑ El criterio no viene definido por una proposición, para la que se indican los grados de acuerdo o
desacuerdo, sino por categorías opuestas de una dimensión.
❑ Se analizan tanto las puntuaciones totales como los perfiles obtenidos
❑ Puede usarse para analizar y comparar diversos estímulos de forma simultánea.
❑ Usado preferentemente para recoger información sobre actitudes, «perfiles de imagen» de
productos, marcas y compañías
Colocar con una X en el espacio que mejor represente su opinión.
Escala diferencial semántico.
62
¿La publicidad comparativa para usted es?
1 2 3 4 5 6 7
de ningun interes de gran interes
nada creible muy creible
no impresiona impresiona mucho
nada atractivo muy atractivo
nada informativo muy informativo
nada claro muy claro
no llama la atencion llama la atencion
no gusta gusta mucho
nada convincente muy convincente
nada simpatico muy simpatico
63
Es una técnica cuantitativa que obtiene medidas objetivas del significado
psicológico que para el sujeto tienen una serie de acontecimientos, objetos o personas por
medio de una serie de escalas descriptivas de adjetivos bipolares; pudiéndose de esta
manera establecer el grado de semejanza o disparidad entre conceptos.
Bueno x Malo
Durable x Indurable
Fuerte x Debil
Moderno x Anticuado
Original x Comun
64
Ejemplo: señale con una X, el lugar en el que usted ubicaría su opinión acerca de las pandillas
juveniles.
65
Bueno-Malo Costoso-barato rápido-lento
Rápido-Lento Activo-pasivo gigante-enano
Fuerte-Débil seguro-peligroso perfecto-imperfecto
Grande-pequeño Dulce-amargo agradable-desagradable
Bonito-Feo profundo-superficial bendito-maldito
Alto-bajo Poderoso-impotente arriba-abajo
Claro-oscuro vivo-muerto útil-inútil
Caliente-frío Joven-viejo favorable-desfavorable
Escalas bipolares:
66
Después de que los datos han sido captados en los formatos diseñados para este fin, será
necesario revisarlos con cuidado con la intención de identificar si están completos y se han
llenado de manera correcta. Esta revisión deberá realizarse, de preferencia, el mismo día en
que los datos fueron recogidos. De otra manera, podría ser muy difícil, o imposible, hacer
las correcciones pertinentes.
Cuando los datos son registrados en un archivo de cómputo, es necesario que la revisión y
corrección de datos incluya los que están guardados en estos medios de almacenamiento.
Revisión y corrección de datos recogidos
67
Aquí las categorías son mutuamente exclusivas y exhaustivas, es decir, cada individuo ha sido
puesto en una categoría y en una sola.
La proporción esta definida con el número en la categoría (X) entre el número total de
casos.(N o n) (muestra o población)
Ejemplo. si en una población de 25,000 habitantes se diagnostican 1,500 pacientes con
diabetes, la proporción de diabéticos en esa población es:
Proporciones:
Análisis descriptivo de datos cualitativos
a es el numero de elementos con la característica de interés y b es el número de elementos sin
la característica de interés
𝑝𝑟𝑜𝑝𝑜𝑟𝑐𝑖𝑜𝑛 =
𝑎
(𝑎 + 𝑏)
Capitulo 2
P=
𝑎
𝑁
El valor de una proporción puede variar así de 0 a 1.
P=
1500
25000
= 0.06 La proporción de diabéticos e 0.06
68
Tabla 01. Distribución proporcional de
pacientes atendidos en el consultorios
del hospital “X”, Puno 2015
Figura 01. Distribución proporcional de pacientes
atendidos en el consultorios del hospital “X”, Puno 2015.
Consultorio Nro %
Medicina 370 0.43
Pediatría 342 0.40
Otros 152 0.18
Total 864 1.00
0.43
0.40
0.18
0.00
0.05
0.10
0.15
0.20
0.25
0.30
0.35
0.40
0.45
Medicina Pediatria Otros
Proporcion
Consultorio
Ejemplo:
Existe mayor proporción (0.43) de pacientes atendidos en el consultorio de medicina, seguido de
la proporción importante de pacientes atendidos en el consultorio de pediatría (0.40). Una
menor proporción de apacientes se atiende en otras especialidades.
69
Ejemplo: De un total de 78,178 nacimientos registrados en Costa Rica durante el año
2000, 39,627 correspondieron a madres solteras.
La proporción de nacimientos de madres solteras es:
La proporción de nacimientos de niños de madres solteras en Costa Rica durante el año 2000 es
0.507.
Tabla 2. distribución proporcional de rasgos de
personalidad de pacientes con intento suicida
atendidos en el hospital regional Manuel Nuñez
Butron de Puno-2016.
Rasgo Frecuencia P
Melancólico normal
Melancólico anormal
Colérico anormal
Colérico normal
Flemático
34
29
8
5
4
0.43
0.36
0.10
0.06
0.05
Total 80 1.00
0.43
0.36
0.1
0.06 0.05
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
0.5
Melancólico
normal
Melancólico
anormal
Colérico
anormal
Colérico
normal
Flemático
Proporcion
Rasgos de personalidad
70
Figura 2. Rasgos de personalidad de pacientes con
intento suicida atendidos en el hospital regional
Manuel Nuñez Butron de Puno 2016.
Porcentajes
100
%
n
X
=
ESTADO DE DESNUTRICION Nro %
Desgastado o malnutrición aguda
Achicados o malnutrición crónica
Malnutrición crónica aguda
05
43
06
9.26
79.63
11.11
Total 54 100.0
Tabla 03. Evaluación nutricional de preescolares de 2 a 6 años con desnutrición beneficiarios
del PANFAR IPSS - Puno 2016.
Son las proporciones multiplicadas por 100
9.26
79.63
11.11
0.00
10.00
20.00
30.00
40.00
50.00
60.00
70.00
80.00
90.00
malnutrición aguda malnutrición crónica Malnutrición crónica
aguda
Porcentaje
Evaluación nutricional
9.26
79.63
11.11
malnutrición aguda malnutrición crónica Malnutrición crónica aguda
71
Figura 03. Evaluación nutricional de preescolares de 2 a 6
años con desnutrición beneficiarios del PANFAR IPSS - Puno
2016.
Rasgo Frecuencia %
Melancólico normal
Melancólico anormal
Colérico anormal
Colérico normal
Flemático
34
29
8
5
4
43
36
10
6
5
Total 80 100
Tabla 04. Rasgos de personalidad en pacientes con intento suicida
atendidos en el hospital regional Manuel Núñez Butron de Puno 2016
43
36
10
6 5
0
5
10
15
20
25
30
35
40
45
50
Melancólico
normal
Melancólico
anormal
Colérico anormal Colérico normal Flemático
Porcentaje
Rasgos de personalidad
43
36
10
6
5
Melancólico normal Melancólico anormal Colérico anormal
Colérico normal Flemático 72
Figura 04. Rasgos de personalidad en pacientes
con intento suicida atendidos en el hospital regional
Manuel Núñez Butron de Puno 2016
Tabla 5. Estado de desnutrición y casos de helmintiasis intestinal en niños
preescolares beneficiarios del PANFAR IPSS Puno 2015
CASOS POSITIVOS NEGATIVOS TOTAL
Grado de Desnutrición Nro % Nro % Nro %
Desgastados o malnut aguda
Achicados o malnut. crónica
Malnutrición crónica aguda
05
35
06
9.26
64.82
11.11
4
4
-
7.42
7.42
--
9
39
6
16.67
72.22
11.11
T o t a l 46 85.19 8 14.81 54 100
9.26
64.82
11.11
7.42 7.42
0
0
10
20
30
40
50
60
70
Desgastados o
malnut. aguda
Achicados o malnut.
crónica
Malnutrición crónica
aguda
%
Estado Nutricional
POSITIVOS
NEGATIVOS
73
DESARROLLO
EDAD DEL NIÑO TOTAL
2 años 3 años
Nro % Nro % Nro %
RIESGO
RETRASO
11
3
30.6
8.3
19
3
52.8
8.3
30
6
83.3
16.7
TOTAL 14 38.9 22 61.1 36 100
Tabla 6. Riesgo en el desarrollo psicomotor de niños de 2 a 3 años según la edad
del niño en wawawasis de puno 2013
74
AGENCIA
Casos
AGENCIA A AGENCIA B AGENCIA C
Nro % Nro % Nro %
Matrimonios
Divorciados
Novios
Madres solteras
Otros
63
19
27
13
11
47.3
14.3
20.3
9.8
8.3
88
37
20
32
16
45.5
19.2
10.4
16.6
8.3
41
26
15
21
9
36.6
23.2
13.4
18.8
8.0
T o t a l 133 100.0 193 100.0 112 100.0
Ejemplo. Uso de porcentajes para efectos de comparación:
75
Tabla 8. distribución de casos tratados por tres agencias hipotéticas de
servicios domésticos (datos hipotéticos)
Ejemplo SPSS. Considérese la siguiente serie, en la cual se presentan algunas características de
20 niños, de 1 a 4 años de edad, que fallecieron ahogados en su hogar en la Zona Metropolitana
de Guadalajara.
76
1) Ingrese datos
2) Obtener porcentajes o proporciones
Tablas de frecuencias en SPSS
Seleccionar variables
Ventana de gráficos
Finalmente,
seleccione
Continuar y luego
Aceptar
77
Resultados :
El 25% de los niños de 1 a 4 años de edad ahogados en su hogar son de sexo Femenino
y el 75% de sexo Masculino
El 45% de los niños de 1 a 4 años de edad se ahogaron en albije, el 20% en otro.
78
La serie de datos puede resumirse como se muestra en la tabla siguiente:.
Tabla 2. Características de 20 niños, de 1 a 4 años de edad ahogados en su hogar.
Guadalajara 2015-2020.
79
Uso de las proporciones en epidemiología
Las proporciones son muy utilizadas en la práctica de la epidemiología, de tal manera que
algunos de sus usos específicos tienen nombres propios, como la prevalencia, la incidencia
acumulada, la sensibilidad y la especificidad.
Frecuencia de la enfermedad en bioestadística
Ejemplos de enfermedad: demencia, tuberculosis, alcoholismo, infección de vías urinarias,
diabetes mellitus, etc. En la figura 6 se presenta de manera gráfica, aunque por lo general se
piensa en la enfermedad como un estado, también es posible concebirla como un evento. El inicio
de un estado de enfermedad es un evento que ocurre en un punto específico del tiempo. Tal es el
caso del cambio de sujeto sano a enfermo de diabetes mellitus, hipertensión arterial, cáncer de
cérvix, etc.
Tradicionalmente, la enfermedad es considerada un estado adverso de salud que caracteriza a un
individuo durante un periodo.
80
Figura 6. Secuencia salud-enfermedad-salud en un sujeto
81
Prevalencia
La prevalencia cuantifica la proporción de individuos en la población que tienen algún estado de
enfermedad en un instante específico del tiempo, y proporciona una estimación de la probabilidad
de que un individuo se encuentre enfermo en algún punto del tiempo. La fórmula para calcular la
prevalencia es la siguiente:
𝑝 =
𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑐𝑜𝑛 𝑙𝑎 𝑒𝑛𝑓𝑒𝑟𝑚𝑒𝑑𝑎𝑑 𝑒𝑛 𝑢𝑛 𝑝𝑢𝑛𝑡𝑜 𝑒𝑠𝑝𝑒𝑐í𝑓𝑖𝑐𝑜 𝑑𝑒𝑙 𝑡𝑖𝑒𝑚𝑝𝑜
𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 𝑒𝑛 𝑒𝑙 𝑚𝑖𝑠𝑚𝑜 𝑔𝑟𝑢𝑝𝑜 𝑦 𝑝𝑢𝑛𝑡𝑜 𝑒𝑠𝑝𝑒𝑐í𝑓𝑖𝑐𝑜 𝑑𝑒 𝑡𝑖𝑒𝑚𝑝𝑜
“punto” puede referirse a un día específico en el calendario, a la edad del sujeto estudiado o a un
momento en el curso del tiempo a partir de un evento. Para facilitar la lectura del cociente anterior,
se acostumbra multiplicar el resultado por una constante que puede ser 100, 1,000, 10,000 u otra
cantidad, con la finalidad de no utilizar fracciones pequeñas al expresar prevalencias.
82
Ejemplo. Con frecuencia, los servicios de medicina familiar están interesados en conocer la
prevalencia de pacientes enfermos de diabetes en la comunidad donde brindan el servicio médico.
Para obtener esa información, el epidemiólogo ordena a su equipo que visite y registre toda la
población que cubre su unidad. Como resultado de su investigación, encuentra que en una población
de 4,550 habitantes se identificaron 228 sujetos diabéticos.
6/100 habitantes tienen diabetes.
La prevalencia de diabetes en esa población es:
83
Prevalencia=
228
4550
= 0.0632 ∗ 100 = 6.3%
Incidencia acumulada
En contraste con la prevalencia, la incidencia cuantifica el número de eventos de enfermedad que
se desarrollan en la población de individuos en riesgo durante un intervalo específico de tiempo. La
incidencia acumulada (IA) es la proporción de personas que adquieren la enfermedad durante un
periodo específico, y se calcula como:
𝐼𝐴 =
𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑛𝑢𝑒𝑣𝑜𝑠 𝑑𝑒 𝑒𝑛𝑓𝑒𝑟𝑚𝑒𝑑𝑎𝑑 𝑑𝑢𝑟𝑎𝑛𝑡𝑒 𝑝𝑒𝑟𝑖𝑜𝑑𝑜 𝑑𝑒 𝑡𝑖𝑒𝑚𝑝𝑜
𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 𝑒𝑛 𝑟𝑖𝑒𝑠𝑔𝑜 𝑎𝑙 𝑖𝑛𝑖𝑐𝑖𝑜 𝑑𝑒𝑙 𝑝𝑒𝑟𝑖𝑜𝑑𝑜 𝑑𝑒 𝑒𝑠𝑡𝑢𝑑𝑖𝑜
Esta medida de frecuencia proporciona un estimado de la probabilidad de que un individuo
tomado al azar en una población en riesgo (susceptible) desarrolle la enfermedad durante un
periodo específico. A esta probabilidad también se le conoce como riesgo. El periodo de
observación es arbitrario y depende de las características evolutivas de la enfermedad. Al igual que
con la prevalencia, la IA puede multiplicarse por una constante para facilitar su lectura e
interpretación.
84
Es necesario señalar que una persona se encuentra “en riesgo” de una enfermedad cuando es
biológicamente posible que desarrolle la enfermedad en un futuro inmediato. “En riesgo” significa
que el sujeto es susceptible a la enfermedad. En otras palabras, la probabilidad de que desarrolle una
enfermedad no es igual a cero. En términos epidemiológicos, “en riesgo” no significa “en mayor
riesgo” en relación con otra persona.
❑ La persona tiene la enfermedad. Alguien que sufra de diabetes mellitus no se encuentra en
riesgo de desarrollarla nuevamente.
❑ La persona ha adquirido inmunidad. Un niño que ya enfermó de sarampión no lo padecerá de
nuevo.
❑ La persona no tiene la capacidad biológica de desarrollar la enfermedad. Los varones nunca
sufrirán cáncer uterino.
❑ Durante algún tiempo de vida la persona fue susceptible de desarrollar la enfermedad, pero ésta
fue abolida por algún procedimiento particular. La mujer a la que se le ha practicado
histerectomía no puede desarrollar cáncer uterino.
Las Razones frecuentes de que alguien no se encuentre en riesgo son:
85
Ejemplo. Si se toma una cohorte de 12 sujetos y se le observa durante cinco años (sin que sus
elementos se pierdan para el estudio y sin que dejen de estar en riesgo durante el periodo del estudio),
y de ellos 5 desarrollan la enfermedad, entonces la IA será:
si se toma un individuo de los observados al inicio del estudio, la probabilidad de que en el
transcurso de cinco años desarrolle la enfermedad es de 0.42, o 42%.
86
𝐼𝑛𝑐𝑖𝑑𝑒𝑛𝑐𝑖𝑎 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎 =
5
12
= 0.42 ∗ 100 = 42%
Figura 7. Eventos y estados de enfermedad en un
grupo de sujetos.
La prevalencia y la incidencia son dos aspectos de un
mismo fenómeno. Para entenderlas, hay que poner
atención a la figura 7, en la cual se representa a 13
sujetos en observación durante cinco años. Al inicio del
estudio, todos los sujetos se encuentran sanos y todos
ellos tienen el riesgo (son susceptibles) de contraer la
enfermedad. Se debe convenir que, en esa figura, la
cruz representa el inicio de la enfermedad o “evento”;
la línea gruesa, el tiempo durante el cual el sujeto está
enfermo o “estado”; y el cuadro, el momento en que el
sujeto sale del estudio porque muere. Si se hace un
corte después de un año de observación, se encuentra
que en ese “punto específico de tiempo” existen dos
enfermos entre los 13 sujetos observados. Así, la
prevalencia es igual a 2/13 = 0.15, mientras que la
incidencia acumulada desde el inicio del estudio es
2/13 = 0.15 en un año. En este caso, la prevalencia y la
incidencia son semejantes, pero no siempre tiene que
ser así, ya que para el cuarto año han fallecido cuatro
sujetos y sólo quedan nueve, de los cuales tres están
enfermos. Por tanto, la prevalencia es de 3/9 = 0.33,
mientras que la incidencia acumulada es de 7/13 =
0.54 en cuatro años
87
Sensibilidad y especificidad
• Sensibilidad. Probabilidad de clasificar correctamente a aquellos que tienen la característica de
interés.
• Especificidad. Probabilidad de clasificar correctamente a aquellos que no tienen la
característica de interés.
Es la probabilidad de clasificar correctamente a un individuo enfermo, es decir, la probabilidad
de que para un sujeto enfermo se obtenga en la prueba un resultado positivo. La sensibilidad
es, por lo tanto, la capacidad del test para detectar la enfermedad
88
Es la probabilidad de clasificar correctamente a un individuo sano, es decir, la probabilidad de
que para un sujeto sano se obtenga un resultado negativo. En otras palabras, se puede definir la
especificidad como la capacidad para detectar a los sanos.
Cuando analizamos en una población la presencia de una enfermedad, nos ayudamos de una prueba
diagnóstica para determinar si los pacientes examinados presentan la enfermedad (POSITIVOS) o no
la poseen (NEGATIVOS). Sin embargo es muy poco probable que la prueba funcione de manera
perfecta en todas las circunstancias, por ello existe la posibilidad de que algunos pacientes que no
poseen la enfermedad sean clasificados como positivos, ellos serán considerados como FALSOS
POSITIVOS, otra posibilidad es que algunos pacientes que tengan la enfermedad sean detectados
como no afectados, estos pacientes se denominan FALSOS NEGATIVOS.
PATRON DE REFERENCIA
(Gold Standar)
Resultado de la
Prueba
Con enfermedad Sin Enfermedad
Positivo
Verdaderos Positivos
a
Falsos Positivos
b
Negativo
Falsos Negativos
c
Verdaderos Negativos
d
89
En esta tabla se pueden determinar:
1.Sensibilidad:
Verdaderos Positivos (a)
Verdaderos Positivos(a)+Falsos Negativos(c)
Es decir: el porcentaje de personas que efectivamente pueden ser clasificadas como enfermas, o
la probabilidad de detectar a un paciente con la enfermedad.
2.Especificidad:
Verdaderos Negativos(d)
Verdaderos Negativos(d)+Falsos Positivos(b)
En otras palabras, el porcentaje de personas sin la enfermedad y que están correctamente
clasificadas, o la probabilidad de detectar a una persona que no posee la enfermedad
90
91
1. Mediante un procedimiento de clasificación “perfecto” (generalmente conocido como “gold
standard” o “estándar de oro”), los sujetos son clasificados según presenten o no la
característica (en términos clínicos, generalmente se clasifican como enfermos y no enfermos)
2. Luego, estos mismos sujetos son clasificados mediante un instrumento menos perfecto
(aunque más sencillo, económico o menos invasivo) en dos grupos según presenten o no la
característica (en términos clínicos, generalmente se clasifican como “positivos” o “negativos”
a la prueba). Uno esperaría que todos aquellos que tienen la característica (según se midió con
el “estándar de oro”) resulten “positivos”, y que aquellos que no tienen la característica (según
se midió con el “estándar de oro”) resulten “negativos”.
Para su cálculo, procedemos de la siguiente manera:
3. Dado que el segundo criterio de clasificación es imperfecto, algunos sujetos que realmente
presentan la característica (según el “estándar de oro”) serán clasificados incorrectamente
como que no la tienen (o “negativos”), mientras que algunos que realmente no presentan la
característica (según el “estándar de oro”) serán clasificados incorrectamente como que sí la
tienen (o “positivos”).
92
4. Para el cálculo de la sensibilidad y la especificidad, generalmente, acomodamos los datos
como:
Clasificación con estándar de
oro
Prueba
alternativa
Presente Ausente
Positivo a b
Ausente c d
a+c b+d
5. Concluimos nuestro cálculo con las dos fórmulas que se muestran a continuación.
Sensibilidad =
𝑎
𝑎+𝑐
Especificidad =
𝑑
𝑏+𝑑
Cuando la sensibilidad es perfecta, el 100% de los que fueron clasificados con la característica
mediante el “estándar de oro” también son clasificados mediante el segundo criterio. Cuando
eso no ocurre, la sensibilidad es menor a 100%. Lo mismo ocurre con la especificidad para los
que fueron clasificados por el “estándar de oro” sin la característica.
93
Ejemplo. Supongamos que tenemos interés en evaluar la validez de una prueba diagnóstica que es
más rápida y económica que el “estándar de oro”. Para hacerlo, seleccionamos dos grupos: uno de
enfermos y otro de no enfermos, ambos clasificados mediante el uso del “estándar de oro”. Las
frecuencias de cada categoría se muestran en el cuadro.
Clasificación con estándar de oro
Prueba alternativa Enfermo Sano
Positivo 85 10
Negativo 15 190
100 200
94
𝑆𝑒𝑛𝑠𝑖𝑏𝑖𝑙𝑖𝑑𝑎𝑑 =
85
100
= 0.85 ∗ 100 = 85%
Especificidad=
190
200
= 0.95 ∗ 100 = 95%
Es la probabilidad de clasificar correctamente a un individuo enfermo
Es la probabilidad de clasificar correctamente a un individuo sano
Ejemplo. Consideremos los datos de un estudio en el
que se incluyó a 2,641 pacientes con sospecha de
cáncer prostático que acudieron a una consulta de
Urología durante un periodo de tiempo determinado.
Durante su exploración, se recogió el resultado del
tacto rectal realizado a cada uno de estos pacientes,
según fuese éste normal o anormal, y se contrastó
con el posterior diagnóstico obtenido de la biopsia
prostática. Los datos del estudio y los resultados
obtenidos se muestran en la Tabla. Se encontraron
en total 1,121 casos de cáncer, lo cual representa un
42.45% del total de sujetos estudiados.
La sensibilidad del tacto rectal para detectar cáncer
fue de 56,56% (634/1121) y la especificidad de 82,3%
(1251/1520). Así, el tacto fue anormal en un 56,56%
de los casos de cáncer prostático y normal en un
82,3% de los casos que presentaron finalmente otras
patologías. Esto significa que un 100-56.56=43.44%
de los pacientes que efectivamente tenían cáncer
presentaban tactos normales. Claramente ello indica
la necesidad de utilizar otros marcadores más
sensibles, como el PSA o sus derivados, para poder
establecer el diagnóstico de forma más precisa.
Tabla 2. Resultados de la exploración y biopsia prostática de
una muestra de pacientes con sospecha de cáncer de próstata
Resultado del
tacto rectal
Resultado de la biopsia prostática
Cáncer
Patología
benigna Total
Anormal 634 269 903
Normal 487 1251 1738
Total 1121 1520 2641
𝑠𝑒𝑛𝑠𝑖𝑏𝑖𝑙𝑖𝑑𝑎𝑑 =
634
634 + 486
=
634
1121
= 0.5656 = 56.56%
𝑒𝑠𝑝𝑒𝑐𝑖𝑓𝑖𝑐𝑖𝑑𝑎𝑑 =
1251
269 + 1251
=
1251
1520
= 0.8230 = 82.30%
𝑣𝑎𝑙𝑜𝑟 𝑝𝑟𝑒𝑑𝑖𝑐𝑡𝑖𝑣𝑜 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑜 =
634
634 + 269
=
634
903
= 0.7021 = 70.21%
𝑣𝑎𝑙𝑜𝑟 𝑝𝑟𝑒𝑑𝑖𝑐𝑡𝑖𝑣𝑜 𝑛𝑒𝑔𝑎𝑡𝑖𝑣𝑜 =
1251
487 + 1251
=
1251
1738
= 0.7198 = 71.98%
𝑅𝑎𝑧𝑜𝑛 𝑑𝑒 𝑣𝑒𝑟𝑜𝑠𝑖𝑚𝑖𝑙𝑖𝑡𝑢𝑑 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑎 =
𝑠𝑒𝑛𝑠𝑖𝑏𝑖𝑙𝑖𝑑𝑎𝑑
1 − 𝑒𝑠𝑝𝑒𝑐𝑖𝑓𝑖𝑐𝑖𝑑𝑎𝑑
=
0.5656
1 − 0.8230
= 3.19
𝑅𝑎𝑧𝑜𝑛 𝑑𝑒 𝑣𝑒𝑟𝑜𝑠𝑖𝑚𝑖𝑙𝑖𝑡𝑢𝑑 𝑛𝑒𝑔𝑎𝑡𝑖𝑣𝑎 =
1 − 𝑠𝑒𝑛𝑠𝑖𝑏𝑖𝑙𝑖𝑑𝑎𝑑
𝑒𝑠𝑝𝑒𝑐𝑖𝑓𝑖𝑐𝑖𝑑𝑎𝑑
=
1 − 0.5656
0.8230
= 0.53
95
Ejercicios.
1) Dentro del Programa de Salud Escolar, se realiza un examen de salud a los escolares de 5º de
Educación Primaria para detectar alumnos con anemia mediante la determinación de
hemoglobina en sangre. Una hemoglobina de 12 gramos (o menos) en 100 ml de sangre, fue
considerada como prueba positiva para la detección de anemia. Los resultados de dicho
examen de salud aplicados a 500 escolares se muestran en la siguiente tabla:
Alumnos con
anemia
Alumnos sanos total
Prueba +
Hb ≤ 12 g/100 ml.
95 25 120
Prueba -
Hb > 12 g/100 ml.
10 370 380
Total 105 395 500
a) Calcule la sensibilidad y la especificidad. Explique los resultados obtenidos.
b) Si el punto de corte del test se modifica a una Hb de 10 g/100 ml de sangre, la prueba sale
positiva en 100 casos, de los cuales 85 son verdaderos anémicos. Con este nuevo punto de corte
vuelva a calcular la sensibilidad y la especificidad.
Valore las diferencias con el anterior supuesto.
96
2) En un ensayo clínico, se quiere determinar la sensibilidad de un método diagnóstico.
Los resultados obtenidos son:
Enfermos Sanos Total
Positivo 72 33 105
Negativo 12 83 95
total 84 116 200
Estimar la sensibilidad y especificidad con una confianza del 95%.
97
Tabla de contingencia DIAGNOST * GRUPO
Razones
La razón de un número a con respecto a otro número b se define como a/b
R = a ÷ b =
𝑎
𝑏
Cuando la serie que se está examinando consta sólo de dos categorías, se pueden utilizar las
razones para resumir la información. Para ello, se divide la totalidad de individuos que tengan
una característica (de preferencia el grupo de mayor tamaño) entre el grupo que tenga la otra
característica.
En la que R representa la razón, a simboliza el número de elementos con la característica de
interés y b, el número de elementos con una característica diferente. Hay que notar que a + b no
necesariamente son el total del universo.
98
Razón de varones a mujeres es: 3/2 o 3:2
Frente al total: de cada 5 personas se da un promedio de 3 varones y dos mujeres, o la
proporción de varones es 0.6 (3/5) frente a las mujeres.
Usando la unidad: 3/2 = 1.5, Por cada mujer 1.5 varones.
Ejemplo: Consideremos: se tiene 3 varones y 2 mujeres.
Varones 3
Mujeres 2
Total 5
99
Ejemplo, Se han registrado los siguientes indicadores en Costa Rica:
Año 1990: 70,048 nacimientos
Año 2000: 78,178 nacimientos y 14,630 defunciones
• Calcular la razón de nacimientos en el año 2000 con respecto al año 1990
• Calcular la razón de nacimientos en el año 2000 con respecto al número de defunciones del año
2000.
La razón de nacimientos en el año 2000 con respecto a los nacimientos en el año 1990 es:
Por cada nacimiento ocurrido en 1990, en el año 2000 ocurrieron aproximadamente 1.12
nacimientos. Al multiplicar el valor de la razón por 100, en Costa Rica, por cada 100
nacimientos en 1980, para el año 2000 se presentaron 112 nacimientos.
La razón del número de nacimientos al número de defunciones para el año 2000 :
Quiere decir que, en Costa Rica, por cada 100 defunciones se produjeron 534 nacimientos
durante el año 2000.
100
Ejemplo: Según el sexo del niño, por cada niña que se asfixia por inmersión en el hogar, hay tres
niños que sufren ese accidente mortal. En este ejemplo, a = 15, b = 5 y a/b = 3 es la razón.
Ejemplo: Según el depósito en que se ahogó, por cada menor que se asfixia por
inmersión en un balde o tina, hay tres que pierden la vida en un aljibe. En este ejemplo, a
= 9, b = 3 y a/b = 3 es la razón.
Sexo de niños de 1 a 4 años de edad ahogados en su hogar. Zona
metropolitana de Guadalajara 1991-1993
sexo Frecuencia Razón
Masculino
Femenino
15 (a)
5 (b)
15/5=3
Deposito de agua en los que se ahogaron niños de 1 a 4 años de edad.
Zona metropolitana de Guadalajara 1991-1993
Depósito Frecuencia Razón
Aljibe
Balde/tina
9 (a)
3 (b)
9/3=3
101
Densidad de incidencia
Para el cálculo de una razón no siempre se utiliza información de dos grupos diferentes. También
podemos utilizar en el numerador y el denominador información procedente de un mismo grupo,
pero de diferente naturaleza. Tal es el caso de la densidad de incidencia (DI), en la que el
numerador es semejante a la incidencia acumulada y el denominador es la suma del tiempo que
cada individuo ha permanecido en observación (“tiempo persona”) y en riesgo de enfermar. Su
fórmula es:
𝐷𝐼 =
𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑛𝑢𝑒𝑣𝑜𝑠 𝑑𝑒 𝑒𝑛𝑓𝑒𝑟𝑚𝑒𝑑𝑎𝑑 𝑑𝑢𝑟𝑎𝑛𝑡𝑒 𝑢𝑛 𝑝𝑒𝑟𝑖𝑜𝑑𝑜 𝑑𝑒 𝑡𝑖𝑒𝑚𝑝𝑜
𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑡𝑖𝑒𝑚𝑝𝑜 − 𝑝𝑒𝑟𝑠𝑜𝑛𝑎 𝑑𝑒 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖ó𝑛
Al presentar la densidad de incidencia es esencial que se especifique la unidad de tiempo; esto es,
si la tasa representa el número de casos por día-persona, mes-persona, año-persona, o alguna otra
medida de tiempo-persona. La densidad de incidencia nos habla del cambio potencial instantáneo
del estado de enfermedad de una población en una unidad de tiempo.
102
A diferencia de la incidencia acumulada, que es una proporción y puede interpretarse como una
probabilidad, la densidad de incidencia dirige su atención al número de eventos que se presentan en
una unidad de tiempo (y de manera inversa al tiempo que transcurre entre evento y evento). Esto se
grafica en la figura, donde el tiempo-persona en riesgo se refiere al tiempo que tuvieron que acumular
los sujetos en estudio para registrar los eventos de interés.
103
Ejemplo. En una unidad de terapia intensiva, están
interesados en conocer la incidencia de muertes en
pacientes que ingresan con infarto de miocardio.
Después de 10 días se han registrado los datos del
cuadro. Con los datos anteriores no es posible
calcular una incidencia acumulada, ya que los
periodos de observación no son los mismos en todos
los sujetos, pero se puede calcular una densidad de
incidencia. Para ello, se toma el total de eventos de
interés observados (tres defunciones) y se divide
entre el tiempo-persona observado durante el cual
se presentaron esos eventos (21 días-persona). Así,
la densidad de incidencia es:
3 ÷ 21 = 0.143 días-persona o 0.143 defunciones por
cada día de estancia acumulada por el grupo
Pacientes con infarto de miocardio observados en terapia
intensiva
Paciente
i
Tiempo de observación en días
a partir del ingreso hasta la alta
de terapia intensiva
Motivo de
egreso
1
2
3
4
5
9
5
3
3
1
defunción
mejoría
mejoría
defunción
defunción
104
COMPARACIÓN DE GRUPOS
Con frecuencia, en el campo de las ciencias de la salud se tiene la necesidad de comparar grupos
entre sí. Cuando el tamaño de los grupos a comparar es idéntico, es posible valerse de frecuencias
absolutas. Sin embargo, lo más frecuente es que los grupos sean diferentes en cuanto al tamaño
del grupo en estudio. En estas ocasiones, el uso de frecuencias relativas (proporciones o razones)
facilita la comparación mediante una simple sustracción. Es preciso notar que cuando las
frecuencias relativas (proporciones o razones) de dos grupos son iguales, la diferencia es de cero,
mientras que cuando son diferentes, el resultado es mayor o menor que cero.
105
Supóngase que se sospecha y existe interés en probar la hipótesis de que en una escuela secundaria
los alumnos varones se lesionan más frecuentemente que sus compañeras. Para ello, se observa a
los estudiantes durante un año escolar y, al final de él, se encuentra que el número de lesionados es
semejante para ambos grupos: 15 lesionados en el transcurso del año.
Estas frecuencias absolutas son de valor, pero pueden conducir a errores graves de interpretación,
por ejemplo, si de 300 alumnos que estudian en el plantel sólo 100 fueran varones. En este caso, el
uso de una proporción permitirá evaluar la frecuencia con que se presentan las lesiones según el
sexo.
106
Ejemplo.
La incidencia de lesionados en el grupo de varones es de 15/100 = 0.15 = 15%
La incidencia de lesionados en el grupo de mujeres es de 15/200 = 0.08 = 8%
La diferencia sería de 0.15 - 0.08 = 0.07.
Lo anterior indicaría que en esa escuela los varones se accidentan más que las mujeres.
Riesgo atribuible
En epidemiología, a esta diferencia se le conoce como riesgo atribuible (RA), y proporciona
información acerca del efecto absoluto de la exposición o exceso de riesgo de la característica de
interés en aquellos que pertenecen a un grupo con una característica específica (expuestos) en
comparación con aquellos que no la tienen (no expuestos). Ayuda a responder a la pregunta: si se ha
inferido que la exposición causa la enfermedad, entre las personas expuestas ¿qué cantidad de la
característica de interés (quizá una enfermedad) se debe a la exposición? Esta medida se define como
la diferencia entre la incidencia de los expuestos y los no expuestos, y se calcula mediante:
𝐼𝑒-𝐼𝑜
Donde Ie es la incidencia de expuestos (medida como incidencia acumulada o como densidad de
incidencia), mientras que Io es la incidencia de no expuestos (medida también como incidencia
acumulada o como densidad de incidencia).
Dos prevalencias también pueden compararse mediante la sustracción, aunque el resultado se conoce
como diferencia de prevalencias y no como riesgo atribuible.
107
Riesgo relativo
La razón también es un instrumento útil para comparar dos grupos. Para su interpretación se debe
tomar en cuenta el grupo a comparar (el numerador) en referencia con el grupo de comparación (el
denominador). Cuando ambos grupos son iguales, el resultado siempre es igual a uno. Así, 9 ÷ 9 = 3 ÷
3 = 1 indica que el grupo a comparar es igual al grupo de comparación o referencia. En otras palabras,
por cada elemento en el grupo a comparar existe otro en el grupo de comparación. Cuando el
numerador es mayor que el denominador, como en 9 ÷ 3 = 3, el resultado siempre será mayor de 1. Si
éste es el caso, el resultado indica cuántos elementos (y fracción de ellos) en el grupo a comparar
existen por cada elemento en el grupo de referencia. Por otra parte, si el numerador es menor que el
denominador, 3 ÷ 9 = 0.33, el resultado expresa qué fracción de un elemento, en el grupo a comparar,
existe por cada elemento en el grupo de comparación. En epidemiología, a este cociente se le conoce
como riesgo relativo (RR), y estima la magnitud de una asociación entre exposición y enfermedad e
indica la probabilidad del grupo expuesto de desarrollar la enfermedad en relación con aquellos que no
están expuestos. Ayuda a responder a la pregunta: ¿la exposición causa la enfermedad? Esta medida se
define como el cociente de la incidencia de los expuestos entre la incidencia de los no expuestos, y se
calcula mediante:
108
𝐼𝑒
𝐼𝑜
En la cual Ie es la incidencia de expuestos (medida como incidencia acumulada o como densidad de
incidencia) e Io es la incidencia de no expuestos (medida también como incidencia acumulada o como
densidad de incidencia). Dos prevalencias también pueden compararse mediante una razón, aunque
el resultado se conoce como razón de prevalencias y no como riesgo relativo.
Una interpretación alternativa del riesgo relativo consiste en restar 1 al resultado (cociente) y
multiplicarlo por 100. De esta manera, el resultado se interpreta como el porcentaje que el grupo a
comparar se encuentra por arriba o por abajo en relación con el grupo de referencia.
Cuando los grupos son idénticos, el resultado es igual a 0% [(1 - 1) x 100 = 0%].
Si el numerador es mayor que el denominador, el resultado es superior a 0% [(3 – 1) x 100 = 200%],
mientras que lo contrario resulta en un valor negativo [(0.33 – 1) x 100 = –67%].
Si se toma al grupo de comparación como 100%, el resultado mediante el procedimiento anterior
indica, de manera porcentual, en qué magnitud porcentual el grupo a comparar se encuentra por
arriba o por abajo del grupo de referencia.
109
Ejemplo. La comparación de grupos que realizamos mediante la diferencia de proporciones en el
ejemplo de estudiantes lesionados, también puede efectuarse mediante una razón entre proporciones,
donde:
110
RR = 1 No hay Asociación
RR > 1 Hay Asociación al Factor de Riesgo
RR < 1 Hay Asociación al Factor de Protección
Era: La incidencia de lesionados en el grupo de varones es de 15/100 = 0.15, mientras que para las
mujeres es de 15/200 = 0.08.
Entonces,
0.15 ÷ 0.08 = 1.88
Nos indica que existen 1.88 hombres lesionados por cada mujer lesionada, o también que existen
88% más hombres lesionados que mujeres lesionadas
111
En un estudio prospectivo de cohorte se desea determinar cuál es RR para desarrollar cáncer de
pulmón entre fumadores y no fumadores. Los datos se muestran en la siguiente tabla
Total
Si CA
pulmón
No CA
pulmón
Fuman 5 (a) 21 (b) 26
No fuman 8 (c) 82 (d) 90
Total 13 103 116
Tabla Individuos con y sin consumo de tabaco que desarrollan cáncer de pulmón
RR =
𝑎
𝑎 + 𝑏
𝑐
𝑐 + 𝑑
=
5
26
8
90
= 2.16
El riesgo de desarrollar cáncer de pulmón entre fumadores es 2,2 veces mayor comparado con las
personas que no fuman entre la población de donde se extrajo la muestra para el estudio.
RR> 1 Hay Asociación al Factor de Riesgo
Ejemplo.
112
IC del 95% para el riesgo relativo es:
𝐿𝑜𝑔𝑁𝑅𝑅 − 𝑍 ൗ
𝛼
2
∗
1 − 𝑝1
𝑛1𝑝1
+
1 − 𝑝2
𝑛2𝑝2
𝑎 𝐿𝑜𝑔𝑁𝑅𝑅 + 𝑍 ൗ
𝛼
2
∗
1 − 𝑝1
𝑛1𝑝1
+
1 − 𝑝2
𝑛2𝑝2
Donde
Reemplazando
0.77− 1.96 ∗ 0.5248 𝑎 0.77 + 1.96 ∗ 0.5248
𝐿𝑜𝑔𝑁RR = 𝐿𝑜𝑔𝑁 2.16 = 0.77
𝑍 Τ
𝛼
2
= 𝑍 Τ
0.05
2
= 𝑍0.025 = 1.96 (tabla normal)
-0.2585 a 1.7987
e=2.718281
Deshaciendo los logaritmos
𝐸𝑥𝑝(−0.2585) = 0.772
𝐸𝑥𝑝(1.7987)=6.042
IC=[0.772 a 6.042]
“Con un nivel de significancia del 0.05% el
riesgo de desarrollar cáncer de pulmón entre
fumadores fue 2,2 veces mayor comparado con
las personas que no fuman en la población de
donde se extrajo la muestra; sin embargo, el
intervalo de confianza para esta estimación
incluye el valor de uno, lo cual significa que la
estimación no es completamente precisa”
1 − 𝑝1
𝑛1𝑝1
+
1 − 𝑝2
𝑛2𝑝2
=
1 − (
5
26
)
(5 ∗
5
26
)
+
1 − (
8
90
)
(8 ∗
8
90
)
= 0.5248
Los expuestos tienen un riesgo que es entre 0.77 y 6.04 veces
superior de los no expuestos.
113
Un trabajo compara la morbimortalidad perioperatoria en un grupo que recibió un bloqueador beta-
adrenérgico en el perioperatorio comparado con la de un grupo control que recibió cuidados estándares.
Dos de 61 pacientes en el grupo con bisoprolol y 9 de 62 pacientes sin el bloqueador beta-adrenérgico
murieron de causa cardiaca:
Ejemplo:
Riesgo de morir por una causa cardiaca de los casos :
2
61
= 0.0328 ∗ 100 = 3.28%
Riesgo de morir por una causa cardiaca de los controles:
9
62
= 0.1452 ∗ 100 = 14.52%
Riesgo relativo: La información puede leerse como que el riesgo de
muerte de causa cardiaca en los pacientes tratados con
bisoprolol se redujo al 22,6% del riesgo de los
pacientes con un cuidado estándar.
RR =
𝑎
𝑎 + 𝑏
𝑐
𝑐 + 𝑑
=
2
61
9
62
= 0.226
Criterio de efecto Total
Muertos Vivos
Criterio de
exposición
Casos 2 (a) 59 (b) 61 (a+b)
Controles 9 (c) 53 (d) 62 (c+d)
Total 11 (a+c) 112(b+d) 123
RR< 1 Hay Asociación al Factor de protección
114
IC del 95% para el riesgo relativo es:
𝐿𝑜𝑔𝑁𝑅𝑅 − 𝑍 ൗ
𝛼
2
∗
1 − 𝑝1
𝑛1𝑝1
+
1 − 𝑝2
𝑛2𝑝2
𝑎 𝐿𝑜𝑔𝑁𝑅𝑅 + 𝑍 ൗ
𝛼
2
∗
1 − 𝑝1
𝑛1𝑝1
+
1 − 𝑝2
𝑛2𝑝2
Donde
Reemplazando
-1.4872 − 1.96 ∗ 0.7607 𝑎 − 1.4872 + 1.96 ∗ 0.7607
𝐿𝑜𝑔𝑁RR = 𝐿𝑜𝑔𝑁 0.226 = −1.4872
𝑍 Τ
𝛼
2
= 𝑍 Τ
0.05
2
= 𝑍0.025 = 1.96 (tabla normal)
-2.978 a 0.00365
e=2.718281
Deshaciendo los logaritmos
𝐸𝑥𝑝(−2.978) = 0.051
𝐸𝑥𝑝(0.00365)=1.0036
IC=[0.051 a 1.0036]
1 − 𝑝1
𝑛1𝑝1
+
1 − 𝑝2
𝑛2𝑝2
=
1 − (
2
61
)
(2 ∗
2
61
)
+
1 − (
9
61
)
(9 ∗
9
62
)
= 0.7607
Tablas de contingencia
Las tablas de contingencia son arreglos ordenados de frecuencias que se acomodan en celdas
definidas por columnas y renglones. El arreglo de frecuencias facilitan algunos procedimientos
estadísticos utilizados frecuentemente, como el cálculo de riesgo atribuible, riesgo relativo, chi-
cuadrada y prueba exacta de Fisher, por mencionar cuatro de los más frecuentes.
La tabla de contingencia más utilizada es la conocida como 2 x 2, que consiste en una tabla con
dos hileras y dos columnas donde los sujetos se clasifican según dos criterios, cada uno de los
cuales ocurre en dos niveles.
Tabla de contingencia 2 x 2
115
Ejemplo. Las frecuencias observadas del ejemplo de estudiantes lesionados pueden presentarse
en una tabla de contingencia 2x2. El cuadro muestra los datos en una tabla de este tipo.
116
Mientras que la incidencia de lesiones en mujeres es:
A partir de este arreglo, la incidencia de lesiones en hombres es:
𝐼𝑛𝑐𝑖𝑑𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑙𝑒𝑠𝑖𝑜𝑛𝑒𝑠 𝑒𝑛 ℎ𝑜𝑚𝑏𝑟𝑒𝑠 =
𝑎
𝑎 + 𝑏
=
15
100
𝐼𝑛𝑐𝑖𝑑𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑙𝑒𝑠𝑖𝑜𝑛𝑒𝑠 𝑒𝑛 𝑚𝑢𝑗𝑒𝑟𝑒𝑠 =
𝑐
𝑐 + 𝑑
=
15
200
Lesionados Total
Sexo Si No
Hombres 15 85 100
Mujeres 15 185 200
Total 30 270 300
Odds ratio
El riesgo relativo supone que el muestreo en la población ha sido realizado de manera aleatoria y que
posteriormente los sujetos han sido clasificados según dos variables dicotómicas (diseño transversal
analítico), o bien que los grupos muestreados han sido formados atendiendo a su nivel de exposición
(diseño de cohortes). En epidemiología, es frecuente que los grupos a comparar sean formados a partir
de la condición de enfermedad que se desea estudiar (diseño de casos y controles). En estas
circunstancias, no es factible estimar el riesgo relativo de manera directa. No obstante, cuando se puede
mantener el supuesto de que la frecuencia de la enfermedad que se estudia está por debajo del 10%, se
puede utilizar una aproximación al riesgo relativo conocida como odds ratio. Cuando, al comparar dos
grupos, las frecuencias se presentan en un cuadro 2 x 2, el odds ratio se puede calcular utilizando la
fórmula siguiente:
Odds ratio =
𝑎𝑑
𝑏𝑐
117
Criterio de efecto Total
Si No
Criterio de
exposición
Si a b a+b
No c d c+d
Total a+c b+d a+b+c+d
Ejemplo.
La expresión odds ratio se ha traducido al español de diferentes formas, entre las que se
pueden mencionar “razón de productos cruzados”, “razón de momios”, “oportunidad relativa”
y “razón de posibilidades”.
Utilizando las frecuencias que se presentan en la tabla, el odds ratio será igual a:
118
Lesionados Total
sexo Si No
Hombres 15 85 100
Mujeres 15 185 200
Total 30 270 300
𝑜𝑑𝑑𝑠 =
15 ∗ 185
15 ∗ 85
=
1775
1275
= 2.18
que nos sugiere que existen 2.18 hombres lesionados por cada mujer lesionada. El resultado no
es igual al calculado con el riesgo relativo (de 1.88), pero es una buena aproximación cuando el
diseño de muestreo no nos permite calcularlo, y los dos resultados se aproximarán en la medida
en que el fenómeno estudiado sea más raro.
119
Intervalo de confianza
𝐿𝑜𝑔𝑁𝑂𝑅 − 𝑍 ൗ
𝛼
2
∗ 𝜎𝐿𝑜𝑔𝑂𝑅 𝑎 𝐿𝑜𝑔𝑁𝑂𝑅 + 𝑍 ൗ
𝛼
2
∗ 𝜎𝐿𝑜𝑔𝑂𝑅
𝜎𝐿𝑜𝑔𝑂𝑅 =
1
𝑎
+
1
𝑏
+
1
𝑐
+
1
𝑑
=
1
15
+
1
85
+
1
15
+
1
185
= 0.3879
𝐿𝑜𝑔𝑁𝑂𝑅 = 𝐿𝑜𝑔𝑁 2.18 = 0.7793
07793. − 1.96 ∗ 0.3879 𝑎 07793. + 1.96 ∗ 0.3879
𝑍 Τ
𝛼
2
= 𝑍 Τ
0.05
2
= 𝑍0.025 = 1.96 (tabla normal)
Escriba aquí la ecuación.
0.0189 𝑎 1.5397
Deshaciendo los logaritmos
𝐸𝑥𝑝(0.0189) = 1.5397
𝐸𝑥𝑝(1.5397)=1.0036
IC=[1.02 a 4.66]
Por lo que se concluye que los expuestos tienen una razón enfermo/sano que es entre 1.02 y 4.66
veces superior.
A continuación se muestran los resultados del análisis de riesgo a partir de los datos de bajo peso al
nacer y tabaquismo (Los datos se presenta en la diapositiva 109)
120
Tabaquismo Bajo peso al nacer Riesgo
relativo
IC 95%
si no
No 26 82 1.0
Si, Pasivo 38 92 1.2 0.8 a 1.9
Si, fumadora
de cigarrillos
70 92 1.8 1.2 a 2.6
Ejemplo. población del departamento de Puno.
AÑO
CANTIDAD
(millones)
1940
1961
1972
1981
1993
646385
727309
813172
910377
1103689
Calcular:
a) El incremento absoluto de 1940 a 1993
b) El incremento porcentual de 1940 a 1993?
c) La tasa de crecimiento total.
Incremento porcentual (cambio porcentual)
Incremento Absoluto 1940-1993 : 1 103 689 - 646 385 = 457 304
100
1
x
No
No
N
IP
−
=
El incremento porcentual de 1940 a 1993
%
74
.
70
100
*
646385
646385
1103689
=
−
El cambio porcentual es un cociente cuyo numerador se constituye con el cambio entre dos
momentos y el denominador es un periodo base.
100
1
x
No
No
N
IP
−
=
121
N
N
P
P
P
P
r *
2
*
0
1
0
1
+
−
= 99
.
0
100
*
53
2
*
646385
1103689
646385
1103689
=
+
−
La tasa de crecimiento total
N = Número de periodos (años, semestres, etc.), k = Constante (generalmente 100)
122
Los datos que se presentan en el cuadro
corresponden al número de casos de
hepatitis viral notificados:
La primera columna corresponde al año de
notificación. La segunda, al número de casos
notificados. En la tercera columna se señala
el cambio porcentual del número de
notificaciones de cada año comparándolo
con el anterior.
Si esto se quisiera expresar en palabras, se
diría: en 1994 se reportaron 16,918 casos;
para el año siguiente (1995), el número de
casos notificados disminuyó en 58.13%; para
1996 se observó un aumento de 100.21% en
relación con 1995; y para 1997 nuevamente
se observó una disminución de 89.15% en
relación con el año anterior.
Ejemplo
Casos de hepatitis viral notificados en México, 1994-1997
123
Año Casos
reportados
Cambio
porcentual
1994
1995
1996
1997
16918
7083
14181
26824
-
58.13%
100.21%
89.15%
7083 − 16918
16918
= 0.5813 ∗ 100 = 58.3%
14181 − 7083
7083
= 1.0021 ∗ 100 = 100.21%
26824 − 14181
14181
= 0.8915 ∗ 100 = 89.15%
AÑO CANTIDAD
(millones)
1980
1981
1982
1983
1984
1985
1986
1987
1988
340.7
349.1
357.5
366.0
374.8
385.8
393.0
402.5
412.1
1) Crecimiento poblacional de América latina (1980-1988), Fuente : BID
a) ¿Cuál es el crecimiento de la población de 1980 a 1988?
b) ¿Cuál es el crecimiento de la población de 1980 a 1985?
c) ¿cual es el crecimiento de la población de 1985 a 1988?
d) ¿cual es el crecimiento de la población de 1987 a 1988?
Ejercicios
124
2) Los datos de la tabla contienen las características de 40 niños recién nacidos y sus madres.
Nro
Bajo
peso
al
nacer
Sexo
RN
Exposición de la madre al
humo del tabaco durante el
embarazo
Consumo de
alcohol por la
madre durante el
embarazo
21 no m no si
22 si m fumadora activa si
23 no f fumadora pasiva no
24 no m fumadora activa no
25 no f no no
26 no m no si
27 no m fumadora pasiva no
28 si m fumadora activa no
29 si m fumadora activa no
30 no m fumadora activa no
31 no m fumadora activa no
32 no f fumadora pasiva si
33 si f no no
34 no f fumadora activa si
35 no m no no
36 no m no si
37 no m fumadora activa no
38 no f fumadora pasiva si
39 no f fumadora activa si
40 si f no si
Nr
o
Bajo
peso al
nacer
Sexo
RN
Exposición de la madre al
humo del tabaco durante
el embarazo
Consumo de alcohol
por la madre
durante el embarazo
1 no f fumadora pasiva no
2 no f fumadora pasiva si
3 si f fumadora activa no
4 no m fumadora pasiva no
5 no f fumadora pasiva no
6 no m fumadora activa no
7 si f fumadora activa no
8 si f fumadora pasiva no
9 no m fumadora pasiva si
10 no m no no
11 no f fumadora activa no
12 si f fumadora pasiva si
13 no f fumadora activa si
14 no m no no
15 no f no no
16 si m fumadora pasiva si
17 no f no no
18 no f fumadora pasiva si
19 no m fumadora activa si
20 no f fumadora activa si
125
a) Suponga que los datos fueron registrados
durante todo un año de estancia en una
comunidad del país y le interesa presentarlos
ante sus colegas. A partir de esos datos, llene
la tabla considerando los 40 registros
b) Al estar preparando su presentación, le surge el
interés de explorar la relación que existe entre
tres de las variables (sexo, tabaco y alcohol) con
el peso bajo.
Variable Frecuencia porcentaje
Bajo peso al nacer
SI
No
Sexo del RN
Femenino
Masculino
Exposición al tabaco
Fumadora activa
Fumadora pasiva
No fuma
Consumo de alcohol
Si
No
Variable
Niños con
bajo peso
% de
renglon
Niños sin
bajo peso
% de
renglon
Sexo del RN
Femenino
Masculino
Exposición al tabaco
Fumadora activa
Fumadora
pasiva
No fuma
Consumo de alcohol
Si
No
126
c) A partir del ejercicio b), se decide hacer varias comparaciones para identificar las características
asociadas con el bajo peso al nacer. Llene la tabla siguiente con los valores de riesgo atribuible
y riesgo relativo considerando las siguientes categorías como los valores de referencia: sexo
masculino, no exposición al tabaco durante el embarazo y no consumo de alcohol durante el
embarazo
Variable
Riesgo
atribuible
Riesgo
relativo
Sexo del RN
Femenino
Masculino (grupo de
referencia)
Exposición al tabaco
Fumadora activa
Fumadora pasiva
No fuma (grupo de
referencia)
Consumo de alcohol
Si
No (grupo de referencia)
127
3. El administrador de una clínica de atención medica ha registrado los números de consultas. A
partir de los datos, calcule los cambios porcentuales que la clínica ha registrado durante los
años señalados.
año
casos
reportados
cambio
porcentual
2017 10785
2018 9279
2019 10642
2020 15193
128
Frecuencia %
Inicio 7
Presencia 18
No hay presencia 3
Total 28
Cuadro Nro. 01. estudio de varices
Cuadro Nro. 02. relación entre lumbalgia y movimiento
Lumbalgia
Total
movimiento
Hay afección No hay afección
nro % Nro % Nro %
inadecuado 15 4
adecuado 5 4
total 20 8
4. Completar los cuadros
129
Métodos descriptivos y gráficos para describir datos
cuantitativos
La distribución de frecuencias es un método para organizar, resumir y representar datos según su
magnitud y queda definido por el recorrido de la variable y el numero de observaciones que corresponde
a cada punto o a cada intervalo
Texto
Texto
Texto
Texto
Texto
Texto
Texto
Texto
Texto
Texto
HISTOGRAMA
POLIGONO
Texto
Texto
Texto
Texto
Texto
X
0
1
2
3
4
5
6
fi
BARRAS SIMPLES
0
1
2
3
4
5
6
fi
X
BASTONES
Texto
Texto
Texto
Texto
Texto
Texto
TextoText
o
DIAGRAMA DE
PARETO
OJIVA acumulada
25%
25%
10%
10%
10%
10%
10%
10%
10%
10%
10%
10%
Texto
Texto
Texto
Texto
Texto
Texto
Texto
Texto
BARRAS COMPUESTAS
PICTOGRAMAS
130
DATOS AGRUPADOS (como variables continuas)
Los datos de variables cuantitativas pueden presentarse en forma tabular mediante un arreglo
ordenado, donde los valores se agrupan en intervalos de clase que señalan los valores que deben
incluirse en la tabulación, y son definidos por sus límites inferior y superior de clase. Los intervalos de
clase no deben traslaparse y son consecutivos, por lo que el límite superior de clase de un intervalo es el
límite inferior de clase del siguiente. Para la elaboración de un arreglo ordenado, se procede de la
siguiente manera:
Pasos generales para obtener un cuadro de distribución de frecuencias
1) Determinar El rango
2) Determinar el número de intervalos
3) Determinar el tamaño (amplitud) del
intervalo
4) Construcción del cuadro de frecuencias
5) Construcción de gráficos
6) Interpretación de resultados
R = Numero Mayor – Numero menor
NI=1+3.33 log (N) 5<NI<25 criterio del
investigador
NI
R
C =
131
Edad Glucosa Edad Glucosa
65
64
62
31
62
36
48
58
41
70
55
120
120
120
120
120
200
120
120
140
120
140
52
30
41
68
40
69
35
34
44
30
62
120
120
120
120
160
120
120
130
120
130
140
Ejemplo. Los siguientes datos representan la edad y el nivel de glucosa de pacientes diabéticos atendidos
en el Hospital de Seguro Social. Los datos fueron tomados en 1977. Realizar una distribución de frecuencias
y su grafico respectivo para la edad.
1) Rango: R = Mayor – Menor R = 70 – 30 = 40
2) Numero de intervalos de clase (NI): NI = 5 por regla
empírica
3) Tamaño del intervalo (TI o C): C = R/NI = 40/5 = 8
I Li - Ls Conteo fi Fi hi Hi hi % Hi% Xi Fi-1
1 [30 – 38> //// / 6 6 0.27 0.27 27 27 34 22
2 [38 – 46> //// 4 10 0.18 0.45 18 45 42 16
3 [46 – 54> // 2 12 0.09 0.54 9 54 50 12
4 [54 – 62> // 2 14 0.09 0.63 9 63 58 10
5 [62 – 70> //// /// 8 22 0.36 0.99 36 99 66 8
T. 22 0.99 99
Li - Ls fi hi %
[30 – 38> 6 27
[38 – 46> 4 18
[46 – 54> 2 9
[54 – 62> 2 9
[62 – 70> 8 36
22 99
5
9
4 3
1
0
5
9
4
3
2
1
30 38 46 54 62 70
fi
Li
6
7
8
Resumen
132
Ejemplo: “Determinación de colesterol total, hdl colesterol, ldl colesterol en el personal
administrativo de la facultad de ciencias biológicas de la una ” se realizo en la ciudad de Puno
durante el mes de Septiembre del 2006 en 21 muestras de suero sanguíneo provenientes de personas
aparentemente sanas, con el objetivo de determinar el nivel de Colesterol total, HDL colesterol, LDL
colesterol y hacer una comparación de los valores obtenidos entre ambos sexos (tesina, Facultad de
biología UNA, Autor: Evelin Garcia).
133
lugar de
trabajo Colesterol Total
HDL
colestero
l
LDL
colestero
l Edad Sexo
puno 194,8 51,30 108,50 28 femenino
chucuito 153,7 44,60 97,10 29 femenino
puno 221,9 53,14 121,76 40 femenino
puno 162,5 41,94 96,56 38 femenino
chucuito 141,0 38,32 90,68 36 femenino
puno 182,9 59,28 103,62 35 masculino
puno 179,2 50,72 94,48 37 masculino
puno 165,9 46,13 95,77 34 masculino
chucuito 172,7 52,64 108,00 31 masculino
chucuito 171,8 53,85 105,95 38 masculino
chucuito 207,1 59,38 113,72 40 masculino
puno 173,3 44,31 94,99 48 femenino
puno 222,0 43,03 121,97 50 masculino
chucuito 184,6 53,10 107,50 45 masculino
chucuito 178,0 54,27 101,73 41 masculino
puno 148,6 43,79 94,81 56 masculino
puno 197,6 41,08 119,52 56 masculino
puno 198,8 45,94 105,86 53 masculino
puno 179,4 46,87 98,53 57 masculino
puno 164,4 44,17 96,23 54 masculino
chucuito 174,4 55,00 80,40 52 Masculino
Colesterol total
Rango: R = > – < = 222 – 141 = 81
Numero de intervalos NI = 4 por regla empírica
Tomaremos como ancho de intervalo 20. A criterio
Intervalo Femenino Masculino
Nro % Nro %
131-153
154- 176
177-199
200- 222
1
3
1
1
16.7
50.0
16.7
16.7
1
5
7
2
6.7
33.3
46.7
13.3
6 100.0 15 100.0
CUADRO Nro. Distribución por sexo para
colesterol total, del personal administrativo de la
facultad de ciencias biológicas de la UNA Puno
2006
16,7
50,0
16,7 16,7
6,7
33,3
46,7
13,3
0
10
20
30
40
50
60
131-153 154- 176 177-199 200- 222
Femenino
Masculino
%
134
Tabla 10. Distribución de frecuencias para el numero de integrantes por familia.
Ii Xi Tabula fi Fi hi% Hi%
1
2
3
4
5
6
7
8
9
10
2
3
4
5
6
7
8
9
10
12
//
////
///
/
//////
////
////
//
////
////
/
2
4
3
1
7
5
7
5
5
1
2
6
9
10
17
22
29
34
39
40
5.0
10.0
7.5
2.5
17.5
12.5
17.5
12.5
12.5
2.5
5.0
15.0
22.5
25.0
42.5
55.0
72.5
85.0
97.5
100.0
Tot 40 100
Ejemplo. Se quiere analizar e interpretar descriptivamente los resultados obtenidos de la
investigación referente al número de integrantes por familias.
2 8 6 8 4 3 6 6 8 10 8 12 2 4 6 6 8 5 8 8
7 9 4 3 3 10 10 6 7 7 9 9 3 10 10 6 7 7 9 9
No se obtienes limites
8
6
4
2
fi
2 3 4 5 6 7 8 9 10 12 Xi
Diagrama
de Barras
Distribución como datos discretos
135
Ejemplo. En un estudio llevado a cabo en la Facultad de Enfermería de la UNA-Puno en el año
2004 con la finalidad de establecer el efecto de la música en la estimulación del desarrollo
psicomotor en niños de 2-4 meses del Hospital Carlos Monge M. se llego a los siguientes resultados
(en puntos según la escala de evaluación del desarrollo psicomotor) datos reales.
Niños
Experimental
niños
Control
Pre test Post test Pre test Post test
Britami
Mariana
Angel
Pamela
Sofia
Sergio
Leydi
Yhon
Tania
Grabriel
Alexander
Richard
88
98
88
98
93
93
88
88
93
93
88
103
139
139
139
136
136
144
136
132
132
132
132
131
Carlos
Miriam
Manuel
Ivan
Cristian
Marco
Maria
Edu
Yesenia
Jorge
Maribel
Pedro
103
93
93
98
98
93
88
103
88
88
93
88
101
101
90
90
90
87
87
87
87
87
87
83
Realice análisis descriptivo utilizando SPSS
136
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf
ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf

Más contenido relacionado

La actualidad más candente

Unidad del paciente y unidad de enfermeria
Unidad del paciente y unidad de enfermeriaUnidad del paciente y unidad de enfermeria
Unidad del paciente y unidad de enfermeriaEliseo Delgado
 
11-4 Decálogo socorrista protocolo PAS
11-4 Decálogo socorrista   protocolo PAS11-4 Decálogo socorrista   protocolo PAS
11-4 Decálogo socorrista protocolo PASsupervegallevis
 
LIMPIEZA Y DESINFECCI N de establecimientos de salud.pdf
LIMPIEZA Y DESINFECCI N de establecimientos de salud.pdfLIMPIEZA Y DESINFECCI N de establecimientos de salud.pdf
LIMPIEZA Y DESINFECCI N de establecimientos de salud.pdfangie209328
 
TÉCNICA DE CALZADO DE GUANTES.pptx
TÉCNICA DE CALZADO DE GUANTES.pptxTÉCNICA DE CALZADO DE GUANTES.pptx
TÉCNICA DE CALZADO DE GUANTES.pptxEhimyJimenez
 
Prevención de Caídas en pacientes Hospitalizados
Prevención de Caídas en pacientes HospitalizadosPrevención de Caídas en pacientes Hospitalizados
Prevención de Caídas en pacientes HospitalizadosFer Campaña
 
Guión simulacro de incendio y evacuacion con victimas multiples
Guión simulacro de incendio y evacuacion con victimas multiplesGuión simulacro de incendio y evacuacion con victimas multiples
Guión simulacro de incendio y evacuacion con victimas multiplesMandirola, Humberto
 
Folio 3 normas de bioseguridad en el laboratorio
Folio 3 normas de bioseguridad en el laboratorioFolio 3 normas de bioseguridad en el laboratorio
Folio 3 normas de bioseguridad en el laboratorioShirly Chong
 

La actualidad más candente (14)

Unidad del paciente y unidad de enfermeria
Unidad del paciente y unidad de enfermeriaUnidad del paciente y unidad de enfermeria
Unidad del paciente y unidad de enfermeria
 
Botiquín de primeros auxilios
Botiquín de primeros auxiliosBotiquín de primeros auxilios
Botiquín de primeros auxilios
 
11-4 Decálogo socorrista protocolo PAS
11-4 Decálogo socorrista   protocolo PAS11-4 Decálogo socorrista   protocolo PAS
11-4 Decálogo socorrista protocolo PAS
 
LIMPIEZA Y DESINFECCI N de establecimientos de salud.pdf
LIMPIEZA Y DESINFECCI N de establecimientos de salud.pdfLIMPIEZA Y DESINFECCI N de establecimientos de salud.pdf
LIMPIEZA Y DESINFECCI N de establecimientos de salud.pdf
 
TÉCNICA DE CALZADO DE GUANTES.pptx
TÉCNICA DE CALZADO DE GUANTES.pptxTÉCNICA DE CALZADO DE GUANTES.pptx
TÉCNICA DE CALZADO DE GUANTES.pptx
 
Prevención de Caídas en pacientes Hospitalizados
Prevención de Caídas en pacientes HospitalizadosPrevención de Caídas en pacientes Hospitalizados
Prevención de Caídas en pacientes Hospitalizados
 
Cadena de frio
Cadena de frioCadena de frio
Cadena de frio
 
Proteccion civil
Proteccion civilProteccion civil
Proteccion civil
 
Bioseguridad 2015
Bioseguridad 2015 Bioseguridad 2015
Bioseguridad 2015
 
Enfermeria Clinico Quirurgica
Enfermeria Clinico QuirurgicaEnfermeria Clinico Quirurgica
Enfermeria Clinico Quirurgica
 
Mordeduras 2015
Mordeduras 2015Mordeduras 2015
Mordeduras 2015
 
Unidad 2 unidad del paciente
Unidad 2   unidad del pacienteUnidad 2   unidad del paciente
Unidad 2 unidad del paciente
 
Guión simulacro de incendio y evacuacion con victimas multiples
Guión simulacro de incendio y evacuacion con victimas multiplesGuión simulacro de incendio y evacuacion con victimas multiples
Guión simulacro de incendio y evacuacion con victimas multiples
 
Folio 3 normas de bioseguridad en el laboratorio
Folio 3 normas de bioseguridad en el laboratorioFolio 3 normas de bioseguridad en el laboratorio
Folio 3 normas de bioseguridad en el laboratorio
 

Similar a ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf

INTRODUCCION_A_LA_ESTADISTICA_.pdf
INTRODUCCION_A_LA_ESTADISTICA_.pdfINTRODUCCION_A_LA_ESTADISTICA_.pdf
INTRODUCCION_A_LA_ESTADISTICA_.pdfPaolaLopez170962
 
Excel trabajo de estadística año lectivo 2024
Excel trabajo de estadística año lectivo 2024Excel trabajo de estadística año lectivo 2024
Excel trabajo de estadística año lectivo 2024SofiaMurillo27
 
Introduccion a la estadistica
Introduccion a la estadisticaIntroduccion a la estadistica
Introduccion a la estadisticawcartaya
 
Trabajo tecnologia
Trabajo tecnologiaTrabajo tecnologia
Trabajo tecnologiahelen010
 
Universidad técnica de manabì estadistica (2)
Universidad técnica de manabì estadistica (2)Universidad técnica de manabì estadistica (2)
Universidad técnica de manabì estadistica (2)rubhendesiderio
 
Universidad técnica de manabì estadistica
Universidad técnica de manabì estadisticaUniversidad técnica de manabì estadistica
Universidad técnica de manabì estadisticarubhendesiderio
 
Guia del curso estadistica
Guia del curso  estadisticaGuia del curso  estadistica
Guia del curso estadisticaEdith Llanos
 
Estadistica inf y desc
Estadistica inf y descEstadistica inf y desc
Estadistica inf y descEQUIPO7
 
Estadística (2)
Estadística (2)Estadística (2)
Estadística (2)Danielac12
 
CONCEPTOS DE PROGRAMACIÓN, MÉTODOS ESTADÍSTICOS.
CONCEPTOS  DE PROGRAMACIÓN, MÉTODOS ESTADÍSTICOS.CONCEPTOS  DE PROGRAMACIÓN, MÉTODOS ESTADÍSTICOS.
CONCEPTOS DE PROGRAMACIÓN, MÉTODOS ESTADÍSTICOS.THETINTER
 
Estadística (1)
Estadística (1)Estadística (1)
Estadística (1)KarmenDP
 
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdfBLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdfjuanjopinilloes2102
 
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdfBLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdfsofiaMnera
 
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdfBLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdfMarianaMolinaZapata
 

Similar a ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf (20)

Estadistica
EstadisticaEstadistica
Estadistica
 
INTRODUCCION_A_LA_ESTADISTICA_.pdf
INTRODUCCION_A_LA_ESTADISTICA_.pdfINTRODUCCION_A_LA_ESTADISTICA_.pdf
INTRODUCCION_A_LA_ESTADISTICA_.pdf
 
Excel trabajo de estadística año lectivo 2024
Excel trabajo de estadística año lectivo 2024Excel trabajo de estadística año lectivo 2024
Excel trabajo de estadística año lectivo 2024
 
Introduccion a la estadistica
Introduccion a la estadisticaIntroduccion a la estadistica
Introduccion a la estadistica
 
Trabajo tecnologia
Trabajo tecnologiaTrabajo tecnologia
Trabajo tecnologia
 
Metodos estadisticos
Metodos estadisticosMetodos estadisticos
Metodos estadisticos
 
Universidad técnica de manabì estadistica (2)
Universidad técnica de manabì estadistica (2)Universidad técnica de manabì estadistica (2)
Universidad técnica de manabì estadistica (2)
 
Trabajo Tecnologia.pdf
Trabajo Tecnologia.pdfTrabajo Tecnologia.pdf
Trabajo Tecnologia.pdf
 
Universidad técnica de manabì estadistica
Universidad técnica de manabì estadisticaUniversidad técnica de manabì estadistica
Universidad técnica de manabì estadistica
 
Guia del curso estadistica
Guia del curso  estadisticaGuia del curso  estadistica
Guia del curso estadistica
 
Estadistica inf y desc
Estadistica inf y descEstadistica inf y desc
Estadistica inf y desc
 
Estadística (2)
Estadística (2)Estadística (2)
Estadística (2)
 
03 cuad mat_aplic_01_2011
03 cuad mat_aplic_01_201103 cuad mat_aplic_01_2011
03 cuad mat_aplic_01_2011
 
CONCEPTOS DE PROGRAMACIÓN, MÉTODOS ESTADÍSTICOS.
CONCEPTOS  DE PROGRAMACIÓN, MÉTODOS ESTADÍSTICOS.CONCEPTOS  DE PROGRAMACIÓN, MÉTODOS ESTADÍSTICOS.
CONCEPTOS DE PROGRAMACIÓN, MÉTODOS ESTADÍSTICOS.
 
Estadística (1)
Estadística (1)Estadística (1)
Estadística (1)
 
Taller 2
Taller 2Taller 2
Taller 2
 
Introducción a la Estaditica.pdf
Introducción a la Estaditica.pdfIntroducción a la Estaditica.pdf
Introducción a la Estaditica.pdf
 
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdfBLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
 
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdfBLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
 
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdfBLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
 

Último

FICHA DE MONITOREO Y ACOMPAÑAMIENTO 2024 MINEDU
FICHA DE MONITOREO Y ACOMPAÑAMIENTO  2024 MINEDUFICHA DE MONITOREO Y ACOMPAÑAMIENTO  2024 MINEDU
FICHA DE MONITOREO Y ACOMPAÑAMIENTO 2024 MINEDUgustavorojas179704
 
5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf
5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf
5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdfOswaldoGonzalezCruz
 
VOLUMEN 1 COLECCION PRODUCCION BOVINA . SERIE SANIDAD ANIMAL
VOLUMEN 1 COLECCION PRODUCCION BOVINA . SERIE SANIDAD ANIMALVOLUMEN 1 COLECCION PRODUCCION BOVINA . SERIE SANIDAD ANIMAL
VOLUMEN 1 COLECCION PRODUCCION BOVINA . SERIE SANIDAD ANIMALEDUCCUniversidadCatl
 
programa dia de las madres 10 de mayo para evento
programa dia de las madres 10 de mayo  para eventoprograma dia de las madres 10 de mayo  para evento
programa dia de las madres 10 de mayo para eventoDiegoMtsS
 
Mapa Mental de estrategias de articulación de las areas curriculares.pdf
Mapa Mental de estrategias de articulación de las areas curriculares.pdfMapa Mental de estrategias de articulación de las areas curriculares.pdf
Mapa Mental de estrategias de articulación de las areas curriculares.pdfvictorbeltuce
 
Unidad II Doctrina de la Iglesia 1 parte
Unidad II Doctrina de la Iglesia 1 parteUnidad II Doctrina de la Iglesia 1 parte
Unidad II Doctrina de la Iglesia 1 parteJuan Hernandez
 
PPT GESTIÓN ESCOLAR 2024 Comités y Compromisos.pptx
PPT GESTIÓN ESCOLAR 2024 Comités y Compromisos.pptxPPT GESTIÓN ESCOLAR 2024 Comités y Compromisos.pptx
PPT GESTIÓN ESCOLAR 2024 Comités y Compromisos.pptxOscarEduardoSanchezC
 
Presentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptx
Presentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptxPresentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptx
Presentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptxYeseniaRivera50
 
plan-de-trabajo-colegiado en una institucion educativa
plan-de-trabajo-colegiado en una institucion educativaplan-de-trabajo-colegiado en una institucion educativa
plan-de-trabajo-colegiado en una institucion educativafiorelachuctaya2
 
Metabolismo 3: Anabolismo y Fotosíntesis 2024
Metabolismo 3: Anabolismo y Fotosíntesis 2024Metabolismo 3: Anabolismo y Fotosíntesis 2024
Metabolismo 3: Anabolismo y Fotosíntesis 2024IES Vicent Andres Estelles
 
Tarea 5-Selección de herramientas digitales-Carol Eraso.pdf
Tarea 5-Selección de herramientas digitales-Carol Eraso.pdfTarea 5-Selección de herramientas digitales-Carol Eraso.pdf
Tarea 5-Selección de herramientas digitales-Carol Eraso.pdfCarol Andrea Eraso Guerrero
 
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...JAVIER SOLIS NOYOLA
 
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdfTarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdfManuel Molina
 
DECÁGOLO DEL GENERAL ELOY ALFARO DELGADO
DECÁGOLO DEL GENERAL ELOY ALFARO DELGADODECÁGOLO DEL GENERAL ELOY ALFARO DELGADO
DECÁGOLO DEL GENERAL ELOY ALFARO DELGADOJosé Luis Palma
 

Último (20)

Unidad 4 | Teorías de las Comunicación | MCDI
Unidad 4 | Teorías de las Comunicación | MCDIUnidad 4 | Teorías de las Comunicación | MCDI
Unidad 4 | Teorías de las Comunicación | MCDI
 
Tema 7.- E-COMMERCE SISTEMAS DE INFORMACION.pdf
Tema 7.- E-COMMERCE SISTEMAS DE INFORMACION.pdfTema 7.- E-COMMERCE SISTEMAS DE INFORMACION.pdf
Tema 7.- E-COMMERCE SISTEMAS DE INFORMACION.pdf
 
Sesión de clase: Defendamos la verdad.pdf
Sesión de clase: Defendamos la verdad.pdfSesión de clase: Defendamos la verdad.pdf
Sesión de clase: Defendamos la verdad.pdf
 
FICHA DE MONITOREO Y ACOMPAÑAMIENTO 2024 MINEDU
FICHA DE MONITOREO Y ACOMPAÑAMIENTO  2024 MINEDUFICHA DE MONITOREO Y ACOMPAÑAMIENTO  2024 MINEDU
FICHA DE MONITOREO Y ACOMPAÑAMIENTO 2024 MINEDU
 
5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf
5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf
5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf
 
VOLUMEN 1 COLECCION PRODUCCION BOVINA . SERIE SANIDAD ANIMAL
VOLUMEN 1 COLECCION PRODUCCION BOVINA . SERIE SANIDAD ANIMALVOLUMEN 1 COLECCION PRODUCCION BOVINA . SERIE SANIDAD ANIMAL
VOLUMEN 1 COLECCION PRODUCCION BOVINA . SERIE SANIDAD ANIMAL
 
programa dia de las madres 10 de mayo para evento
programa dia de las madres 10 de mayo  para eventoprograma dia de las madres 10 de mayo  para evento
programa dia de las madres 10 de mayo para evento
 
Mapa Mental de estrategias de articulación de las areas curriculares.pdf
Mapa Mental de estrategias de articulación de las areas curriculares.pdfMapa Mental de estrategias de articulación de las areas curriculares.pdf
Mapa Mental de estrategias de articulación de las areas curriculares.pdf
 
Unidad II Doctrina de la Iglesia 1 parte
Unidad II Doctrina de la Iglesia 1 parteUnidad II Doctrina de la Iglesia 1 parte
Unidad II Doctrina de la Iglesia 1 parte
 
PPT GESTIÓN ESCOLAR 2024 Comités y Compromisos.pptx
PPT GESTIÓN ESCOLAR 2024 Comités y Compromisos.pptxPPT GESTIÓN ESCOLAR 2024 Comités y Compromisos.pptx
PPT GESTIÓN ESCOLAR 2024 Comités y Compromisos.pptx
 
Presentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptx
Presentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptxPresentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptx
Presentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptx
 
plan-de-trabajo-colegiado en una institucion educativa
plan-de-trabajo-colegiado en una institucion educativaplan-de-trabajo-colegiado en una institucion educativa
plan-de-trabajo-colegiado en una institucion educativa
 
Metabolismo 3: Anabolismo y Fotosíntesis 2024
Metabolismo 3: Anabolismo y Fotosíntesis 2024Metabolismo 3: Anabolismo y Fotosíntesis 2024
Metabolismo 3: Anabolismo y Fotosíntesis 2024
 
Tarea 5-Selección de herramientas digitales-Carol Eraso.pdf
Tarea 5-Selección de herramientas digitales-Carol Eraso.pdfTarea 5-Selección de herramientas digitales-Carol Eraso.pdf
Tarea 5-Selección de herramientas digitales-Carol Eraso.pdf
 
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...
 
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdfTarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
 
DECÁGOLO DEL GENERAL ELOY ALFARO DELGADO
DECÁGOLO DEL GENERAL ELOY ALFARO DELGADODECÁGOLO DEL GENERAL ELOY ALFARO DELGADO
DECÁGOLO DEL GENERAL ELOY ALFARO DELGADO
 
Earth Day Everyday 2024 54th anniversary
Earth Day Everyday 2024 54th anniversaryEarth Day Everyday 2024 54th anniversary
Earth Day Everyday 2024 54th anniversary
 
La Trampa De La Felicidad. Russ-Harris.pdf
La Trampa De La Felicidad. Russ-Harris.pdfLa Trampa De La Felicidad. Russ-Harris.pdf
La Trampa De La Felicidad. Russ-Harris.pdf
 
Defendamos la verdad. La defensa es importante.
Defendamos la verdad. La defensa es importante.Defendamos la verdad. La defensa es importante.
Defendamos la verdad. La defensa es importante.
 

ESTADISTICA DESCRIPTIVA SALUD PUBLICA 22.pdf

  • 1. Edgar Eloy Carpio Vargas Universidad Nacional del Altiplano-Puno
  • 2. CONCEPTOS PRELIMINARES Etimología Capitulo I 2 La palabra "estadística" proviene del latín "statisticum collegium", que significa "consejo de Estado" o "gobierno del Estado". La palabra "statisticum" se deriva del término "status", que significa "estado" o "condición". En la antigua Roma, los gobernantes utilizaban la estadística para recopilar datos sobre la población y los recursos del Estado para tomar decisiones importantes. En el siglo XVIII, la palabra "estadística" comenzó a utilizarse con su significado moderno para referirse a la recopilación, análisis e interpretación de datos numéricos. El término fue popularizado por el alemán Gottfried Achenwall en su libro "Staatskunde" (Ciencia del Estado) publicado en 1749. Desde entonces, la estadística ha evolucionado como una disciplina científica que se centra en la recopilación, análisis e interpretación de datos numéricos y ha encontrado aplicaciones en una amplia gama de campos, desde la investigación médica y científica hasta la toma de decisiones empresariales y políticas.
  • 3. 3 Usos de la estadística. La estadística es una disciplina científica que se ocupa de la recopilación, análisis e interpretación de datos numéricos. Debido a su versatilidad y aplicabilidad, la estadística se utiliza en una amplia variedad de campos y situaciones. Algunos de los usos más comunes de la estadística incluyen: Investigación científica: La estadística se utiliza para analizar los datos recopilados en estudios científicos, desde ensayos clínicos hasta experimentos en física, química y biología. Negocios y finanzas: La estadística se utiliza para analizar los datos financieros y de mercado, como el precio de las acciones, la inflación, las tasas de interés y las tendencias de los consumidores. Gobierno y política: La estadística se utiliza para recopilar y analizar datos sobre la población, la economía y los recursos del Estado, y para apoyar la toma de decisiones políticas. Educación: La estadística se utiliza en la evaluación de los resultados de los exámenes y en el análisis de los datos de la investigación educativa Investigación de mercado: La estadística se utiliza para analizar los datos de los estudios de mercado, como encuestas y análisis de preferencias de los consumidores. Salud pública: La estadística se utiliza en el análisis de datos de salud para identificar tendencias, patrones y factores de riesgo, y para evaluar la efectividad de las intervenciones médicas. Ingeniería y tecnología: La estadística se utiliza para analizar datos en la industria manufacturera, la ingeniería y el desarrollo de productos.
  • 4. • Los términos estadísticos invaden la literatura. • La medicina es cada vez más cuantitativa. • Su conocimiento nos permitirá leer la bibliografía con más capacidad crítica para detectar errores potenciales. • Nos será útil para llegar a conclusiones correctas. • Nos permitirá valorar protocolos de estudio e informes remitidos para su publicación • Participar, en definitiva, en la investigación médica. Razones por las cuales los profesionales deben conocer los fundamentos de la estadística. 4
  • 5. Errores estadísticos comunes Errores al momento de recopilar y durante el cómputo de los mismos. Sesgo: Es imposible ser completamente objetivo o no tener ideas preconcebidas antes de comenzar a estudiar un problema, y existen muchas maneras en que una perspectiva o estado mental pueda influir en la recopilación y en el análisis de la información. Datos no comparables: es extremadamente importante que las comparaciones se hagan entre datos que sean comparables. Proyección descuidada de tendencias: la proyección simplista de tendencias pasadas hacia el futuro es uno de los errores que más ha desacreditado el uso del análisis estadístico. Muestreo Incorrecto: el volumen de información disponible es tan inmenso que se hace necesario estudiar muestras, para derivar conclusiones Hay otros errores que no son tan fácilmente identificables: 5
  • 6. Definición de estadística 6 La estadística es una disciplina que se encarga del diseño, análisis y la interpretación de datos. A continuación, se presentan algunas definiciones de estadística de diferentes autores: Ronald E. Walpole: "La estadística es la ciencia de la toma de decisiones en la presencia de incertidumbre". Morris H. deGroot y Mark J. Schervish: "La estadística es el estudio de los métodos para la recolección, análisis e interpretación de datos". David S. Moore y George P. McCabe: "La estadística es una colección de métodos para planear experimentos, obtener datos y luego organizar, resumir, analizar, interpretar y presentar esos datos y extraer conclusiones y tomar decisiones". William Mendenhall y Terry Sincich: "La estadística es la ciencia que se ocupa de la toma de decisiones en la presencia de la incertidumbre".
  • 7. 7 ANALISIS UNIVARIADO ANALISIS BIVARIADO ANALISIS MULTIVARIADO EN FUNCION AL NUMERO DE VARIABLES EN ESTUDIO Analizar una variables independientemente Analizar a la vez dos variables Analizar a la vez mas de dos variables ANALISIS ESTADISTICO
  • 8. Estadística descriptiva o deductiva Estadística inferencial o inductiva: 8 División de la estadística La estadística descriptiva se enfoca en la descripción y el resumen de los datos recopilados. Esta categoría incluye la presentación de datos en tablas, gráficos y medidas descriptivas como la media, la mediana, la moda, la desviación estándar y la varianza. La estadística descriptiva es útil para comprender las características básicas de un conjunto de datos y para resumir y visualizar la información sin sacar conclusiones o inferencias. La estadística inferencial se enfoca en hacer inferencias y predicciones sobre una población a partir de una muestra de datos. Esta categoría incluye la estimación de parámetros, la prueba de hipótesis y la regresión y técnicas avanzadas. La estadística inferencial se utiliza para tomar decisiones basadas en datos y para hacer inferencias sobre una población más amplia a partir de un conjunto de datos limitado.
  • 9. La finalidad de la estadística es suministrar información y su utilidad dependerá del fin que se proponga y de la forma como se obtenga los datos. • Determinar la realidad de una observación o fenómeno. • Lo típico o normal de esa observación. • Determinar los cambios que presenta el fenómeno. • Relacionar dos o más fenómenos. • Determinar las causas que originan el fenómeno. • Hacer estimativos sobre el comportamiento futuro del fenómeno. • Obtener conclusiones de un grupo menor (muestra), para hacerlas extensivas a un grupo mayor (población). • La estadística facilita una serie instrumentos o técnicas que, al ser utilizadas correctamente, permiten determinar el grado de validez y confiabilidad, ya sea de las predicciones o de las conclusiones obtenidas a partir de muestras. Finalidad de la estadística 9
  • 10. Esta referido a un colectivo (conjunto total, completo) de individuos o elementos individuales (mediciones o conteos) que se están estudiando y sobre los que se desean hacer inferencias. Presentan determinada característica (propiedades comunes) de grupo. Población Es aquella que contiene un número limitado de individuos u objetos llamados también elementos (se puede contar). Es aquella que tiene un numero ilimitado de elementos (no contable), en la práctica una población finita con un numero grande de elementos se considera una población infinita. Población finita. Población infinita. La población puede estar definida por: características de individuos, limites geográficos, grupos existentes, limites de tiempo, etc. 10
  • 11. Un cardiólogo, investiga un nuevo fármaco para disminuir los niveles de colesterol en pacientes que consumen alimentos ricos en grasas en varones adultos mayores de 40 años. población objeto de estudio: todos los varones adultos mayores de 40 años que consumen alimentos ricos en grasas y que tengan colesterol. Al momento tal como se plantea la investigación, no se conoce los elementos de la población (relación de adultos mayores de 40 años que consumen grasas y que tengan colesterol). En este sentido, se podría pensar en determinar la muestra por muestreo no probabilístico determinando una muestra de 100. Note que a pesar de que la población es finita, no es enumerable, esto se puede definir cono una población infinita. La muestra proporciona información sobre el objeto de estudio, la cual puede ser seleccionada aleatoriamente o no aleatoriamente. Lo habitual en nuestro contexto es que en el procedimiento de extracción intervenga el azar, pero muchas veces esto no es posible. Ejemplo: 11
  • 12. Se quiere analizar el tiempo que dedican al estudio (semanal) los alumnos de la EP de Medicina humana de la Universidad Nacional del Altiplano. La muestra para este caso si se puede determinar por muestreo probabilístico utilizando las formulas adecuadas, supongamos que la formula reporte 120 estudiantes como muestra. Población: Todos los estudiantes de la EP de Medicina de la Universidad Nacional del Altiplano, 560. Muestra: 120 estudiantes, aquí si es posible elegir los elementos de la muestra aleatoriamente ya que se puede conformar el marco muestral (relación de alumnos) . 12 Ejemplo:
  • 13. Es toda medida descriptiva de una población. - El ingreso promedio de todos los asalariados del Perú. - El ingreso promedio de docentes universitarios del Perú INDICADOR: PARAMETRO (µ, P, 2, N,  ) Parámetro. En otras palabras, son valores obtenidos de la población 13
  • 14. Es una parte (o sub conjunto) representativa de la población, tomada sea por muestreo probabilístico o no probabilístico, y, que se utiliza con el objeto de investigar las propiedades o realizar inferencias sobre la población. INDICADOR: ESTIMADOR ( ത 𝑋, 𝑆2 , 𝑝 𝑛, 𝑆) Ejemplo: Cada mes el Ministerio de Trabajo calcula el ingreso promedio en una muestra de varios miles de asalariados seleccionados entre la población total de 2 millones de trabajadores. El promedio de esa muestra se utiliza luego como una estimación del ingreso promedio para toda la población. Muestra Son valores obtenidos de la muestra 14
  • 15. 15 Ejemplo de población y muestra. Un cardiólogo, que investiga un nuevo fármaco para rebajar el colesterol, desea conocer el consumo de grasas en varones adultos mayores de 40 años. La población objeto de estudio: todos los varones adultos mayores de 40 años. La variable de interés: consumo de grasas. El cardiólogo podría pensar en analizar a todos los individuos de la población. Sin embargo, esto resulta inviable (y así ocurre en muchas otras situaciones prácticas debido al coste, al tiempo que requiere,...) Entonces se conformará con extraer una muestra. Ejemplo: Se quiere analizar el tiempo que dedican al estudio (semanal) los alumnos de la EP de Medicina de esta Universidad. Para ello se pregunta a 50 alumnos. Población: Todos los estudiantes de la EP de Medicina de esta Universidad. Variable: Número de horas de estudio semanal. Muestra: 50 alumnos encuestados.
  • 16. 16 Ejemplo: El sindicato de una industria que tiene 100 empleados desea saber cual es el sueldo promedio, encarga una encuesta a una empresa para que entreviste a 20 operarios y averigüe sus salarios. Estos datos son una muestra de 20 observaciones del universo o población formado por los salarios de todos los operarios de la industria textil.
  • 17. Las razones para estudiar muestras en lugar de poblaciones son diversas y entre ellas podemos señalar 3: ❑ Ahorrar tiempo. ❑ Ahorrar costes. ❑ Estudiar la totalidad de los pacientes o personas con una característica determinada en muchas ocasiones puede ser una tarea inaccesible o imposible de realizar. 17 Pero, ❑ al disponer de más tiempo y recursos, las observaciones y mediciones realizadas pueden ser más exactas, además, ❑ Reduce la heterogeneidad de una población.
  • 18. Se considera dato a la cuantificación de las particularidades o peculiaridades de un fenómeno individual que forma parte del fenómeno de masa Se denomina marco, marco muestral o marco de referencia, a la lista, mapa o cualquier otro material aceptable, que contenga todas las unidades perfectamente identificadas y actualizadas, de la cual se seleccionará muestra Dato estadístico. Marco muestral. Es el objeto o elemento indivisible que será estudiado en una población, sobre la cual se obtendrán los datos de interés para la investigación. La unidad de análisis no es el fenómeno investigado sino el que genera el fenómeno. Unidad de análisis 18
  • 19. Elementos Características Personas salarios personas horas de trabajo personas cargos hogar consumo personas enfermedad personas notas Fabrica Producto Es importante resaltar que a la estadística no le interesa el elemento o la unidad en si, sino su característica Características. 19 Unidad de análisis Es el objeto o elemento indivisible que será estudiado en una población, sobre la cual se obtendrán los datos de interés para la investigación.
  • 21. CLASIFICACIÓN DEL TIPO DE DATOS. DE ACUERDO A LA FUENTE. Datos primarios.- Directamente de los encuestados Datos secundarios.- Publicaciones o instituciones que no tienen relación directa con el fenómeno (INEI, Oficinas, revistas, historias clínicas etc.) Series temporales.- obtenidas en forma cronológica, Día, mes, año etc. Corte transversal.- Se dan en un momento determinado del tiempo. POR SU NATURALEZA Datos Cualitativos ( Nominales y ordinales) Datos Cuantitativos (Discretos y continuos) POR LA FORMA DE RECOPILAR. Encuestas.- Recopilación por sondeos Experimento.- cuando se ejerce control sobre uno o más de sus factores 21
  • 22. 22 ANALISIS UNIVARIADO ANALISIS BIVARIADO ANALISIS MULTIVARIADO EN FUNCION AL NUMERO DE VARIABLES EN ESTUDIO Analizar una variables independientemente Analizar a la vez dos variables Analizar a la vez mas de dos variables ANALISIS ESTADISTICO
  • 23. 23 Estadísticas y recopilación de datos. Los datos generalmente se recopilan mediante encuestas por muestreo, estudios observacionales o experimentos. Las encuestas por muestreo se usan normalmente cuando el propósito de la recopilación de datos es estimar algunas propiedades de la población finita sin realizar un censo completo. Los estudios observacionales y los experimentales, normalmente se usan para determinar la relación entre dos o más cantidades medidas en una población conceptual. Una población conceptual, a diferencia de una población finita, solo puede existir en nuestras mentes. Por ejemplo, si hubiera interés en estudiar la relación entre las futuras emisiones de gases de efecto invernadero y la temperatura global promedio futura, la población no puede ser muestreada porque aún no existe.
  • 24. 24 • En un estudio observacional, los datos se observan en su entorno natural, pero en un experimental, el medio ambiente está controlado. • En estudios observacionales, no se puede demostrar que las relaciones detectadas sean causa y efecto, pero se pueden encontrar correlaciones entre dos variables observadas porque ambas están afectadas por cambios en una tercera variable que no se observó ni registró, y cualquier predicción futura basada en las relaciones encontradas en un estudio observacional debe asumir las mismas interrelaciones entre las variables que existieron. Diferencia entre estudios observacionales y experimentales En un experimento, por otro lado, algunas variables se cambian deliberadamente mientras que otras se mantienen constantes. De esta forma, se puede observar directamente el efecto causado por el cambio en la variable deliberadamente variada, y se pueden hacer predicciones sobre el resultado de los cambios futuros en la variable expresamente variada.
  • 25. Son características de las personas u objetos que pueden tomar diferentes valores los cuales pueden ser cuantificables. Ejemplo. Un investigador está interesado en los valores de hemoglobina en sangre de los trabajadores de un taller dedicado al mantenimiento de automóviles. Para ello, decide estudiar a todos los trabajadores que laboran en el taller. Variable: Nro. Nombre sexo edad Hemoglobina en sangre (mg/dL) i X Y Z 1 Miguel Masculino 45 12 2 Domitila Femenino 23 13 3 Manuel Masculino 32 11 4 Jesus Masculino 18 15 5 Sergio Masculino 21 14 Tabla 1. algunas características de trabajadores que laboran en un taller de automóviles Variables: sexo, edad y hemoglobina No son variables: Nro. y Nombre 25
  • 26. CLASIFICACIÓN DE VARIABLES ESTADÍSTICAS En función del tipo de dominio, las variables se clasifican en: cualitativas, cuantitativas y cuasicuantitativas. En función a los tipos de datos se clasifican en: cualitativos (atributos) y cuantitativos. Ordinales Nominales Cualitativas Continuas Discretas Cuantitativas Variables                26
  • 27. (también llamados atributos, categorías) Este tipo de variables representan una cualidad o atributo que clasifica a cada caso en una de varias categorías. La situación más sencilla es aquella en la que se clasifica cada caso en uno de dos grupos (hombre/mujer, enfermo/sano, fumador/no fumador). Son datos dicotómicos o binarios. En muchas ocasiones este tipo de clasificación no es suficiente y se requiere de un mayor número de categorías. Este tipo de variables no llevan clasificación numérica alguna. - color de los ojos - grupo sanguíneo - Profesión - clase social - color de piel - lanzar una moneda al aire - estado civil - sexo - especie de animales - ¿posee Ud. Actualmente bonos de gas del gobierno? - resultado de un tratamiento, etc. Ejemplo. Variables cualitativas Variable cualitativa. 27
  • 28. Son variables cualitativas de acuerdo al dominio y surgen cuando observamos o medimos los datos en categorías que no mantienen una relación de orden entre sí. (no lleva ningún orden). Por ejemplo, la variable color puede asumir las siguientes formas de clasificación: Rojo azul verde amarillo o Azul rojo verde amarillo o Verde amarillo rojo azul….. etc Variable Categoría Color de ojos Estado civil Raza Ciudad Sexo Profesión Propietario de un auto? Lanzar una moneda Especie de peces Factor de riesgo Enfermedad tuberculosis Pardos verdes azulados negros Soltero casado viudo divorciado Mestiza negra india amarilla Puno Juliaca Lima Arequipa Femenino masculino Arquitecto ingeniero medico Si no Sello cara Trucha carachi pejerrey Presencia ausencia Presencia ausencia 1) Nominal. 28
  • 29. de acuerdo al dominio de denomina Variable cuasicuantitativa. Porque, aunque sus modalidades son de tipo nominal, es posible establecer un orden entre ellas. (Cuando se va más allá del nivel de clasificación y se busca ordenar sus casos en términos del grado que poseen, Lleva un orden) Variable Categoría Clase social Nivel de estudios Categoría docente universitario Evaluación de hostales Dolor Alta baja media 1ro 2do 3ro 4to 5to Principal asociado auxiliar 5 4 3 2 estrellas Intenso moderado leve 2) Ordinal. 29
  • 30. Son aquellas variables que se obtienen como resultado de mediciones o conteos (medidas numéricas). Estas pueden ser de dos tipos: Son respuestas numéricas que surgen de un proceso de conteo que comprenden todas aquellas observaciones cuyos valores son enteros (no admiten siempre una modalidad intermedia entre dos cualesquiera de sus modalidades). Variable Indicador - alumnos de la FINESI - accidentes de tránsito en una semana - admisiones en un hospital en una semana - hijos de una familia - suscripciones a revistas - lanzar un dado, ver el número que sale - cigarrillos fumados por día - partos en un mes Número (300) Número (20) Número (220) Número (3) Número (3) Número (4) Número (6) Número (200) Variable cuantitativa. 1) Variable discreta. 30
  • 31. (intervalar) Son respuestas numéricas que surgen de un proceso de conteo que pueden tomar infinitos valores entre dos números discretos (admiten una modalidad intermedia entre dos cualesquiera de sus modalidades) Variable Indicador - notas de evaluaciones - edad - talla de personas - peso - temperatura - longitud de peces - Concentración de DDT Número ( 12.3, 18.0, ..) Número ( 1 año 2 meses, ….) Número (1.75, 1.60, cm) Número (60.5, 70,1 kg) Número (3.4º, 18.2º grados c.) Número (0.75, 0.60, cm) Número (3.5%, 4.2% ...) 2) Variable continua 31
  • 32. Nota: Los métodos estadísticos dependen del tipo de variables consideradas. Es entonces interesante poder transformar una variable de un tipo a otro. Por ejemplo, la edad se puede transformar en una variable nominal o ordinal considerando como conjunto Q un conjunto de clases de edad. Según la precisión requerida de la variable edad y los métodos utilizados se usará la edad como variable cuantitativa (discreta , continua) u ordinal. Variable Escala de medición Edad de la madre (en años cumplidos) Talla de la madre en cm. Estado civil Escolaridad (primaria, secundaria, superior) Temperatura en grados C. Ocupación Exposición al tabaco durante el embarazo (no fumadora, fumadora pasiva, fumadora activa) Hemoglobina mg/dL Número de consultas prenatales Discreta, cuantitativa Continua, cuantitativa Nominal, Cualitativa Ordinal, Cualitativa Continua, Cuantitativa Nominal, Cualitativa Ordinal. Cualitativa Continua, Cuantitativa Discreta, Cuantitativa Algunas características de mujeres durante el embarazo 32
  • 34. Ejercicios 1) En las variables que se presentan a continuación, indique de qué tipo de variable se trata mediante las siguientes abreviaturas: N para una variable cualitativa nominal, O para una variable cualitativa ordinal, D para una variable cuantitativa discreta y C para una variable cuantitativa continua. 1. Concentración de triglicéridos en sangre (mg/dl) ( ) 2. Diabetes (si, no) ( ) 3. Colesterol total (mg/dl) ( ) 4. Creatinina (mol/L) ( ) 5. Numero de cigarrillos fumados el día anterior ( ) 6. Índice de masa corporal (peso/talla2) ( ) 7. Numero de consultorios en la clínica ( ) 8. Presión arterial diastólica (mm Hg) ( ) 34 9. Intensidad del dolor (escala de 0 a 10) ( ) 10. Opinión del servicio (bueno, regular, malo) ( ) 11. Edad en años cumplidos ( ) 12. Uso de drogas antihipertensivas (si, no) ( ) 13. Presencia de cefalea (si, no) ( ) 14. Sexo (masculino, femenino) ( ) 15. Porcentaje de grasa corporal ( ) 16. Deposito de agua (aljibe, balde, alberca, tina, otro) ( )
  • 35. 2) Los datos que contiene la siguiente tabla, se refieren a las características de seis pacientes. Primero identifique la variable IMC con la letra W, la variable Colesterol-HDL con la letra X, la variable glucosa en sangre con la letra Y, y la variable Fumador con la letra Z. Luego escriba cuáles son los valores individuales que representan las siguientes referencias: Identificación Índice de masa corporal (IMC) Colesterol HDL Glucosa en sangre Fumador 1 24 52 110 si 2 27 50 95 no 3 25 57 103 no 4 27 48 115 si 5 26 49 100 no 6 29 56 120 no referencia valor referencia valor W1 ( ) Y3 ( ) W2 ( ) Y4 ( ) W3 ( ) Y5 ( ) X2 ( ) Z4 ( ) X3 ( ) Z5 ( ) X4 ( ) Z6 ( ) 35
  • 36. 3) Describa con sus propios términos la diferencia entre; a) una población y una muestra b) un parámetro y un estadístico. c) Una variable cuantitativa y una variable cualitativa d) Una variable continua y una variable discreta. 4) La revista Forbes reporto datos sobre las condiciones y estilos de vida en varias ciudades de Estados Unidos. Algunos de esos datos se presentan seguidamente. a. Identifique las variables cualitativas y cuantitativas b. Identifique las variables discreta y continuas c. Identifique las variables ordinales y nominales 36 Ciudad Población en millones Mediana del ingreso por hogar Mejor negocio hotelero Atracción mas visitada Tasa de criminalidad x cada 100,000 Atlanta 3.5 43,249 Ritz-Carlton Stone Montain Patk 846.2 Baltimore 2.5 43,291 Harbor Count Harborplace 1296.5 St.Louis 2.5 39,079 Hyatt Regency Gateway Arch 263.4 Philadelphia 5.0 43,576 Bellevue Liberty Bell 693.1 Raleigh-Durham 1.0 40,990 Radisson plaza State fair 634.9
  • 37. Recolección y revisión de datos Los datos se obtienen directamente de los elementos en estudio mediante la observación (observación directa, medición física, medición química) o el interrogatorio (entrevistas personales, cuestionarios autoadministrados, diarios). Cuando éste es el caso, se dice que los datos proceden de fuente primaria. Los datos de fuente secundaria son los que se toman de registros previos, generalmente elaborados con propósitos diferentes a los de nuestra investigación. Su utilidad para el análisis dependerá de la calidad de la información y de su accesibilidad administrativa. Los datos que proceden de una fuente primaria tienen que ser registrados por el investigador. Ocasionalmente, los datos de fuente secundaria están disponibles en archivos de cómputo y se capturaron de tal manera que están listos para su tabulación, pero lo más frecuente es que el investigador también tenga que buscarlos y registrarlos. 37
  • 38. Forma de registro de datos Antes de empezar a diseñar un instrumento, es necesario que el investigador enumere todas las variables de interés. En cada una de ellas se deberán definir tres aspectos: • Su naturaleza, debe ser específica (que distinga la variable de interés de posibles confusores) y sensitiva (que incluya todas las maneras en que el sujeto se encuentra con la variable de interés). • La dosis, en sus diferentes expresiones: dosis acumulada, tasa de exposición, exposición promedio, dosis pico. • El tiempo, o periodo relevante en que se presentó la característica de interés 38
  • 39. 39 Estos tres aspectos de las variables deberán ser interpretadas por el investigador y traducidos en preguntas, que en conjunto integrarán la forma de registro de datos. Para algunas variables estas definiciones son muy sencillas y generalmente pueden ser exploradas con una pregunta (sexo, edad en años cumplidos) o medir directamente en el sujeto en estudio (talla, peso, presión arterial). Otras son engañosamente sencillas, como el alcoholismo, la escolaridad o la ocupación. En algunos casos, el proceso puede ser muy complejo y la medición se tiene que realizar de manera indirecta por medio de varias preguntas cuyas respuestas se resumen en un índice. A este grupo pertenecen las mediciones de la calidad de vida, el estrés, la depresión y la inteligencia.
  • 40. Al utilizar ahorramos tiempo y recursos; además, la comparación de nuestros resultados con los de otros estudios puede ser más sencilla cuando en ambos trabajos se utilizó el mismo instrumento. Sin embargo, es necesario tener cuidado porque un instrumento utilizado previamente no necesariamente es el mejor para una nueva investigación, aunque ya estuviera probado y validado. 1) Utilizar uno ya existente (estandarizado) Diseño de un instrumento 40
  • 41. Esta es una opción muy útil cuando ya existe un instrumento previo, pero tiene alguno de los siguientes inconvenientes: 2) Adaptar uno ya existente. • El instrumento es muy extenso para el estudio. Puede ser que el instrumento original se haya diseñado para una entrevista, pero se desea utilizar en un cuestionario autocontestado, o que el tiempo en que se contesta excede el tiempo que se dispone para captar los datos. • La población es diferente. Un instrumento desarrollado para un grupo de población urbana puede no ser adecuado para una población rural, sobre todo si los niveles de escolaridad o el uso del lenguaje son diferentes. • El instrumento está escrito en otra lengua. En estos casos, el instrumento deberá ser traducido. • Es necesario extender, reordenar o realizar otros cambios en la manera en que los datos se colectan. Esto es necesario cuando el investigador considera que al instrumento se le deben agregar más preguntas, cuando el orden de éstas debe ser cambiado o cuando el instrumento original fue diseñado para una entrevista y las preguntas se aplicarán por medio de un equipo de cómputo. 41
  • 42. Muchos investigadores lo hacen, pero no es un trabajo sencillo que pueda realizarse en poco tiempo. Con frecuencia el desarrollo de un nuevo instrumento toma tiempo y requiere conceptos teóricos, prácticos y experiencia en el tema. 3) Desarrollar un instrumento propio. Sin importar que adoptemos un instrumento ya existente, que lo adaptemos o que desarrollemos uno propio, en términos generales, el instrumento que utilicemos estará compuesto por preguntas y respuestas. De alguna manera, la forma en que queramos registrar la respuesta determinará el tipo de pregunta. 42
  • 43. Las preguntas La selección y el fraseo de las preguntas están determinados por el contexto de la investigación, por lo que es muy importante tener claridad en los diferentes componentes de este contexto antes de decidir qué forma de registro de datos utilizar. El contexto de la investigación que determina el instrumento incluye los siguientes aspectos: • Identificar el objetivo general y los específicos de la investigación. • Definir con claridad las variables en estudio. • Recordar que las preguntas se realizan en un contexto social, cultural y económico. • Conocer a los encuestados, es decir, quién responde. • Identificar a los encuestadores, es decir, quién pregunta. • Estandarizar las preguntas, es decir, cómo se pregunta. • Estandarizar el formato de las respuestas, es decir, cómo se responde. • Conciliar lo que se quiere preguntar con el tiempo que se dispone para hacerlo. 43
  • 44. Recomendaciones para redactar y seleccionar preguntas: • Realizar preguntas útiles, relacionadas con la investigación. • Hacer preguntas concretas utilizando un lenguaje convencional. • Utilizar oraciones completas. En español, la sintaxis de la oración tiene la siguiente estructura: primero va el sujeto, luego un verbo conjugado y termina con un complemento (Cohen, 2010). • Utilizar un lenguaje fácil de comprender para los entrevistados o para quien llene el instrumento. Para ello, conviene no utilizar abreviaturas, expresiones coloquiales o en jerga o expresiones técnicas. • Utilizar periodos de tiempo pertinentes a la importancia de la pregunta. • Preguntas y respuestas cortas cuando se quiera ahorrar tiempo, pero sin sacrificar su claridad. 44
  • 45. • En caso de temas sensibles al entrevistado, se pueden utilizar preguntas cargadas. Por ejemplo, si existe interés en preguntar sobre consumo de drogas ilegales, podríamos redactar una pregunta en los siguientes términos: “Algunas personas, por experimentar, han probado la mariguana. ¿Usted ha probado la mariguana en alguna oportunidad de su vida?”. Al plantear la pregunta de esta manera, facilitamos que los entrevistados la contesten, pero es necesario tener cuidado, porque la redacción puede ser tan compleja que llega a dificultar su interpretación por el entrevistado. • Evitar frases y palabras sesgadas. Éstas son las que orientan la respuesta. Por ejemplo, la pregunta “¿Verdad que usted quiere a sus hijos?” anticipa la respuesta que queremos escuchar. • Evitar preguntas con dos respuestas. • Evitar preguntas en negativo. • Hacer que las preguntas sean revisadas por expertos y por respondientes potenciales. • Las preguntas son precisas y sin ambigüedades cuando dos o más personas entrevistadas potenciales están de acuerdo con las palabras usadas para contestarla. • Recordar que se pueden adoptar o adaptar preguntas que ya han sido utilizadas satisfactoriamente por otros investigadores. 45
  • 46. se refiere a que el instrumento realmente mida lo que se se quiere medir. Por ejemplo, si queremos medir la grasa corporal de una persona, tendríamos varias opciones: podríamos pesarla (sabemos que a mayor grasa corporal mayor peso corporal, pero también la masa muscular aumenta el peso, por lo que el peso total no sería la mejor opción), calcular el índice de masa corporal (peso/talla2), medir pliegues cutáneos o medir la impedancia. El último tendría mayor validez que los anteriores. • La objetividad • La confiabilidad se refiere a la consistencia en los resultados. Es decir, que cada vez que se mida lo mismo se obtenga el mismo resultado. Por ejemplo, si nos pesamos en una báscula y registramos 70 kg, nos bajamos de la misma y luego nos pesamos nuevamente, esperamos que la segunda lectura sea igual (o muy cercana) a 70 kg. Si éste es el caso, hablamos de una lectura confiable. En caso contrario (que la segunda lectura sea, por ejemplo, de 80 kg), las lecturas no son confiables. • La validez Se refiere al grado potencial en que los resultados pueden ser influenciados o sesgados por el investigador o quien registra el dato. 46
  • 47. Las respuestas Las respuestas se clasifican en cerradas o abiertas según sea la forma en que las registramos. En el caso de las respuestas cerradas, el que llena la forma de registro de datos selecciona una o varias opciones entre una lista limitada de respuestas posibles. En las respuestas abiertas, estas opciones predefinidas no existen, por lo que quien responde deberá utilizar sus propias palabras. Respuestas cerradas. Entre las respuestas cerradas podemos encontrar varios modelos; las más frecuentes pueden clasificarse en dicotómicas, múltiples nominales y múltiples ordinales. • Las respuestas dicotómicas. presuponen sólo dos opciones posibles. Las más frecuentes en esta categoría son SÍ o NO. Por ejemplo: ¿Ha tenido usted tres o más evacuaciones líquidas en las últimas 24 horas? No ( ) Si ( ) 47
  • 48. • Las respuestas múltiples nominales presuponen más de dos opciones posibles, sin que exista entre ellas una relación de orden, por lo que la secuencia en que se anotan generalmente no tiene tanto impacto en la respuesta. Sin embargo, no es raro que algunas opciones tengan que situarse después de otras, como es el caso de la opción “otro”. Por ejemplo: Ayer que regresó del trabajo a su casa, ¿qué medio de transporte utilizó? Automóvil o camioneta Autobús o minibús Motocicleta Otro vehículo menor Bicicleta Otro vehículo Ninguno de los anteriores 48
  • 49. • Las respuestas múltiples ordinales presuponen varias opciones posibles que mantienen una relación de orden entre ellas. Por ejemplo: ¿Qué tan de acuerdo o en desacuerdo está usted con el siguiente enunciado?: Los accidentes son causados por el destino. Completamente de acuerdo Casi de acuerdo No sabe Casi en desacuerdo Completamente en desacuerdo 49 ¿Dentro de que intervalo se encuentra su edad actual?¡ ( ) 12 a 18 ( ) 19 a 25 ( ) 25 a 30 ( ) mas de 30
  • 50. c) Balancear las respuestas. d) Usar escalas de 5 o 7 categorías. e) Poner las categorías negativas al principio de la escala. f) Mantener las escalas en la misma página y fáciles de completar. g) Usar escalas sólo cuando los encuestados pueden ver o recordar con facilidad todas a) Utilizar escalas que tengan sentido con los objetivos. Al considerar el uso de esta opción, es necesario tomar en cuenta las siguientes consideraciones: b) Considerar cinco tipos de respuestas: Aprobación: Definitivamente cierto, cierto, no sé, falso, definitivamente falso. Frecuencia: Siempre, frecuentemente, regularmente, algunas veces, casi nunca, nunca. Intensidad: Nada, muy poco, regular, moderado, severo. Influencia: Gran problema, problema regular, problema pequeño, casi sin problema, sin problema. Comparación: Mucho más que los otros, poco más que los otros, aproximadamente igual que los otros, algo menos que los otros, mucho menos que los otros. 50
  • 51. Para el caso de cualquiera de los tres modelos de respuestas anteriores (dicotómicas, múltiples nominales, múltiples ordinales), siempre es necesario considerar la opción “otra”. Es preciso tener cuidado, porque no es raro que la opción “otra” resulte la respuesta más frecuente. Por otra parte, también es necesario tomar en cuenta las respuestas “no sé”, “sin datos”, “no aplica” o “no quiso contestar” que llegan a ser importantes durante el análisis aunque no sean categorías de la variable en estudio. 51
  • 52. 52 Respuestas abiertas. Con frecuencia se afirma que las respuestas abiertas no son adecuadas para el análisis estadístico, pero esto no es cierto para el caso de las variables cuantitativas que deben registrarse mediante respuestas abiertas, ni para algunas respuestas que cuentan con sistemas de codificación ya establecidos. • En el caso de las variables cuantitativas, la mejor opción es la respuesta abierta. De esta manera, el investigador, o quien responde, podrá registrar el número que corresponda a la pregunta. Por ejemplo: ¿Cuál es su edad en años cumplidos? …………
  • 53. Antes de que tuviéramos las facilidades de cómputo que nos brindan los ordenadores, las tabulaciones tenían que hacerse manualmente y se acostumbraba agrupar las posibles respuestas numéricas. Así, para la edad las opciones de respuesta podrían haber sido las siguientes: ( ) menores de 1 año ( ) 1 a 4 años ( ) 5 a 9 años, ( ) 10 a 14 años. Pero desde que tenemos acceso a computadoras y paquetes estadísticos, lo mejor es registrar el dato como tal para después agruparlo durante el análisis, si es que así lo queremos presentar. 53
  • 54. 54 • Hay un grupo de variables que ya han sido codificadas con anticipación, para las que incluso existen acuerdos internacionales, tal es el caso para la codificación de las enfermedades que está normada por la Clasificación Internacional de Enfermedades, actualmente en su décima revisión. En este tipo de respuestas también se incluyen la descripción de los eventos en que los sujetos resultan lesionados por causa externa, las intervenciones quirúrgicas y las ocupaciones laborales. Al registrar estas variables, no es raro que sea necesario contestar a dos o más preguntas, como en el caso de la ocupación
  • 55. Tomando en cuenta las respuestas anteriores, y con el auxilio del catálogo de ocupaciones que esté utilizando, se podrán asignar códigos específicos a las diferentes ocupaciones laborales de los sujetos que se estudien. En su trabajo, usted es: (seleccione solo una alternativa) Empleado, obrero, jornalero o peón Trabaja por su cuenta Patrón o empresario ¿A que se dedica el negocio, empresa o institución donde trabaja? ¿Cuál es el oficio, puesto o cargo que tienen en el trabajo? 55
  • 56. • Desde una perspectiva cuantitativa, las respuestas abiertas deben evitarse cuando no existan criterios claros de codificación, porque consumen mucho tiempo durante el llenado del instrumento, su manejo posterior es muy complejo y generalmente no son adecuadas para el tratamiento estadístico. Mixta ¿Dónde bota la basura? En el camión recolector ( ) En el basural ( ) En contenedor ( ) Otro: ………………….. 56
  • 57. Clases de escalas: 57 Escalas básica Escalas comparativas Escalas no comparativas Escalas estandarizadas • Nominal • Ordinal • De intervalo • De razón • De comparaciones pareadas • De clasificación • De suma constante • De Guttman • De clases o similitudes • De protocoles verbales • De clasificación continua • Likert • Diferencial semántico • Stapel • Thurstone • Cetscale • Lov • Markov • Serperf • Servqual • Vals • otros
  • 58. O escala de medición grafica, los encuestados califican a los objetos al otorgar una marca en la posición apropiada en una línea que va de un extremo a otro de la variable criterio. Una vez que el encuestado proporciona las calificaciones, el investigador divide la línea en tantas categorías como desee y asigna las puntuaciones con base en las categorías en las que caen las calificaciones. Por lo general son datos que se tratan con datos de intervalo. Diseñadas para medir opinión de entrevistados, presentando un elevado número de alternativas de respuesta a través de un continuo. También puede usarse clasificaciones numéricas. Ejemplo: Indique por favor, marcando sobre esta línea, cual es su opinión respecto a la amabilidad del personal que trabaja en este restaurante: 58 De clasificación o medición continua.
  • 59. Es una escala de medición por reactivos que requiere que los encuestados indiquen el grado de acuerdo o desacuerdo con cada una de las series de afirmaciones sobre los objetos de estimulo. En general, cada reactivo de la escala tiene 5 categorías de respuesta que van de «muy en desacuerdo» a «muy de acuerdo». Empleada habitualmente para medir actitudes. Por ejemplo una escala de 5 categorías puede ser: 59 Escala Likert. Las categorías también pueden ser; 3,5,7,9 u 11. Indique su grado de acuerdo o desacuerdo con las afirmaciones brindadas por el ministro sobre el uso de protectores faciales Muy de acuerdo (-2) De acuerdo (-1) Indiferente (0) En desacuerdo (1) Muy en desacuerdo (2) (1) (2) (3) (4) (5)
  • 60. La Compañía de Seguros “Bolivar “ indica que ofrece respaldo inmediato al asegurado en el momento del siniestro Completamente de acuerdo ____ De acuerdo ____ Ni de acuerdo, ni en desacuerdo ____ En desacuerdo ____ Completamente en desacuerdo ____ 60 Los motores de dos tiempos son Muy de acuerdo (5) De acuerdo (4) Indiferente (3) Desacuerdo (2) Muy en desacuerdo (1) Sencillos de mantener Potentes Económicos
  • 61. Por favor, indique su grado de acuerdo o desacuerdo respecto a las siguientes afirmaciones en relación al gran almacén X: Totalment e de acuerdo Bastante de acuerdo Ni de acuerdo ni en desacuerdo Bastante en desacuerdo Totalmente en desacuerdo se pueden encontrar las últimas novedades 2 1 0 -2 -3 no es únicamente un sitio para ir de compras 2 1 0 -2 -3 cambiar un producto en X es una odisea 2 1 0 -2 -3 en X siempre tienen en cuenta las necesidades del cliente 2 1 0 -2 -3 en X si no quedas satisfecho te devuelven el dinero 2 1 0 -2 -3 61
  • 62. ❑ Es una escala de medición por reactivos de 7 categorías de respuesta con etiquetas bipolares (ejemplo: «frio» y «caliente») que tienen significado semántico. ❑ El criterio no viene definido por una proposición, para la que se indican los grados de acuerdo o desacuerdo, sino por categorías opuestas de una dimensión. ❑ Se analizan tanto las puntuaciones totales como los perfiles obtenidos ❑ Puede usarse para analizar y comparar diversos estímulos de forma simultánea. ❑ Usado preferentemente para recoger información sobre actitudes, «perfiles de imagen» de productos, marcas y compañías Colocar con una X en el espacio que mejor represente su opinión. Escala diferencial semántico. 62
  • 63. ¿La publicidad comparativa para usted es? 1 2 3 4 5 6 7 de ningun interes de gran interes nada creible muy creible no impresiona impresiona mucho nada atractivo muy atractivo nada informativo muy informativo nada claro muy claro no llama la atencion llama la atencion no gusta gusta mucho nada convincente muy convincente nada simpatico muy simpatico 63
  • 64. Es una técnica cuantitativa que obtiene medidas objetivas del significado psicológico que para el sujeto tienen una serie de acontecimientos, objetos o personas por medio de una serie de escalas descriptivas de adjetivos bipolares; pudiéndose de esta manera establecer el grado de semejanza o disparidad entre conceptos. Bueno x Malo Durable x Indurable Fuerte x Debil Moderno x Anticuado Original x Comun 64
  • 65. Ejemplo: señale con una X, el lugar en el que usted ubicaría su opinión acerca de las pandillas juveniles. 65
  • 66. Bueno-Malo Costoso-barato rápido-lento Rápido-Lento Activo-pasivo gigante-enano Fuerte-Débil seguro-peligroso perfecto-imperfecto Grande-pequeño Dulce-amargo agradable-desagradable Bonito-Feo profundo-superficial bendito-maldito Alto-bajo Poderoso-impotente arriba-abajo Claro-oscuro vivo-muerto útil-inútil Caliente-frío Joven-viejo favorable-desfavorable Escalas bipolares: 66
  • 67. Después de que los datos han sido captados en los formatos diseñados para este fin, será necesario revisarlos con cuidado con la intención de identificar si están completos y se han llenado de manera correcta. Esta revisión deberá realizarse, de preferencia, el mismo día en que los datos fueron recogidos. De otra manera, podría ser muy difícil, o imposible, hacer las correcciones pertinentes. Cuando los datos son registrados en un archivo de cómputo, es necesario que la revisión y corrección de datos incluya los que están guardados en estos medios de almacenamiento. Revisión y corrección de datos recogidos 67
  • 68. Aquí las categorías son mutuamente exclusivas y exhaustivas, es decir, cada individuo ha sido puesto en una categoría y en una sola. La proporción esta definida con el número en la categoría (X) entre el número total de casos.(N o n) (muestra o población) Ejemplo. si en una población de 25,000 habitantes se diagnostican 1,500 pacientes con diabetes, la proporción de diabéticos en esa población es: Proporciones: Análisis descriptivo de datos cualitativos a es el numero de elementos con la característica de interés y b es el número de elementos sin la característica de interés 𝑝𝑟𝑜𝑝𝑜𝑟𝑐𝑖𝑜𝑛 = 𝑎 (𝑎 + 𝑏) Capitulo 2 P= 𝑎 𝑁 El valor de una proporción puede variar así de 0 a 1. P= 1500 25000 = 0.06 La proporción de diabéticos e 0.06 68
  • 69. Tabla 01. Distribución proporcional de pacientes atendidos en el consultorios del hospital “X”, Puno 2015 Figura 01. Distribución proporcional de pacientes atendidos en el consultorios del hospital “X”, Puno 2015. Consultorio Nro % Medicina 370 0.43 Pediatría 342 0.40 Otros 152 0.18 Total 864 1.00 0.43 0.40 0.18 0.00 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 Medicina Pediatria Otros Proporcion Consultorio Ejemplo: Existe mayor proporción (0.43) de pacientes atendidos en el consultorio de medicina, seguido de la proporción importante de pacientes atendidos en el consultorio de pediatría (0.40). Una menor proporción de apacientes se atiende en otras especialidades. 69
  • 70. Ejemplo: De un total de 78,178 nacimientos registrados en Costa Rica durante el año 2000, 39,627 correspondieron a madres solteras. La proporción de nacimientos de madres solteras es: La proporción de nacimientos de niños de madres solteras en Costa Rica durante el año 2000 es 0.507. Tabla 2. distribución proporcional de rasgos de personalidad de pacientes con intento suicida atendidos en el hospital regional Manuel Nuñez Butron de Puno-2016. Rasgo Frecuencia P Melancólico normal Melancólico anormal Colérico anormal Colérico normal Flemático 34 29 8 5 4 0.43 0.36 0.10 0.06 0.05 Total 80 1.00 0.43 0.36 0.1 0.06 0.05 0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5 Melancólico normal Melancólico anormal Colérico anormal Colérico normal Flemático Proporcion Rasgos de personalidad 70 Figura 2. Rasgos de personalidad de pacientes con intento suicida atendidos en el hospital regional Manuel Nuñez Butron de Puno 2016.
  • 71. Porcentajes 100 % n X = ESTADO DE DESNUTRICION Nro % Desgastado o malnutrición aguda Achicados o malnutrición crónica Malnutrición crónica aguda 05 43 06 9.26 79.63 11.11 Total 54 100.0 Tabla 03. Evaluación nutricional de preescolares de 2 a 6 años con desnutrición beneficiarios del PANFAR IPSS - Puno 2016. Son las proporciones multiplicadas por 100 9.26 79.63 11.11 0.00 10.00 20.00 30.00 40.00 50.00 60.00 70.00 80.00 90.00 malnutrición aguda malnutrición crónica Malnutrición crónica aguda Porcentaje Evaluación nutricional 9.26 79.63 11.11 malnutrición aguda malnutrición crónica Malnutrición crónica aguda 71 Figura 03. Evaluación nutricional de preescolares de 2 a 6 años con desnutrición beneficiarios del PANFAR IPSS - Puno 2016.
  • 72. Rasgo Frecuencia % Melancólico normal Melancólico anormal Colérico anormal Colérico normal Flemático 34 29 8 5 4 43 36 10 6 5 Total 80 100 Tabla 04. Rasgos de personalidad en pacientes con intento suicida atendidos en el hospital regional Manuel Núñez Butron de Puno 2016 43 36 10 6 5 0 5 10 15 20 25 30 35 40 45 50 Melancólico normal Melancólico anormal Colérico anormal Colérico normal Flemático Porcentaje Rasgos de personalidad 43 36 10 6 5 Melancólico normal Melancólico anormal Colérico anormal Colérico normal Flemático 72 Figura 04. Rasgos de personalidad en pacientes con intento suicida atendidos en el hospital regional Manuel Núñez Butron de Puno 2016
  • 73. Tabla 5. Estado de desnutrición y casos de helmintiasis intestinal en niños preescolares beneficiarios del PANFAR IPSS Puno 2015 CASOS POSITIVOS NEGATIVOS TOTAL Grado de Desnutrición Nro % Nro % Nro % Desgastados o malnut aguda Achicados o malnut. crónica Malnutrición crónica aguda 05 35 06 9.26 64.82 11.11 4 4 - 7.42 7.42 -- 9 39 6 16.67 72.22 11.11 T o t a l 46 85.19 8 14.81 54 100 9.26 64.82 11.11 7.42 7.42 0 0 10 20 30 40 50 60 70 Desgastados o malnut. aguda Achicados o malnut. crónica Malnutrición crónica aguda % Estado Nutricional POSITIVOS NEGATIVOS 73
  • 74. DESARROLLO EDAD DEL NIÑO TOTAL 2 años 3 años Nro % Nro % Nro % RIESGO RETRASO 11 3 30.6 8.3 19 3 52.8 8.3 30 6 83.3 16.7 TOTAL 14 38.9 22 61.1 36 100 Tabla 6. Riesgo en el desarrollo psicomotor de niños de 2 a 3 años según la edad del niño en wawawasis de puno 2013 74
  • 75. AGENCIA Casos AGENCIA A AGENCIA B AGENCIA C Nro % Nro % Nro % Matrimonios Divorciados Novios Madres solteras Otros 63 19 27 13 11 47.3 14.3 20.3 9.8 8.3 88 37 20 32 16 45.5 19.2 10.4 16.6 8.3 41 26 15 21 9 36.6 23.2 13.4 18.8 8.0 T o t a l 133 100.0 193 100.0 112 100.0 Ejemplo. Uso de porcentajes para efectos de comparación: 75 Tabla 8. distribución de casos tratados por tres agencias hipotéticas de servicios domésticos (datos hipotéticos)
  • 76. Ejemplo SPSS. Considérese la siguiente serie, en la cual se presentan algunas características de 20 niños, de 1 a 4 años de edad, que fallecieron ahogados en su hogar en la Zona Metropolitana de Guadalajara. 76
  • 77. 1) Ingrese datos 2) Obtener porcentajes o proporciones Tablas de frecuencias en SPSS Seleccionar variables Ventana de gráficos Finalmente, seleccione Continuar y luego Aceptar 77
  • 78. Resultados : El 25% de los niños de 1 a 4 años de edad ahogados en su hogar son de sexo Femenino y el 75% de sexo Masculino El 45% de los niños de 1 a 4 años de edad se ahogaron en albije, el 20% en otro. 78
  • 79. La serie de datos puede resumirse como se muestra en la tabla siguiente:. Tabla 2. Características de 20 niños, de 1 a 4 años de edad ahogados en su hogar. Guadalajara 2015-2020. 79
  • 80. Uso de las proporciones en epidemiología Las proporciones son muy utilizadas en la práctica de la epidemiología, de tal manera que algunos de sus usos específicos tienen nombres propios, como la prevalencia, la incidencia acumulada, la sensibilidad y la especificidad. Frecuencia de la enfermedad en bioestadística Ejemplos de enfermedad: demencia, tuberculosis, alcoholismo, infección de vías urinarias, diabetes mellitus, etc. En la figura 6 se presenta de manera gráfica, aunque por lo general se piensa en la enfermedad como un estado, también es posible concebirla como un evento. El inicio de un estado de enfermedad es un evento que ocurre en un punto específico del tiempo. Tal es el caso del cambio de sujeto sano a enfermo de diabetes mellitus, hipertensión arterial, cáncer de cérvix, etc. Tradicionalmente, la enfermedad es considerada un estado adverso de salud que caracteriza a un individuo durante un periodo. 80
  • 81. Figura 6. Secuencia salud-enfermedad-salud en un sujeto 81
  • 82. Prevalencia La prevalencia cuantifica la proporción de individuos en la población que tienen algún estado de enfermedad en un instante específico del tiempo, y proporciona una estimación de la probabilidad de que un individuo se encuentre enfermo en algún punto del tiempo. La fórmula para calcular la prevalencia es la siguiente: 𝑝 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑐𝑜𝑛 𝑙𝑎 𝑒𝑛𝑓𝑒𝑟𝑚𝑒𝑑𝑎𝑑 𝑒𝑛 𝑢𝑛 𝑝𝑢𝑛𝑡𝑜 𝑒𝑠𝑝𝑒𝑐í𝑓𝑖𝑐𝑜 𝑑𝑒𝑙 𝑡𝑖𝑒𝑚𝑝𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 𝑒𝑛 𝑒𝑙 𝑚𝑖𝑠𝑚𝑜 𝑔𝑟𝑢𝑝𝑜 𝑦 𝑝𝑢𝑛𝑡𝑜 𝑒𝑠𝑝𝑒𝑐í𝑓𝑖𝑐𝑜 𝑑𝑒 𝑡𝑖𝑒𝑚𝑝𝑜 “punto” puede referirse a un día específico en el calendario, a la edad del sujeto estudiado o a un momento en el curso del tiempo a partir de un evento. Para facilitar la lectura del cociente anterior, se acostumbra multiplicar el resultado por una constante que puede ser 100, 1,000, 10,000 u otra cantidad, con la finalidad de no utilizar fracciones pequeñas al expresar prevalencias. 82
  • 83. Ejemplo. Con frecuencia, los servicios de medicina familiar están interesados en conocer la prevalencia de pacientes enfermos de diabetes en la comunidad donde brindan el servicio médico. Para obtener esa información, el epidemiólogo ordena a su equipo que visite y registre toda la población que cubre su unidad. Como resultado de su investigación, encuentra que en una población de 4,550 habitantes se identificaron 228 sujetos diabéticos. 6/100 habitantes tienen diabetes. La prevalencia de diabetes en esa población es: 83 Prevalencia= 228 4550 = 0.0632 ∗ 100 = 6.3%
  • 84. Incidencia acumulada En contraste con la prevalencia, la incidencia cuantifica el número de eventos de enfermedad que se desarrollan en la población de individuos en riesgo durante un intervalo específico de tiempo. La incidencia acumulada (IA) es la proporción de personas que adquieren la enfermedad durante un periodo específico, y se calcula como: 𝐼𝐴 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑛𝑢𝑒𝑣𝑜𝑠 𝑑𝑒 𝑒𝑛𝑓𝑒𝑟𝑚𝑒𝑑𝑎𝑑 𝑑𝑢𝑟𝑎𝑛𝑡𝑒 𝑝𝑒𝑟𝑖𝑜𝑑𝑜 𝑑𝑒 𝑡𝑖𝑒𝑚𝑝𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 𝑒𝑛 𝑟𝑖𝑒𝑠𝑔𝑜 𝑎𝑙 𝑖𝑛𝑖𝑐𝑖𝑜 𝑑𝑒𝑙 𝑝𝑒𝑟𝑖𝑜𝑑𝑜 𝑑𝑒 𝑒𝑠𝑡𝑢𝑑𝑖𝑜 Esta medida de frecuencia proporciona un estimado de la probabilidad de que un individuo tomado al azar en una población en riesgo (susceptible) desarrolle la enfermedad durante un periodo específico. A esta probabilidad también se le conoce como riesgo. El periodo de observación es arbitrario y depende de las características evolutivas de la enfermedad. Al igual que con la prevalencia, la IA puede multiplicarse por una constante para facilitar su lectura e interpretación. 84
  • 85. Es necesario señalar que una persona se encuentra “en riesgo” de una enfermedad cuando es biológicamente posible que desarrolle la enfermedad en un futuro inmediato. “En riesgo” significa que el sujeto es susceptible a la enfermedad. En otras palabras, la probabilidad de que desarrolle una enfermedad no es igual a cero. En términos epidemiológicos, “en riesgo” no significa “en mayor riesgo” en relación con otra persona. ❑ La persona tiene la enfermedad. Alguien que sufra de diabetes mellitus no se encuentra en riesgo de desarrollarla nuevamente. ❑ La persona ha adquirido inmunidad. Un niño que ya enfermó de sarampión no lo padecerá de nuevo. ❑ La persona no tiene la capacidad biológica de desarrollar la enfermedad. Los varones nunca sufrirán cáncer uterino. ❑ Durante algún tiempo de vida la persona fue susceptible de desarrollar la enfermedad, pero ésta fue abolida por algún procedimiento particular. La mujer a la que se le ha practicado histerectomía no puede desarrollar cáncer uterino. Las Razones frecuentes de que alguien no se encuentre en riesgo son: 85
  • 86. Ejemplo. Si se toma una cohorte de 12 sujetos y se le observa durante cinco años (sin que sus elementos se pierdan para el estudio y sin que dejen de estar en riesgo durante el periodo del estudio), y de ellos 5 desarrollan la enfermedad, entonces la IA será: si se toma un individuo de los observados al inicio del estudio, la probabilidad de que en el transcurso de cinco años desarrolle la enfermedad es de 0.42, o 42%. 86 𝐼𝑛𝑐𝑖𝑑𝑒𝑛𝑐𝑖𝑎 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎 = 5 12 = 0.42 ∗ 100 = 42%
  • 87. Figura 7. Eventos y estados de enfermedad en un grupo de sujetos. La prevalencia y la incidencia son dos aspectos de un mismo fenómeno. Para entenderlas, hay que poner atención a la figura 7, en la cual se representa a 13 sujetos en observación durante cinco años. Al inicio del estudio, todos los sujetos se encuentran sanos y todos ellos tienen el riesgo (son susceptibles) de contraer la enfermedad. Se debe convenir que, en esa figura, la cruz representa el inicio de la enfermedad o “evento”; la línea gruesa, el tiempo durante el cual el sujeto está enfermo o “estado”; y el cuadro, el momento en que el sujeto sale del estudio porque muere. Si se hace un corte después de un año de observación, se encuentra que en ese “punto específico de tiempo” existen dos enfermos entre los 13 sujetos observados. Así, la prevalencia es igual a 2/13 = 0.15, mientras que la incidencia acumulada desde el inicio del estudio es 2/13 = 0.15 en un año. En este caso, la prevalencia y la incidencia son semejantes, pero no siempre tiene que ser así, ya que para el cuarto año han fallecido cuatro sujetos y sólo quedan nueve, de los cuales tres están enfermos. Por tanto, la prevalencia es de 3/9 = 0.33, mientras que la incidencia acumulada es de 7/13 = 0.54 en cuatro años 87
  • 88. Sensibilidad y especificidad • Sensibilidad. Probabilidad de clasificar correctamente a aquellos que tienen la característica de interés. • Especificidad. Probabilidad de clasificar correctamente a aquellos que no tienen la característica de interés. Es la probabilidad de clasificar correctamente a un individuo enfermo, es decir, la probabilidad de que para un sujeto enfermo se obtenga en la prueba un resultado positivo. La sensibilidad es, por lo tanto, la capacidad del test para detectar la enfermedad 88 Es la probabilidad de clasificar correctamente a un individuo sano, es decir, la probabilidad de que para un sujeto sano se obtenga un resultado negativo. En otras palabras, se puede definir la especificidad como la capacidad para detectar a los sanos.
  • 89. Cuando analizamos en una población la presencia de una enfermedad, nos ayudamos de una prueba diagnóstica para determinar si los pacientes examinados presentan la enfermedad (POSITIVOS) o no la poseen (NEGATIVOS). Sin embargo es muy poco probable que la prueba funcione de manera perfecta en todas las circunstancias, por ello existe la posibilidad de que algunos pacientes que no poseen la enfermedad sean clasificados como positivos, ellos serán considerados como FALSOS POSITIVOS, otra posibilidad es que algunos pacientes que tengan la enfermedad sean detectados como no afectados, estos pacientes se denominan FALSOS NEGATIVOS. PATRON DE REFERENCIA (Gold Standar) Resultado de la Prueba Con enfermedad Sin Enfermedad Positivo Verdaderos Positivos a Falsos Positivos b Negativo Falsos Negativos c Verdaderos Negativos d 89
  • 90. En esta tabla se pueden determinar: 1.Sensibilidad: Verdaderos Positivos (a) Verdaderos Positivos(a)+Falsos Negativos(c) Es decir: el porcentaje de personas que efectivamente pueden ser clasificadas como enfermas, o la probabilidad de detectar a un paciente con la enfermedad. 2.Especificidad: Verdaderos Negativos(d) Verdaderos Negativos(d)+Falsos Positivos(b) En otras palabras, el porcentaje de personas sin la enfermedad y que están correctamente clasificadas, o la probabilidad de detectar a una persona que no posee la enfermedad 90
  • 91. 91
  • 92. 1. Mediante un procedimiento de clasificación “perfecto” (generalmente conocido como “gold standard” o “estándar de oro”), los sujetos son clasificados según presenten o no la característica (en términos clínicos, generalmente se clasifican como enfermos y no enfermos) 2. Luego, estos mismos sujetos son clasificados mediante un instrumento menos perfecto (aunque más sencillo, económico o menos invasivo) en dos grupos según presenten o no la característica (en términos clínicos, generalmente se clasifican como “positivos” o “negativos” a la prueba). Uno esperaría que todos aquellos que tienen la característica (según se midió con el “estándar de oro”) resulten “positivos”, y que aquellos que no tienen la característica (según se midió con el “estándar de oro”) resulten “negativos”. Para su cálculo, procedemos de la siguiente manera: 3. Dado que el segundo criterio de clasificación es imperfecto, algunos sujetos que realmente presentan la característica (según el “estándar de oro”) serán clasificados incorrectamente como que no la tienen (o “negativos”), mientras que algunos que realmente no presentan la característica (según el “estándar de oro”) serán clasificados incorrectamente como que sí la tienen (o “positivos”). 92
  • 93. 4. Para el cálculo de la sensibilidad y la especificidad, generalmente, acomodamos los datos como: Clasificación con estándar de oro Prueba alternativa Presente Ausente Positivo a b Ausente c d a+c b+d 5. Concluimos nuestro cálculo con las dos fórmulas que se muestran a continuación. Sensibilidad = 𝑎 𝑎+𝑐 Especificidad = 𝑑 𝑏+𝑑 Cuando la sensibilidad es perfecta, el 100% de los que fueron clasificados con la característica mediante el “estándar de oro” también son clasificados mediante el segundo criterio. Cuando eso no ocurre, la sensibilidad es menor a 100%. Lo mismo ocurre con la especificidad para los que fueron clasificados por el “estándar de oro” sin la característica. 93
  • 94. Ejemplo. Supongamos que tenemos interés en evaluar la validez de una prueba diagnóstica que es más rápida y económica que el “estándar de oro”. Para hacerlo, seleccionamos dos grupos: uno de enfermos y otro de no enfermos, ambos clasificados mediante el uso del “estándar de oro”. Las frecuencias de cada categoría se muestran en el cuadro. Clasificación con estándar de oro Prueba alternativa Enfermo Sano Positivo 85 10 Negativo 15 190 100 200 94 𝑆𝑒𝑛𝑠𝑖𝑏𝑖𝑙𝑖𝑑𝑎𝑑 = 85 100 = 0.85 ∗ 100 = 85% Especificidad= 190 200 = 0.95 ∗ 100 = 95% Es la probabilidad de clasificar correctamente a un individuo enfermo Es la probabilidad de clasificar correctamente a un individuo sano
  • 95. Ejemplo. Consideremos los datos de un estudio en el que se incluyó a 2,641 pacientes con sospecha de cáncer prostático que acudieron a una consulta de Urología durante un periodo de tiempo determinado. Durante su exploración, se recogió el resultado del tacto rectal realizado a cada uno de estos pacientes, según fuese éste normal o anormal, y se contrastó con el posterior diagnóstico obtenido de la biopsia prostática. Los datos del estudio y los resultados obtenidos se muestran en la Tabla. Se encontraron en total 1,121 casos de cáncer, lo cual representa un 42.45% del total de sujetos estudiados. La sensibilidad del tacto rectal para detectar cáncer fue de 56,56% (634/1121) y la especificidad de 82,3% (1251/1520). Así, el tacto fue anormal en un 56,56% de los casos de cáncer prostático y normal en un 82,3% de los casos que presentaron finalmente otras patologías. Esto significa que un 100-56.56=43.44% de los pacientes que efectivamente tenían cáncer presentaban tactos normales. Claramente ello indica la necesidad de utilizar otros marcadores más sensibles, como el PSA o sus derivados, para poder establecer el diagnóstico de forma más precisa. Tabla 2. Resultados de la exploración y biopsia prostática de una muestra de pacientes con sospecha de cáncer de próstata Resultado del tacto rectal Resultado de la biopsia prostática Cáncer Patología benigna Total Anormal 634 269 903 Normal 487 1251 1738 Total 1121 1520 2641 𝑠𝑒𝑛𝑠𝑖𝑏𝑖𝑙𝑖𝑑𝑎𝑑 = 634 634 + 486 = 634 1121 = 0.5656 = 56.56% 𝑒𝑠𝑝𝑒𝑐𝑖𝑓𝑖𝑐𝑖𝑑𝑎𝑑 = 1251 269 + 1251 = 1251 1520 = 0.8230 = 82.30% 𝑣𝑎𝑙𝑜𝑟 𝑝𝑟𝑒𝑑𝑖𝑐𝑡𝑖𝑣𝑜 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑜 = 634 634 + 269 = 634 903 = 0.7021 = 70.21% 𝑣𝑎𝑙𝑜𝑟 𝑝𝑟𝑒𝑑𝑖𝑐𝑡𝑖𝑣𝑜 𝑛𝑒𝑔𝑎𝑡𝑖𝑣𝑜 = 1251 487 + 1251 = 1251 1738 = 0.7198 = 71.98% 𝑅𝑎𝑧𝑜𝑛 𝑑𝑒 𝑣𝑒𝑟𝑜𝑠𝑖𝑚𝑖𝑙𝑖𝑡𝑢𝑑 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑎 = 𝑠𝑒𝑛𝑠𝑖𝑏𝑖𝑙𝑖𝑑𝑎𝑑 1 − 𝑒𝑠𝑝𝑒𝑐𝑖𝑓𝑖𝑐𝑖𝑑𝑎𝑑 = 0.5656 1 − 0.8230 = 3.19 𝑅𝑎𝑧𝑜𝑛 𝑑𝑒 𝑣𝑒𝑟𝑜𝑠𝑖𝑚𝑖𝑙𝑖𝑡𝑢𝑑 𝑛𝑒𝑔𝑎𝑡𝑖𝑣𝑎 = 1 − 𝑠𝑒𝑛𝑠𝑖𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑒𝑠𝑝𝑒𝑐𝑖𝑓𝑖𝑐𝑖𝑑𝑎𝑑 = 1 − 0.5656 0.8230 = 0.53 95
  • 96. Ejercicios. 1) Dentro del Programa de Salud Escolar, se realiza un examen de salud a los escolares de 5º de Educación Primaria para detectar alumnos con anemia mediante la determinación de hemoglobina en sangre. Una hemoglobina de 12 gramos (o menos) en 100 ml de sangre, fue considerada como prueba positiva para la detección de anemia. Los resultados de dicho examen de salud aplicados a 500 escolares se muestran en la siguiente tabla: Alumnos con anemia Alumnos sanos total Prueba + Hb ≤ 12 g/100 ml. 95 25 120 Prueba - Hb > 12 g/100 ml. 10 370 380 Total 105 395 500 a) Calcule la sensibilidad y la especificidad. Explique los resultados obtenidos. b) Si el punto de corte del test se modifica a una Hb de 10 g/100 ml de sangre, la prueba sale positiva en 100 casos, de los cuales 85 son verdaderos anémicos. Con este nuevo punto de corte vuelva a calcular la sensibilidad y la especificidad. Valore las diferencias con el anterior supuesto. 96
  • 97. 2) En un ensayo clínico, se quiere determinar la sensibilidad de un método diagnóstico. Los resultados obtenidos son: Enfermos Sanos Total Positivo 72 33 105 Negativo 12 83 95 total 84 116 200 Estimar la sensibilidad y especificidad con una confianza del 95%. 97 Tabla de contingencia DIAGNOST * GRUPO
  • 98. Razones La razón de un número a con respecto a otro número b se define como a/b R = a ÷ b = 𝑎 𝑏 Cuando la serie que se está examinando consta sólo de dos categorías, se pueden utilizar las razones para resumir la información. Para ello, se divide la totalidad de individuos que tengan una característica (de preferencia el grupo de mayor tamaño) entre el grupo que tenga la otra característica. En la que R representa la razón, a simboliza el número de elementos con la característica de interés y b, el número de elementos con una característica diferente. Hay que notar que a + b no necesariamente son el total del universo. 98
  • 99. Razón de varones a mujeres es: 3/2 o 3:2 Frente al total: de cada 5 personas se da un promedio de 3 varones y dos mujeres, o la proporción de varones es 0.6 (3/5) frente a las mujeres. Usando la unidad: 3/2 = 1.5, Por cada mujer 1.5 varones. Ejemplo: Consideremos: se tiene 3 varones y 2 mujeres. Varones 3 Mujeres 2 Total 5 99
  • 100. Ejemplo, Se han registrado los siguientes indicadores en Costa Rica: Año 1990: 70,048 nacimientos Año 2000: 78,178 nacimientos y 14,630 defunciones • Calcular la razón de nacimientos en el año 2000 con respecto al año 1990 • Calcular la razón de nacimientos en el año 2000 con respecto al número de defunciones del año 2000. La razón de nacimientos en el año 2000 con respecto a los nacimientos en el año 1990 es: Por cada nacimiento ocurrido en 1990, en el año 2000 ocurrieron aproximadamente 1.12 nacimientos. Al multiplicar el valor de la razón por 100, en Costa Rica, por cada 100 nacimientos en 1980, para el año 2000 se presentaron 112 nacimientos. La razón del número de nacimientos al número de defunciones para el año 2000 : Quiere decir que, en Costa Rica, por cada 100 defunciones se produjeron 534 nacimientos durante el año 2000. 100
  • 101. Ejemplo: Según el sexo del niño, por cada niña que se asfixia por inmersión en el hogar, hay tres niños que sufren ese accidente mortal. En este ejemplo, a = 15, b = 5 y a/b = 3 es la razón. Ejemplo: Según el depósito en que se ahogó, por cada menor que se asfixia por inmersión en un balde o tina, hay tres que pierden la vida en un aljibe. En este ejemplo, a = 9, b = 3 y a/b = 3 es la razón. Sexo de niños de 1 a 4 años de edad ahogados en su hogar. Zona metropolitana de Guadalajara 1991-1993 sexo Frecuencia Razón Masculino Femenino 15 (a) 5 (b) 15/5=3 Deposito de agua en los que se ahogaron niños de 1 a 4 años de edad. Zona metropolitana de Guadalajara 1991-1993 Depósito Frecuencia Razón Aljibe Balde/tina 9 (a) 3 (b) 9/3=3 101
  • 102. Densidad de incidencia Para el cálculo de una razón no siempre se utiliza información de dos grupos diferentes. También podemos utilizar en el numerador y el denominador información procedente de un mismo grupo, pero de diferente naturaleza. Tal es el caso de la densidad de incidencia (DI), en la que el numerador es semejante a la incidencia acumulada y el denominador es la suma del tiempo que cada individuo ha permanecido en observación (“tiempo persona”) y en riesgo de enfermar. Su fórmula es: 𝐷𝐼 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑛𝑢𝑒𝑣𝑜𝑠 𝑑𝑒 𝑒𝑛𝑓𝑒𝑟𝑚𝑒𝑑𝑎𝑑 𝑑𝑢𝑟𝑎𝑛𝑡𝑒 𝑢𝑛 𝑝𝑒𝑟𝑖𝑜𝑑𝑜 𝑑𝑒 𝑡𝑖𝑒𝑚𝑝𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑡𝑖𝑒𝑚𝑝𝑜 − 𝑝𝑒𝑟𝑠𝑜𝑛𝑎 𝑑𝑒 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖ó𝑛 Al presentar la densidad de incidencia es esencial que se especifique la unidad de tiempo; esto es, si la tasa representa el número de casos por día-persona, mes-persona, año-persona, o alguna otra medida de tiempo-persona. La densidad de incidencia nos habla del cambio potencial instantáneo del estado de enfermedad de una población en una unidad de tiempo. 102
  • 103. A diferencia de la incidencia acumulada, que es una proporción y puede interpretarse como una probabilidad, la densidad de incidencia dirige su atención al número de eventos que se presentan en una unidad de tiempo (y de manera inversa al tiempo que transcurre entre evento y evento). Esto se grafica en la figura, donde el tiempo-persona en riesgo se refiere al tiempo que tuvieron que acumular los sujetos en estudio para registrar los eventos de interés. 103
  • 104. Ejemplo. En una unidad de terapia intensiva, están interesados en conocer la incidencia de muertes en pacientes que ingresan con infarto de miocardio. Después de 10 días se han registrado los datos del cuadro. Con los datos anteriores no es posible calcular una incidencia acumulada, ya que los periodos de observación no son los mismos en todos los sujetos, pero se puede calcular una densidad de incidencia. Para ello, se toma el total de eventos de interés observados (tres defunciones) y se divide entre el tiempo-persona observado durante el cual se presentaron esos eventos (21 días-persona). Así, la densidad de incidencia es: 3 ÷ 21 = 0.143 días-persona o 0.143 defunciones por cada día de estancia acumulada por el grupo Pacientes con infarto de miocardio observados en terapia intensiva Paciente i Tiempo de observación en días a partir del ingreso hasta la alta de terapia intensiva Motivo de egreso 1 2 3 4 5 9 5 3 3 1 defunción mejoría mejoría defunción defunción 104
  • 105. COMPARACIÓN DE GRUPOS Con frecuencia, en el campo de las ciencias de la salud se tiene la necesidad de comparar grupos entre sí. Cuando el tamaño de los grupos a comparar es idéntico, es posible valerse de frecuencias absolutas. Sin embargo, lo más frecuente es que los grupos sean diferentes en cuanto al tamaño del grupo en estudio. En estas ocasiones, el uso de frecuencias relativas (proporciones o razones) facilita la comparación mediante una simple sustracción. Es preciso notar que cuando las frecuencias relativas (proporciones o razones) de dos grupos son iguales, la diferencia es de cero, mientras que cuando son diferentes, el resultado es mayor o menor que cero. 105
  • 106. Supóngase que se sospecha y existe interés en probar la hipótesis de que en una escuela secundaria los alumnos varones se lesionan más frecuentemente que sus compañeras. Para ello, se observa a los estudiantes durante un año escolar y, al final de él, se encuentra que el número de lesionados es semejante para ambos grupos: 15 lesionados en el transcurso del año. Estas frecuencias absolutas son de valor, pero pueden conducir a errores graves de interpretación, por ejemplo, si de 300 alumnos que estudian en el plantel sólo 100 fueran varones. En este caso, el uso de una proporción permitirá evaluar la frecuencia con que se presentan las lesiones según el sexo. 106 Ejemplo. La incidencia de lesionados en el grupo de varones es de 15/100 = 0.15 = 15% La incidencia de lesionados en el grupo de mujeres es de 15/200 = 0.08 = 8% La diferencia sería de 0.15 - 0.08 = 0.07. Lo anterior indicaría que en esa escuela los varones se accidentan más que las mujeres.
  • 107. Riesgo atribuible En epidemiología, a esta diferencia se le conoce como riesgo atribuible (RA), y proporciona información acerca del efecto absoluto de la exposición o exceso de riesgo de la característica de interés en aquellos que pertenecen a un grupo con una característica específica (expuestos) en comparación con aquellos que no la tienen (no expuestos). Ayuda a responder a la pregunta: si se ha inferido que la exposición causa la enfermedad, entre las personas expuestas ¿qué cantidad de la característica de interés (quizá una enfermedad) se debe a la exposición? Esta medida se define como la diferencia entre la incidencia de los expuestos y los no expuestos, y se calcula mediante: 𝐼𝑒-𝐼𝑜 Donde Ie es la incidencia de expuestos (medida como incidencia acumulada o como densidad de incidencia), mientras que Io es la incidencia de no expuestos (medida también como incidencia acumulada o como densidad de incidencia). Dos prevalencias también pueden compararse mediante la sustracción, aunque el resultado se conoce como diferencia de prevalencias y no como riesgo atribuible. 107
  • 108. Riesgo relativo La razón también es un instrumento útil para comparar dos grupos. Para su interpretación se debe tomar en cuenta el grupo a comparar (el numerador) en referencia con el grupo de comparación (el denominador). Cuando ambos grupos son iguales, el resultado siempre es igual a uno. Así, 9 ÷ 9 = 3 ÷ 3 = 1 indica que el grupo a comparar es igual al grupo de comparación o referencia. En otras palabras, por cada elemento en el grupo a comparar existe otro en el grupo de comparación. Cuando el numerador es mayor que el denominador, como en 9 ÷ 3 = 3, el resultado siempre será mayor de 1. Si éste es el caso, el resultado indica cuántos elementos (y fracción de ellos) en el grupo a comparar existen por cada elemento en el grupo de referencia. Por otra parte, si el numerador es menor que el denominador, 3 ÷ 9 = 0.33, el resultado expresa qué fracción de un elemento, en el grupo a comparar, existe por cada elemento en el grupo de comparación. En epidemiología, a este cociente se le conoce como riesgo relativo (RR), y estima la magnitud de una asociación entre exposición y enfermedad e indica la probabilidad del grupo expuesto de desarrollar la enfermedad en relación con aquellos que no están expuestos. Ayuda a responder a la pregunta: ¿la exposición causa la enfermedad? Esta medida se define como el cociente de la incidencia de los expuestos entre la incidencia de los no expuestos, y se calcula mediante: 108 𝐼𝑒 𝐼𝑜
  • 109. En la cual Ie es la incidencia de expuestos (medida como incidencia acumulada o como densidad de incidencia) e Io es la incidencia de no expuestos (medida también como incidencia acumulada o como densidad de incidencia). Dos prevalencias también pueden compararse mediante una razón, aunque el resultado se conoce como razón de prevalencias y no como riesgo relativo. Una interpretación alternativa del riesgo relativo consiste en restar 1 al resultado (cociente) y multiplicarlo por 100. De esta manera, el resultado se interpreta como el porcentaje que el grupo a comparar se encuentra por arriba o por abajo en relación con el grupo de referencia. Cuando los grupos son idénticos, el resultado es igual a 0% [(1 - 1) x 100 = 0%]. Si el numerador es mayor que el denominador, el resultado es superior a 0% [(3 – 1) x 100 = 200%], mientras que lo contrario resulta en un valor negativo [(0.33 – 1) x 100 = –67%]. Si se toma al grupo de comparación como 100%, el resultado mediante el procedimiento anterior indica, de manera porcentual, en qué magnitud porcentual el grupo a comparar se encuentra por arriba o por abajo del grupo de referencia. 109
  • 110. Ejemplo. La comparación de grupos que realizamos mediante la diferencia de proporciones en el ejemplo de estudiantes lesionados, también puede efectuarse mediante una razón entre proporciones, donde: 110 RR = 1 No hay Asociación RR > 1 Hay Asociación al Factor de Riesgo RR < 1 Hay Asociación al Factor de Protección Era: La incidencia de lesionados en el grupo de varones es de 15/100 = 0.15, mientras que para las mujeres es de 15/200 = 0.08. Entonces, 0.15 ÷ 0.08 = 1.88 Nos indica que existen 1.88 hombres lesionados por cada mujer lesionada, o también que existen 88% más hombres lesionados que mujeres lesionadas
  • 111. 111 En un estudio prospectivo de cohorte se desea determinar cuál es RR para desarrollar cáncer de pulmón entre fumadores y no fumadores. Los datos se muestran en la siguiente tabla Total Si CA pulmón No CA pulmón Fuman 5 (a) 21 (b) 26 No fuman 8 (c) 82 (d) 90 Total 13 103 116 Tabla Individuos con y sin consumo de tabaco que desarrollan cáncer de pulmón RR = 𝑎 𝑎 + 𝑏 𝑐 𝑐 + 𝑑 = 5 26 8 90 = 2.16 El riesgo de desarrollar cáncer de pulmón entre fumadores es 2,2 veces mayor comparado con las personas que no fuman entre la población de donde se extrajo la muestra para el estudio. RR> 1 Hay Asociación al Factor de Riesgo Ejemplo.
  • 112. 112 IC del 95% para el riesgo relativo es: 𝐿𝑜𝑔𝑁𝑅𝑅 − 𝑍 ൗ 𝛼 2 ∗ 1 − 𝑝1 𝑛1𝑝1 + 1 − 𝑝2 𝑛2𝑝2 𝑎 𝐿𝑜𝑔𝑁𝑅𝑅 + 𝑍 ൗ 𝛼 2 ∗ 1 − 𝑝1 𝑛1𝑝1 + 1 − 𝑝2 𝑛2𝑝2 Donde Reemplazando 0.77− 1.96 ∗ 0.5248 𝑎 0.77 + 1.96 ∗ 0.5248 𝐿𝑜𝑔𝑁RR = 𝐿𝑜𝑔𝑁 2.16 = 0.77 𝑍 Τ 𝛼 2 = 𝑍 Τ 0.05 2 = 𝑍0.025 = 1.96 (tabla normal) -0.2585 a 1.7987 e=2.718281 Deshaciendo los logaritmos 𝐸𝑥𝑝(−0.2585) = 0.772 𝐸𝑥𝑝(1.7987)=6.042 IC=[0.772 a 6.042] “Con un nivel de significancia del 0.05% el riesgo de desarrollar cáncer de pulmón entre fumadores fue 2,2 veces mayor comparado con las personas que no fuman en la población de donde se extrajo la muestra; sin embargo, el intervalo de confianza para esta estimación incluye el valor de uno, lo cual significa que la estimación no es completamente precisa” 1 − 𝑝1 𝑛1𝑝1 + 1 − 𝑝2 𝑛2𝑝2 = 1 − ( 5 26 ) (5 ∗ 5 26 ) + 1 − ( 8 90 ) (8 ∗ 8 90 ) = 0.5248 Los expuestos tienen un riesgo que es entre 0.77 y 6.04 veces superior de los no expuestos.
  • 113. 113 Un trabajo compara la morbimortalidad perioperatoria en un grupo que recibió un bloqueador beta- adrenérgico en el perioperatorio comparado con la de un grupo control que recibió cuidados estándares. Dos de 61 pacientes en el grupo con bisoprolol y 9 de 62 pacientes sin el bloqueador beta-adrenérgico murieron de causa cardiaca: Ejemplo: Riesgo de morir por una causa cardiaca de los casos : 2 61 = 0.0328 ∗ 100 = 3.28% Riesgo de morir por una causa cardiaca de los controles: 9 62 = 0.1452 ∗ 100 = 14.52% Riesgo relativo: La información puede leerse como que el riesgo de muerte de causa cardiaca en los pacientes tratados con bisoprolol se redujo al 22,6% del riesgo de los pacientes con un cuidado estándar. RR = 𝑎 𝑎 + 𝑏 𝑐 𝑐 + 𝑑 = 2 61 9 62 = 0.226 Criterio de efecto Total Muertos Vivos Criterio de exposición Casos 2 (a) 59 (b) 61 (a+b) Controles 9 (c) 53 (d) 62 (c+d) Total 11 (a+c) 112(b+d) 123 RR< 1 Hay Asociación al Factor de protección
  • 114. 114 IC del 95% para el riesgo relativo es: 𝐿𝑜𝑔𝑁𝑅𝑅 − 𝑍 ൗ 𝛼 2 ∗ 1 − 𝑝1 𝑛1𝑝1 + 1 − 𝑝2 𝑛2𝑝2 𝑎 𝐿𝑜𝑔𝑁𝑅𝑅 + 𝑍 ൗ 𝛼 2 ∗ 1 − 𝑝1 𝑛1𝑝1 + 1 − 𝑝2 𝑛2𝑝2 Donde Reemplazando -1.4872 − 1.96 ∗ 0.7607 𝑎 − 1.4872 + 1.96 ∗ 0.7607 𝐿𝑜𝑔𝑁RR = 𝐿𝑜𝑔𝑁 0.226 = −1.4872 𝑍 Τ 𝛼 2 = 𝑍 Τ 0.05 2 = 𝑍0.025 = 1.96 (tabla normal) -2.978 a 0.00365 e=2.718281 Deshaciendo los logaritmos 𝐸𝑥𝑝(−2.978) = 0.051 𝐸𝑥𝑝(0.00365)=1.0036 IC=[0.051 a 1.0036] 1 − 𝑝1 𝑛1𝑝1 + 1 − 𝑝2 𝑛2𝑝2 = 1 − ( 2 61 ) (2 ∗ 2 61 ) + 1 − ( 9 61 ) (9 ∗ 9 62 ) = 0.7607
  • 115. Tablas de contingencia Las tablas de contingencia son arreglos ordenados de frecuencias que se acomodan en celdas definidas por columnas y renglones. El arreglo de frecuencias facilitan algunos procedimientos estadísticos utilizados frecuentemente, como el cálculo de riesgo atribuible, riesgo relativo, chi- cuadrada y prueba exacta de Fisher, por mencionar cuatro de los más frecuentes. La tabla de contingencia más utilizada es la conocida como 2 x 2, que consiste en una tabla con dos hileras y dos columnas donde los sujetos se clasifican según dos criterios, cada uno de los cuales ocurre en dos niveles. Tabla de contingencia 2 x 2 115
  • 116. Ejemplo. Las frecuencias observadas del ejemplo de estudiantes lesionados pueden presentarse en una tabla de contingencia 2x2. El cuadro muestra los datos en una tabla de este tipo. 116 Mientras que la incidencia de lesiones en mujeres es: A partir de este arreglo, la incidencia de lesiones en hombres es: 𝐼𝑛𝑐𝑖𝑑𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑙𝑒𝑠𝑖𝑜𝑛𝑒𝑠 𝑒𝑛 ℎ𝑜𝑚𝑏𝑟𝑒𝑠 = 𝑎 𝑎 + 𝑏 = 15 100 𝐼𝑛𝑐𝑖𝑑𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑙𝑒𝑠𝑖𝑜𝑛𝑒𝑠 𝑒𝑛 𝑚𝑢𝑗𝑒𝑟𝑒𝑠 = 𝑐 𝑐 + 𝑑 = 15 200 Lesionados Total Sexo Si No Hombres 15 85 100 Mujeres 15 185 200 Total 30 270 300
  • 117. Odds ratio El riesgo relativo supone que el muestreo en la población ha sido realizado de manera aleatoria y que posteriormente los sujetos han sido clasificados según dos variables dicotómicas (diseño transversal analítico), o bien que los grupos muestreados han sido formados atendiendo a su nivel de exposición (diseño de cohortes). En epidemiología, es frecuente que los grupos a comparar sean formados a partir de la condición de enfermedad que se desea estudiar (diseño de casos y controles). En estas circunstancias, no es factible estimar el riesgo relativo de manera directa. No obstante, cuando se puede mantener el supuesto de que la frecuencia de la enfermedad que se estudia está por debajo del 10%, se puede utilizar una aproximación al riesgo relativo conocida como odds ratio. Cuando, al comparar dos grupos, las frecuencias se presentan en un cuadro 2 x 2, el odds ratio se puede calcular utilizando la fórmula siguiente: Odds ratio = 𝑎𝑑 𝑏𝑐 117 Criterio de efecto Total Si No Criterio de exposición Si a b a+b No c d c+d Total a+c b+d a+b+c+d
  • 118. Ejemplo. La expresión odds ratio se ha traducido al español de diferentes formas, entre las que se pueden mencionar “razón de productos cruzados”, “razón de momios”, “oportunidad relativa” y “razón de posibilidades”. Utilizando las frecuencias que se presentan en la tabla, el odds ratio será igual a: 118 Lesionados Total sexo Si No Hombres 15 85 100 Mujeres 15 185 200 Total 30 270 300 𝑜𝑑𝑑𝑠 = 15 ∗ 185 15 ∗ 85 = 1775 1275 = 2.18 que nos sugiere que existen 2.18 hombres lesionados por cada mujer lesionada. El resultado no es igual al calculado con el riesgo relativo (de 1.88), pero es una buena aproximación cuando el diseño de muestreo no nos permite calcularlo, y los dos resultados se aproximarán en la medida en que el fenómeno estudiado sea más raro.
  • 119. 119 Intervalo de confianza 𝐿𝑜𝑔𝑁𝑂𝑅 − 𝑍 ൗ 𝛼 2 ∗ 𝜎𝐿𝑜𝑔𝑂𝑅 𝑎 𝐿𝑜𝑔𝑁𝑂𝑅 + 𝑍 ൗ 𝛼 2 ∗ 𝜎𝐿𝑜𝑔𝑂𝑅 𝜎𝐿𝑜𝑔𝑂𝑅 = 1 𝑎 + 1 𝑏 + 1 𝑐 + 1 𝑑 = 1 15 + 1 85 + 1 15 + 1 185 = 0.3879 𝐿𝑜𝑔𝑁𝑂𝑅 = 𝐿𝑜𝑔𝑁 2.18 = 0.7793 07793. − 1.96 ∗ 0.3879 𝑎 07793. + 1.96 ∗ 0.3879 𝑍 Τ 𝛼 2 = 𝑍 Τ 0.05 2 = 𝑍0.025 = 1.96 (tabla normal) Escriba aquí la ecuación. 0.0189 𝑎 1.5397 Deshaciendo los logaritmos 𝐸𝑥𝑝(0.0189) = 1.5397 𝐸𝑥𝑝(1.5397)=1.0036 IC=[1.02 a 4.66] Por lo que se concluye que los expuestos tienen una razón enfermo/sano que es entre 1.02 y 4.66 veces superior.
  • 120. A continuación se muestran los resultados del análisis de riesgo a partir de los datos de bajo peso al nacer y tabaquismo (Los datos se presenta en la diapositiva 109) 120 Tabaquismo Bajo peso al nacer Riesgo relativo IC 95% si no No 26 82 1.0 Si, Pasivo 38 92 1.2 0.8 a 1.9 Si, fumadora de cigarrillos 70 92 1.8 1.2 a 2.6
  • 121. Ejemplo. población del departamento de Puno. AÑO CANTIDAD (millones) 1940 1961 1972 1981 1993 646385 727309 813172 910377 1103689 Calcular: a) El incremento absoluto de 1940 a 1993 b) El incremento porcentual de 1940 a 1993? c) La tasa de crecimiento total. Incremento porcentual (cambio porcentual) Incremento Absoluto 1940-1993 : 1 103 689 - 646 385 = 457 304 100 1 x No No N IP − = El incremento porcentual de 1940 a 1993 % 74 . 70 100 * 646385 646385 1103689 = − El cambio porcentual es un cociente cuyo numerador se constituye con el cambio entre dos momentos y el denominador es un periodo base. 100 1 x No No N IP − = 121
  • 122. N N P P P P r * 2 * 0 1 0 1 + − = 99 . 0 100 * 53 2 * 646385 1103689 646385 1103689 = + − La tasa de crecimiento total N = Número de periodos (años, semestres, etc.), k = Constante (generalmente 100) 122
  • 123. Los datos que se presentan en el cuadro corresponden al número de casos de hepatitis viral notificados: La primera columna corresponde al año de notificación. La segunda, al número de casos notificados. En la tercera columna se señala el cambio porcentual del número de notificaciones de cada año comparándolo con el anterior. Si esto se quisiera expresar en palabras, se diría: en 1994 se reportaron 16,918 casos; para el año siguiente (1995), el número de casos notificados disminuyó en 58.13%; para 1996 se observó un aumento de 100.21% en relación con 1995; y para 1997 nuevamente se observó una disminución de 89.15% en relación con el año anterior. Ejemplo Casos de hepatitis viral notificados en México, 1994-1997 123 Año Casos reportados Cambio porcentual 1994 1995 1996 1997 16918 7083 14181 26824 - 58.13% 100.21% 89.15% 7083 − 16918 16918 = 0.5813 ∗ 100 = 58.3% 14181 − 7083 7083 = 1.0021 ∗ 100 = 100.21% 26824 − 14181 14181 = 0.8915 ∗ 100 = 89.15%
  • 124. AÑO CANTIDAD (millones) 1980 1981 1982 1983 1984 1985 1986 1987 1988 340.7 349.1 357.5 366.0 374.8 385.8 393.0 402.5 412.1 1) Crecimiento poblacional de América latina (1980-1988), Fuente : BID a) ¿Cuál es el crecimiento de la población de 1980 a 1988? b) ¿Cuál es el crecimiento de la población de 1980 a 1985? c) ¿cual es el crecimiento de la población de 1985 a 1988? d) ¿cual es el crecimiento de la población de 1987 a 1988? Ejercicios 124
  • 125. 2) Los datos de la tabla contienen las características de 40 niños recién nacidos y sus madres. Nro Bajo peso al nacer Sexo RN Exposición de la madre al humo del tabaco durante el embarazo Consumo de alcohol por la madre durante el embarazo 21 no m no si 22 si m fumadora activa si 23 no f fumadora pasiva no 24 no m fumadora activa no 25 no f no no 26 no m no si 27 no m fumadora pasiva no 28 si m fumadora activa no 29 si m fumadora activa no 30 no m fumadora activa no 31 no m fumadora activa no 32 no f fumadora pasiva si 33 si f no no 34 no f fumadora activa si 35 no m no no 36 no m no si 37 no m fumadora activa no 38 no f fumadora pasiva si 39 no f fumadora activa si 40 si f no si Nr o Bajo peso al nacer Sexo RN Exposición de la madre al humo del tabaco durante el embarazo Consumo de alcohol por la madre durante el embarazo 1 no f fumadora pasiva no 2 no f fumadora pasiva si 3 si f fumadora activa no 4 no m fumadora pasiva no 5 no f fumadora pasiva no 6 no m fumadora activa no 7 si f fumadora activa no 8 si f fumadora pasiva no 9 no m fumadora pasiva si 10 no m no no 11 no f fumadora activa no 12 si f fumadora pasiva si 13 no f fumadora activa si 14 no m no no 15 no f no no 16 si m fumadora pasiva si 17 no f no no 18 no f fumadora pasiva si 19 no m fumadora activa si 20 no f fumadora activa si 125
  • 126. a) Suponga que los datos fueron registrados durante todo un año de estancia en una comunidad del país y le interesa presentarlos ante sus colegas. A partir de esos datos, llene la tabla considerando los 40 registros b) Al estar preparando su presentación, le surge el interés de explorar la relación que existe entre tres de las variables (sexo, tabaco y alcohol) con el peso bajo. Variable Frecuencia porcentaje Bajo peso al nacer SI No Sexo del RN Femenino Masculino Exposición al tabaco Fumadora activa Fumadora pasiva No fuma Consumo de alcohol Si No Variable Niños con bajo peso % de renglon Niños sin bajo peso % de renglon Sexo del RN Femenino Masculino Exposición al tabaco Fumadora activa Fumadora pasiva No fuma Consumo de alcohol Si No 126
  • 127. c) A partir del ejercicio b), se decide hacer varias comparaciones para identificar las características asociadas con el bajo peso al nacer. Llene la tabla siguiente con los valores de riesgo atribuible y riesgo relativo considerando las siguientes categorías como los valores de referencia: sexo masculino, no exposición al tabaco durante el embarazo y no consumo de alcohol durante el embarazo Variable Riesgo atribuible Riesgo relativo Sexo del RN Femenino Masculino (grupo de referencia) Exposición al tabaco Fumadora activa Fumadora pasiva No fuma (grupo de referencia) Consumo de alcohol Si No (grupo de referencia) 127
  • 128. 3. El administrador de una clínica de atención medica ha registrado los números de consultas. A partir de los datos, calcule los cambios porcentuales que la clínica ha registrado durante los años señalados. año casos reportados cambio porcentual 2017 10785 2018 9279 2019 10642 2020 15193 128
  • 129. Frecuencia % Inicio 7 Presencia 18 No hay presencia 3 Total 28 Cuadro Nro. 01. estudio de varices Cuadro Nro. 02. relación entre lumbalgia y movimiento Lumbalgia Total movimiento Hay afección No hay afección nro % Nro % Nro % inadecuado 15 4 adecuado 5 4 total 20 8 4. Completar los cuadros 129
  • 130. Métodos descriptivos y gráficos para describir datos cuantitativos La distribución de frecuencias es un método para organizar, resumir y representar datos según su magnitud y queda definido por el recorrido de la variable y el numero de observaciones que corresponde a cada punto o a cada intervalo Texto Texto Texto Texto Texto Texto Texto Texto Texto Texto HISTOGRAMA POLIGONO Texto Texto Texto Texto Texto X 0 1 2 3 4 5 6 fi BARRAS SIMPLES 0 1 2 3 4 5 6 fi X BASTONES Texto Texto Texto Texto Texto Texto TextoText o DIAGRAMA DE PARETO OJIVA acumulada 25% 25% 10% 10% 10% 10% 10% 10% 10% 10% 10% 10% Texto Texto Texto Texto Texto Texto Texto Texto BARRAS COMPUESTAS PICTOGRAMAS 130
  • 131. DATOS AGRUPADOS (como variables continuas) Los datos de variables cuantitativas pueden presentarse en forma tabular mediante un arreglo ordenado, donde los valores se agrupan en intervalos de clase que señalan los valores que deben incluirse en la tabulación, y son definidos por sus límites inferior y superior de clase. Los intervalos de clase no deben traslaparse y son consecutivos, por lo que el límite superior de clase de un intervalo es el límite inferior de clase del siguiente. Para la elaboración de un arreglo ordenado, se procede de la siguiente manera: Pasos generales para obtener un cuadro de distribución de frecuencias 1) Determinar El rango 2) Determinar el número de intervalos 3) Determinar el tamaño (amplitud) del intervalo 4) Construcción del cuadro de frecuencias 5) Construcción de gráficos 6) Interpretación de resultados R = Numero Mayor – Numero menor NI=1+3.33 log (N) 5<NI<25 criterio del investigador NI R C = 131
  • 132. Edad Glucosa Edad Glucosa 65 64 62 31 62 36 48 58 41 70 55 120 120 120 120 120 200 120 120 140 120 140 52 30 41 68 40 69 35 34 44 30 62 120 120 120 120 160 120 120 130 120 130 140 Ejemplo. Los siguientes datos representan la edad y el nivel de glucosa de pacientes diabéticos atendidos en el Hospital de Seguro Social. Los datos fueron tomados en 1977. Realizar una distribución de frecuencias y su grafico respectivo para la edad. 1) Rango: R = Mayor – Menor R = 70 – 30 = 40 2) Numero de intervalos de clase (NI): NI = 5 por regla empírica 3) Tamaño del intervalo (TI o C): C = R/NI = 40/5 = 8 I Li - Ls Conteo fi Fi hi Hi hi % Hi% Xi Fi-1 1 [30 – 38> //// / 6 6 0.27 0.27 27 27 34 22 2 [38 – 46> //// 4 10 0.18 0.45 18 45 42 16 3 [46 – 54> // 2 12 0.09 0.54 9 54 50 12 4 [54 – 62> // 2 14 0.09 0.63 9 63 58 10 5 [62 – 70> //// /// 8 22 0.36 0.99 36 99 66 8 T. 22 0.99 99 Li - Ls fi hi % [30 – 38> 6 27 [38 – 46> 4 18 [46 – 54> 2 9 [54 – 62> 2 9 [62 – 70> 8 36 22 99 5 9 4 3 1 0 5 9 4 3 2 1 30 38 46 54 62 70 fi Li 6 7 8 Resumen 132
  • 133. Ejemplo: “Determinación de colesterol total, hdl colesterol, ldl colesterol en el personal administrativo de la facultad de ciencias biológicas de la una ” se realizo en la ciudad de Puno durante el mes de Septiembre del 2006 en 21 muestras de suero sanguíneo provenientes de personas aparentemente sanas, con el objetivo de determinar el nivel de Colesterol total, HDL colesterol, LDL colesterol y hacer una comparación de los valores obtenidos entre ambos sexos (tesina, Facultad de biología UNA, Autor: Evelin Garcia). 133
  • 134. lugar de trabajo Colesterol Total HDL colestero l LDL colestero l Edad Sexo puno 194,8 51,30 108,50 28 femenino chucuito 153,7 44,60 97,10 29 femenino puno 221,9 53,14 121,76 40 femenino puno 162,5 41,94 96,56 38 femenino chucuito 141,0 38,32 90,68 36 femenino puno 182,9 59,28 103,62 35 masculino puno 179,2 50,72 94,48 37 masculino puno 165,9 46,13 95,77 34 masculino chucuito 172,7 52,64 108,00 31 masculino chucuito 171,8 53,85 105,95 38 masculino chucuito 207,1 59,38 113,72 40 masculino puno 173,3 44,31 94,99 48 femenino puno 222,0 43,03 121,97 50 masculino chucuito 184,6 53,10 107,50 45 masculino chucuito 178,0 54,27 101,73 41 masculino puno 148,6 43,79 94,81 56 masculino puno 197,6 41,08 119,52 56 masculino puno 198,8 45,94 105,86 53 masculino puno 179,4 46,87 98,53 57 masculino puno 164,4 44,17 96,23 54 masculino chucuito 174,4 55,00 80,40 52 Masculino Colesterol total Rango: R = > – < = 222 – 141 = 81 Numero de intervalos NI = 4 por regla empírica Tomaremos como ancho de intervalo 20. A criterio Intervalo Femenino Masculino Nro % Nro % 131-153 154- 176 177-199 200- 222 1 3 1 1 16.7 50.0 16.7 16.7 1 5 7 2 6.7 33.3 46.7 13.3 6 100.0 15 100.0 CUADRO Nro. Distribución por sexo para colesterol total, del personal administrativo de la facultad de ciencias biológicas de la UNA Puno 2006 16,7 50,0 16,7 16,7 6,7 33,3 46,7 13,3 0 10 20 30 40 50 60 131-153 154- 176 177-199 200- 222 Femenino Masculino % 134
  • 135. Tabla 10. Distribución de frecuencias para el numero de integrantes por familia. Ii Xi Tabula fi Fi hi% Hi% 1 2 3 4 5 6 7 8 9 10 2 3 4 5 6 7 8 9 10 12 // //// /// / ////// //// //// // //// //// / 2 4 3 1 7 5 7 5 5 1 2 6 9 10 17 22 29 34 39 40 5.0 10.0 7.5 2.5 17.5 12.5 17.5 12.5 12.5 2.5 5.0 15.0 22.5 25.0 42.5 55.0 72.5 85.0 97.5 100.0 Tot 40 100 Ejemplo. Se quiere analizar e interpretar descriptivamente los resultados obtenidos de la investigación referente al número de integrantes por familias. 2 8 6 8 4 3 6 6 8 10 8 12 2 4 6 6 8 5 8 8 7 9 4 3 3 10 10 6 7 7 9 9 3 10 10 6 7 7 9 9 No se obtienes limites 8 6 4 2 fi 2 3 4 5 6 7 8 9 10 12 Xi Diagrama de Barras Distribución como datos discretos 135
  • 136. Ejemplo. En un estudio llevado a cabo en la Facultad de Enfermería de la UNA-Puno en el año 2004 con la finalidad de establecer el efecto de la música en la estimulación del desarrollo psicomotor en niños de 2-4 meses del Hospital Carlos Monge M. se llego a los siguientes resultados (en puntos según la escala de evaluación del desarrollo psicomotor) datos reales. Niños Experimental niños Control Pre test Post test Pre test Post test Britami Mariana Angel Pamela Sofia Sergio Leydi Yhon Tania Grabriel Alexander Richard 88 98 88 98 93 93 88 88 93 93 88 103 139 139 139 136 136 144 136 132 132 132 132 131 Carlos Miriam Manuel Ivan Cristian Marco Maria Edu Yesenia Jorge Maribel Pedro 103 93 93 98 98 93 88 103 88 88 93 88 101 101 90 90 90 87 87 87 87 87 87 83 Realice análisis descriptivo utilizando SPSS 136