1. ESTADÍSTICA BÁSICA PARA LA
INVESTIGACIÓN CLÍNICA
Profesora: Maricela Morera Pérez
Especialista de Primer grado en Medicina General Integral y
Bioestadística.
Dpto. Investigaciones CNCMA
Correo electrónico: mari.morera@infomed.sld.cu
2. Medicina
ESCENARIOS DIFERENTES-PROBLEMAS DIFERENTES
Trabaja con un paciente del que conoce
nombre y apellidos, antecedentes,
familia
Estudian a los pacientes de cien en cien,
de mil en mil ….
Debe realizar un diagnóstico concreto a
un paciente
Habla de curva ROC, sensibilidad,
especificidad, valores predictivos ……
Desea concretar la causa de una
enfermedad
Calcula un OR (odds ratio) un RR (riesgo
relativo), intervalos de confianza del 95%
…..
Desea conocer la mejor terapéutica Calcula reducciones absolutas y relativas
de riesgo y número necesario de
pacientes a tratar para prevenir un
evento…..
Desea conocer el pronóstico de un
paciente determinado
Habla de Kaplan-Meier, de riesgos
proporcionales y de regresiones de Cox.
3. El gran mérito de Bradford Hill
consistió en difundir la
estadística dentro del personal
sanitario, él consideraba que,
solo conociendo algo de
estadística, los médicos podrán
considerar a los estadísticos
como genuinos interlocutores y
colegas en materia de
investigación.
4. EL CONOCIMIENTO DE LA ESTADÍSTICA
Desempeño cabal y competente del profesional de la salud
Asistencia
Dirección Investigación
Superación
¿CUAN EXTENSO Y PROFUNDO DEBE SER ESTE
CONOCIMIENTO SOBRE ESTADISTICA?
¿QUE APTITUDES DE CARÁCTER ESTADISTICO
DEBEN POSEER?
5. Los necesarios para:
Cultivar una cultura de comprensión.
Entender de que se está hablando.
Tener una idea de cómo se hace y cuán
válido puede ser un proceder
estadístico.
Del proceder
formalizado ESPECIALISTA
6. SUGERENCIAS:
I. NO AVANZAR EN EL ESTUDIO DE UN TEMA ESTADÍSTICO HASTA
QUE NO DOMINE CABALMENTE LOS PRECEDENTES
II. ESFORZARSE POR DOMINAR EL LENGUAJE, EL PROPÓSITO, LA
LÓGICA Y LAS CONDICIONES DE APLICACIÓN DE LOS MÉTODOS
ESTADÍSTICOS ANTES QUE SU ARITMÉTICA INTERNA
III. NO DEJARSE AMEDRENTAR POR LA SIEMPRE CRECIENTE
CANTIDAD DE TÉCNICAS EXISTENTES QUE NO DOMINA: EN LO
ESENCIAL, NO LE HACEN FALTA
IV. APLICAR AUTÓNOMAMENTE SOLO AQUELLO QUE ENTIENDE
TOTALMENTE Y ACUDIR A UN ESPECIALISTA EN TODOS LOS
DEMÁS CASOS.
Cultura estadística e investigación científica en el campo de la salud:
una mirada crítica. Ediciones Díaz de Santos, S.A.
Profesor: Luis Carlos Silva Ayçaguer, 1997
7. ESTADÍSTICA
Concepto:
La disciplina que aborda el manejo de datos
numéricos obtenidos de un conjunto de unidades
individuales:
-personas
-animales u otros organismos
-unidades administrativas (hospitales, municipios,
etc.)
≠ estadísticas
Ciencia encargada
de recolectar,
organizar, presentar,
analizar e interpretar
datos numéricos
Estadística
Datos
numéricos
“herramienta”
8. ¿Por qué el interés en datos numéricos de conjuntos
de unidades en Medicina?
Dos razones principales:
1.- Obtener datos necesarios para la
administración de salud. (Qué está
sucediendo?)
2.- Evaluar datos para dar respuesta a un
problema científico determinado.
2 usos básicos de la
Estadística en Salud:
Administración
Investigación
9. DOS TIPOS PRINCIPALES DE MÉTODOS
ESTADÍSTICOS PARA DOS FINES:
Describir una situación
determinada.
Hacer inferencias a
poblaciones conociendo la
probabilidad de errores.
Métodos descriptivos
Métodos inferenciales
10. Muestra: parte de la población que se observa
directamente
Población objeto de estudio: aquella sobre la que
se pretende recaigan las conclusiones del estudio.
Poblaciones
Finitas: Aquellas que están definidas en
tiempo y espacio.
Población del estado de Vargas, junio de 2010.
Infinitas: Aquellas que se definen por
características y nunca es de interés del
investigador definirlas en tiempo y espacio.
Población de pacientes con diagnóstico de ERGE,
mayores de 17 años.
12. Una variable es una propiedad o
característica que se “mide” en los
sujetos de una investigación y que
puede tomar valores o categorías
que cambian de un individuo a otro
o de un momento a otro.
Medir es definir en qué categoría de la variable se
encuentra el sujeto medido en el momento de la
medición.
13. Tipos de
variables
Cualitativas
Cuantitativas
Nominales
Necesidad de conversión,
técnica quirúrgica
Ordinales
Grados de esofagitis,
Intensidad del sangrado
operatorio
Continuas
Tiempo quirúrgico,
estatura, peso, nivel de
creatinina
Discretas
Número de camas en uci,
cantidad de lesiones
premalignas detectadas
14. Escala de clasificación:
conjunto de clases o categorías que se definen para
clasificar la información de determinada variable.
Tipos de
escalas
Cualitativas
Cuantitativas
Discretas
Continuas
Nominales
Ordinales
15. Una variable puede estudiarse con distintos
tipos de escalas.
Ejemplo:
Peso de recién nacidos (en gramos)
- 2450, 2500, 2600, 3000, 3500, 3600 (escala
cuantitativa discreta)
- Normopeso y no normopeso (escala cualitativa
nominal)
- Bajo peso, normopeso, sobrepeso, obeso
(escala cualitativa ordinal)
16. Condiciones de una buena escala
Ser exhaustiva:
que permita clasificar a todas las unidades de
análisis.
Ser mutuamente excluyente:
una unidad de análisis puede estar en una y
solo en una categoría
17. ¿ Dónde se ubicaría un
paciente con un
porcentaje de ondas
normales igual al 90%
(no mutuamente
excluyente)
o un paciente con un
porcentaje menor de 30
(no exhaustiva) ?
Estudio de la motilidad esofágica por manometría
Ondas
peristálticas
normales (%)
30-39
40-59
60-90
90-100
19. No siempre la naturaleza de la
variable coincide con el tipo de
escala que se le construye.
Las variables cualitativas pueden codificarse
a través de números para facilitar su
procesamiento estadístico, pero no debe
olvidarse qué tipo de variables son.
¿ Cómo construir una escala de
clasificación cuantitativa de intervalo?
20. intervalos de clase (IC)
• Divisiones ordenadas que componen la escala
• Están delimitados por límites de clase, que
son los valores mayor y menor que los
enmarcan. (Límite inferior LI y superior LS).
• Los intervalos pueden o no tener igual amplitud,
aunque lo primero facilita el trabajo con los
datos.
• La marca de clase de un IC es el punto medio
de dicho intervalo, que se computa mediante la
semisuma de los límites de clase del intervalo
referido. Por ejemplo, la marca de clase del
tercer intervalo es MC = (60 + 89) / 2 = 74,5.
21. • Existen dos límites reales para cada intervalo: el
superior (LRS) y el inferior (LRI), LRS de un
intervalo es, a la vez, el LRI del intervalo siguiente.
Se calculan mediante la semisuma de los LS y LI
de intervalos contiguos Esto es, sumar ambos
números y dividir el resultado por dos. Por
ejemplo, la semisuma de 89 y 90 es (89 + 90) 2
= 89.5. (En el ejemplo este valor sería el LRS del
penúltimo IC y el LRI del último IC)
• La amplitud o recorrido (A) de un IC es la
longitud de éste. Su cálculo puede hacerse de
distintas maneras: La más utilizada consiste en
hallar la diferencia entre los límites reales del
intervalo en cuestión. En el ejemplo anterior, los
límites reales del segundo IC son 39.5 y 59.5, por
lo que la amplitud es 20.
22. Pasos para construir una escala con intervalos de clase
de igual amplitud:
1. Determinar el recorrido de la serie (R). Restar el valor mínimo al
máximo.
2. Fijar el número mínimo de intervalos de clase deseado. Se determina
según necesidad del investigador. No siempre este número será el
definitivo de ICs, ocasionalmente requerirás un IC adicional.
3. Calcular la amplitud (A) de los intervalos. Para ello, se divide el
recorrido que se obtuvo en el paso 1 por el número de ICs que se fijó
en el paso anterior.
4. Delimitar los límites inferiores (LI) de los intervalos. Partiendo del valor
mínimo de la serie, añadirle la amplitud y tendrá el LI del intervalo
siguiente, a este le suma la amplitud y tendrá el subsiguiente, y así
hasta llegar al último LI de la escala.
5. Delimitar los límites superiores (LS). Lo hará sustrayendo una unidad
al LI siguiente. En el caso del LS del último intervalo, lo obtendrá
sumándole la amplitud al último LI, y luego restando al resultado una
unidad.
UN EJEMPLO:
23. Peso Peso Peso Peso
1. 160,00 6. 170,54 11. 166,00 16. 150,00
2. 160,36 7. 160,20 12. 156,70 17. 151,78
3. 158,20 8. 163,20 13. 154,50 18. 152,00
4. 174,00 9. 165,80 14. 155,00 19. 154,80
5. 170,00 10. 165,90 15. 155,90 20. 156,70
Se tienen los pesos (en libras) de 20
trabajadores del centro, y se desea agruparlos
en una escala cuantitativa con intervalos de
igual amplitud.
24. Peso Peso Peso Peso
1.150,00 6.155,00 11.160,00 16.165,90
2.151,78 7.155,90 12.160,20 17.166,00
3.152,00 8.156,70 13.160,36 18.170,00
4.154,50 9.156,70 14.163,20 19.170,54
5.154,80 10.158,20 15.165,80 20.174,00
Para visualizar mejor el recorrido, se
comienza por ordenar los pesos:
25. El valor mínimo es 150.00, y el máximo es 174.00
1. El recorrido de la serie es R = 174.00 – 150.00 = 24.
2. El investigador desea como mínimo 4 intervalos de clase.
3. La amplitud que tendrán los intervalos es A = 24 4 = 6.
4. Límites inferiores:
IC LIs
1. 150
2. 150 + 6 = 156
3. 156 + 6 = 162
4. 162 + 6 = 168
5. Límites superiores:
IC LIs
1. 156 - 1 = 155
2. 162 - 1 = 161
3. 168 - 1 = 167
4. 174 - 1 = 173
26. La escala será 150-155, 156-161, 162-167, 168-173,
completando así los cuatro intervalos deseados.
Pero en los datos existe un valor que supera 173, de ahí que
sea necesario añadir un intervalo de clase al número
predicho con el objetivo de lograr la exhaustividad de la
escala:
150 – 155
156 – 161
162 – 167
168 – 173
174 – 179
Límite inferior del quinto IC: 168 + 6 = 174
Límite superior del último intervalo: 174 + 6 - 1 = 179
Finalmente, la escala que necesitabas construir es:
Cumple con los requisitos de ser exhaustiva y mutuamente excluyente,
tiene 5 Ics, el LRI del segundo IC es 155,5 y el LRS es 161,5, la marca de
clase es 2,5 en todos los IC porque la amplitud es la misma en todos A= 6
ej: segundo IC (161,5-155,5)
27. Medidas de Resumen para diferentes
tipos de variables
Variables cualitativas:
• Razón e índice.
• Proporción y porcentaje
• Tasas
Una razón es la relación por cociente que se establece
entre las unidades de análisis que pertenecen a un grupo o
categoría (a) y las unidades de análisis que pertenecen a
otra categoría (b) de la misma variable. Su expresión
general es: a/b.
Si multiplicas el resultado obtenido por 100, entonces el
nuevo número se denomina índice
28. Una proporción es la relación por
cociente que se establece entre las
unidades de análisis que pertenecen
a un grupo o categoría (a) de una
variable y el total de las unidades de
análisis estudiadas (a + b). Su
expresión general es: a/a+b
Si se multiplica su resultado por 100,
se obtendrá el porcentaje.
29. Medidas de Resumen
Datos cualitativos: ejemplo.
Frec. Porcentaje
Si 76 71,70
No 30 28,30
Total 106 100,00
Caracterización del derrame pleural. Disnea
Razón: con disnea/sin disnea = 76/30 = 2.5
30. El numerador contiene al número de veces que
ocurrió determinado fenómeno en un área
geográfica y en un período determinados.
El denominador indica el número de habitantes
de la población en la cual puede ocurrir el
fenómeno.
k es un múltiplo de 10 cuyo uso está justificado
por el hecho de que habitualmente el
resultado del cociente es un número
fraccionario, y al multiplicarlo por una
potencia de 10 se facilita enormemente la
lectura y comprensión del indicador.
Una tasa es una relación por cociente que expresa el riesgo de
que ocurra cierto evento en una población y período
determinados. Está compuesta por tres elementos, a saber:
Tasa= Numerador/Denominador * K
31. Tasas
Cuando el denominador es muy grande en relación al
numerador, las proporciones y los porcentajes resultan
incómodos.
Ejemplos:
Proporción de fallecidos por TB en La Habana, año 1998.
%
001
.
0
00001
.
0
2000000
200
Se prefiere decir: 1x1000 habitantes.
32. Ejemplo de tasa:
En el año 2000 se tenían 12 personas que
enfermaron de dengue en cierto municipio
de una ciudad. Este municipio tiene 125000
habitantes.
La tasa de enfermos de dengue en ese
municipio en el año 2000 fue de:
(12/125000) X 100000 = 9,6 enfermos por
100000 habitantes.
33. Ejemplos:
Riesgo de morir por una enfermedad en una población.
Riesgo de enfermar de TB en una población.
k
Tasa
r
denominado
numerador Donde k = 10n
Numerador: eventos ocurridos en un tiempo y
lugar determinados
Denominador: población expuesta al evento.
Cuando se quiere estimar el riesgo de mortalidad o de
enfermedad en las poblaciones suele presentarse el
problema de los grandes denominadores.
34. Tasas más frecuentes en Salud Pública
Tasa bruta de
natalidad
1000
X.
tiempo
y
lugar
el
en
total
población
X
tiempo
y
lugar
en
)
NV
(
vivos
nacidos
total
TBN
Tasa general de
fecundidad
1000
X
tiempo
y
lugar
el
en
fértil
edad
en
mujeres
X
tiempo
y
lugar
el
en
vivos
nacidos
total
TGF
Tasa bruta de
mortalidad 1000
X
y tiempo
lugar
en
población
X
y tiempo
lugar
en
fallecidos
TBM
35. Tasas más frecuentes en Salud Pública (cont.)
Tasa de mortalidad
infantil. Tasa especial
1000
X
y tiempo
lugar
en
NV
X
y tiempo
lugar
en
año
1
de
menores
fallecidos
TMI
36. n
TI 10
X
y tiempo
lugar
en
total
población
X
y tiempo
lugar
en
nuevos
casos
n
TP 10
X
y tiempo
lugar
en
total
población
X
y tiempo
lugar
en
casos
de
Total
100
X
y tiempo
lugar
en
i
enfermedad
por
enfermos
X
y tiempo
lugar
en
i
enfermedad
por
fallecidos
TL
Tasa de incidencia de una enfermedad
Tasa de prevalencia de una enfermedad
Tasa de letalidad
37. Las frecuencias y la distribución de frecuencias
Distribución de frecuencias:
modo en que se distribuyen las unidades de
análisis entre las clases o categorías que
conforman la escala de clasificación de la
variable en cuestión.
Frecuencia:
veces que aparece un valor de una variable en
una serie de datos
Dato:
Valor de una variable en una unidad de análisis
(sujeto de estudio)
38. Clasificación de las distribuciones de frecuencia
Distribución de trabajadores del CNCMA según peso. 2012
Peso
(libras)
Frecuencia
absoluta
(Número)
Frecuencia
Relativa
(proporción o
porcentaje)
Frecuencia
absoluta
Acumulada
Frecuencia
relativa
Acumulada
(proporción o
porcentaje)
150 – 155 6 0,30 30 6 0,3 30
156 – 161 7 0,35 35 13 0,65 65
162 – 167 4 0,20 20 17 0,85 85
168 – 173 2 0,10 10 19 0,95 95
174 – 179 1 0,05 5 20 1 100
Total 20 1 100
Ejemplo:
39. Frecuencia acumulada
• Se puede calcular frecuencia acumulada
absoluta o relativa
• Sólo se puede calcular para variables
cuantitativas expresadas en escalas
numéricas.
• Se obtiene sumando las frecuencias de
todas las clases que anteceden a la clase
para la cual se esta realizando el cálculo.
40. TAREA
1- Realizar los ejercicios 1 y 2
del fichero en word titulado
Ejercicios Estad_1.
Para entregar en la próxima
conferencia sábado 9 de junio
individual y por escrito.
Notas del editor
La estadística incluye procedimientos que permiten describir y resumir un conjunto de datos; pero también incluye métodos que permiten inferir resultados a poblaciones a partir de la información obtenida de una muestra. Es la Estadística Inferencial la que contribuye a obtener conclusiones generales a partir de los datos de un estudio.
El concepto de variable es central en la estadística. Una variable es la expresión de cierto concepto que se estudia y que, como indica su nombre, varía, o sea, toma distintos valores en los sujetos que se evalúan. Por ejemplo cuando se describe la edad de un conjunto de individuos la variable edad mide el concepto del tiempo transcurrido desde el nacimiento que es diferente en los individuos evaluados.
La expresión del concepto de variable toma distintas formas que dan origen a una clasificación. Esta clasificación resulta útil para determinar el método estadístico mejor para describirla o para hacer determinadas inferencias. Toda la estadística se mueve alrededor de este concepto.
A menudo sucede que, con el objetivo de facilitar el trabajo, el investigador toma la decisión de agrupar los datos de manera tal que convenga a sus intereses. Ello se logra mediante la construcción de una escala de clasificación, o simplemente escala.
De los cuatro tipos de escalas (nominal, ordinal, discreta y continua), la escala continua es la más fuerte y da la mayor información cuantitativa, mientras que la nominal es la más débil. Esta jerarquía permite que los datos se puedan transformar a un nivel más bajo de información, pero nunca a uno más alto.
Se puede construir una escala nominal a cualquier variable (dentro de lo razonablemente lógico), no importa cual sea la naturaleza de dicha variable. Pero se debe considerar que si se está representando una variable de naturaleza no nominal, sencillamente se está perdiendo información que pudiera resultar valiosa; es más, en realidad no se está midiendo cosa alguna, sólo se está clasificando las unidades de análisis en categorías o grupos. Siempre que se pueda no se debe perder información.
Los resultados obtenidos de la medición de variables cualitativas se representan mediante tablas de frecuencias absolutas a las que se añaden las frecuencias relativas. Sin estas últimas la información no podría generalizarse. Por ejemplo, en este caso, el número absoluto 76 pacientes con disnea de una serie de 106, nos da la idea de que EN GENERAL en esta población de pacientes con derrame pleural, el 72% presenta disnea y el 28% no.
La diferencia entre tasa, proporción y porcentaje estriba más bien en su uso y el significado que quiere dársele. Como se trata de poblaciones a las tasas se les toma como indicadores de riesgo. En este caso el riesgo que tiene un poblador cualquiera de ese municipio de enfermar de dengue es de 0,0000096.
La tasa de mortalidad infantil resulta especial porque, además de su connotación como indicador de nivel de salud de una población, se calcula con los Nacidos Vivos de cierto lugar y tiempo. Esto último porque se considera al número de nacidos vivos como una buena aproximación a la población de niños menores de un año de una región dada en cierto período de tiempo. Este período suele ser un año.