Bioestadística descriptiva y medidas de posición

BIOESTADÍSTICA I
Juan José Villacís Barrazueta

INDICACIONES DE LA CLASE
• Materia teórico - práctica.
• Lunes de 7 - 9 am.
• 4 módulos
• Todas las clases se realizarán ejercicios. Se usará Excel para resolver los
mismos.
• Materiales sugeridos: Computadora y calculadora.

ACTIVIDADES
• Cuestionarios:
• De forma individual, con plazo de UNA semana. Deberán ser entregados hasta el
domingo 23:59.
• Cuestionarios atrasados únicamente con justificación. TODO trabajo atrasado será
calificado con una nota menor.
• Se califica: conocimiento, análisis y tiempo. Por ende, los cuestionarios contienen
ejercicios prácticos con límite de tiempo.
• Las diapositivas de cada clase se subirán a la plataforma cada lunes.
• Cada semana se subirá a la plataforma la resolución de los cuestionarios.

EXÁMENES
• Por parcial: DOS evaluaciones y UN examen parcial.
• Examen final.

SÍLABO
Unidad 1: Bases de la Investigación
. Introducción a la Investigación
. Ciencia, conocimiento e investigación científica
. Metodo cientifico
. Relación entre ciencia, investigación y método científico
- Idea de defender. Hipótesis. y pregunta científica
. Planteamiento del problema de investigación
Unidad 2: Diseño de estudio
. Elementos fundamentales de la investigación
. Clasificación de la investigación
. Variables de la Investigación
- Población y muestra
. Tablas de frecuencia estadística
Unidad 3: Recoleccion de la información
. Generalidades de la recolección
. Medidas de tendencia central
. Medidas de dispersión
. Indicadores básicos para el análisis estadístico del estado de salud
Unidad 4: Estructura del proyecto de Investigación

SÍLABO
Fecha Actividades
Mayo 15, 2023 UNIDAD 1: Introducción a la Bioestadística descriptiva. Tipos de variables. Frecuencias absolutas,
relativas y acumuladas. Tipos y usos de gráficos.
Mayo 22, 2023 UNIDAD 1: Medidas de tendencia central. Medidas de dispersión. Medidas de posición y forma.
Mayo 29, 2023 Refuerzo Unidad 1
Junio 5, 2023 Evaluación Unidad 1
Junio 12, 2023 UNIDAD 2: Distribución normal. Muestreo y Probabilidades. Teorema de Bayes
Junio 19, 2023 UNIDAD 2: Regresión lineal
Junio 26, 2023 Refuerzo Unidad 2
Julio 3, 2023 Evaluación Unidad 2
Julio 10, 2023 Examen 1° Parcial
Julio 17, 2023 UNIDAD 3: Introducción a la Bioestadística inferencial. Hipótesis y valores p.
Julio 24, 2023 UNIDAD 3: Pruebas - KS. Distribución binomial.
Julio 31, 2023 Evaluación Unidad 3
Agosto 7, 2023 UNIDAD 4: Pruebas paramétricas. Distribución t
Agosto 14, 2023 UNIDAD 4: Distribución F. Correlación de Pearson.
Agosto 21, 2023 Evaluación Unidad 4
Agosto 28, 2023 Examen 2° Parcial
Septiembre 4, 2023 Tutorías académicas
Septiembre 11, 2023 Examen Final
Septiembre 18, 2023 Examen de Recuperación

ETIMOLOGÍA DE LA
ESTADÍSTICA
• Latín: statisticum collegium (“consejo de Estado”)
• Italiano: statista (“hombre de Estado” o “político”)
• Alemán: statistik (“hombre de Estado” o “político”)

¿POR QUÉ LA CIENCIA DEL
ESTADO?
• Por razones de organización:
C R R P
Conocer las
características de
su población para
gestionar el pago
de impuestos.
Reclutamiento
de soldados
Reparto de
tierras o bienes
Prestación de
servicios públicos

VARIOS AUTORES LA DEFINEN:
• Croxton y Cowen: “La estadística es el método científico que e
utiliza para recolectar, elaborar, analizar e interpretar datos sobre
características susceptibles de ser expresadas numéricamente de
un conjunto de hechos, personas o cosas”.
• Clifford y Taylor: “La estadística es la disciplina interesada en la
organización y resumen de datos, para obtención de conclusiones
acerca de características de un conjunto de personas u objetos
cuando solo una porción está disponible para su estudio”

BIOESTADÍSTICA
• Castro (2019):
“Es la rama de la estadística que se ocupa de los problemas
planteados dentro de las ciencias de la vida, como la biología o la
medicina. Médicos, enfermeras, especialistas en salud pública,
epidemiólogos necesitan conocer los principios que guían la
aplicación de los métodos estadísticos a so temas propios de sus
respectivas áreas de conocimiento (…). Permitirá elaborar
modelos, predicciones, estrategias y priorización de presupuesto.”

JUEGO: Actividad fuera de la realidad
Reglas
distintas de
la vida real
Improductivo
SISTEMA DE ENSEÑANZA
Reglas de la
vida real
Productivo
Sin
motivación
inmediata
Motivación
inmediata
Información
compleja
Todo igual
Utilidad
antropométrica
Momentos
significativos
Narrativa
organiza la
información

COMPONENTES DE LA
BIOESTADÍSTICA
DATOS
Son la materia prima, nacen de
las mediciones o también
llamadas observaciones
ANÁLISIS
Permite que los datos se
conviertan en información útil
• La estadística en salud depende de los datos y de su análisis, por tanto, es esencial conocer la
metodología para la correcta recolección de los datos y comprender la estadística para un
correcto análisis de éstos.

CONCEPTOS BÁSICOS
P M V
MUESTRA
Subconjunto sobre
el cual se
realizarán
mediciones y
obtención de
conclusiones.
POBLACIÓN
Todos los
individuos sobre
los cuáles se
realizará el
análisis.
VARIABLE
Característica
que se desea
investigar

MEDIDAS
Parámetro
Estadístico
Estimación numérica en relación a una
variable de la POBLACIÓN
Media: µ
Desviación estándar: σ
Estimación numérica en relación a una
variable de la MUESTRA
Media: X
Desviación estándar: S

VARIABLES
• Característica que deseo investigar.
• Una variable es un atributo que describe a una persona, lugar,
cosa o idea.
• Existen dos tipos de variables.

¿POR QUÉ IMPORTA EL TIPO DE
VARIABLE?
Los tipos de variables se relacionan directamente con los métodos
estadísticos e inferenciales disponibles.

TIPOS DE VARIABLES
1 2
CUALITATIVA
S
No numéricas
CUANTITATIVAS
Numéricas

Variables
Cualitativas
Categóricas
Dicotómicas/Binarias:
En estas variables solo
existen dos posibilidades de
respuesta
Politómicas:
>2 categorías
NIVELES DE
MEDICIÓN
1. Nominal (sin
orden jerárquico)
2. Escala de razón
(tienen un orden)

Variables
Cuantitativas
Discretas
Continuas
Surgen de un proceso de
conteo y toman solo ciertos
valores correspondientes al
conjunto de números enteros
positivos
Días de hospitalización
N° de hijos
N° de muertes
Surgen de un proceso de
medición en el que pueden
tomar cualquier valor dentro
del conjunto de los números
racionales (decimales o
negativos).
Peso
Talla
Presión
NIVELES DE
MEDICIÓN
1. Escala de
intervalo
2. Escala de
razón

DEL TIPO DE VARIABLE
DEPENDE
Test a usar
Hipótesis
Gráficos

ESTADÍSTICA DESCRIPTIVA
• Clasifica, agrupa y ordena los datos de la muestra.
• Tabula y representa gráficamente los datos de acuerdo a sus
frecuencias.
• Calcula medidas que resumen la información que contiene la
muestra.
• No tiene poder inferencial. No deben sacarse conclusiones
sobre la población.

DISTRIBUCIÓN DE
FRECUENCIAS
Clasifica:
• SIN AGRUPAR: Ordena todos los valores obtenidos en la
muestra de menor a mayos
• AGRUPADOS: Ordena los valores en clases (intervalos) y
de menor a mayor

FRECUENCIAS
ABSOLUTA
RELATIVA
Es el número de veces que se observa
cada categoría en un conjunto de
observaciones
fi
Es el cociente entre la frecuencia absoluta
de una determinada categoría y el número
total de observaciones. La sumatoria de
frecuencias:
Razón=1 o %=100
ni

FRECUENCIAS
ACUMULADAS
ABSOLUTA
RELATIVA
Sumatoria de las fi. Es el resultado de
sumar el Fi correspondiente y el siguiente
fi.
Fi
Se obtiene de ir sumando las frecuencias
relativas de una clase o grupo de la
muestra con la anterior.
Ni

REGLA DE STURGES
• Es un criterio utilizado para determinar el número de clases o
intervalos que son necesarios para agrupar los datos.
Rango: Max - Xmin
K = intervalos (número de casillas que generó la tabla) 1 +
3,322 log(n)
Amplitud = tamaño del intervalo. R/K

ESTADÍSTICA DESCRIPTIVA
Permiten presentarlos de forma
significativa y comprensible, lo que a
su vez da pie a una interpretación
simplificada del conjunto de datos en
cuestión.
Los datos brutos serían difíciles de analizar, y la
determinación de tendencias y patrones pueden ser
un reto. Además, los datos en bruto dificultan la
visualización de lo que realmente muestran
El uso de la estadística descriptiva permite resumir y
presentar un conjunto de datos mediante combinación
de descripciones tabuladas y gráficas. La estadística
descriptiva se utiliza para resumir datos cuantitativos
complejos.

VARIABLES CUANTITATIVAS
DATOS
AGRUPADOS

Medidas de
posición
Percentiles,
cuártales,
quintiles, deciles
Medidas de posición NO
central
Percentiles son las medidas
más utilizadas para
propósitos de ubicación o
clasificación de las personas
en características tales como
peso, estatura, etc.

A TENER EN CUENTA
• La preferencia para elegir cuartiles, deciles o percentiles está
condicionada al grado de detalle con que se contextualiza la
posición de una observación en el conjunto de datos referenciados.
• Pero, también la elección entre las distintas medidas de posición
no central está asociada a la heterogeneidad de las distribuciones.
• Mientras más dispersión presentan los datos de una variable, se
aconseja incrementar las unidades divisionales.

• La preferencia para elegir cuartiles, deciles o percentiles está
condicionada al grado de detalle con que se contextualiza la
posición de una observación en el conjunto de datos referenciados.
• Pero, también la elección entre las distintas medidas de posición
no central está asociada a la heterogeneidad de las distribuciones.
• Mientras más dispersión presentan los datos de una variable, se
aconseja incrementar las unidades divisionales.

• Recién nacidos - peso demasiado bajo. ¿Qué peso se considera
“demasiado bajo”?
• Consultas de emergencia en hospitales según causa.
• Fecundidad adolescente según países.

PERCENTILES
• Cada uno de los 99 valores que dividen a la distribución de datos
en 100 partes iguales.
Pk
𝑛𝑘
100

• Lk-1 es el límite inferior del intervalo h (cuya frecuencia acumulada es la primera
mayor o igual a
𝑛𝑘
100
• nk es la frecuencia absoluta del intervalo h.
• Nk-1 es la frecuencia acumulada hasta Lk-1
• A es la longitud del intervalo h.

EJEMPLO
• Calcular el percentil de orden 86 de los ingresos mensuales de
algunos médicos en EEUU.
INGRESO MENSUAL NÚMERO DE PERSONAS (ni) FRECUENCIA ACUMULADA (Ni)
2400-3000 3 3
3000-4200 20 23
4200-5400 35 58
5400-7250 25 83
7250-9000 15 98
9000-12000 2 100

INGRESO
MENSUAL
NÚMERO DE
PERSONAS (ni)
FRECUENCIA
ACUMULADA
(Ni)
2400-3000 3 3
3000-4200 20 23
4200-5400 35 58
5400-7250 25 83
7250-9000 15 98
9000-12000 2 100
Lk-1 es el límite inferior del intervalo h
(cuya frecuencia acumulada es la
primera mayor o igual a
𝑛𝑘
100
P86 es (7250, 9000)
Lk-1 = 7250
𝑛𝑘
100
𝑛𝑘
100
=
100 ∗ 86
100
= 86

INGRESO
MENSUAL
NÚMERO DE
PERSONAS (ni)
FRECUENCIA
ACUMULADA
(Ni)
2400-3000 3 3
3000-4200 20 23
4200-5400 35 58
5400-7250 25 83
7250-9000 15 98
9000-12000 2 100
Nk-1 es la frecuencia
acumulada hasta Lk-1
Nk-1 = 83
nk es la frecuencia
absoluta del intervalo h.
nk= 15
A es la longitud del
intervalo h
A=9000-7250 = 1750

• Con esos datos, reemplazo:
P86= 7250 +
86−83
15
∗ 1750
P86= 7600
El 86% de los sueldos mensuales de los médicos están ubicados en
$7.600 o menos

CUARTILES
Son 3 valores o
elementos que
dividen a la
distribución o conjunto
de datos en 4 partes
iguale, es decir, cada
una engloba el 25%
de los mismos
Cuartil inferior
(Q1)
Cuartil medio
(Q2)
Cuartil superior
(Q3)
Deja a su izquierda el 25% de los datos (es el menor valor
pero, a su vez, el mayor de una cuarta parte de los datos) y
se cumple que Q1 = P25
Deja a su izquierda el 50% de los datos y coincide
exactamente con la mediana y se cumple que Q2 = P50
Deja a su izquierda el 75% de los datos (tres cuartas partes)
y se cumple que Q3 = P75

DATOS AGRUPADOS
Q1=
1
4
𝑁 Q2=
2
4
𝑁 Q3=
3
4
𝑁
N de obs de las
posiciones de
los cuartiles

EJEMPLO
• La distribución de edades de personas con COVID-19 en un
Hospital público de la ciudad de Ambato
Edad Frecuencia absoluta Frecuencia absoluta acumulada
30-35 3 3
36-40 3 6
41-45 6 12
46-50 14 26
51-55 9 35
56-60 8 43
61-65 7 50
66-70 6 56
71-75 4 60

Q1=
1
4
𝑁 Q2=
2
4
𝑁 Q3=
3
4
𝑁
Edad Frecuencia absoluta
Frecuencia absoluta
acumulada
30-35 3 3
36-40 3 6
41-45 6 12
46-50 14 26
51-55 9 35
56-60 8 43
61-65 7 50
66-70 6 56
71-75 4 60
Q1=15
Q2=30
Q3=45

Q1=46 +
15−12
14
∗ 4 = 46,86 años
Q2=51 +
30−26
9
∗ 4 = 52,78 años
Q3=61 +
45−43
7
∗ 4 = 62,14 años

75
30
46,86
54,78
62,14
Q3
Q2
Q1

DECILES
• Son valores que dividen los datos ordenados en diez partes iguales
(9 divisiones). Datos clasificados en orden ascendente.
Li D1 D2 D3 D4 D5 D6 D7 D8 D9. Ls
• Los deciles dan los valores correspondientes al 10%, 20%…90%
de los datos.
• El decir 5 es la mediana o Q2

EJEMPLO
• La distribución de edades de personas con Zika, en un hospital
público de Esmeraldas. Calcular el decil 4
Edad
Número de personas
(ni)
Frecuencia
acumulada (NI)
10-19 5 5
20-29 11 16
30-39 8 24
40-49 5 29
50-59 8 37
60-69 6 43
70-79 7 50
50 ∗ 4
10
= 20

Medidas de
tendencia central
Ubicados en el
centro de la
distribución
Media
Mediana
Moda
µ
X

DATOS AGRUPADOS POR INTERVALOS
LSC LSC Punto medio Frecuencia absoluta
l1 s1 x1 n1
l2 s2 x2 n2
. . . .
. . . .
lk sk xk nk
Punto medio xi=
𝑙𝑖+𝑠𝑖
2
x=∑
𝑥𝑖∗𝑓𝑖
𝑛

EJEMPLO
• El MSP realizó una tabla de frecuencias del presupuesto destinado
a 10 pequeños proyectos de salud. Calcular el promedio
Min Max Punto medio Frecuencia absoluta
0 100 12
100 200 28
200 300 46
300 400 71
400 500 186
500 600 224
600 700 209
700 800 122
800 900 53
900 1000 19

RESULTADO
x = 555.15
El promedio del presupuesto destinado a
pequeños proyectos de salud es de $555.15

MEDIANA: Es el valor medio
Donde:
• Li: Límite inferior del intervalo en el cual se encuentra la mediana.
• n: Número de datos del estudio.
• Fi-1: Frecuencia absoluta del intervalo anterior al que se encuentra la mediana.
• Ai: Amplitud del intervalo en el que se encuentra la mediana.
• fi: Frecuencia absoluta del intervalo en el que se encuentra la mediana.

RECORDAR
Si los datos están agrupados en una tabla de distribución de
frecuencias, se debe establecer el intervalo donde se encuentra la
mediana.
Para ello se determina el intervalo cuya frecuencia acumulada sea >
𝑛
2

EJEMPLO
Presupuesto anual Número de programas de salud Frecuencia acumulada
2400 - 3000 3 3
3000 - 4200 20 23
4200 - 5400 35 58
5400 - 7250 25 83
7250 - 9000 15 98
9000 - 12000 2 100

Donde:
• Li: Límite inferior del intervalo en
el cual se encuentra la mediana.
• n: Número de datos del estudio.
• Fi-1: Frecuencia absoluta del
intervalo anterior al que se
encuentra la mediana.
• Ai: Amplitud del intervalo en el
que se encuentra la mediana.
• fi: Frecuencia absoluta del
intervalo en el que se encuentra
la mediana.

MODA: Es el valor que tiene la mayor frecuencia absoluta
Donde:
• Li: Límite inferior del intervalo en el cual se encuentra la moda.
• fi-1: Frecuencia absoluta del intervalo anterior en el que se encuentra la moda.
• fi: Frecuencia absoluta del intervalo en el que se encuentra la moda.
• fi+1: Frecuencia absoluta del intervalo siguiente en el que se encuentra la moda.
• Ai: Amplitud del intervalo en el que se encuentra la moda.

EJEMPLO
Edad Punto medio Frecuencia absoluta Frecuencia acumulada
0 - 4 2 3 3
4 - 8 6 5 8
8 - 12 10 6 14
12 - 16 14 4 18
16 - 20 18 3 21

Medidas de
tendencia
dispersión
Mide el grado de
dispersión de los datos
comparados con el centro
Una medida de variabilidad
Mientras que una medida de
tendencia central describe el
valor típico; las medidas de
variabilidad definen cuán
lejos tienen a caer los datos
del centro

DESVIACIÓN ESTÁNDAR
• Raíz cuadrada de la varianza.
• Si el valor de la misma es grande, la dispersión de los valores
también los será.
σ = Desviación estándar de la población
s = Desviación estándar de la muestra

VARIANZA Y DESVIACIÓN ESTÁNDAR PARA DATOS
AGRUPADOS

EJEMPLO
Minutos
Número de mujeres
(ni)
0 - 10 2
11- 20 3
21 - 30 3
31 - 40 7
41 - 50 5
• Minutos de traslado en automóvil, al centro de salud mas cercano,
en mujeres dela Joya de los Sachas
Punto medio

Minutos
Número de
mujeres (ni)
Punto medio
Xi
x Xi - X (Xi - X)2 fi * (Xi - X)2
0 - 10 2
11- 20 3
21 - 30 3
31 - 40 7
41 - 50 5

Minutos
Número de
mujeres (ni)
Punto medio
Xi
x Xi - X (Xi - X)2 fi * (Xi - X)2
0 - 10 2 5 10 -25.45 647.7025 1295.405
11- 20 3 15.5 46.5 -14.95 223.5025 670.5075
21 - 30 3 25.5 76.5 -4.95 24.5025 73.5075
31 - 40 7 35.5 248.5 5.05 25.5025 178.5175
41 - 50 5 45.5 227.5 15.05 226.5025 1132.5125
=
609
15
= 30.45 =
3350.45
15 − 1
= 176.34 = 13.28

INTERPRETACIÓN EN RELACIÓN A LA MEDIA
• La desviación estándar toma las unidades de medida del ejercicio:
cm, dólares, años, kg, etc.
• La desviación estándar de los minutos de traslado, con respecto a su
promedio es 13.28 minutos

¿QUÉ TAN DISPERSOS ESTÁN LOS DATOS?
• Coeficiente de variación: =
𝑠
𝑥
=
13.28
30.45
∗ 100
= 43.61%

MEDIDAS DE FORMA
Y DISTRIBUCIÓN
NORMAL

Permiten conocer qué
forma tiene la curva que
representa la serie de
datos de la muestra
Se clasifican en:
asimetría y
curtosis
Asimetría: mide si la curva tiene o no, una
forma simétrica - dispersión
Curtosis: Mide si los valores de la
distribución están más o menos
concentrados alrededor de los valores
medios de la muestra
MEDIDAS DE FORMA

Mide el grado de asimetría de la
distribución de sus datos en torno a su
media
ASIMETRÍA
Las colas de la variable están
constituidas por los valores alejados de
la media (valores extremos).
Una variable es asimétrica si su cola tiene una
lado más largo que otro, y simétrica si ambas
colas son iguales

• Si As < 0 : izquierda / la cola izquierda es más larga / -
• Si As = 0 : simétrica / ambas colas son iguales
• Si As > 0 : derecha / la cola derecha es más larga /+

CURTOSIS O APUNTAMIENTO
Mide el grado de concentración de los valores que toma en
torno a la media

• Leptocúrtica. K > 0: los valores están muy concentrados en torno a la media, hay
pocos valores extremos (apuntamiento pronunciado).
• Mesocúrtica. K = 0: los valores son simétricos - distribución normal.
• Platicúrtica. K < 0: hay muchos valores extremos (dispersión).

¿Qué sucede si la
distribución de datos es
perfectamente simétrica?

DISTRIBUCIÓN NORMAL
INTRODUCTORY BIOSTATISTICS / CHAP T. LE
CAPITULO 3

¿PARA QUÉ NOS SIRVE?
Se puede calcular la probabilidad de que ciertos valores
ocurran dentro de ciertos rangos o intervalos

La distribución normal o
distribución de Gauss
representa la forma en la
que se distribuyen los
diversos valores numéricos
de las variables
cuantitativas.

PROPIEDADES DE LA CURVA NORMAL
• Toma en cuenta la media y desviación estándar.
• El área bajo la curva es igual a 1
• Es simétrica respecto al centro, o a la media. El 50% de los valores
son mayores que la media, y el 50% de los valores son menores que
la media.
• La media es igual a la mediana y la moda

EXISTEN MILES DE PROBABILIDADES PARA ARMAR
UNA DISTRIBUCIÓN NORMAL
• Se estandariza la distribución de la variable “x” a “z”, la cual tiene
una media = “0”; y desviación estándar = “1”
Media 7 - Desviación estándar 1,5
Media 3 - Desviación estándar 2,4

• Las puntuaciones “z” transformadas se pueden utilizar para
determinar áreas bajo la curva para cualquier distribución normal.

PROPIEDADES
PARA RESOLVER LA
CURVA NORMAL

SIMÉTRICOS RESPECTO A “0”

Supongamos que se sabe el peso que el peso de los sujetos de una determinada
población sigue una distribución aproximadamente normal, con una media de 80kg
y una desviación estándar de 10kg.
1. ¿Cuál es la probabilidad de que una persona elegida al azar, tengo un peso
superior a 100kg?
2. ¿Cuál es la probabilidad de que el peso de un sujeto esté entre 60 y 100kg?

PROBABILIDADES
• Es un valor entre 0 y 1 que indica la posibilidad relativa de que ocurra
un evento.
• El valor de la probabilidad es 0 cuando es imposible que ocurra dicho
evento.
• Mientras más cerca al 0, menos posibilidades hay.

FÓRMULA ESTÁNDAR DE PROBABILIDAD

PROBABILIDADES
• La salud pública está dirigida por probabilidades, y al mismo tiempo
manejan incertidumbre.

VALIDEZ
• La validez parte de una prueba dicotómica, que clasifica a cada
persona como sano o enfermo en función de que el resultado de la
prueba sea positiva o negativa.
• Generalmente, un resultado positivo se asocia con presencia de la
enfermedad y un resultado negativo con la ausencia.
• Cuando se estudia una muestra de personas, los datos obtenidos
permiten clasificar a los sujetos en cuatro grupos; en una tabla 2x2.

RELACIÓN ENTRE EL RESULTADO DE UNA PRUEBA
DIAGNÓSTICA Y LA PRESENCIA/AUSENCIA DE UNA
ENFERMEDAD
Verdadero diagnóstico
ENFERMO SANO
Reactivo (Positivo)
Verdaderos Positivos
(VP) (a)
Falsos Positivos
(FP) (b)
No reactivo
(Negativo)
Falsos Negativos (FN) (c)
Verdaderos Negativos
(VN) (d)

SENSIBILIDAD
• Probabilidad de clasificar correctamente a un individuo enfermo. Es
decir, la probabilidad de que para un sujeto enfermo se obtenga en la
prueba de tamizaje un resultado positivo.
• La sensibilidad es la capacidad del test para detectar la enfermedad.

ESPECIFICIDAD
• Probabilidad de clasificar correctamente a un individuo sano. Es
decir, la probabilidad de que para un sujeto sano se obtenga en la
prueba de tamizaje un resultado negativo.
• La especificidad es la capacidad del test para detectar a los sanos.

SEGURIDAD: VALOR PREDICTIVO
• La sensibilidad y la especificidad informan acerca de la probabilidad
de obtener un resultado correcto (positivo o negativo) en función de
la verdadera condición de la persona respecto a la enfermedad.

VALOR PREDICTIVO POSITIVO
(VPP)
• Probabilidad de padecer la
enfermedad si se obtiene un
restallado positivo en la
prueba.
• El VPP se puede estimar a
partir de la proporción de
pacientes con un resultado
positivo en la prueba que
finalmente resultaron estar
enfermos

VALOR PREDICTIVO POSITIVO
(VPN)
• Es la probabilidad de que un
sujeto con un resultado
negativo en la prueba, esté
realmente sano.
• Se estima dividiendo el
número de verdaderos
negativos entre el total de
pacientes con un resultado
negativo en la prueba.

• La siguiente tabla muestra el número de mujeres que recibieron y no
recibieron un diagnóstico de cáncer en el último año, y el resultado de
su mamografía.
Cáncer No cáncer Total
Mamografía + 15 135 150
Mamografía - 45 470 515
Total 60 605 665

PROBABILIDAD CONDICIONAL
• Es la probabilidad de que ocurra un evento, dado que ha ocurrido
otro evento.
• P (A|B) : se lee “dado que”
• La probabilidad de que ocurra el evento A, dado que ha ocurrido el
evento B.

FÓRMULA PARA LA PROBABILIDAD CONDICIONAL
P(A|B) = P(B&A) / P(B)
P(A|B) = P(B ∩ A) / P(B)
Los eventos son independientes

La siguiente tabla muestra el número de mujeres que recibieron y no
recibieron un diagnóstico de cáncer en el último año, y el resultado de su
mamografía. Encuentra la probabilidad de que una mujer elegida al azar:
a. Tiene cáncer dado que tiene una mamografía con resultado positivo.
b. Tiene una mamografía con resultado positivo dado que tiene cáncer
Cáncer No cáncer Total
Mamografía + 15 135 150
Mamografía - 45 470 515
Total 60 605 665

P(A|B) no es igual a
P(B|A)
Creemos que el orden de los factores no altera el
producto. Esta ley sirve para la multiplicación, aquí
no.
“Dado que” es una condición que no funciona con la
propiedad conmutativa

• Las probabilidades condicionales son utilizadas por las compañías
de seguros privados para determinar sus tarifas.
• Analizan la probabilidad condicional de que tenga un accidente
dada la edad, enfermedades preexistentes, etc. Y fijan el precio de
su póliza en función de esa probabilidad.

TEOREMA DE BAYES
• Se aplica en bioestadística para calcular probabilidades para
detección de enfermedades.
• No obstante, no se evalúa el test diagnóstico; solo un evento con
otro.

PRIMER PASO
• Colocar el esqueleto del teorema
P(A|B)
=
P(A) x
P(B|A)
P(B)
NOTA: La probabilidad de B nunca debe ser “0”

• Calcular la probabilidad de una persona que tiene fiebre
(F) dado que tiene gripe (G)
P( | ) =
P( ) x P( | )
P(
)
NOTA: La probabilidad de B nunca debe ser “0”

EJEMPLO
• En el consultorio de Ma. Alejandra, el 40% de los pacientes fingen
tener gastroenteritis para obtener un descanso médico. El 10% de
los pacientes del consultorio, son hombres. La probabilidad de que
el paciente finja una enfermedad dado que es hombre, es del
50%. Calcular la probabilidad de que un paciente sea hombre,
dado que finge una enfermedad.

Y, ¿SI TENGO MÁS ELEMENTOS?
1. Mapa de árbol.
2. Las probabilidades deben siempre sumar “1”

EJEMPLO
• Una clínica de Quito, cuanta solo con dos especialidades médicas.
El 40% de los médicos son internistas, y el 60% son
gastroenterólogos.
• De los internistas, el 30% son hombres. Mientras que de los
gastroenterólogos el 40% son mujeres.
• Se reporta un accidente cerca de la clínica. En ese caso, si se
selecciona una médica para colaborar con los accidentados, cuál
es la probabilidad de que sea internista.

¿Cuál es la probabilidad de que sea internista dado que sea mujer?

¿Cuál es la probabilidad de que sea internista dado que sea hombre?

Probabilidad condicional Teorema de Bayes
La probabilidad condicional es la
probabilidad de un evento A, que se basa
en la aparición de otro evento B.
El teorema de Bayes se deriva utilizando
la definición de probabilidad condicional.
La fórmula del teorema de bases incluye
dos probabilidades condicionales.

Bioestadística descriptiva y medidas de posición

Recomendados

Recomendados

Más contenido relacionado

Similar a Bioestadística descriptiva y medidas de posición

Similar a Bioestadística descriptiva y medidas de posición (20)

Último

Último (20)

Bioestadística descriptiva y medidas de posición