2. Pensamientos sobre la estadística
“No existe la suerte. Sólo hay preparación adecuada o
inadecuada para hacer frente a una estadística.”
Robert Heinlein
“Las estadísticas no son un sustituto de la sentencia.”
Henry Clay
“Quien hace puede equivocarse, quien no hace ya está
equivocado.”
Daniel Kon
3. La ciencia se ocupa en general de fenómenos observables.
La ciencia se desarrolla observando hechos, formulando
leyes que los explican y realizando experimentos para validar
o rechazar dichas leyes .
Los modelos que crea la ciencia son de tipo determinista o
aleatorio (estocástico).
4. La estadística se utiliza como tecnología al servicio de
las ciencias donde la variabilidad y la incertidumbre
forman parte de su naturaleza.
“La Bioestadística [...] enseña y ayuda a investigar en
todas las áreas de las Ciencias de la Vida donde la
variabilidad no es la excepción sino la regla.” Carrasco
de la Peña (1982)
5. La estadística es una ciencia formal y una
herramienta que estudia el uso y los análisis
provenientes de una muestra representativa
de datos, buscando explicar las correlaciones y
dependencias de un fenómeno físico o natural, de
ocurrencia en forma aleatoria o condicional.
6. Un estudio estadístico consta de las
siguientes fases:
Recogida de datos
Organización y representación de datos
Análisis de datos
Obtención de conclusiones
7. Hacer conclusiones del comportamiento de la población
basadas en datos muestrales no representativos.
Realizar conclusiones cuando no se tienen los suficientes
datos.
Por diferencias en las definiciones.
Medición inadecuada o la mala clasificación.
Comparaciones inadecuadas.
8. Conceptos de estadística
Una población es el
conjunto de todos los
elementos a los que
se somete a un
estudio estadístico.
Un individuo o
unidad estadística
es cada uno de los
elementos que
componen la
población.
Una muestra es un
conjunto representativo
de la población de
referencia.
El número de individuos
de una muestra es
menor que el de la
población.
9. Conceptos de estadística (continuación)
El muestreo es la
reunión de datos que se
desea estudiar,
obtenidos de una
proporción reducida y
representativa de la
población.
Un valor es cada
uno de los distintos
resultados que se
pueden obtener en
un estudio
estadístico.
Si lanzamos una
moneda al aire 5
veces obtenemos 2
valores: cara y cruz.
Un dato es cada uno
de los valores que se
ha obtenido al realizar
un estudio estadístico.
Si lanzamos una
moneda al aire 5
veces obtenemos
5 datos: cara, cara,
cruz, cara, cruz.
10. ¿Cómo calcular el tamaño de una muestra representativa?
Población infinita Población Finita
Cuando no se sabe el número exacto de
unidades del que está compuesta la
población.
Cuando se conoce cuántos elementos
tiene la población
En donde:
Z = nivel de confianza.
p = Probabilidad a favor.
q = Probabilidad en contra.
N = Universo
e = error de estimación.
n = tamaño de la muestra
Se recomienda trabajar con un nivel de confianza igual o mayor al 95% y un
error igual o menor del 5%.
11.
12. Supóngase que se desea determinar la calidad y el nivel de servicio que ofrecen
los centros de atención médica de Cochabamba; por lo que resulta necesario
entrevistar a los distintos pacientes que acuden a estos centros para así conocer
su opinión. ¿Cómo calcular el tamaño de la muestra?
Ejercicio resuelto
1-Establecer el nivel de confianza (95% y un error del 5%).
2-Se obtiene el marco muestral, en este caso la referencia con que se cuenta es
el registro de pacientes del año pasado y que arroja la cifra de 43 700 pacientes.
Valores a estimar:
n = ?
e = 5% =0.05
Z = 1.96 (tabla de distribución normal para el 95% de confiabilidad y 5% error)
N= 43700 (Población finita)
p = 0.50
q = 0.50
16. Variable
cualitativa
nominal
Presenta modalidades
no numéricas que no
admiten un criterio de
orden
Ejemplo: el estado civil,
religión,
color de los ojos,
género…
ordinal
Presenta modalidades no
numéricas, en las que existe
un orden.
Por ejemplo:
-La nota en un examen:
suspenso, aprobado, notable,
sobresaliente.
-Puesto conseguido en una
prueba deportiva: 1º, 2º, 3º.
-Vómito leve, moderado,
severo.
-Estado socioeconómico:
bajo, medio, alto.
Variables estadísticas
Son características que
no pueden ser medidas
con instrumentos.
17. Variable
cuantitativa
discreta
Es aquella que toma
valores aislados, es decir
no admite valores
intermedios entre dos
valores específicos.
Por ejemplo: El número de
hermanos de 5 amigos:
2, 1, 0, 1, 3
continua
Es aquella que puede
tomar valores
comprendidos entre dos
números.
Por ejemplo: La altura de
5 amigos:
1,73 m; 1,82 m; 1,77 m;
1,69 m; 1,75 m
Variables estadísticas
18. Ejemplo de la utilización de diferentes tipos de escalas de las
variables para un mismo fenómeno:
Escala de razón: número de evacuaciones por día = 20
Escala de intervalo: número de evacuaciones por día = de (1-5; 6-15; >15)
Escala ordinal: diarrea leve, moderada, severa.
Escala nominal: con diarrea, sin diarrea.
Fenómeno: Evaluación de la diarrea
19. Distribución de frecuencias
La frecuencia absoluta
es el número de veces
que aparece un
determinado valor en un
estudio estadístico.
La suma de las
frecuencias absolutas es
igual al número total de
datos, que se representa
por N.
La frecuencia relativa es
el cociente entre la
frecuencia absoluta de un
determinado valor y el
número total de datos.
20. Ejemplo : Encuesta sobre el candidato más
votado en las elecciones 1997
P = Jaime Paz B = Hugo Bánzer
K = Ivo Kuljis V = Alejo Veliz
Pa = Carlos Palenque D = Juan Carlos Durán
U = Miguel Urioste G = Eudoro Galindo
D D D B P B D D B B
B B B D D D K D B U
V B B P U K P U P P
U B D P K K V P V U
U D D B B B B B K B
21. FRECUENCIA ABSOLUTA ( ni )
Como la frecuencia
absoluta es el número de
veces que aparece un valor
(xi) en los datos obtenidos.
En nuestro ejemplo, la
frecuencia absoluta indica
el número de veces que se
voto por cada candidato
N es el número total de
datos, en el ejemplo, N = 50
Xi ni
P 7
B 17
K 5
V 3
Pa 0
D 12
U 6
G 0
N = 50
22. Como la frecuencia relativa es el cociente entre la
frecuencia absoluta (n i) y el número total de datos
(N). En nuestro ejemplo N = 50:
FRECUENCIA RELATIVA ( hi )
Xi ni hi
P 7 14
B 17 34
K 5 10
V 3 6
Pa 0 0
D 12 24
U 6 12
G 0 0
Total 50 100
24. Un diagrama de sectores
se puede utilizar para todo
tipo de variables, pero se
usa frecuentemente para
las variables cualitativas.
Diagrama de sectores
Los datos se
representan en un
círculo, de modo que el
ángulo de cada sector
es proporcional a la
frecuencia absoluta
correspondiente.
25. En una clase de
30 alumnos, 12
juegan a
baloncesto, 3
practican la
natación, 4 juegan
al fútbol y el resto
no practica ningún
deporte.
Ejemplo:
26. Un diagrama de barras se utiliza para de
presentar datos cualitativos o datos
cuantitativos de tipo discreto.
Diagrama de barras
Se representan sobre unos ejes de
coordenadas.
En el eje de abscisas se colocan los
valores de la variable, y sobre el eje de
ordenadas las frecuencias absolutas o
relativas o acumuladas.
Los datos se representan mediante
barras de una altura proporcional a la
frecuencia.
27. Un estudio hecho al conjunto de los 20 alumnos
de una clase para determinar su grupo sanguíneo
ha dado el siguiente resultado:
Ejemplo
28. Un polígono de frecuencias se forma
uniendo los extremos de las barras de un
diagrama de barras mediante segmentos.
Polígono de frecuencias
También se puede realizar trazando los
puntos que representan las frecuencias y
uniéndolos mediante segmentos.
29. Las temperaturas en un día invernal de una ciudad han
sufrido las siguientes variaciones:
Hora
Temperatura
(ºC)
Ejemplo
30. Un histograma es una representación gráfica de una
variable en forma de barras.
Se utilizan para variables continuas o para variables
discretas, con un gran número de datos, y que se han
agrupado en clases.
En el eje abscisas se construyen unos rectángulos que
tienen por base la amplitud del intervalo, y por altura, la
frecuencia absoluta de cada intervalo.
La superficie de cada barra es proporcional a la frecuencia
de los valores representados.
Histograma
31. Ejemplo
El peso de 65 personas adultas viene dado por la siguiente
tabla:
32. La frecuencia absoluta acumulada indica cuantos
elementos de la lista de datos son menores o iguales a un
valor dado. Es la suma de las frecuencias absolutas desde
la primera fila hasta la fila elegida.
Frecuencia absoluta acumulada (Ni)
33. La frecuencia relativa acumulada es el cociente entre la
frecuencia absoluta acumulada (Ni) y el número total de datos
(N).
Frecuencia relativa acumulada (Ni)
34. Ejemplo: Ocupación en una planta de producción
G = Gerente I = Ingeniero
T = Técnico de prod. O = Operario
A = Ayudante
T I O A T G A O O A
A O G I O T O T A O
I O A T O O G O I A
O T A O T I O T A A
35. Distribución de 40 trabajadores según su categoría
Xi ni hi Ni Hi
G 3 7.5 3 7.5
I 5 12.5 8 20
T 8 20 16 40
O 14 35 30 75
A 10 25 40 100
40 100
36. Diagrama de barras de 40 trabajadores según categoría
0
2
4
6
8
10
12
14
16
G I T O A
ni
Trabajadores por ocupación
37. Polígono de frecuencia de 40 trabajadores según su categoría
3
8
16
30
40
0
5
10
15
20
25
30
35
40
45
G I T O A
Ni
Ocupaciones por trabajadores
38. Utilización de estadígrafos
1- ESTADÍGRAFOS DE POSICIÓN O MEDIDAS DE TENDENCIA CENTRAL
Estos estadígrafos, son indicadores ó
medidas de resumen estadístico. Describen
la posición que ocupa una distribución de
frecuencia alrededor “de un valor” de la
variable. Los estadígrafos no son valores
determinantes, ni menos valores exactos,
pero si los más representativos de una
variable.
39. Media aritmética
La media de n datos corresponde al resultado de la expresión:
Ejemplo: Se pretende describir el promedio de edad de los 10 niños que
ingresaron por primera vez a una guardería. Las edades registradas en
años fueron: 1, 2, 3, 2, 1, 4, 1, 1, 3 y 4. La suma de las edades de todos
los niños es 22, dividido entre los 10 niños es igual a 2.2 años. Por lo
tanto, el promedio de edad de los niños que ingresaron por primera vez
a una guardería es de 2.2 años.
Es el promedio aritmético de las observaciones. Es el valor que
representa a todos los individuos de la muestra.
Donde xi es el valor de cada una de las observaciones y n representa el
total de las observaciones.
40. Moda
La moda es el valor que tiene mayor frecuencia absoluta.
Se representa por Mo.
Se puede hallar la moda para variables cualitativas y cuantitativas.
Hallar la moda de la distribución:
2, 3, 3, 4, 4, 4, 5, 5 Mo = 4
Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y
esa frecuencia es la máxima, la distribución es bimodal o multimodal, es
decir, tiene varias modas.
1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9 Mo= 1, 5, 9
41. Mediana
Es el valor que ocupa el lugar central de todos los datos cuando éstos
están ordenados de menor a mayor.
Ejemplo: Encontrar la mediana de la hemoglobina glicosilada (medida
en %) de 14 personas con diabetes mellitus tipo II tratados con
glibenclamida:
8, 11.9, 8.5, 7.4, 8, 9.6, 8.5, 6.7, 7, 10.4, 7, 8.2, 8.7, 8.1. Me = 8.15
Cálculo de la mediana
1. Ordenamos los datos de menor a mayor.
2. Si la serie tiene un número impar de medidas la mediana es
la puntuación central de la misma.
2, 3, 4, 4, 5, 5, 5, 6, 6 Me = 5
3. Si la serie tiene un número par de puntuaciones la mediana es
la media entre las dos puntuaciones centrales.
7, 8, 9, 10, 11, 12 Me = 9.5
42. ESTADÍGRAFOS DE DISPERSIÓN Y ASIMETRÍA
Intentan cuantificar la representatividad de una medida de posición,
mediante el grado de variabilidad o dispersión de los datos
observados respecto de dicha medida de posición.
Medir la variabilidad ó dispersión de los datos respecto de un
estadígrafo deposición, equivale a cuantificar la separación (ó
desviación ) de éstos datos respecto de dicho estadígrafo. Sí todos
los datos están cercanos al estadígrafo de posición, sus desviaciones
serán pequeñas ( la dispersión respecto del estadígrafo será
pequeña), por tanto dicho estadígrafo será representativo de los
datos.
43. La desviación estándar ó
desviación típica
La desviación típica es la raíz cuadrada de la varianza.
Es decir, la raíz cuadrada de la media de los cuadrados de las
puntuaciones de desviación.
La desviación típica se representa por σ.
Si a todos los valores de la variable se les suma un número la desviación
típica no varía.
Cuanta más pequeña sea la desviación típica mayor será la concentración
de datos alrededor de la media.
44. Varianza de la muestra
La varianza es la media aritmética del cuadrado de las desviaciones
respecto a la media de una distribución estadística.
-La varianza, al igual que la media, es un índice muy sensible a las
puntuaciones extremas.
-En los casos que no se pueda hallar la media tampoco será posible
hallar la varianza.
-La varianza no viene expresada en las mismas unidades que los
datos, ya que las desviaciones están elevadas al cuadrado.
45. Rango ó recorrido
intercuartílico
Es la diferencia entre Q3 y Q1. La idea es dividir los datos en cuatro
grupos iguales y ver lo distantes que son los extremos de esos grupos.
Los cuartiles primero y tercero ayudar a tener una visión del grado de
dispersión de las respuestas, ya que el primer cuartil (Q1), que es igual
al percentil 25, sería el valor que deja el 25% de las respuestas por
debajo de ella y el 75% por encima, y por otra parte el tercer cuartil
(Q3), que es igual al percentil 75, sería el valor que deja el 75% de las
respuestas por debajo de ella y el 25% por encima. Es decir entre Q1 y
Q3, se situaría la mitad central de las respuestas obtenidas.
46. MEDIDAS DE FRECUENCIA DE LA ENFERMEDAD MÁS UTILIZADAS EN
LA PRÁCTICA CLÍNICA
RAZÓN
Es la comparación, a través de una división, de dos grupos de individuos
con atributos de diferente naturaleza. Es la forma más simple de mostrar
desigualdades entre grupos.
Ejemplo: Se han atendido a 1,200 pacientes con diabetes en el servicio de
urgencias de un hospital, 900 de ellos fueron mujeres y 300 hombres.
En la división puede considerarse como numerador cualquiera de los
valores. De ahí que 900/300 = 3, por lo que la relación entre mujeres y
hombres con respecto a diabetes mellitus que acudieron al Servicio de
Urgencias fue de 3 mujeres por cada hombre (3:1).
47. MEDIDAS DE FRECUENCIA DE LA ENFERMEDAD MÁS UTILIZADAS EN
LA PRÁCTICA CLÍNICA (Continuación)
PROPORCIÓN
La proporción es la medida de estadística descriptiva que más se usa. Es
el número de observaciones con una característica en particular entre la
población de referencia. El numerador siempre está incluido en el
denominador. Se expresa en porcentaje.
Las medidas de proporción utilizadas en la práctica clínica para describir
la enfermedad son la prevalencia y la incidencia.
La prevalencia es el número
de casos existentes de una
enfermedad en particular
entre la población de
referencia.
La incidencia, a diferencia de la
prevalencia, es el número de
casos nuevos que se presentan
de una enfermedad en particular
dividida entre la población libre de
la enfermedad al inicio del
seguimiento.
48. MEDIDAS DE FRECUENCIA DE LA ENFERMEDAD MÁS UTILIZADAS EN
LA PRÁCTICA CLÍNICA (Continuación)
Ejemplo del Cálculo de la Prevalencia
La prevalencia de pacientes con cáncer de próstata diagnosticados en
el servicio de urología en el 2015 en un hospital determinado sería:
Prevalencia =
No. de pacientes con cáncer de próstata (75)
Total de pacientes del servicio de Urología (1500)
75/1500= 0.05. Generalmente la fracción resultante se multiplica por 100,
debido a que la probabilidad es de 0 a 100 y se expresa en porcentaje.
Esto es, la prevalencia de pacientes con cáncer de próstata
diagnosticados en el servicio de urología durante el 2015 fue de 5%;
dicho de otra manera, aproximadamente 5 de cada 100 pacientes que
acuden al servicio de urología son diagnosticados con cáncer de
próstata.
49. MEDIDAS DE FRECUENCIA DE LA ENFERMEDAD MÁS UTILIZADAS EN
LA PRÁCTICA CLÍNICA (Continuación)
Ejemplo del Cálculo de la Incidencia
Se pretende estimar la incidencia de infección de sitio quirúrgico en
cirugías electivas en un hospital de segundo nivel. A lo largo del trimestre
se presentaron 25 casos nuevos de infección de sitio quirúrgico y en ese
mismo periodo se realizaron 789 cirugías.
Incidencia =
No. de casos nuevos de infección de sitio quirúrgico (25)
Población expuesta a cirugía electiva (789)
(25/789) * 100 = 3.17 % . Es decir, durante el trimestre, de cada 100
pacientes que se operaron, aproximadamente 3 desarrollaron infección
de sitio quirúrgico.
50. MEDIDAS DE FRECUENCIA DE LA ENFERMEDAD MÁS UTILIZADAS EN
LA PRÁCTICA CLÍNICA (Continuación)
TASA
La tasa es la medida de frecuencia que da cuenta de la velocidad de cambio
en la población, de estar sana a pasar al estado enfermo, o del estado de
enfermo a sano. La tasa es la comparación, a través de una división, entre el
número de veces que se presenta una enfermedad, o el evento estudiado,
en un periodo determinado, entre el tiempo-persona o tiempo poblacional,
que es la expresión con la que cada individuo contribuye libre de la
enfermedad, o del evento, en el tiempo de seguimiento.
Ejemplo: Se pretende estimar la tasa de recuperación de los pacientes
operados de colecistectomía por invasión mínima. Se siguió a 10 pacientes
durante 7 días. Se construye un cuadro con la evolución de los pacientes
en días, se realiza la suma de los días que tardaron en recuperarse, se
divide el número de pacientes recuperados (9 pacientes) entre la sumatoria
de los días-persona. La fracción se multiplica por 1000 días persona, ya
que la tasa se expresa en múltiplos de mil.
51. MEDIDAS DE FRECUENCIA DE LA ENFERMEDAD MÁS UTILIZADAS EN
LA PRÁCTICA CLÍNICA (Continuación)
TASA (continuación)
Tasa de recuperación =
9/33.5 días persona = 0.269 x
1,000 días persona = 269. La
interpretación es que si se
siguiera a 1,000 pacientes
postoperados de
colecistectomía con cirugía
de invasión mínima en un día,
se recuperarían 269. La tasa
debe describirse de acuerdo
a la unidad de tiempo que
puede ser día, mes o año. El
paciente número 8 no se
recuperó, pero se contaron
los 7 días de contribución sin
recuperación.
55. Ejemplos de encuestas
Encuesta aplicada a pacientes para determinar su satisfacción con respecto a los
servicios de salud de un hospital X
56. Ejemplos de encuestas
Encuesta aplicada a pacientes para determinar su percepción sobre a la atención
recibida en un centro médico
57. Estadística descriptiva implementada en Excel
Instalar las herramientas de análisis de datos en Excel
Hacer clic en la ficha Archivo y posteriormente en Opciones. Se
mostrará el cuadro de diálogo Opciones y hacer clic en Complementos.
Dentro de la lista desplegable se deberá seleccionar la
opción Complementos de Excel y hacer clic en el botón Ir.
59. Trabajo Final del Módulo
1-Confeccione una encuesta en base a una necesidad informacional presentada en su
proyecto de investigación (tesis) preferiblemente, o cualquier otro tema vinculado a su perfil
de desempeño actual.
2-Determine una muestra representativa para aplicar dicha encuesta, validada por los
métodos estudiados en clases.
3-Realice un análisis estadístico en EXCEL de los datos recolectados. Incluye:
-Confección de tablas de distribución de frecuencias para cada pregunta de la encuesta con
sus gráficos correspondientes.
- Cálculo de media aritmética, mediana, moda, desviación estándar, varianza de la muestra
y recorrido intercuartílico.
Partes del trabajo:
-Introducción (una breve caracterización de la investigación a realizar)
-Desarrollo (Diseño y procesamiento estadístico de una encuesta en base a una necesidad
una muestra representativa previamente calculada o establecida).
-Conclusiones (Interpretaciones fundamentales resultantes del análisis estadístico
realizado).
Notas del editor
Si los elementos de la Poblacion son los votos. La cantidad de votos a un candidato es una variable discreta. Seran X1, X2, X3,…X8 , 8 variables discretas.
En la pizarra anotar cuantas veces aparece cada voto, y definir la frecuencia absoluta
UNMSM - FQIQ - IQ - 2008 II
UNMSM - FQIQ - IQ - 2008 II
UNMSM - FQIQ - IQ - 2008 II
Los puestos en una planta estan distribuidos de esta manera. Vamos a realizar la distribucion de los mismos