1. CERRO DE PASCO - 2015
PROCESAMIENTO Y
PRESENTACIÓN DE DATOS
2. Una vez que se han captado o recopilado
los datos de cada uno de los elementos
del grupo de estudio, estos datos, son
revisados, clasificados, presentados y
resumidos para que permita su análisis e
interpretación.
ELABORACIÓN DE DATOS
2
3. • La clasificación consiste en agrupar los
datos en un número determinado de
categorías o clases.
• El número de categorías o clases
depende del tipo de variable.
CLASIFICACIÓN DE LOS DATOS
3
4. Ejemplo:
Población: Niños menores de 5 años de edad.
Variables cualitativas de interés a estudiar:
Sexo: Masculino (M), Femenino (F)
Estado de la nutrición: Normal, desnutrido
y obeso
Nivel socio económico: B, C y D
CLASIFICACIÓN DE DATOS SEGÚN
VARIABLE CUALITATIVA
4
5. Estado de la
Nutrición
n %
Normal
Desnutrido
Obeso
Total
CLASIFICACIÓN DE DATOS SEGÚN
UNA VARIABLE CUALITATIVA
5
Sexo n %
Masculino
Femenino
Total
6. Estado de la
Nutrición
Sexo
Masculino Femenino Total
n %
Normal
Desnutrido
Obeso
Total
n % n %
CLASIFICACIÓN DE DATOS SEGÚN
DOS VARIABLES CUALITATIVAS:
6
7. Estado de la
Nutrición
Nivel Socioeconómico
Total
B C D
Normal
Desnutrido
Obeso
Total
CLASIFICACIÓN DE DATOS SEGÚN
DOS VARIABLES CUALITATIVAS:
7
8. .
Sexo Nivel
Socio
Econ.
Estado de la Nutrición
Total
Normal Desnutrido Obeso
Masculino B
C
D
Femenino
B
C
D
Clasificación de datos según
tres variables cualitativas
8
9. Ejemplo N°1:
A continuación se presenta los resultados de
30 personas con cáncer pulmonar del Hospital
Nacional DAC de la Provincia de Pasco, en
2010. los pacientes se clasifican según ciudad
de residencia (A, B, C, D), edad (años) y sexo
(M=masculino y F=femenino). Los resultados
fueron:
a) Representar en una tabla según ciudad de procedencia.
b) Representar en una tabla según sexo.
c) Representar en una tabla según ciudad de procedencia y por
sexo.
9
10. Paciente Ciudad Edad Sexo Paciente Ciudad Edad Sexo
01 A 30 M 16 B 46 F
02 A 43 M 17 A 69 M
03 B 58 F 18 A 44 M
04 C 61 M 19 C 59 F
05 A 70 M 20 D 62 M
06 D 42 F 21 D 66 M
07 C 58 F 22 C 71 M
08 A 39 M 23 A 70 F
09 B 60 F 24 C 65 M
10 B 55 M 25 D 39 M
11 C 57 M 26 A 40 F
12 A 49 M 27 A 61 F
13 A 61 F 28 B 65 M
14 D 69 M 29 B 56 M
15 D 43 M 30 C 38 M
10
11. Se forma intervalos de clase, siguiendo los
siguientes pasos:
MÉTODO 1:
1.- Determinar el rango o recorrido (R) del
conjunto de datos, viene a ser el valor máximo
menos el valor mínimo,
R= (Vmax - Vmin)
Del ejemplo N°1, tenemos:
A= (71 - 30) = 41
CLASIFICACIÓN DE DATOS SEGÚN
VARIABLE CUANTITATIVA
11
12. 2. Determinar el número de intervalos (m), está dado
por la regla de Sturges:
m = 1 + 3.322 log (n)
En relación al ejemplo se tiene que: m = 5.9 =
6
Por tanto, m puede ser 5 ó 6 ó 7.
En este caso, para nuestro ejemplo
consideramos, m = 6.
3. Determinar la amplitud del intervalo de clase (C),
llamado también tamaño de clase, mediante:
C = R / m
Para nuestro ejemplo: C = 41 / 6 = 6.8 = 7 12
13. 4. Determinar Rango nuevo (Rn) y exceso, mediante:
Rn = c . m
Rn = 7 x 6 = 42
Por lo tanto se presenta un exceso con respecto al
rango original: Exceso = Rn – R
Exceso = 42 – 41 = 1
Nota: Si el exceso es un número par, repartir la
mitad al extremo inferior y la otra mitad al
extremo superior; si es impar, descomponer el
número luego se distribuye el menor al extremo
inferior y el mayor al extremo superior.
Ejms: 2 1 3 2
1 1 13
14. 14
CLASE Edad Xi fi Fi hi Hi hi% Hi%
1
2
3
4
5
6
[30 – 37)
37 - 44
44 - 51
51 - 58
58 - 65
65 - 72
33.5
40.5
47.5
54.5
61.5
68.5
1
7
3
3
8
8
1
8
11
14
22
30
0.03
0.23
0.10
0.10
0.27
0.27
0.03
0.26
0.36
0.46
0.73
1.00
3
23
10
10
27
27
3
26
36
46
73
100
TOTAL 30 1.00 100
Por lo tanto la tabla de frecuencias es como
sigue:
Xi = Punto medio o marca de clase.
15. 1.- Determinar la amplitud (A) del conjunto de
datos, es decir, el valor máximo menos el valor
mínimo, más uno si los datos están expresados en
enteros:
A= (Vmax - Vmin) + 1
Del ejemplo N°1, tenemos:
A= (71 - 30) + 1= 42
MÉTODO II:
15
16. Nota: Si los valores máximo y mínimo están
expresados hasta décimas se incrementará un décimo
(0,1); si los valores están expresados en centésimos,
se agregará un centésimo (0,01) y así sucesivamente.
2. Determinar el número de intervalos (denotado por
k), mediante:
k = 1 + 3.322 log (n)
En relación al ejemplo se tiene que: k = 5.9 = 6
Por tanto, k puede ser 5 ó 6 ó 7.
En este caso, para nuestro ejemplo
consideramos, K= 6. 16
17. 3. Determinar la amplitud del intervalo de clase (C),
utilizando la siguiente expresión: C= A / k
Para nuestro ejemplo: C= 42 / 6 = 7
4.Como los números están expresados en enteros, el
Vmín es el límite inferior de la primera clase y su
respectivo límite superior será Vmin + (C-1); el
límite inferior de la segunda clase es el límite
superior de la primera clase más uno y el
respectivo límite superior será igual al límite
inferior mas (C-1); y así sucesivamente hasta
completar el número de intervalos.
17
18. En relación al ejemplo se tiene:
30-36
37-43
44-50
51-57
58-64
65-71
Edad
mínima
Edad
máxima
30 + (7 – 1 )
36 + 7, así sucesivamente
30 + 7, así
sucesivamente
18
19. Nota:
Si los límites están expresados hasta décimas
entonces se tendrá que el límite superior de la
primera clase es:
Vmín + (C – 0,1);
Si está expresado hasta centésimas será:
Vmín + (C – 0,01) y así sucesivamente.
5- Entonces se obtiene la tabla de clasificación de
los datos de una variable continua.
19
21. Donde:
fi: Frecuencia absoluta del i-ésimo intervalo, nos indica
número de veces que aparece repetido dicho valor.
Fi: Frecuencia absoluta acumulada de la clase i.
F1=f1
F2=f1+f2
hi: Frecuencia relativa de la clase i, es el cociente entre la
frecuencia absoluta y el número total de observaciones.
hi = fi/n
Hi: Frecuencia relativa acumulada de la clase i.
H3 = h1 + h2 + h3
21
22. hi%: Frecuencia relativa porcentual de la clase i, es la
frecuencia relativa multiplicando por 100.
hi% = hi * 100
Hi%: Frecuencia relativa acumulada porcentual de la clase i,
es la frecuencia relativa acumulada multiplicado por
100.
Hi% = Hi * 100
Xi: Es la marca de clase de la clase i, se determina mediante
el promedio de los límites de dicho intervalo.
Limites reales: Si los límites nominales de los intervalos de
clase están expresados en enteros los límites reales de cada
intervalo se determina restando y sumando media unidad al
límite inferior y superior respectivamente de cada intervalo.
22
23. La presentación de los datos se hace
fundamentalmente utilizando dos
métodos:
- Tabular y
- Gráfico
PRESENTACIÓN DE LA INFORMACIÓN
23
24. Partes principales de un cuadro
estadístico
Generalmente un cuadro estadístico
completo puede tener las siguientes partes:
1. Número del cuadro.
2. Título.
3. Matriz.
4. Cuerpo.
5. Nota de pie o llamadas.
24
25. Ciudad de
Procedencia
SEXO
Masculino Femenino Total
n %
A
B
C
D
Total
n % n %
25
Tabla 1. Personas con cáncer pulmonar según ciudad
de procedencia y por sexo. Hospital DAC - 2010.
Leyenda
1. Número
del cuadro
2. Título
3. Matriz
4. Cuerpo
5. Nota de
pie o
llamadas
1 2
3
4
3
5 Fuente: Historias Clínicas.
26. Es la descripción resumida del contenido del
cuadro.
Debe responder a las preguntas:
• Que? Población.
• Como? Variable(s) de estudio.
• Donde? El lugar.
• Cuando? El tiempo.
TÍTULO
26
27. MÉTODO GRÁFICO
Esencialmente un gráfico estadístico es la
presentación de la información por medio de
figuras geométricas.
El objetivo primordial de un gráfico es dar una
impresión visual de conjunto para una rápida y fácil
comprensión del fenómeno que se está estudiando.
Por tal motivo un gráfico debe ser sencillo y
explicativo.
27
28. Gráfica de los datos según una
variable cualitativa
Generalmente para representar variables
categóricas se utilizan gráficos de:
- Barras simples o dobles, y
- Sectores circulares.
28
29. GRAFICO N°1
PACIENTES CON TUMOR MALIGNO SEGÚN DISTRITO
DE RESIDENCIA. Hospital Arzobispo Loayza. Lima 2004.
12
14
12
22
0
4
8
12
16
20
24
La Perla Callao La Punta Bellavista
Distrito
Número
de
pacientes
Fuente: Tabla N° 1 29
30. GRAFICO N°2
PACIENTES CON TUMOR MALIGNO SEGÚN DISTRITO DE
RESIDENCIA Y POR SEXO.
Hospital Arzobispo Loayza. Lima.2004
0
2
4
6
8
10
12
14
16
La Perla Callao La Punta Bellavista
Distrto
Número
de
Pacientes
Femenno Masculino
Fuente: Tabla N° 2
30
31. Gráfico de Sectores Circulares
Para su elaboración se utiliza la circunferencia
siendo necesario que los valores absolutos
y/o porcentajes sean traducidos a grados, los
360° se reparten en proporción a los
porcentajes. Correspondiendo a cada sector
de la circunferencia la magnitud de cada
categoría de la variable.
31
32. GRAFICO N°4
PACIENTES CON TUMOR MALIGNO SEGÚN DISTRITO DE
RESIDENCIA.
Hospital Arzobispo Loayza.Lima.2004
La Perla
37%
Callao
20%
La Punta
23%
Bellavista
20%
Fuente: Tabla N° 1
32
33. Gráfica de los datos según una
variable cuantitativa
Los principales gráficos son el histograma,
polígono de frecuencia y el ojivas:
Histograma
Es un gráfico que se utiliza para
representar las frecuencias absolutas o
relativas mediante rectángulos adyacentes,
teniendo como base los respectivos límites
reales de los intervalos de clase y la altura
proporcional a la frecuencia respectiva.
33
34. GRAFICO N° 5
PACIENTES CON TUMOR MALIGNO SEGÚN EDAD.
Hospital Arzobispo Loayza. Lima.2004
0
4
8
12
16
20
33 40 47 54 61 68
Edad (años)
Número
de
pacientes
Fuente: Tabla N° 3
34
35. Polígono de Frecuencias
Este gráfico se obtiene uniendo los puntos
medios superiores de los rectángulos del
histograma, formándose de esta manera
un gráfico lineal, el cual debe llevarse hasta
el eje x en los extremos del límite inferior
del primer intervalo y superior del último
intervalo respectivamente.
El área total bajo el polígono equivale al
área del histograma.
35
36. GRAFICO N° 6
PACIENTES CON TUMOR MALIGNO SEGÚN EDAD.
Hospital Arzobispo Loayza. Lima - 2004
0
4
8
12
16
20
33 40 47 54 61 68
Edad (años)
Número
de
pacientes
Fuente: Tabla N° 3
36
37. Ojivas
Utiliza las frecuencias absolutas o relativas
acumuladas, y consiste en un gráfico lineal
que nos permite observar la cantidad de
elementos que quedan por encima o por
debajo de determinados valores de los límites
de los intervalos de clase.
La ojiva se obtiene uniendo los puntos que le
corresponden a las frecuencias acumuladas de
los respectivos límites superiores de cada
intervalo. 37
38. GRAFICO N°7
HISTOGRAMA Y POLIGONO DE FRECUENCIAS RELATIVAS ACUMULADAS
PACIENTES CON TUMOR MALIGNO SEGÚN EDAD. Hospital Arzobispo
Loayza. Lima.2004
0
20
40
60
80
100
33 40 47 54 61 68
Edad (años)
H¡%
Fuente: Tabla N° 3
38
39. Ejemplo 1:
Variable: Nº de hijos por familia.
Se tiene 50 familias y los datos son:
5 3 1 2 1 0 1 2 0 1 3 0 1 0
1 4 3 5 2 1 0 1 2 0 1 4 5 1
3 4 1 0 1 0 2 3 1 0 1 2 5 4
1 0 1 0 2 3 4 0
Representar mediante un cuadro estadístico.
EJERCICIOS DE APLICACIÓN
39
41. Ejemplo3:
Número de horas que 35 pacientes de un
hospital durmieron después que se les aplicó
una cierta forma de anestesia.
3,1 0,9 17,0 10,3 7,6 11,0 7,1 6,6 4,0
5,4 3,1 1,4 5,2 3,7 13,0 7,6 7,0 4,5
2,3 13,2 7,7 11,8 11,9 3,0 6,6 2,9 9,7
7,8 3,5 8,3 4,6 7,2 1,1 3,5 3,9
Construir tabla de distribución de frecuencias.
Construya el polígono de frecuencia y la ojiva
correspondiente. 41