2. • En una investigación, la recolección de datos es
un paso crucial e indispensable.
• Los datos se obtienen de una medición o de un
conteo de las variables de interés en la
población o muestra.
1. Recolección de datos
3. Primarias: aquellos datos que son generados por el investigador,
quien los obtiene directamente de las unidades de observación.
– Se registran usando diversas técnicas: cuestionario
(encuesta), entrevista, observación, experimentación, entre
otros.
Secundarios: aquellos datos obtenidos anteriormente de las
unidades de observación y que se encuentran documentados en:
revistas, tesis, censos, registros, publicaciones de organizaciones,
publicaciones en Internet, entre otros.
– Las fuentes mencionadas constituyen fuentes secundarias de
datos y son las primeras que deben ser analizadas en el
proceso de recolección.
Fuentes de Datos
4. Después de recopilar y revisar los datos
necesarios para la investigación, se deben
clasificar y presentar de forma adecuada para
permitir su análisis e interpretación.
2. Elaboración de datos
6. • La tabla de frecuencias es una forma de agrupación
de datos.
• Los datos pueden ser cualitativos o cuantitativos,
• Facilita la lectura y el análisis de los datos.
• Sirve para observar la frecuencia con la cual los
datos adoptan ciertos valores.
Tabla de frecuencias
7. • Cada tipo de variable tiene características
especiales por lo que la estructuración de una
tabla de frecuencias para cada una es
diferente.
• Tipo de variable:
• cualitativa,
• cuantitativa discreta y
• cuantitativa continua.
8. Para explicar cómo se construye una tabla de frecuencias
con datos cualitativos se utilizará los resultados de la
evaluación de 20 pacientes hacia un tratamiento:
a) Caso de las variables cualitativas
Paciente Bueno Satisfactorio Regular Malo
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
9. • Haciendo un conteo de las observaciones, se puede
establecer que de los 20 pacientes en 6 de ellos el
resultado es bueno, en 8 de ellos es satisfactorio, en 3 es
regular y en 3 es malo.
• Estas cifras constituyen la frecuencia absoluta simple (fi)
de cada valor (bueno, satisfactorio, regular y malo).
• Para obtener la frecuencia relativa simple (hi%) se
procede a aplicar la fórmula establecida (fi/n x 100).
Paciente Bueno Satisfactorio Regular Malo
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
fi hi%
Bueno
Satisfactorio
Regular
Malo
TOTAL 20 100
10. El resultado es la siguiente tabla
de frecuencias:
fi hi%
Bueno 6 30
Satisfactorio 8 40
Regular 3 15
Malo 3 15
TOTAL 20 100
11. • Las variables cuantitativas discretas son
representadas sólo por números enteros, como
número de hijos, de episodios de enfermedad, de
comidas en un día, entre otros.
• Se creará una tabla de frecuencias a partir de la
siguiente información de 15 pacientes mujeres:
b) Caso de las variables
cuantitativas discretas
Paciente 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
# de hijos 3 2 0 5 4 0 1 0 1 2 2 1 4 3 0
12. Haciendo un conteo de la información, se
puede establecer que de las 15 pacientes 4
de ellas no tienen hijos, 3 de ellas tienen un
hijo, 3 de ellas tienen dos hijos, 2 de ellas
tienen tres hijos, 2 de ellas tienen cuatro
hijos y sólo 1 tiene más de 4 hijos.
Estas cifras constituyen la frecuencia
absoluta simple (fi) de cada valor (0, 1, 2, 3,
4 y más de 4)
13. Con esta información se puede hallar
también las frecuencias absolutas
acumuladas (Fi = F(i-1) + fi).
Para obtener la frecuencia relativa simple
(hi%) se procede a aplicar la fórmula
establecida (fi/n x 100).
Finalmente, la frecuencia relativa acumulada
(Hi%) también se halla con la fórmula
correspondiente (Fi/n x 100).
14. # de hijos fi Fi hi% Hi%
0
1
2
3
4
más de 4
TOTAL
15. • El resultado es la siguiente tabla de frecuencias:
Cabe mencionar que en el caso de que la variable pueda
adoptar una gran cantidad de valores se utilizan
enunciados como ‘más de...’ o ‘menos de...’ para resumir
la información, pero NUNCA intervalos.
# de hijos fi Fi hi% Hi%
0 4 4 26.7 26.7
1 3 7 20 46.7
2 3 10 20 66.7
3 2 12 13.3 80
4 2 14 13.3 93.3
más de 4 1 15 6.7 100
TOTAL 15 100
16. • Frecuencia absoluta simple (fi):
• Se refiere a la frecuencia absoluta del valor ó del i-
ésimo intervalo (en el caso de variables cuantitativas
continuas).
• Indica el número de veces que aparece repetido dicho
valor en el conjunto de observaciones estudiadas.
• Frecuencia absoluta acumulada (Fi):
• Indica la suma de las frecuencias absolutas de los
iguales o inferiores a ese valor ó al i-ésimo intervalo
(en el caso de variables cuantitativas continuas).
Fi = F(i-1) + fi
17. • Frecuencia relativa simple (hi%):
• indica el porcentaje del total de observaciones que
representa el valor ó el i-ésimo intervalo (en el caso de
variables cuantitativas continuas). Se obtiene:
hi% = fi/n*100 (siendo n el número de observaciones)
• Frecuencia relativa acumulada (Hi%):
• Es el cociente de frecuencia absoluta y el número total de
observaciones, multiplicado por 100.
Hi% = Fi/n*100 (siendo n el número de observaciones)
18. • En el caso de las variables continuas, hay una cantidad
muy grande de posibles valores.
• Cuando se manejan más de 30 observaciones es
necesario usar intervalos que permitan ordenar de
forma práctica los valores.
• Sólo cuando se dividen los valores en intervalos
encontramos en la tabla de frecuencias: clase,
marca de clase y límites reales.
c) Caso de las variables
cuantitativas continuas
19. • Para crearlos existe un procedimiento e implica la
aparición de 3 nuevas columnas:
• Clase: indica el número de intervalo del que se
trata.
• Marca de clase (Xi): es un promedio de los límites
del intervalo de clase i. Es el número
representativo del intervalo.
• Límites reales: cada intervalo tiene números que
representan sus límites, pero los límites reales
indican los verdaderos valores que toma una
medición, ya que los límites nominales son
aparentes.
20. Datos de
30
pacientes
con
cáncer
pulmonar.
Paciente Ciudad Edad Sexo
1 A 30 M
2 A 43 M
3 B 58 F
4 C 61 M
5 A 70 M
6 D 42 F
7 C 58 F
8 A 39 M
9 B 60 F
10 B 55 M
11 C 57 M
12 A 49 M
13 A 61 F
14 D 69 M
15 D 43 M
16 B 46 F
17 A 69 M
18 A 44 M
19 C 59 F
20 D 62 M
21 D 66 M
22 C 71 M
23 C 70 F
24 C 65 M
25 D 37 M
26 A 40 F
27 A 61 F
28 B 65 M
29 B 56 M
30 C 38 M
21. PROCEDIMIENTO PARA CONSTRUIR
TABLAS DE FRECUENCIAS
1.- Encontrar la amplitud (A) del conjunto de datos, es decir el
valor máximo menos el valor mínimo, mas una unidad de
medida.
A=(Vmax - Vmin)+ 1
Ejemplo.- Considerando los datos de edad dado en el tabla
tenemos:
A=(71 - 30) + 1= 42
Nota: Si los valores máximo y mínimo están expresados hasta
décimas se incrementará un décimo (0.1); si los valores están
expresados en centésimos, se agregará un centésimo (0.01) y
así sucesivamente.
22. 2.- Determinar el número de intervalos (k), utilizando
la siguiente fórmula:
k= 1 + 3.322 log n
En relación al ejemplo se tiene que:
k=1 + 3.322 log 30 = 5.9 Redondeando = 6
3.- Determinar la amplitud del intervalo de clase (C),
utilizando la siguiente expresión:
C= A / k
Para nuestro ejemplo: C= 42 / 6 = 7
23. 4.- Determinar los límites. El Vmin es el límite inferior de la
primera clase y su respectivo límite superior será Vmin +
(C-1); el límite inferior de la segunda clase es el límite
superior de la primera clase mas uno y el respectivo límite
superior será igual al límite inferior mas (C-1); y así
sucesivamente hasta completar el número de intervalos.
En relación al ejemplo se tiene:
30-36
37-43
44-50
51-57
58-64
65-71
Edad
mínima
Edad
máxima
30 + (7 – 1 )
36 + 7, así sucesivamente
30 + 7, así
sucesivamente
24. Nota:
Si los límites están expresados hasta décimas entonces se
tendrá que el límite superior de la primera clase es:
Vmin + (C-0.1);
Si está expresado hasta centésimas será:
Vmin + (C-0.01)
5- La clasificación de los datos de una variable continua
puede hacerse manualmente o en forma automatizada.
27. Las frecuencias absolutas son siempre
valores enteros.
La suma de las frecuencias absolutas es
igual n.
Las frecuencias relativas son siempre
valores fraccionarios. O < hi < 1
Propiedades de las frecuencias
28. La suma de las frecuencias relativas
porcentual es igual a 100%
El último valor de las frecuencias absolutas
acumuladas es igual a n.
El último valor correspondiente a las
frecuencias relativas acumulada porcentual
debe ser igual a 100%.
29. Recuerden:
fi: Frecuencia absoluta del i-ésimo intervalo, nos indica número de
veces que aparece repetido dicho valor en el conjunto de
observaciones estudiadas.
Fi: Frecuencia absoluta acumulada de la clase i nos indica la suma
de las frecuencias absolutas de los iguales o inferiores a el.
F1=f1
F2=f1+f2
hi%: Frecuencia relativa de la clase i es el cociente entre la
frecuencia absoluta y el número total de observaciones
multiplicando por 100.
hi% = fi/n*100
30. Hi%: Frecuencia relativa acumulada de la clase i, es la frecuencia
absoluta acumulada dividido por el número total de observaciones.
Hi% = Fi/n*100
Xi: Es la marca de clase de la clase i se determina mediante el
promedio de los límites de dicho intervalo.
Limites reales: Si los límites nominales de los intervalos de clase
están expresados en enteros los límites reales de cada intervalo se
determina restando y sumando media unidad al límite inferior y
superior respectivamente de cada intervalo.
33. • Es una variable que sólo admite dos posibles datos,
por lo que es una medida dicotómica:
• Sexo: masculino o femenino.
• Antecedente de enfermedad cardiovascular : si o no.
Para la presentación tabular,
se utiliza la tabla de frecuencia
univariable dicotómica.
Para la presentación gráfica se utiliza
un gráfico de barras:
a) Variable Cualitativa de dos
categorías
Sexo fi hi(%)
Masculino 50 37
Femenino 85 63
Total 135 100
0
50
100
Femenino Masculino
División por la variable sexo
34. • Es una variable que sólo admite varios datos
posibles, teniendo una escala de medición
nominal u ordinal.
• Estado civil: soltero/casado/viudo/divorciado…
• Estadío de enfermedad: Fase I / Fase II / Fase
III…
Para la presentación tabular,
se utiliza la tabla de frecuencia
univariable.
Para la presentación gráfica
se utiliza un gráfico de barras:
b) Variable Cualitativa de más de dos
categorías
Estado civil fi hi(%)
Soltero 24 30
Casado 30 37.5
Divorciado 17 21.3
Viudo 9 11.3
Total 80 100
Estado civil
0
10
20
30
40
Soltero Casado Divorciado Viudo
35. Gráfico de sectores circulares.
Para su elaboración se utiliza la circunferencia
siendo necesario que los valores absolutos y/o
porcentajes sean traducidos a grados, los 360°
se reparten en proporción a los porcentajes.
Correspondiendo a cada sector de la
circunferencia la magnitud de cada categoría de
la variable.
36. Fuente: Archivo estadistico
Provincia Número Porcentaje
Piura 11 36.7
Talara 6 20.0
Sullana 7 23.3
Paita 6 20.0
Total 30 100.0
36.7
20.0
23.3
20.0
GRAFICO 1
PACIENTES CON CANCER UTERINO SEGUN PROVINCIA
DE RESIDENCIA
Hospital de Talara-Piura 2019
Piura Talara Sullana Paita
38. • Es una variable que sólo admite valores
numéricos enteros.
• Número de hijos
• Cantidad de comidas al día
Para la presentación tabular,
se utiliza la tabla de
frecuencia univariable.
En casos de tener una gran
cantidad de datos, estos pueden ser
agrupados.
Para la presentación gráfica
a) Variable discreta
Libros leídos hi% Hi%
2 4.7 4.7
3 16.7 21.4
4 16.7 38.1
5 26.2 64.3
6 23.8 88.1
más de 6 11.9 100
TOTAL 100
0
50
100
2 3 4 5 6 >6
Libros leídos
39. • Es una variable que admite valores numéricos reales, es decir, que
pueden contener décimas, centésimas, milésimas, etc. La precisión
de la observación, en este tipo de variable, sólo se ve limitado por el
método o instrumento con el cual se mide.
• Edad
• Temperatura
• Para la presentación tabular, se utiliza la tabla de frecuencia
univariable. En casos de tener una gran cantidad de datos, estos
pueden ser agrupados en intervalos.
Para la presentación gráfica se utiliza un
histograma:
b) Variable continua
Edad
0
2
4
6
8
10
30-36 37-43 44-50 51-57 58-64 65-71
Clase Edad Xi fi Fi hi% Hi% Límites
reales
1 30 – 36 33 1 1 3.3 3.3 29.5 – 36.5
2 37 – 43 40 7 8 23.3 26.6 36.5 – 43.5
3 44 – 50 47 3 11 10.0 36.6 43.5 – 50.5
4 51 – 57 54 3 14 10.0 46.6 50.5 – 57.5
5 58 – 64 61 8 22 26.7 73.3 57.5 – 64.5
6 65 – 71 68 8 30 26.7 100 64.5 – 71.5
30
40. • Muestra la distribución de datos cuantitativos
• El área es proporcional a la frecuencia
respectiva
• Representa a la frecuencias absolutas o
relativas
• Tiene como base los límites reales de los
intervalos de clase.
Histograma
42. Este gráfico se obtiene uniendo los puntos
medios superiores de los rectángulos del
histograma, formándose de esta manera un
gráfico lineal, el cual debe llevarse hasta el eje x
en los extremos del límite inferior del primer
intervalo y superior del último intervalo
respectivamente.
El área total bajo el polígono equivale al área
del histograma.
Polígono de frecuencias
SIMPLES
43. GRAFICO N° 3
PACIENTES CON TUMOR MALIGNO SEGÚN EDAD.
Hospital Arzobispo Loayza. Lima - 2019
0
4
8
12
16
20
33 40 47 54 61 68
Edad (años)
Número
de
pacientes
Fuente: Archivo estadistico
Pacientes con Cáncer Pulmonar según Edad Hospital de
Talara - Piura 2019
44. Denominado también ojiva, utiliza las
frecuencias absolutas o relativas
acumuladas, y consiste en un gráfico lineal
que nos permite observar la cantidad de
elementos que quedan por encima o por
debajo de determinados valores de los
límites de los intervalos de clase.
La ojiva se obtiene uniendo los puntos que le
corresponden a las frecuencias acumuladas
de los respectivos límites superiores de cada
intervalo.
Polígono de frecuencias
ACUMULADAS (OJIVA)
45. GRAFICO N°4
HISTOGRAMA Y POLIGONO DE FRECUENCIAS RELATIVAS ACUMULADAS
PACIENTES CON CANCER PULMONAR SEGÚN EDAD. Hospital de Talara -
Piura 2019
0
20
40
60
80
100
33 40 47 54 61 68
Edad (años)
H¡%
Fuente: Cuadro N°3
46. Tipos de datos Variable Tipo de gráfico
Distribuciones de
frecuencia
Cualitativa
Cuantitativa discreta
Barras: simples y todos sus
variedades
Gráficos circulares
pictogramas
Cuantitativa continua Histogramas
Polígonos de frecuencia
Ojiva
Tendencias
Cuantitativa Curvas
Gráficos lineales
Gráficos logaritmicos y
semilogaritmicos
SELECCIÓN DEL GRAFICO DE ACUERDO AL TIPO VARIABLE