El documento presenta una introducción al análisis de datos en investigación social, describiendo las etapas del proceso que incluyen la prueba previa del cuestionario, la capacitación y trabajo de campo, la supervisión, edición y codificación de datos, el análisis de datos univariado y bivariado utilizando técnicas como tablas, gráficos y medidas estadísticas. Explica conceptos como medidas de tendencia central, variabilidad, y métodos para describir y comparar variables.
2. LA PRUEBA PREVIA (PRETEST)
Se pone a prueba el
cuestionario en una
muestra pequeña de
similares características
Se revisa:
Si se entienden las
preguntas
Si alguna no es
innecesaria
Si el cuestionario se
desarrolla
“naturalmente”
Se ponen a prueba
diferentes formas de
preguntas
3. TRABAJO DE CAMPO
Capacitación:
Cómo formular las preguntas.
Cómo anotar las respuestas.
Antecedentes de la investigación.
Técnicas de muestreo
Uso de tarjetas.
4. SUPERVISIÓN, EDICIÓN, CODIFICACIÓN.
Supervisión: verificación de
muestreo. Coherencia y cohesión.
Edición: Revisar y ajustar datos
para detectar omisiones, verificar
legibilidad, consistencia.
Codificación: Identificar cada
respuesta con una calificación
numérica.
5. MATRIZ DE DATOS.
Principio de comparabilidad:
Todas las Unidades de análisis
han de ser medidas en las
mismas variables.
Principio de Clasificación: Para
cada par (U de A – Variable)
debe encontrarse un valor y
sólo uno.
Principio de Integridad: Para
cada par (U de A – Variable)
debe hallarse empíricamente un
valor.
6. ANÁLISIS Y DESCRIPCIÓN DE DATOS: ANÁLISIS UNIVARIADO
Determinar si se han producido errores en la carga de datos
Establecer si los datos pueden ser analizados
Seleccionar las variables que ofrezcan buena información
Describir las variables
7. TÉCNICAS DE ANÁLISIS (ANÁLISIS UNIVARIADO)
Tablas
• De
frecuencias
• De
porcentajes
Gráficos
• Sector
circular
• Barras
• Histograma
Medidas
• De
tendencia
central
• De
variabilidad
Análisis de
Contenido
(Preguntas
abiertas)
8. TÉCNICAS DE ANÁLISIS (ANÁLISIS BIVARIADO)
Variables
categoriales
• Tabla de
contingencia
Variables
ordinales
• Análisis de
varianza
Variables
intervalares
• Correlación
lineal y múltiple
9. ANÁLISIS UNIVARIADO
Tabla de frecuencias y porcentajes
Edad Frecuenci
a
Porcentaj
e
Grados
18 -19
años
34 49,3% 177°
20 - 21
años
16 23,2% 84°
22 y +
años
19 27,5% 99°
Total 69 100% 360°
Sector Circular
Edad
18 - 19 años 20 - 21 años 22 y + años
10. ANÁLISIS UNIVARIADO
P3 ¿Cómo se siente Ud. en referencia
a su vida sentimental?
P3 ƒ % ƒ %
(5) Muy Satisfecho 19 27,5 4 44,5
(4) Satisfecho 29 42,0 3 33,3
(3) Indiferente 16 23,2 2 22,3
(2) Insatisfecho 5 7,3 - -
(1) Muy
Insatisfecho
- - - -
Totales 69 100 9 100
Gráfico de Barras
0
5
10
15
20
25
30
35
Muy Satisfecho Satisfecho Indiferente Insatisfecho
Grado de satisfacción con su vida
sentimental
Varones Mujeres Columna1
Varones
11.
12. MEDIDAS DE TENDENCIA CENTRAL
De un conjunto de n
mediciones x1; x2; x3…xn, es
igual a la suma de los valores
dividido en el número total de
mediciones.
MEDIA ARITMÉTICA
13. MEDIDAS DE TENDENCIA CENTRAL
De un conjunto de
mediciones x1; x2; x3…xn, la
mediana es el valor de x que
se encuentra en el punto
medio o centro cuando se
ordenan los valores de menor
a mayor.
REGLA PARA EL CÁLCULO DE LA
MEDIANA
a) Ordenar las mediciones de menor a
mayor
b1) Si n es impar, se toma la medición con
rango (n + 1)/2
b2) Si n es par, se toma el valor medio entre
las mediciones con rango n/2 y n/2 + 1
MEDIANA
14. COMPARACIÓN ENTRE LAS MEDIDA
La mediana es menos sensible a los valores extremos.
Si la distribución es sesgada la media se desplaza en la dirección
del sesgo.
Simétric
a
15. no
MEDIDAS DE VARIABILIDAD
Indican en cuánto se alejan los
valores extremos de las medidas de
tendencia central
AMPLITUD
De un conjunto de n mediciones x1;
x2; x3…xn, se define a la amplitud
como la diferencia entre la mayor y
la menor medición
16. MEDIDAS DE VARIABILIDAD
La varianza de n mediciones x1; x2;
x3…xn se define como la media de los
cuadrados de las desviaciones de las
mediciones respecto de su propia
media
VARIANZA
Problema: La varianza se
mide en términos del
cuadrado de las unidades
originales
DESVÍO ESTANDAR
(Raíz cuadrada positiva
de la varianza)
17. TEOREMA DE TCHEBYSHEFF
(Supuesto: La distribución se acerca a la curva
normal)
El intervalo (µ ± δ) contendrá
aproximadamente el 68% de las mediciones
El intervalo (µ ± 2 δ) contendrá
aproximadamente el 95% de las mediciones
El intervalo (µ ± 3 δ) contendrá
aproximadamente la totalidad de las
mediciones
18. MEDIDAS DE TENDENCIA CENTRAL Y VARIABILIDAD
(ANÁLISIS)
2012 2013
Media
Aritmética
3,18 2,73
Moda 3 2
Mediana 3 2
Amplitud 6 9
Desvío 1,36 1,61
En 2012 las medidas de tendencia central se
ubican en torno a las tres materias aprobadas,
en 2013 en torno a 2.
La mayor diferencia entre la media y la mediana
en 2013 indica la presencia de valores extremos
y una curva sesgada hacia la derecha (valores
altos)
La cercanía de las medidas de tendencia central
en 2012 indican una distribución cercana a la
curva normal
La mayor amplitud y desvío en 2013 indican una
mayor variabilidad en relación a 2012
Cantidad de materias aprobadas según
año