Este documento presenta información sobre metodología de investigación. Explica que la investigación es un proceso sistemático, organizado y objetivo para responder preguntas y aclarar incertidumbres. Luego detalla las etapas del proceso de investigación como definir el problema, objetivos, variables y diseño de estudio. Finalmente, presenta un caso práctico sobre análisis de datos de rendimientos de girasol en diferentes localidades para recomendar una para alquiler.
2. Metodología de la Investigación
• La investigación es un proceso
– sistemático,
– organizado y
– objetivo
destinado a responder a una pregunta
• La respuesta lo que pretende es aclarar la
incertidumbre de nuestro conocimiento.
2
3. ¿Preguntas a responder?
¿Qué investigar?
Definición del problema
¿Para qué?
Definición del propósito
¿Qué estudiar
concretamente?
Definición de los objetivos
¿Cómo?
Definición del tipo de
diseño
3
4. Esquema general del planteamiento de un
estudio
•
•
•
•
•
•
Hipótesis de trabajo
Objetivos
Diseño de estudio
Selección de variables
Definición de variables
Escala de medida
• Protocolo de recogida
de datos
• Construcción de bases
de datos
• Depuración de los
datos
• Análisis
• Resultados
• Conclusiones
Estadística: Herramienta indispensable
4
5. Esquema del proceso de obtener
conclusiones a partir de los datos
OBJETIVO
Materia Prima
DATOS
Procesamiento
ORGANIZACION Y
ANALISIS
Producto
CONCLUSIONES
5
6. El caso de análisis
• Una empresa dedicada al alquiler de campos y
producción de girasol recibe el ofrecimiento de 4 lotes
para alquiler ubicados en 4 localidades diferentes.
Todos los lotes ofrecidos tienen la misma superficie,
los costos de producción son idénticos y se precisa
obtener un rendimiento mínimo de 15 quintales/ha para
obtener un resultado económico positivo. Se dispone
de información sobre los rendimiento del girasol en los
últimos 12 años de las 4 localidades donde se ubican
los lotes ofrecidos. Usted es el asesor técnico de la
empresa y se le pide que, a partir de dicha información,
recomiende un lote para alquilar.
6
7. Objetivos del análisis de los datos
• Para producir la recomendación pedida, deberá analizar los
datos de modo de contestar la siguiente pregunta general:
• ¿Cómo fueron los rendimientos de girasol de los últimos
12 años en cada una de las cuatro localidades?
• En relación con esta pregunta general, interesará establecer
y documentar, mediante gráficos y medidas, los siguientes
puntos para cada localidad:
• ¿Los rendimientos fueron altos o bajos?
• ¿Los rendimientos fueron parejos entre años?
• ¿Los resultados económicos negativos fueron frecuentes o
raros?
• ¿Los resultados económicos sobresalientes fueron
frecuentes o raros?
7
9. En la actualidad el conjunto de métodos que la estadística brinda para atender
todos los problemas hace que se la divida en 2 grandes campos, Estadística
Descriptiva e Inferencial.
Clasificación de la estadística moderna
Cuadros
representación de datos Tablas
Gráficos
Descriptiva
Promedios
Reducción de datos
Dispersiones
Predice, infiere
Inferencial Trabajo en base a
muestras
Decide sobre las poblaciones
9
10. VARIABLE
CUALITATIVAS O CATEGORICAS
aquellas que indican una cualidad o sea una característica
no medible o contable,
a) Ordenables: cuando puede hacer una correspondencia
lógica entre los valores de la variable y los números
naturales.
Ejemplo: x= resistencia a Roya =no resistente, resistente o
muy resistente
b) No ordenables: caso contrario al anterior.
•Ejemplo : x= Pelajes = Bayo, Zaino, etc.
10
11. VARIABLE
CUANTITATIVAS
Las que indican características medibles o contables,
a) Discretas : aquellas cuyos valores se interrumpen o
separan.
• Ejemplo : x= número de vacas de una granja en una
determinada región. Los valores posibles son 0, 1, 2,...
existe un salto o ruptura entre ellos, (por ejemplo entre 15 y
16, la variable x número de vacas, no puede tomar un valor
15,2).
b) Continuas: aquellas cuyos valores posibles no tienen
interrupción.
• Ejemplo : x= peso de las vacas de una granja en una
determinada región. Entre 400 y 500 kg podemos tener
infinitos valores.
11
13. Definiciones básicas
“Población es un conjunto de elementos definidos en el
tiempo y en el espacio, sobre los cuales se realizarán
las observaciones en el caso de una encuesta
exhaustiva o censo, o a los cuales se referirán los
resultados de la investigación en el caso de un estudio
por muestreo”.
“Muestra es el subconjunto de unidades seleccionadas
de la población definida. En esta recae la realización de
las observaciones”.
“Valores poblacionales” Parámetros
“Estimadores” Estadísticos
13
14. Análisis de datos
Los datos recopilados para cada sujeto , unidad de
observación, ó expertimental pueden provenir de
distintos tipos de variables y escalas de medición:
Variables
Cualitativa o Atributo
Escala de medición
Cuantitativa o Númerica
Escala de medición
Tipo
Nominal
Intervalo
Discreta
Ordinal
Razón
Continua
14
15. Unidad Estadística
A cada elemento que integra la población se lo llama
unidad estadística, unidad elemental o simplemente
elemento.
Para seleccionar una muestra, se toman unidades
estadísticas de la población en estudio.
Unidad de Muestreo
Se designa de esta manera a cada uno de los grupos de
unidades estadísticas, que se determinan con el objetivo
de seleccionar la muestra.
15
16. Presentaciones visuales, reducción de
datos
Tablas, Gráficos y Distribuciones
¿Qué representación mental le sugiere la palabra
estadística a la mayor parte de la gente ?
Una tabla es una ordenación de datos en filas y columnas
utilizada para documentar o comunicar información.
Desde este punto de vista de su uso, existen dos tipos de
tablas a saber : Tablas generales o de Referencia y Tablas
Específicas o de Resumen
16
17. Distribución de una variable
cuantitativa discreta
Veamos con un ejemplo la tabla de distribución de
frecuencias.
En 13 cajones de huevos se contó la cantidad de
huevos desechables por cajón:
xi
fi
Fi
1
2
3
4
5
6
Totales
2
4
1
3
2
1
13
2
6
7
10
12
13
f
fr = i
n
fri%
0,1538
0,3077
0,0769
0,2308
0,1538
0,0769
1,000
15,38
30,77
7,69
23,08
15,38
7,69
100,00
F
Fr=
n
0,1538
0,4615
0,5385
0,7692
0,9231
1,0000
Fr %
15,38
46,15
53,85
76,92
92,30
100,00
17
18. Distribución de una variable
cuantitativa continua
Ahora si lo que nos interesa son los índices de
Productividad ponderado de 20 establecimientos estamos
frente a una variable cuantitativa continua. En este caso
los valores individuales carecen de interés, por la propia
naturaleza de dicha variable, por lo tanto se los agrupa en
los llamados “intervalos de clase”. La cantidad de
intervalos necesarios para construir una distribución de
frecuencias no se puede determinar por alguna regla
precisa, depende de la experiencia y el sentido del
investigador, generalmente se utilizan entre 5 -15.
18
19. Distribución de una variable
cuantitativa continua
El límite inferior del primer intervalo debe ser algo menor
que el valor más pequeño de la variable, y el límite superior
del último intervalo algo mayor al dato más grande.
Definiendo:
xmáx= valor extremo superior de la variable
xmín= valor extremo inferior de la variable
La diferencia entre estos dos valores nos da la “amplitud
total”
A=xmáx-xmín
Si creemos que la cantidad de intervalos conveniente es h
entonces
la
amplitud
de
los
intervalos
será
aproximadamente a=A/h
19
20. Distribución de una variable
cuantitativa continua
Veamos por ejemplo...
X= valor de índice de Productividad de 20
establecimientos.
45,0
52,0
50,0
49,0
55,0
49,0
56,5
44,3
48,9
52,5
57,0
41,0
40,5
51,7
52,0
59,2
Vemos cuál es el valor extremo inferior
xmín=40,5
y el extremo superior,
xmáx=59,2
42,8
50,0
45,0
46,3
20
21. Distribución de una variable
cuantitativa continua
Para obtener a= amplitud del intervalo.
a
60 40
5
20
5
4
Los intervalos se construyen de tal forma que
contienen al extremo inferior pero no al superior.
Intervalo de clase
fi
Fi
fri
Fri
40,0 - 44,0
44,0 - 48,0
48,0 - 52,0
52,0 - 56,0
56,0 - 60,0
3
4
6
4
3
20
3
7
13
17
20
3/20=0,15
4/20=0,20
6/20=0,30
4/20=0,20
3/20=0,15
1,00
3/20=0,15
7/20=0,35
13/20=0,65
17/20=0,85
20/20=1,00
21
22. Distribución de una variable
cuantitativa continua
FRECUENCIAS
La representación gráfica correspondiente a la distribución
de frecuencias simples o relativas de una variable
cuantitativa continua es el
HISTOGRAMA
HISTOGRAMA
7
6
5
4
3
2
1
0
40,0 - 44,0
44,0 - 48,0
48,0 - 52,0
52,0 - 56,0
56,0 - 60,0
X
22
23. Caso estudio
Los siguientes puntajes representan el número de tomates
rechazados en un día en un mercado mayorista. Los puntajes
corresponden a 50 días seleccionados aleatoriamente:
29
12
83
95
28
58
73
23
63
91
80
54
71
86
87
35
91
63
42
15
30
45
47
22
67
23
28
87
44
10
88
61
36
88
45
49
61
8
27
67
35
45
94
20
26
97
84
26
33
19
1)Construya un tabla de frecuencias con 10 clases.
2)Construya un histograma que corresponde a la tabla anterior,
3)Realice un diagrama de tallo y hoja.
4)Construya un diagrama de caja.
5)Utilice la tabla de frecuencias para encontrar la media y el desvío
estándar de los números de tomates que se rechazan.
23
29. Medidas que resumen información
Promedios y Dispersión
Mediana
Medidas de tendencia Central
Modo
Promedios
Media Aritmética
Media Geométrica
Media Armónica
Rango
Medidas de variabilidad y concentración
Desvío medio
Varianza
Desvío típico (estándar)
Rango intercuartilar
Coeficiente de Variación
29
30. H
I
N
G
E
M
E
D
I
A
N
A
V a lo r E xtrem o
le ve
Extremo o
Outlier
H
I
N
G
E
Valores
extremos
leves
D
1.5
D
3D
Diagrama de Caja
(BoxPlot)
30
31. Coeficiente de Variación
S
cv
se puede expresar como % cv%
x
S
*100
x
Si el CV 5% ----> datos muy homogéneos, Media
aritmética muy representativa
Si el 5%
CV
20%
----> datos con
homogeneidad aceptable. La media aritmética es
representativa
Si el CV 20% ----> datos heterogéneos, la media
aritmética es poco representativa
31
32. Comparación de los rindes según localidades
4.000
3.000
2.000
7
1.000
0
Loc A
Loc B
Loc C
Loc D
Des criptive Statis tics
Loc A
Loc B
Loc C
Loc D
V alid N (lis tw ise)
N
Statistic
12
12
12
12
12
Range
Statistic
3740
2600
1000
850
Minimum
Statistic
260
0
1100
750
Max imum
Statistic
4000
2600
2100
1600
Mean
Statistic
Std. Error
2121,67
339,319
1475,83
217,519
1684,17
73,520
1131,67
74,619
Std.
V arianc e
Deviation
Statistic
Statistic
1175,437
1381652
753,506 567772,0
254,682 64862,879
258,486 66815,152
32