2. Programa de Investigación
Formativa
Técnicas e Instrumentos de
la
Investigación Científica
RESULTADO DE APRENDIZAJE:
Aplica y describe en los informes parciales los fundamentos de
investigación, operacionalización de variables, técnicas e
instrumentos de recolección de datos, población, muestra y muestreo,
procesamiento de datos, tablas, figuras y medidas estadísticas y
presenta el segundo avance del informe estadístico.
3. Programa de Investigación
Formativa
Técnicas e Instrumentos de
la
Investigación Científica
SESIÓN 06:
Elaboración de tablas de frecuencia y gráficos
estadísticos.
Interpretación de tablas y gráficos estadísticos.
4. Programa de Investigación
Formativa
Técnicas e Instrumentos de
la
Investigación Científica
¿Qué medidas estadísticas descriptivas
podemos evaluar en esta Fábrica ?
Un Fabricante de jugos realiza una investigación, desea evaluar ciertos indicadores
estadísticos en el procesamiento de envasado de botellas de jugo.
El Fabricante quiere evaluar:
▪ El promedio de botellas envasadas de
jugo.
▪ La mayor venta de botellas de jugo que
se distribuyó en los establecimientos
comerciales.
▪ Evaluar cual es la venta mediana de
botellas de jugo.
5. Programa de Investigación
Formativa
Técnicas e Instrumentos de
la
Investigación Científica
¿Qué son medidas estadísticas descriptivas?
Desviación estándar
Coeficiente de variación
Media
Mediana
Moda
Varianza
Rango
Su finalidad es
resumir un conjunto
de datos en un solo
valor que describen
ciertos aspectos de
una población o
muestra.
6. Programa de Investigación
Formativa
Técnicas e Instrumentos de
la
Investigación Científica
Tendencia central:
Media
Mediana
Moda
Tendencia no central Cuartiles
Deciles
Percentiles
Dispersión
Rango
Varianza
Desv Estándar
Coef. de Variación
Medidas
Estadísticas
Indican valores con respecto a los
que los datos parecen agruparse
Dividen un conjunto ordenado de datos
en grupos con la misma cantidad de
individuos idénticos
Indican el nivel de concentración de
los datos con respecto a la medida
de
Posición
Medidas de Forma Asimetría
Curtosis
CLASIFICACIÓN DE LAS
MEDIDAS ESTADÍSTICAS
7. Programa de Investigación
Formativa
Técnicas e Instrumentos de
la
Investigación Científica
MEDIDAS DE TENDENCIA
CENTRAL
• Media aritmética
• La Mediana
• La Moda
MUESTRA POBLACION
me Me
mo Mo
Son valores representativos que se ubica en
la parte central de un conjunto de datos
Parámetro
Estadístico
Estadígrafo
Vemos algunos videos de las
medidas estadísticas:
Medidas estadísticas en Excel: https://youtu.be/MQPsw7-gyvI
Medidas estadísticas en SPSS: https://www.youtube.com/watch?v=Q8AyY-A2AIc
8. Programa de Investigación
Formativa
Técnicas e Instrumentos de
la
Investigación Científica
MEDIA ARITMÉTICA (µ)
alias: promedio
CARACTERISTICAS
� Única para un conjunto dado de datos
� Centro de gravedad de los datos
� Sensible a los valores extremos
� Útil para comparar poblaciones
Es el valor que representa a un
conjunto de datos numéricos
Su formula es la suma de los valores
observados divididos entre el número
total de observaciones.
POBLACION MUESTRA
Datos Sin
Agrupar
Datos
agrupado
s
(cuadros)
.fi
Donde:
Xi = Marca de Clase.
f i = Frec absoluta simple
n = tamaño de la muestra
La media como punto de equilibrio
=promedio(rango)
9. Programa de Investigación
Formativa
Técnicas e Instrumentos de
la
Investigación Científica
Ejemplo
SIN AGRUPAR DATOS AGRUPADOS
Ejemplo: Las edades
de 7 niños son:
4, 5, 7, 4, 6, 5, 5.
Calcular el promedio.
Calcular el promedio de nota:
X = Σxi . fi = 230 = 14.4
n 16
Xi fi
5x13 = 65
3x14= 42
6x15= 90
1x16= 16
1x17= 17
230
Notas
(xi)
N° alumnos
(fi)
13 5
14 3
15 6
16 1
17 1
Total 16
Las notas de alumnos del curso de
Matemáticas son las siguientes
Las calificaciones 9
estudiantes son: 14,
15, 07, 14, 11, 15,
08, 14, 12. Calcular e
interpretar el
promedio.
Los pesos de los trabajadores de una Fábrica.
Pesos
a - b
Marca de Clase
Xi = (a+b)/2
fi Xi*fi
60 – 64 (60+64)/2 = 62 5 310
65 – 69 (65+69)/2 = 67 5 335
70 – 74 72 8 576
75 – 79 77 12 924
80 – 84 82 16 1312
85 - 89 87 4 348
n = 50 3805
DATOS CON INTERVALOS
10. Programa de Investigación
Formativa
Técnicas e Instrumentos de
la
Investigación Científica
MEDIANA (Me)
Es el valor que divide al conjunto ORDENADO (ascendente
o descendente) de datos en dos partes iguales. La mitad de
ellos son menores a Me y la otra mitad son mayores a Me.
Mín Máx
Mediana Me
5
0
%
5
0
%
CARACTERISTICAS
• Calculada para variables cuantitativa o
cualitativa ordinal
• Única para un conjunto dado de datos
• No se afecta por valores extremos.
=mediana(rango)
11. Programa de Investigación
Formativa
Técnicas e Instrumentos de
la
Investigación Científica
Los pesos, en kilogramos, de 7 jugadores de fútbol son: 72, 65, 71, 56, 59, 63, 72
1º. Ordenamos los datos:
56, 59, 63, 65, 71, 72, 72
Me = X(n+1)/2
1° Ordenamos los datos: 56, 57, 59, 63 , 65, 71, 72, 72,
2° Obtenemos la mediana es:
EJEMPLO: ( n impar)
EJEMPLO: (n par )
Los pesos, en kilogramos, de 8 jugadores de un equipo de fútbol son: 72, 65, 71, 56, 59, 63, 72,57
Interpretación.
El 50% de los jugadores pesan menos
de 65 kg. y el otro 50% más de 65 kg.
MEDIANA CON DATOS SIN AGRUPAR
Interpretación.
El 50% de los jugadores pesan
menos de 64 kg. y el otro 50%
más de 64 kg.
12. Programa de Investigación
Formativa
Técnicas e Instrumentos de
la
Investigación Científica
Ejemplo: Distribución de las
estaturas según alumnos de la UCV
El 50% de los alumnos tienen una estatura menor
o igual de 1.66m. El otro 50% supera a 1.66m.
Intervalo f F
1.50 – 1.56 6 6
1.56 – 1.62 14 20
1.62 – 1.68 24 44
1.68 – 1.74 18 62
1.74 – 1.80 8 70
1.80 – 1.86 3 73
73
36.5 = n/2
MEDIANA - Datos Agrupados
Fórmula:
Donde:
Li = Límite inferior del intervalo de interés
C = Amplitud
n = número de datos
Fj-1 = intervalo anterior al intervalo de interés.
13. Programa de Investigación
Formativa
Técnicas e Instrumentos de
la
Investigación Científica
Propiedades de la moda
• La moda NO es afectada por valores extremos.
• Puede no existir o puede tener muchas modas
LA MODA (MO)
Def. Es el valor que ocurre con más frecuencia. Util para datos cualitativos y cuantitativos
4, 5, 7, 8, 8 , 10, 12, 15
4, 7, 12,12 , 15, 16, 20, 20 , 24
7, 12, 15, 18, 25, 30, 31, 38
Ejemplo1: Determinar Moda de las notas de
alumnos
17 19 19 19 18 16 18 18 19 15
DATOS AGRUPADOS
Determinar el intervalo modal, este
intervalo modal será aquel donde se
encuentra la mayor fi (frec abs simple)
Fórmula:
Donde:
Linf = Límite inferior del intervalo de interés
C = Amplitud interválica
i = intervalo de interés
i-1 = intervalo anterior al intervalo de interés.
i+1 = intervalo posterior al intervalo de interés
=moda(rango)
14. Programa de Investigación
Formativa
Técnicas e Instrumentos de
la
Investigación Científica
MODA - Datos Agrupados
Punto de
Fusión
(ºC)
Nº de
Filamentos
fi
300 – 350 8
350 – 400 9
400 – 450 6
450 – 500 7
500 – 550 4
550 – 600 6
TOTAL 40 El Punto de Fusión que más
se repite es de 362.5 (ºC).
Identificar Mayor fi
Fuente: Área de Registros de Fábrica.
Ejemplo 2: Un fabricante esta preocupado por las quejas de
sus clientes acerca de la falta de uniformidad en los
filamentos (º C) metálicos producidos. Se seleccionaron 40
filamentos y sus puntos de fusión fueron los siguientes:
Ejemplo 1:
Nº hijos Nº de familias
(fi)
1 2
2 8
3 12
4 14
5 3
6 1
fi – fi-1
fi – fi+1
15. Programa de Investigación
Formativa
Técnicas e Instrumentos de
la
Investigación Científica
Ejercicio para desarrollar en Excel
La siguiente BD de 15 alumnos
Nro Genero Nombre Apellidos Edad
1 Femenino Alba Torres 51
2 Masculino Alejandro Soriano 50
3 Masculino
Andres
Danie Solana 49
4 Femenino Carmen Silva 49
5 Femenino Catalina Segura 48
6 Femenino Clara Segador 48
7 Masculino Daniel Sanchez 25
8 Masculino David Ruiz 23
9 Masculino David Rolda 45
10 Masculino Diego Riera 59
11 Femenino Dolors Redondo 57
12 Masculino Eloi Quiroja 57
13 Femenino Emilia Perez 46
14 Masculino Ernesto Perez 46
15 Femenino Eva Padilla 34
PROMEDIO 45.8 =PROMEDIO(E2:E16)
La edad representativa de los 15 alumnos es 45.8 años
MEDIANA 48 =MEDIANA(E2:E16)
La mitad (50%) de los alumnos tienen menos de 48 años
y la otra mitad tiene mas
MODA 49 =MODA(E2:E16)
La edad que mas se repite es 49 años
17. Programa de Investigación
Formativa
Técnicas e Instrumentos de
la
Investigación Científica
CUARTILES (Qi): Son valores que dividen
a un conjunto de datos ordenados en forma
ascendente o descendente en 4 partes
Min Q1 Q3 Max
Q2 = Me
25% 25% 25% 25%
DECILES (Di): dividen a un conjunto
de datos ordenados (ascendente o
descendente) en diez partes iguales
Min D
1
Max
D
2
D
3
D
4
10
%
D
6
D
7
D
8
10
%
D
5
D
9
10
%
10
%
10
%
10
%
10
%
10
%
PERCENTILES: dividen a un conjunto de datos ordenados
(ascendente o descendente) en 100 partes iguales
Es el valor de la variable que indica el porcentaje de una
distribución que es igual o menor a esa.
Medidas de Posición
=cuartil(matriz, cuartil)
=percentil(matriz, k)
18. Programa de Investigación
Formativa
Técnicas e Instrumentos de
la
Investigación Científica
Grafico de cajas y
bigotes (Box Plot)
• Es un gráfico basado en cuartiles que sirve
para visualizar la simetría y valores atípicos
de un conjunto de datos.
• Si la mediana no está en el centro del
rectángulo, la distribución no es simétrica.
19. Programa de Investigación
Formativa
Técnicas e Instrumentos de
la
Investigación Científica
Ejercicio para desarrollar en
Excel
La siguiente BD de 15 alumnos
Nro Nombre Apellidos Genero
Eda
d
1 Alba Torres Femenino 51
2 Alejandro Soriano Masculino 50
3
Andres
Daniel Solana Masculino 49
4 Carmen Silva Femenino 49
5 Catalina Segura Femenino 48
6 Clara Segador Femenino 48
7 Daniel Sanchez Masculino 25
8 David Ruiz Masculino 23
9 David Rolda Masculino 45
10 Diego Riera Masculino 59
11 Dolors Redondo Femenino 57
12 Eloi Quiroja Masculino 57
13 Emilia Perez Femenino 46
14 Ernesto Perez Masculino 46
15 Eva Padilla Femenino 34
1) Sombrear las variables Genero
y Edad
Menú Insertar 🡪 Gráficos 🡪
Gráficos Recomendados
20. Programa de Investigación
Formativa
Técnicas e Instrumentos de
la
Investigación Científica
Indican como los datos se dispersan (alejamiento o cercanía) alrededor de su punto central (la media).
Miden la variabilidad o la distancia promedio de separación de los datos con respecto a su valor
central. Es decir si los datos están muy próximas o muy lejos de la media
Cuanto mayor sea ese valor
mayor será la variabilidad,
cuanto menor sea, más
homogénea será a la media
MEDIDAS DE DISPERSION
http://docentes.educacion.navarra.es/m
sadaall/geogebra/figuras/e2desvtip.htm
Media o promedio
Poca dispersión
Rango = Max - Min
Media o promedio
Absolut
as
Rango
Varianza
Desviación
Estándar
Relativa
s
Coeficiente de
Variación
21. Programa de Investigación
Formativa
Técnicas e Instrumentos de
la
Investigación Científica
• Diferencia entre el valor máximo y mínimo de un conjunto de datos.
• Es muy sensible a los valores extremos
• Ofrece poca información sobre la agrupación de los datos.
RANGO
R = 22 – 12.5 = 9.5
Ejemplo: Se tiene el registro del tiempo en minutos, que demora la movilidad
de casa al centro de estudios. Los datos son: 15´, 14.5`, 12.5`, 22`, 20`.
Encontrar el rango del tiempo de demora de esta movilidad.
R = Vmáx.- Vmín
22. Programa de Investigación
Formativa
Técnicas e Instrumentos de
la
Investigación Científica
Donde:
Xi : valores de la variable X
n : tamaño de la muestra
Yi :marca de clase de cada
variable o grupo.
σ² :Varianza poblacional
N : tamaño de la población
S² :Varianza muestral.
LA VARIANZA
• Mide la dispersión de los valores respecto a un valor central (media).
• Es el promedio de los cuadrados de las diferencias entre cada valor de la
variable y la media aritmética de la distribución.
Población: =var.p(rango)
Muestra: =var.s(rango)
23. Programa de Investigación
Formativa
Técnicas e Instrumentos de
la
Investigación Científica
Población Muestra
Es la raíz cuadrada de la varianza (siempre es
positivo) y mide indica la dispersión de los
datos alrededor de la media (promedio).
DESVIACIÓN ESTÁNDAR
O DESVIACIÓN TIPICA
CARACTERISTICAS
1. Está influenciado por todos los valores.
2. Mayor influencia ejercen los valores extremos debido a que son elevados al cuadrado
3. Sirven para definir la dispersión de los datos alrededor de la media.
µ
x1
x2
x3 x4
x5
x6
d5=(X5-µ)
d6=(X6-µ)
Población: =DESVEST.P(rango)
Muestra: =DESVEST.M(rango)
𝜎 =
𝑋𝑖 − 𝜇 2
𝑁
𝑆 =
𝑋𝑖 − 𝑋 2
𝑛 − 1
24. Programa de Investigación
Formativa
Técnicas e Instrumentos de
la
Investigación Científica
COEFICIENTE DE VARIACIÓN
Indica que tan grande es la desviación estándar
en relación a la media.
Este coeficiente permite comparar la
variabilidad de 2 o + datos expresados en
unidades diferentes (peso: Kg. y libras).
Coef de variabilidad Indicador
<= 10% Muy homogéneos
10% < CV < 15% Regularmente Homogénea
15% <= CV < 20% Regularmente heterogénea
>= 20% Muy Heterogénea
El CV sirve para determinar
si un conjunto de datos
tiene un comportamiento
homogéneo o heterogéneo.
X 100
No hay formula
25. Programa de Investigación
Formativa
Técnicas e Instrumentos de
la
Investigación Científica
https://www.youtube.com/watch?v=MQPsw7-gyvI&t=5s
Preparando Excel: herramientas para análisis de datos
26. Programa de Investigación
Formativa
Técnicas e Instrumentos de
la
Investigación Científica
Determinar la Varianza, Desviación Estándar y
Coeficiente de Variación con los siguientes datos:
17 19 18 18 16 20
1) Promedio X = (17+19+18+18+16+20) / 6 = 18
2) Determinar la Varianza
4) Coeficiente de Variación
“Las calificaciones son homogéneas”
Ejemplo:
3) Desv Estándar
MONTOS
S/.
Marca de
Clase
Xi
Clientes
fi Xi * fi Xi 2 * fi
300 – 350 325 8 2600 845000
350 – 400 375 9 3375 1265625
400 – 450 425 6 2550 1083750
450 – 500 475 7 3325 1579375
500 – 550 525 4 2100 1102500
550 – 600 575 6 3450 1983750
TOTAL 40 17400 7860000
MONTOS EN SOLES CORRESPONDIENTES A LOS
INGRESOS SEMANALES DE LOS TRABAJADORES SAGA FALABELLA
Fuente: Área de Contabilidad de Saga Falabella.
Varianza:
Desv. Stand.:
Coef. Var.:
Promedio:
Interpretación: Los ingresos presentan una variabilidad del S/. 85.294.
respecto a su promedio y además presentan homogeneidad”
Calcula las medidas de dispersión de los montos en soles de
los ingresos de los padres de familia de un colegio
27. Programa de Investigación
Formativa
Técnicas e Instrumentos de
la
Investigación Científica
Ejercicio para desarrollar en
Excel
La siguiente BD de 15 alumnos
Nro Genero Nombre Apellidos Edad
1 Femenino Alba Torres 51
2 Masculino Alejandro Soriano 50
3 Masculino
Andres
Danie Solana 49
4 Femenino Carmen Silva 49
5 Femenino Catalina Segura 48
6 Femenino Clara Segador 48
7 Masculino Daniel Sanchez 25
8 Masculino David Ruiz 23
9 Masculino David Rolda 45
10 Masculino Diego Riera 59
11 Femenino Dolors Redondo 57
12 Masculino Eloi Quiroja 57
13 Femenino Emilia Perez 46
14 Masculino Ernesto Perez 46
15 Femenino Eva Padilla 34
PROMEDIO 45.8 =PROMEDIO(E2:E16)
La edad representativa de los 15 alumnos es 45.8 años
MEDIANA 48 =MEDIANA(E2:E16)
La mitad (50%) de los alumnos tienen menos de 48 años y
la otra mitad tiene mas
MODA 49 =MODA(E2:E16)
La edad que mas se repite es 49 años
RANGO 36 =MAX(A2:A16)-MIN(A2:A16)
La diferencia entre el mas viejo y el mas joves es 36 años
VARIANZA 106.16 =VAR.P(A2:A16)
La variabilidad es de 106.16 años cuadraticos
DESV STD 10.3 =DESVEST.P(A2:A16)
La diferencia promedio de edades es de 10.3 años
28. Programa de Investigación
Formativa
Técnicas e Instrumentos de
la
Investigación Científica
Medidas de Forma
• Aparte de las medidas centrales y de
dispersión, debemos conocer el
comportamiento de la misma como:
• Las medidas de asimetría
• Las medidas de curtosis o apuntamiento
Medidas de asimetría
Medidas de curtosis o apuntamiento
29. Programa de Investigación
Formativa
Técnicas e Instrumentos de
la
Investigación Científica
Medidas de asimetría
de Fisher:
• Si g1 = 0 � la distribución es
simétrica
• Si g1 > 0 � Asimétrica positiva
• Si gi < 0 � Asimétrica negativa
Indican el grado de simetría o asimetría
de una distribución, sin necesidad de
su grafica. Algunas son:
de Ficher
estandarizado (N > 150)
Es asintóticamente normal
con U = 0, y varianza 6/N
de Karl Pearson:
• Entre la media y moda
• Si X = Mo = Me 🡪 es simétrica
• Si Ap > 0 🡪 Asim positiva (derecha)
• Si Ap < 0 🡪 Asim negativa (izquierda)
Principales coeficientes de asimetría
=COEFICIENTE.ASIMETRIA(rango)
30. Programa de Investigación
Formativa
Técnicas e Instrumentos de
la
Investigación Científica
Coef. de Fisher:
• Si g2 = 0 � la distribución es normal
(mesocurtica)
• Si g2 > 0 � Distribución apuntada
(leptocúrtica)
• Si g2< 0 � Distribución aplanada (platicurtica)
Hace referencia al apuntamiento de
los datos en relación a la distribución
normal estándar (mesocúrtica)
• Platicúrtica (aplanada): curtosis < 0
• Mesocúrtica (como la normal): curtosis = 0
• Leptocúrtica (apuntada): curtosis > 0
Dist. Normal
=Curtosis(rango)
Medidas de curtosis o apuntamiento
31. Programa de Investigación
Formativa
Técnicas e Instrumentos de
la
Investigación Científica
Ejercicio para desarrollar
en Excel
La siguiente BD de 15 alumnos
Nro Genero Nombre Apellidos Edad
1 Femenino Alba Torres 51
2 Masculino Alejandro Soriano 50
3 Masculino
Andres
Danie Solana 49
4 Femenino Carmen Silva 49
5 Femenino Catalina Segura 48
6 Femenino Clara Segador 48
7 Masculino Daniel Sanchez 25
8 Masculino David Ruiz 23
9 Masculino David Rolda 45
10 Masculino Diego Riera 59
11 Femenino Dolors Redondo 57
12 Masculino Eloi Quiroja 57
13 Femenino Emilia Perez 46
14 Masculino Ernesto Perez 46
15 Femenino Eva Padilla 34
Asimetria -1.16 =COEFICIENTE.ASIMETRIA(E2:E16)
La distribución es asimetrica negativa (izquierda)
CURTOSIS 0.82 =CURTOSIS(E2:E16)
La distribución se presenta mas aplanada que una normal
32. Programa de Investigación
Formativa
Técnicas e Instrumentos de
la
Investigación Científica
Referencias
• Castillo, S (2018), Fundamentos básicos de Estadística. Primera edición,(pág 23)
http://www.dspace.uce.edu.ec/bitstream/25000/13720/3/Fundamentos%20B%C3%A1sicos%20de%20Estad
%C3%ADstica-Libro.pdf
• Hernández, R. (2014) Metodología de la investigación. (pág. 197), editorial 2014, respecto a la sexta edición
por Malhotra Narest, (2008) Investigación de Mercados, Quinta edición Mcgraw-hill / Interamericana Editores,
S.A. de C.V, editorial Pearson,
http://www.elmayorportaldegerencia.com/Libros/Mercadeo/%5BPD%5D%20Libros% 20-
%20Investigacion%20de%20Mercados.pdf