1. Instrumentos y Técnicas de
Recolección de Datos
Autor: Thais T. Hernández C.
Barquisimeto, Noviembre de 2014
República Bolivariana de Venezuela
Universidad de Yacambu
Vicerrectorado de Investigación y Postgrado
Instituto de Investigación y Postgrado
Departamento de Doctorados
Seminario Avanzado de Diseño de Investigación I
Facilitador: Marioxy Morales
2. Contenido
• Instrumentos de Recolección de Datos.
• La Entrevista
• La Encuesta
• La Revisión Documental
• La Observación
3. Contenido
• Técnicas de Recolección de Datos.
• Tabulación de datos
• Graficación de resultados
• Estadísticas Descriptivas
• Medidas de Tendencia Central
• Medidas de Posición
• Medidas de Dispersión
• Medidas de Apuntalamiento
• Medidas de Simetría
4. Técnicas de Recolección de Datos
En la etapa de recolección de datos es importante elaborar
un plan detallado de los procedimientos que conduzcan a
reunir datos con un propósito especifico (Hernández y otros)
Para ello se debe tomar en cuenta, las fuentes a utilizar:
primarias o secundarias; los requisitos de un instrumento:
confiabilidad, validez (de contenido, constructo y criterio); los
recursos tanto económicos como de talento humano con el
que se cuenta para realizar el estudio.
5. Técnicas de Recolección de Datos
La Entrevista:
Es un instrumento en la cual una persona
calificada aplica un conjunto de preguntas a un
entrevistado para luego realizar una análisis de
las respuestas del participante en la entrevista.
Son instrumentos que consumen tiempo en el análisis de
los resultados.
Son instrumentos difíciles de analizar ya
que depende de si las respuestas son abiertas
o cerradas.
6. Técnicas de Recolección de Datos
Cualidades de un entrevistador:
Debe lograr un ambiente de camaradería y
amistad con el entrevistado
Debe formular las preguntas en un lenguaje
fácil de comprensión para el entrevistado
No debe realizar preguntas capciosas, de
mala intención o poco claras. Tampoco deberá
realizar preguntas ajenas al tema que se está
desarrollando
Debe ser hábil al momento de escoger a los participantes en la
entrevista de forma tal que no se produzca sesgo en la información,
7. Técnicas de Recolección de Datos
La Encuesta:
Se fundamenta en una serie de preguntas
elaboradas de antemano, pero orientadas a los
objetivos preestablecidos en la investigación.
Como primer paso se escoge el nivel de
medición de la variable, en este sentido Arias
lo define como “el tipo de escala que permite
asignar un grado o valor a una variable”
Debe ser congruente con el planteamiento del problema e
hipótesis y puede estar diseñado con preguntas cerradas o
abiertas
8. Técnicas de Recolección de Datos
La Revisión Documental:
Se fundamenta en un análisis documental
compuesto por una revisión de la información
física y digital de la información con que
cuenta el ente de estudio.
En la investigación se
deberá utilizar una
matriz de categorías la
cual “permite clasificar,
agrupar y categorizar
información contenida en
documentos”
9. Técnicas de Recolección de Datos
La Observación:
Esta técnica permite interactuar
con el ente de estudio, como bien lo
afirma Arias “es una técnica que
consiste en visualizar o captar
mediante la vista, de forma
sistemática, cualquier hecho,
fenómeno o situación que se
produzca en la naturaleza o en la
sociedad, en función de unos
objetivos de investigación
preestablecidos”.
10. Técnicas de Recolección de Datos
No todos las áreas de la vida disponen
de datos publicados. En algunos casos
deberá recolectarse y analizarse. Cuando
esto sucede se denomina “Fuentes
Primarias”
Una forma de recolectar este tipo de datos es mediante
las encuestas. Hay dos posibilidades:
• Encuestas Muestrales (En muestras)
• Encuestas Censales (En poblaciones)
11. Encuestas Censales:
Se emplea cuando el número de unidades de análisis
no es grande (n< 40 aproximadamente)
Censo: Estadística Descriptiva
Si el número de unidades de análisis es grande y se
necesita una amplia cobertura de información en áreas
menores, como distritos, Comunidades nativas, y otros.
Características:
• Costoso
• Errores de Medición
12. Técnicas de Recolección de Datos
Se emplea cuando el número de unidades de análisis
es grande pero no se necesita información a detalle de
áreas geográficas menores.
Muestreo: Estadística Inferencial
Características:
• Mayor rapidez y viabilidad
• Mayor exactitud en la obtención
de información
• Reduce los costos
13. Técnicas de Recolección de Datos
Los problemas que se estudian o se investigan
adquiriendo datos empíricos (de la realidad) publicados.
Los datos (estadísticas) que se encuentran
relacionadas en artículos publicados, tesis,
revistas y periódicos.
Este tipo de datos se les conoce
como “Fuentes Secundarias”
14. Análisis básico de la recolección de
datos
Todo análisis de recolección de datos son estrategias para
traducir la cantidad de información obtenida en la
recolección de datos, a índices que sean interpretables y
que representen alguna dimensión del comportamiento de
las variables
La estrategia más sencilla es
mostrar la información en un
formato visual (gráficos) o en un
esquema sintetizado (tablas).
15. Tabulación
Las tablas deben incluir todos los puntajes registrados
Deben respetar las características de la variable
Llevan un título representativo del contenido (sobre la
tabla, numerado)
Puntaje f p % Fasc %asc
10 – 15 154 0.2962 29.62% 154 29.62%
16 – 21 222 0.4269 42.69% 376 72.31%
22 – 27 124 0.2385 23.85% 500 96.16%
28 – 33 20 0.0384 3.84% 520 100%
TOTAL 520 1 100%
16. Muestra
Se requiere saber el número de hijos por matrimonio
en Lima. Para este propósito, se elige una muestra
representativa de 50 matrimonios de ella. Se obtienen los
siguientes datos:
2 , 2 , 4 , 1 , 3 , 5 , 3 , 2 , 1 , 6 , 3 , 4 , 1 , 2 , 0 , 2 , 3 , 1 ,
7 , 4 , 2, , 3 , 0 , 5 , 1 , 4 , 3 , 2 , 4 , 1 , 5 , 2 , 1 , 2 , 4 , 0 ,
3 , 3, 2 , 6 , 1 , 5 , 4 , 2 , 0 , 3 , 2 , 4 , 3 , 1.
El número total de datos se representa con la
letra n. En nuestro ejemplo n = 50.
17. Frecuencia Absoluta (fi)
La frecuencia absoluta es
el número de veces que aparece
un valor (x i) en los datos
obtenidos.
En nuestro ejemplo, la
frecuencia absoluta indica el
número de familias que tienen
esa cantidad de hijos:
TABLA
x i f i
0 4
1 9
2 12
3 10
4 8
5 4
6 2
7 1
18. Frecuencia Absoluta Acumulada (Fi)
La frecuencia absoluta acumulada indica cuantos
elementos de la lista de datos son menores o iguales a un
valor dado.
Es la suma de las frecuencias
absolutas desde la primera fila hasta la
fila elegida.
Por ejemplo, sabemos que hay 25
matrimonios de la muestra que tienen a
lo más 2 hijos:
20. Frecuencia Relativa (hi)
La frecuencia relativa es el cociente entre la
frecuencia absoluta (f i) y el número total de
datos (n).
En nuestro ejemplo n = 50:
TABLA
x i f i F i h i
0 4 4 0,08
1 9 13 0,18
2 12 25 0,24
3 10 35 0,20
4 8 43 0,16
5 4 47 0,08
6 2 49 0,04
7 1 50 0,02
21. Frecuencia Relativa Absoluta (Hi)
La frecuencia relativa acumulada es el cociente
entre la frecuencia absoluta acumulada (F i) y el
número total de datos (n).
En nuestro ejemplo n = 50:
TABLA
x i f i F i h i H i
0 4 4 0,08 0,08
1 9 13 0,18 0,26
2 12 25 0,24 0,50
3 10 35 0,20 0,70
4 8 43 0,16 0,86
5 4 47 0,08 0,94
6 2 49 0,04 0,98
7 1 50 0,02 1,00
22. Frecuencia Porcentual (fi %)
La frecuencia porcentual es la frecuencia
relativa (hi) expresada en forma porcentual.
En otras palabras, es la frecuencia relativa (hi)
multiplicada por 100.
TABLA
x i f i F i h i H i f i %
0 4 4 0,08 0,08 8 %
1 9 13 0,18 0,26 18 %
2 12 25 0,24 0,50 24 %
3 10 35 0,20 0,70 20 %
4 8 43 0,16 0,86 16 %
5 4 47 0,08 0,94 8 %
6 2 49 0,04 0,98 4 %
7 1 50 0,02 1,00 2 %
23. Frecuencia Porcentual Acumulada (Fi %)
La frecuencia porcentual acumulada es la frecuencia
relativa acumulada (Hi) expresada en forma porcentual.
En otras palabras, es la frecuencia relativa acumulada
(Hi) multiplicada por 100.
TABLA
x i f i F i h i H i f i % F i %
0 4 4 0,08 0,08 8 % 8 %
1 9 13 0,18 0,26 18 % 26 %
2 12 25 0,24 0,50 24 % 50 %
3 10 35 0,20 0,70 20 % 70 %
4 8 43 0,16 0,86 16 % 86 %
5 4 47 0,08 0,94 8 % 94 %
6 2 49 0,04 0,98 4 % 98 %
7 1 50 0,02 1,00 2 % 100 %
24. Organización y Presentación de Datos
Unidimensionales
• Frecuencia Absoluta (fi): Es el número de veces que se
presenta un valor o categoría de una variable. Se representa
por fi:
f1 + f2 + f3 + . . . + fn = n
25. Organización y Presentación de Datos
Unidimensionales
• Frecuencia Absoluta Acumulada (Fi): Es el número de
datos igual o inferior (“Menor o igual que”) al valor
considerado de la variedad o la suma de las frecuencias
absolutas menor o igual que el valor considerado de la
variable. Es decir:
F1 = f1
F2 = f1 + f2
Fn = f1 + f2 + f3 + . . . fn
26. Organización y Presentación de Datos
Unidimensionales
• Frecuencia Relativa (hi): Es igual a la frecuencia absoluta
sobre el número de observaciones.
h1
f1
n
=
h2
f2
n
=
hn
fn
n
=
:
27. Organización y Presentación de Datos
Unidimensionales
• Frecuencia Relativa Acumulada (Hi): Es el resultado de
cada frecuencia absoluta acumulada dividida entre el
número total de observaciones.
h1
f1
n
=
h2
f1 + f2
n
=
hn
f1 + f2 + . . . + fn
n
=
:
28. Tablas de Frecuencias
Las frecuencias son, sin embargo, datos absolutos. No
es posible comparar los resultados de dos tablas con un N
total de respuestas diferente.
Para hacer esas comparaciones, se utilizan medidas
estandarizadas, esto es, transformaciones de los puntajes
originales a escalas que sean las mismas en todas las tablas
(y que permiten la comparación.)
29. Tablas de Frecuencias
En muchas ocasiones, la cantidad de valores que
puede tomar la variable son demasiados, de manera que se
agrupan en intervalos.
Cada intervalo agrupa a una serie de puntajes
Los intervalos son excluyentes entre sí
El número de valores que compone cada intervalo, se
denominada amplitud (i)del intervalo es la misma para
todos los intervalos de una tabla.
30. Tablas de Frecuencias
En todo intervalo se distinguen límites superiores e
inferiores, los cuales pueden ser aparentes (lo que sale
en la tabla) o reales (lo que se usa para clasificar).
El número de intervalos debe ser manejable para quien
revise la tabla.
Las tablas de frecuencia reflejan el comportamiento de
una sola variable. Usualmente no se usan para la
presentación de resultados ya que revisar variable por
variable sería demasiado extenso.
En esos casos, se hacen tablas de resumen, en las que
se indican los datos más importantes de un conjunto de
valores.
32. Resumen de resultados
Síntoma Porcentaje de Incidencia
Depresión 44.0%
Ansiedad 33.1%
Insomnio 22.3%
Onicofagia 5%
Colon Irritable 12.6%
Tablas de Frecuencias
33. Otro tipo de tablas útiles son aquellas que combinan
los resultados de dos variables.
Ambas variables deben expresar sus resultados en
categorías.
Se dividen en filas y columnas (una variable en las filas y
otra en las columnas).
Se dividen en filas y columnas (una variable en las filas y
otra en las columnas). Una celda representa la
combinación de valores de las dos variables.
Cada celda se refiere a tres totales: filas, columnas y
total.
Tablas de Frecuencias
34. Tabla III. Disposición a ayudar según sexo
Sexo
Mujer Hombre TOTAL
¿Ayuda?
Sí
266
55.5
69.8
36.4
213
44.5
60.9
29.1
479
65.5
No
115
45.6
30.2
15.7
137
54.4
39.1
18.7
252
34.5
TOTAL
381
52.1
350
47.9
731
100
Tablas de Frecuencias
35. Graficación
Son complementos de la tabulación
Representan la distribución de la variable
Deben llevar un título representativo (bajo el gráfico y
numerado)
36. Tipos de Gráficos
Gráfico de Torta
Son ideales para variables
nominales.
Se hace un circulo que representa al
100 % de los casos.
Se divide el círculo en sectores:
Cada sector representa un valor de la
variable.
El tamaño de cada sector depende
del porcentaje de ocurrencia de cada
valor.
Sólo se grafica un grupo a la vez.
PSICOLOGIA
30%
MEDICINA
28%
ARQUITECTURA
10%
DERECHO
4%
INGENIERIA
10%
ECONOMIA
18%
No permite usar muchas categorías
37. Histograma
Es una representación gráfica de una variable en forma de
barras, donde la superficie de cada barra es proporcional a la
frecuencia de los valores representados.
En el eje vertical se
representan las frecuencias, y
en el eje horizontal los valores
de las variables.
Normalmente se señalan las
marcas de clases, es decir, la
mitad del intervalo en el que
están agrupados los datos.
Tipos de Gráficos
38. Tipos de Histograma
Diagrama de Barras Simples Vertical:
Se manejan dos ejes. El eje horizontal indica los
valores de la variable y el eje vertical representa el índice
estadístico (valor).
Tipos de Gráficos
39. Tipos de Histograma
Diagrama de Barras Simples Horizontal:
Se parecen mucho a las gráficas de columnas, con la
salvedad importante de que la función de los ejes se
intercambian y el eje horizontal queda destinado a las
frecuencias y el eje vertical a las clases.
Tipos de Gráficos
40. Tipos de Histograma
Diagrama de Barras Compuestas o
Comparativos:
Se usa para representar la
información de una tabla de
doble entrada o sea a partir de
dos variables, las cuales se
representan así; la altura de la
barra representa la frecuencia
simple de las modalidades o
categorías de la variable y esta
altura es proporcional a la
frecuencia simple de cada
modalidad.
Tipos de Gráficos
41. Tipos de Histograma
Diagrama de Barras Proporcionales:
Se usan cuando lo que se
busca es resaltar la
representación de los porcentajes
de los datos que componen un
total.
-
20.00
40.00
60.00
80.00
100.00
120.00
SinNivel
Inicial
SecundariaSup.NoUniver.
Sup.Univer.
Especial
MUJER
HOMBRE
Tipos de Gráficos
42. Tipos de Histograma
Otros Diagrama de Barras:
Existe la posibilidad, y si los
recursos lo permiten, de
representar gráficos compuestos
de una manera "tridimensional",
es decir, con gráficos que posean
no sólo dos ejes, sino tres; y en
los que los rectángulos son
sustituidos por prismas de base
rectangular.
Ocasionalmente el software en el mercado permite
utilizar prismas cuya base son polígonos regulares de más
de cuatro lados, pirámides o cilindros).
Tipos de Gráficos
43. Tipos de Histograma
Polígonos de Frecuencias:
Es un gráfico de líneas que se usa para presentar las
frecuencias absolutas de los valores de una distribución en
el cual la altura del punto asociado a un valor de las
variables es proporcional a la frecuencia de dicho valor.
Tipos de Gráficos
44. Tipos de Histograma
Gráficos Mixtos:
En estos tipos de
gráficos se representan dos
o más series de datos, cada
una con un tipo diferente
de gráfico. Son gráficos
más vistosos y se usan para
resaltar las diferencias
entre las series.
Tipos de Gráficos
46. Tipos de Histograma
Diagrama de Barras Continuas:
Usualmente se utiliza en
tablas con intervalos.
• Representan variables continuas.
• Se usa el punto medio como
referencia.
• Permite visualizar la distribución
de la variable.
Tipos de Gráficos
47. Gráficos de Líneas:
Resultan interesantes para
estudiar tendencias a lo largo
del tiempo.
• No son más que una serie de
puntos conectados entre sí
mediante rectas.
• Cada punto puede representar
distintas cosas o mediciones
según lo que nos interese en
cada momento.
Gráfico No. 1. Nro. De
pacientes transplantados
renales en el Complejo “Juan
Camejo” durante el período
1981-1997
Tipos de Gráficos
49. Ojivas:
La ojiva es una gráfica
asociada a la distribución
de frecuencias, es decir,
que en ella se permite ver
cuántas observaciones se
encuentran por encima o
debajo de ciertos valores,
en lugar de solo exhibir
los números asignados a
cada intervalo.
La ojiva apropiada
para información que
presente frecuencias
mayores que el dato que
se está comparando
tendrá una pendiente
negativa (hacia abajo y a
la derecha) y en cambio
la que se asigna a valores
menores, tendrá una
pendiente positiva.
Tipos de Gráficos
51. Gráficas de áreas:
Consiste en rellenas el
área que se encuentre debajo
de las líneas que resultan de
una gráfica de líneas
Tipos de Gráficos
52. Pictogramas:
Actualmente, y mucho en
los medios masivos de
comunicación, se utilizan
gráficos para ilustrar los datos
o los resultados de alguna
investigación.
Regularmente se utilizan
dibujos para representar dicha
información, y el tamaño o el
número de estos dibujos
dentro de una gráfica queda
determinado por la frecuencia
correspondiente.
Tipos de Gráficos
54. Gráficos de dispersión o
dispersogramas:
Son gráficos que se construyen
sobre dos ejes ortogonales de
coordenadas, llamados cartesianos,
cada punto corresponde a un par de
valores de datos x e y de un mismo
elemento suceso.
Diagrama de dispersión (regresión
logística). Probabilidad de padecer
cirrosis hepática, según un modelo de
regresión logística ajustando por el % de
protrombina y el presentar o no
hepatomegalia.
Tipos de Gráficos
55. Gráficos de dispersión de burbujas:
Son gráficos en los cuales se
presenta la dispersión de las
observaciones de la misma forma
que aquéllas, pero se le añade la
posibilidad de visualizar otra
variable representada en el tamaño
del punto, pues éstos se convierten
en círculos (burbujas) con radios
proporcionales a las magnitudes
que representan.
Tipos de Gráficos
56. Cartogramas:
Estos tipos de gráficos se
utilizan para mostrar datos
sobre una base geográfica. La
densidad de datos se puede
marcar por círculos,
sombreado, rayado o color.
Tipos de Gráficos
60. Errores en los Gráficos
No colocar la
escala
No indicar
el punto
cero
1 2 3
Visualización
confusa
61. No es recomendable comparar dos gráficos circulares
puesto que resulta muy difícil y, por lo tanto, no es muy
aconsejable.
En ocasiones existen categorías con pocas frecuencias,
haciendo que la gráfica resulte "pesada" y las etiquetas se
encimen.
Una posible solución es juntarlas en una sola categoría
(por ejemplo, la típica "otras" o "varias"), pero entonces
habría que ponderar si se hace una gráfica extra con dichas
observaciones únicamente, haciendo la anotación
pertinente, o simplemente se ignoran por no resultar
significativas.
Errores en los Gráficos
63. Análisis de los Resultados con
estadísticas
Es la ciencia que:
Recolecta
Describe
Organiza
Interpreta
Los datos para transformarlos en información,
de forma que se puedan tomar decisiones
eficientes a partir de esos datos.
64. Estadística
• Es el conjunto de procedimientos y técnicas empleadas
para recolectar, organizar y analizar datos, los cuales sirven
de base para tomar decisiones en las situaciones de
incertidumbre que plantean las ciencias sociales o
naturales.
Definición:
65. Estadística (Definición):
La estadística es una ciencia que estudia
la recolección, análisis e interpretación de
datos, ya sea para ayudar en la resolución de
la toma de decisiones o para explicar
condiciones regulares o irregulares de algún
fenómeno o estudio aplicado, de ocurrencia en
forma aleatoria o condicional.
Sin embargo estadística es más que eso,
en otras palabras es el vehículo que permite
llevar a cabo el proceso relacionado con la
investigación científica.
66. ¿Para qué sirven las Estadísticas?
• La Ciencia se ocupa en general de fenómenos
observables.
• La Ciencia se desarrolla observando hechos, formulando
leyes que los explican y realizando experimentos para
validar o rechazar dichas leyes.
• Los modelos que crea la ciencia son de tipo determinista o
aleatorio (estocástico).
• La Estadística se utiliza como
tecnología al servicio de las ciencias
donde la variabilidad y la incertidumbre
forman parte de su naturaleza.
67. ¿Quiénes usan las Estadísticas?
• Organismos Oficiales
• Periodistas y Publicistas
• Políticos
• Comentadores Deportivos
• Profesionales de Marketing
• Controladores de Calidad
• Administradores
• Investigadores Científicos
• Médicos
• Educadores, etc.
68. Clasificación de la Estadística
Uno de los problemas fundamentales de la
Estadística es el estudio de la relación existente entre una
población y sus muestras.
Según la dirección de tal relación la Estadística
puede ser:
Estadística Inductiva
Estadística Deductiva
69. Población :
Es el conjunto de todos los individuos o elementos
(unidad de análisis) que son el objetivo de nuestro interés.
Población Finita:
Alumnos de la UPTJAA
Empleados de PDVSA
Países con Convenios con Vzla
Población Infinita:
Peces del Mar Caribe
Bacterias
Flores Silvestres
La Población, según su número de elementos puede
ser:
70. Muestra
Es una parte o un subconjunto de una población.
Tiene la característica fundamental de ser representativa de
la población.
La selección y estudio de una muestra facilita la
inferencia de conclusiones válidas para la población de
donde se obtuvo la muestra.
Ejemplos:
Grupo de sacos de azúcar que se extraen
sistemáticamente de una línea de envasado.
Grupo de tornillos que se extrae para llevar a cabo el
control de calidad.
72. Estadística Deductiva:
Es cuando a partir del conocimiento de la población
se trata de caracterizar cada muestra posible.
Es cuando a partir del conocimiento derivado de
una muestra se pretende caracterizar la población.
73.
74. Estadística Descriptiva:
Se refiere a la recolección, presentación,
descripción, análisis e interpretación de una colección de
datos, esencialmente consiste en resumir éstos con uno o
dos elementos de información (medidas descriptivas) que
caracterizan la totalidad de los mismos.
Puede utilizarse para resumir o describir cualquier
conjunto ya sea que se trate de una población o de una
muestra, cuando en la etapa preliminar de la Inferencia
Estadística se conocen los elementos de una muestra.
75. Estadística Descriptiva:
Ejemplos básicos de parámetros estadísticos son:
la media y la desviación estándar. Algunos ejemplos
gráficos son: histograma, pirámide poblacional, clústers,
entre otros.
76. Estadística Inferencial:
Se refiere al proceso de lograr
generalizaciones acerca de las propiedades del
todo, población, partiendo de lo específico,
muestra. las cuales llevan implícitos una serie de
riesgos.
Para que éstas generalizaciones sean válidas la
muestra deben ser representativa de la población y la
calidad de la información debe ser controlada, además
puesto que las conclusiones así extraídas están sujetas a
errores, se tendrá que especificar el riesgo o probabilidad
que con que se pueden cometer esos errores.
77. Estadística Inferencial:
Estas inferencias pueden tomar la forma de
respuestas a preguntas si/no (prueba de hipótesis),
estimaciones de características numéricas (estimación),
pronósticos de futuras observaciones, descripciones de
asociación (correlación) o modelamiento de relaciones entre
variables (análisis de regresión). Otras técnicas de
modelamiento incluyen anova, series de tiempo y minería
de datos.
78. Estadística Inferencial:
El Rol de las Probabilidades en la
inferencia estadística
MuestraPoblación
Estadística Inferencial
Probabilidad
79. Crítica a la Estadística
Hay una percepción general de que el conocimiento
estadístico es intencionada y demasiado frecuentemente
mal usado, encontrando maneras de interpretar los datos
que sean favorables al presentador.
Un dicho famoso, al parecer de Benjamin Disraeli, es:
«Hay tres tipos de mentiras: mentiras pequeñas, mentiras
grandes y estadísticas».
El popular libro How to lie with statistics (‘cómo
mentir con las estadísticas’) de Darrell Huff discute muchos
casos de mal uso de la estadística, con énfasis en gráficas
malintencionadas.
80. Crítica a la Estadística
Al escoger (o rechazar o modificar) una cierta
muestra, los resultados pueden ser manipulados; por
ejemplo, mediante la eliminación selectiva de valores
atípicos (outliers).
Este puede ser el resultado de fraudes o sesgos
intencionales por parte del investigador (Darrel Huff).
Lawrence Lowell (decano de la Universidad de
Harvard) escribió en 1909 que las estadísticas, «como
algunos pasteles, son buenas si se sabe quién las hizo y se
está seguro de los ingredientes».
81. Etapas de la Investigación
Estadística
Selección y determinación de la población o muestra y
las características contenidas que se desean estudiar. En el
caso de que se desee tomar una muestra, es necesario
determinar el tamaño de la misma y el tipo de muestreo a
realizar (probabilístico o no probabilístico).
• Tomar una muestra
• Determinar el tipo de muestreo a realizar :
Probabilístico
No probabilístico
82. Etapas de la Investigación
Estadística
Obtención de los datos: Esta
puede ser realizada mediante la
observación directa de los
elementos, la aplicación de
encuestas y entrevistas, y la
realización de experimentos.
83. Etapas de la Investigación
Estadística
Clasificación, tabulación y
organización de los datos. La
clasificación incluye el
tratamiento de los datos
considerados anómalos que
pueden en un momento dado,
falsear un análisis de los
indicadores estadísticos.
La tabulación implica el resumen de los datos en tablas
y gráficos estadísticos.
84. Etapas de la Investigación
Estadística
Análisis descriptivo de los datos. El análisis se
complementa con la obtención de indicadores estadísticos
como las medidas: de tendencia central, dispersión, posición
y forma.
85. Etapas de la Investigación
Estadística
Análisis inferencial de los datos. Se aplican técnicas de
tratamiento de datos que involucran elementos
probabilísticos que permiten inferir conclusiones de una
muestra hacia la población (opcional).
Elaboración de conclusiones. Se construye el informe final.
86. Variables
La definición de una Población y sus
Características dependerán de sus unidades (Variables)
elementales que deben ser observadas y dependiendo de
la naturaleza del problema planteado.
Por lo tanto, una variables es una
característica de interés sobre cada elemento
individual de una población o muestra.
Ejemplo:
El sexo de una familia: Sexo Femenino y Sexo
Masculino
87. Dato
Valor de la variable asociada a un elemento de la
población o muestra. Este valor puede ser un número, una
palabra o un símbolo.
Ejemplo:
La familia González tiene “4” miembros, sus ingresos
mensuales son de “US$ 685.00”, “2” son de sexo femenino y
“2” sexo masculino.
Variables
Datos
88. Tipos de Variables
Clasifica o describe un elemento de la población.
Los valores que puede asumir no constituyen un espacio
métrico, por lo tanto las operaciones aritméticas, como
sumar y obtener promedios, no son significativas.
Cualitativa o de Atributos:
Ejemplos:
• Sexo
• Nacionalidad
• Marcas de Auto
• Grado de Satisfacción con la Universidad
• Listado de Ferreterías
89. Tipos de Variables
Sólo hay dos categoría, que son excluyentes una
de la otra.
Dicotómicas:
Ejemplos:
• Enfermo - Sano
• Vivo - Muerto
• Hombre - Mujer
90. Tipos de Variables
Tiene mas de dos categorías y no hay orden entre
ellas.
Nominal:
Ejemplos:
• Color de los ojos
• Grupo Sanguíneo
Tiene varias categorías y hay orden entre ellas.
Ordinal:
Ejemplos:
• Grado Tumoral
• Calificación del riesgo en
Anestesia
91. Niveles de Medición de las Variables:
De acuerdo a su naturaleza pueden encontrarse en
estas escalas:
De razón
Nominal
Ordinal
Intervalar
92. Niveles de Medición de las Variables:
Tipos Característica Ejemplos
Nominal Valores que se agrupan en
categorías disjuntas y exhaustivas
•Género: Sexo
•Color de Pelo
•Religión
Ordinal Hay un orden entre las categorías •Clase Social
•Preferencias
•Educación
De Intervalo •Hay orden
•Hay distancia
•Hay un cero convencional
•Temperatura
•Coeficiente Intelectual
•Presión
De Razón •Hay orden
•Hay distancia
•Hay un cero convencional
•Edad
•Producción
•Ingresos
93. Escalas de Medición
Las variables cualitativas se miden en escala Nominal
u Ordinal
• Sectores de Residencia de los alumnos: Casco Viejo,
Inavi, Chaguaramos, Rahme, etc.
• Color de los ojos: Azules, Verdes, Negros, Marrones
• Club de Beisbol: Caribes, Leones, Magallanes, Tigres
Ejemplos de Nominales:
Características:
• Son mutuamente excluyentes
• No pueden ser ordenados
• Es Exhaustivo: Todos deben clasificarse
94. Escalas de Medición
• Grado de Satisfacción en el uso de los servicios públicos:
Pésimo, Malo, Bueno, Satisfactorio, Excelente
• Grado de Educación: Preescolar, Escolar, Bachillerato,
Universitaria, Post-Universitaria
Ejemplos de Ordinales:
Características:
• Los valores se pueden ordenar
• No es posible determinar la diferencia
aritmética (o distancia) entre ellos.
95. Tipos de Variables
Cuantifica un elemento de la población. Los valores
que puede asumir constituyen un espacio métrico, por lo
tanto las operaciones aritméticas, como sumar y obtener
promedios, son significativas.
Cuantitativa o Numérica:
Ejemplos:
• Cantidad de Habitaciones
• Número de Hijos
• Kilómetros Recorridos
• Ingreso
• Tiempo de vuelo
96. Tipos de Variables
Sólo pueden asumir ciertos valores y normalmente
hay huecos entre ellos.
Cuantitativas Discreta:
Ejemplos:
• Cantidad de Materias Aprobadas
• Cantidad de Hijos: 1, 2, 3, …
Puede asumir cualquier valor dentro del rango de
medición. Normalmente se miden magnitudes como ser
longitud, superficie, volumen, peso, tiempo, dinero.
Cuantitativas Continuas:
Ejemplos:
• Peso al Nacer
• Salario de un Empleado
• Tiempo de viaje en un autobús
97. Escalas de Medición
Las variables cuantitativas se miden en escala de
intervalo o razón.
Los elementos son clasificados en categorías que
tienen un orden o jerarquía, es decir, la diferencia entre
valores se puede realizar y son significativas.
Ejemplo:
Intervalos:
• Temperatura en grados Celsius
98. Escalas de Medición
Similar al nivel ordinal con la propiedad adicional
de que se pueden determinar cantidades significativas.
Ejemplo:
Nivel Intervalar:
• Temperatura en escala en grados Celsius
• Tallas de camisas (zapatos,
pantalones, etc.)
99. Escalas de Medición
Los elementos son clasificados en categorías que
tienen un orden o jerarquía, la diferencia entre valores se
pueden realizar y son significativas. Existe el “0” absoluto,
es decir la ausencia de la variable medida.
Ejemplo:
Razón:
• Tiempo de viaje
• Ingresos Familiares
• Producción
100. Variable Cuantitativa
(Numérica)
Variable Cualitativa
(No numérica )
Continua Discreta
Puede tomar
cualquier valor
en un intervalo
dado.
(Procesos de
medición)
Nº de trabajadores
por oficina,
nº de alumnos
por curso etc.
Sexo,
ocupación,
Condición de
de empleo
(nombrado o
contratado)
NominalOrdinal
-Nivel de
Educación,
estrato
socioeconómico,
categoría de
ocupación.
Ingreso, talla,
peso etc.
Toma sólo
ciertos
valores.
(procesos de
contar)
Se caracteriza por
Tienen
un orden
predeter-
minado:
No tienen
un orden
predeter-
minado:
Clasificación de Variables
101. Una MTC es un indicador numérico que representa el
comportamiento que se considera más representativo de
un grupo de valores.
El puntaje que
más se repite.
El puntaje que
divide al grupo
por la mitad
El puntaje que equipara los puntajes positivos con los
negativos
Medidas de Tendencia Central
103. La Moda para datos no agrupados
Se denota Mo y es la medida que indica cual dato
tiene la mayor frecuencia en un conjunto de datos, o
sea, cual se repite más.
El puntaje que más se repite. Una distribución de
puntajes puede ser bimodal, esto es, tener dos modas.
Si hay más de dos valores con la mayor frecuencia se
dice que no tiene moda.
En datos no tabulados, es el valor que se repite más.
104. Ejercicio
Se requiere saber el número de hijos por matrimonio
en Lima. Para este propósito, se elige una muestra
representativa de 50 matrimonios de ella. Se obtienen
los siguientes datos:
2 , 2 , 4 , 1 , 3 , 5 , 3 2 , 1 , 6 , 3 , 4 , 1 , 2 , 0 , 2 , 3 , 1
, 7, 4 , 2, 3 , 0 , 5 , 1 , 4 , 3 , 2 , 4 , 1 , 5 , 2 , 1 , 2 , 4 , 0
, 3, 3, 2 , 6 , 1 , 5 , 4 , 2 , 0 , 3 , 2 , 4 , 3 , 1.
El número total de datos se representa con la
letra n. En nuestro ejemplo n = 50.
¿Cuál es el valor de la moda?
La Moda para datos no agrupados
105. Si los datos se ordenan de orden ascendente de
magnitud, entonces la Mediana está dada por:
Me n + 1
2
=
Si n es impar, la mediana es exactamente el valor
promedio
Si n es par, la mediana es el promedio de los valores
centrales
La Mediana para datos no agrupados
106. Ejercicio
¿Cuál es el valor de la mediana?
Me
2
= 2 + 3
Me= 2,5
Caso par:
Me
2
= 50 + 1
Me= 25,5
0 1 2 2 3 4 6
0 1 2 3 3 4 7
0 1 2 3 3 4
0 1 2 3 4 5
1 1 2 3 4 5
1 2 2 3 4 5
1 2 2 3 4 5
1 2 2 3 4 6
Mediana
Mediana
La Mediana para datos no agrupados
107. Ejercicio
Se obtienen los siguientes datos:
80, 75, 56, 45, 80, 64, 53, 74, 34
El número total de datos se representa con la
letra n. En nuestro ejemplo n = 9.
La Mediana para datos no agrupados
108. Ejercicio
¿Cuál es el valor de la mediana?
Xi
34
45
53
56
64
74
75
80
80
Me
2
= 9 + 1
Me= 5
Caso impar:
Mediana
La Mediana para datos no agrupados
109. La Media
Representa al puntaje que equilibra los valores
positivos con los negativos de una distribución.
Media Aritmética
Media Geométrica
Media Armónica
Clasificación de la media:
110. Representa al puntaje que equilibra los valores
positivos con los negativos de una distribución.
Es aquella medida que se obtiene al dividir la suma
de todos los valores de una variable por la frecuencia
total. En palabras más simples, corresponde a la suma
de un conjunto de datos dividida por el número total de
dichos datos.
Datos no
Agrupados:
La Media Aritmética
111. Ejercicio
¿Cuál es el valor de la media aritmética?
Xi
34
45
53
56
64
74
75
80
80
9
= 561
= 62,33
X
X
561
La Media Aritmética
112. Ejercicio
Se requiere saber el número de hijos por matrimonio
en Lima. Para este propósito, se elige una muestra
representativa de 50 matrimonios de ella. Se obtienen
los siguientes datos:
2 , 2 , 4 , 1 , 3 , 5 , 3 2 , 1 , 6 , 3 , 4 , 1 , 2 , 0 , 2 , 3 ,
1 , 7, 4 , 2, 3 , 0 , 5 , 1 , 4 , 3 , 2 , 4 , 1 , 5 , 2 , 1 , 2 , 4
, 0 , 3, 3, 2 , 6 , 1 , 5 , 4 , 2 , 0 , 3 , 2 , 4 , 3 , 1.
El número total de datos se representa con la
letra n. En nuestro ejemplo n = 50.
La Media Aritmética
113. Ejercicio
¿Cuál es el valor de la media aritmética?
x i f i f ix i
0 4 0
1 9 9
2 12 24
3 10 30
4 8 32
5 4 20
6 2 12
7 1 7
134
X
50
= 134
X = 2,68
La Media Aritmética
114. La media geométrica es otro estadígrafo de
tendencia central, pero de poca utilización. El cálculo de
la media geométrica se puede hacer en datos con
frecuencia y datos sin frecuencias
Datos no
Agrupados:
n
n321 x·.......···x xxG
n f
n
f
3
f
2
f
1
n321
x·.......···x xxG Datos
Agrupados:
La Media Geométrica
115. Ejercicio
¿Cuál es el valor de la
media geométrica?
Xi
34
45
53
56
64
74
75
80
80
60,1680.80.75.74.64.56.53.45.349
G
La Media Geométrica
116. Ejercicio
Se requiere saber el número de hijos por matrimonio
en Lima. Para este propósito, se elige una muestra
representativa de 50 matrimonios de ella. Se obtienen
los siguientes datos:
2 , 2 , 4 , 1 , 3 , 5 , 3 2 , 1 , 6 , 3 , 4 , 1 , 2 , 0 , 2 , 3 ,
1 , 7, 4 , 2, 3 , 0 , 5 , 1 , 4 , 3 , 2 , 4 , 1 , 5 , 2 , 1 , 2 , 4
, 0 , 3, 3, 2 , 6 , 1 , 5 , 4 , 2 , 0 , 3 , 2 , 4 , 3 , 1.
El número total de datos se representa con la
letra n. En nuestro ejemplo n = 50.
La Media Geométrica
117. Ejercicio
¿Cuál es el valor de la media Geométrica?
x i f i f i
fi
0 4 04 0
1 9 19 1
2 12 212 4096
3 10 310 59049
4 8 48 65536
5 4 54 625
6 2 62 36
7 1 71 7
50
7.36.625.65536.59049.4096.1.0G 1,27G
La Media Geométrica
118. 1. Identificar el tipo de variable Cuantitativa discreta
o Continua,
2. Determinar el valor mayor (Xmax) y el menor valor
(Xmin),
3. Calcular el recorrido, donde R = Xmax - Xmin
Variables Cuantitativas:
La Distribución de
Frecuencias
119. Variables Cuantitativas Discretas:
4. Si la variable es cuantitativa discreta:
a) Si el rango es pequeño, entonces
trabajar con los valores originales
ordenados de las variables,
b) Si el rango es grande, entonces trabajar
con los datos ordenados agrupados en
intervalos de clases, (Regla de Sturges)
La Distribución de Frecuencias
120. Variables Cuantitativas Continuas:
4. Si la variable es cuantitativa Continuas:
a) Determinar el número de intervalos
(entre 5 y 20)
b) Utilizar las Regla de Sturges:
m=1+(3,322 *Log (n))
c) Los intervalos creados son cerrados
por la izquierda y abiertos por la
derecha
d) Calcular la marca de clase
La Distribución de Frecuencias
121. Ejercicio
En un estudio de dos semanas sobre la productividad de
los trabajadores de una fundición, se obtuvieron los
siguientes datos sobre el número total de piezas
aceptables que produjeron los trabajadores:
Tabla de Frecuencias
Histograma: Diagrama de barras vertical
Polígono de frecuencia
Media aritmética
Mediana
Moda
La Distribución de Frecuencias
123. 1. Se identificó que la variable es cuantitativa
discreta,
2. Se procede a determinar los valores máximo y
Mínimo de la variable:
3. Se calcula el rango
X max =88
X min =21
X max = 88- X min - 21R = = 67
Solución
124. 4. Como el rango es grande (mayor de 20), entonces
se procede a trabajar con los datos ordenados
agrupados en intervalos de clase (Regla de
Sturges),
5. Determine el número de intervalos
m = 1+(3,322 * Log (n)) = 1 +(3,322 * Log (97)) = 7,60
6. Como el valor dio 7,60; se redondea a m= 8, es
decir, tendrá 8 intervalos de clase
7. El menor del primer intervalo izquierdo es
X’ min = (Xmin) – menor unidad/2 = 21 – 1/2
X’ min = 20,5
Solución
125. 8. Amplitud de clase
A = R / m = 67 / 8 = 8,375 = 9
9. Calcular la marca de clase
MC = X’min+(A/2)
MC1= 20,5 + 9/2 = 20,5 + 4,5 = 25
10. Se comienza a trabajar la Tabla de Frecuencia
Solución
127. Para datos agrupados:
n
MCxf
X
k
1i
ii
INTERVALOS MC fi fi * MC
[20,5 – 29,5) 25 4 100
[29,5 – 38,5) 34 10 340
[38,5 – 47,5) 43 15 645
[47,5 – 56,5) 52 19 988
[56,5 – 65,5) 61 18 1098
[65,5 – 74,5) 70 15 1050
[74,5 – 83,5) 79 13 1027
[83,5 – 92,5] 88 3 264
97 5512
82,56
97
5512
X
La Media Datos Agrupados
128. Datos Agrupados:
L : Límite inferior Clase Mediana (C Me)
Ne-1 : Frec. Acumulada hasta antes (C Me)
ne : Frecuencia Absoluta (C Me)
ae : Amplitud (C Me)
n : Tamaño de la muestra
e
e-1
e
n
N
n
2
aLMe
)( -
+=
xeL
ne
ae
Ne-1= fiS
i = e-1
i = 1
La Mediana Datos Agrupados
130. Para datos
agrupados:
INTERVALOS MC fi
[20,5 – 29,5) 25 4
[29,5 – 38,5) 34 10
[38,5 – 47,5) 43 15
[47,5 – 56,5) 52 19
[56,5 – 65,5) 61 18
[65,5 – 74,5) 70 15
[74,5 – 83,5) 79 13
[83,5 – 92,5] 88 3
97
A*LMo
21
1
54,7Mo
9*
1)(4
4
47,5Mo
∆1 : 19 – 15 = 4
∆2 : 19 – 18 = 1
A : 9
fi menor
fi mayor
Mayor fi
La Moda Datos Agrupados
131. El área de Control de Calidad de la empresa Tornillos C,
A,, está realizando un seguimiento a un lote de tornillos
en su planta de la ciudad X, para ello toma una muestra
aleatoria, con el fin de que se le realice sus respectivo
análisis descriptivo:
Tabla de Frecuencias
Histograma: Diagrama de barras vertical
Polígono de frecuencia
Media aritmética
Mediana
Moda
Ejercicio
133. 1. Se identificó que la variable es cuantitativa
continua,
2. Se procede a determinar los valores máximo y
Mínimo de la variable
3. Se calcula el rango
X max = 1287,5
X min = 1265,5
X max = 1287,5- X min - 1265,5R= = 22
Solución
134. 4. Como el rango es grande (mayor de 20), entonces
se procede a trabajar con los datos ordenados
agrupados en intervalos de clase (Regla de
Sturges),
5. Determine el número de intervalos
m = 1+(3,322 * Log (n)) = 1 +(3,322 * Log (110)) = 7,78
6. Como el valor dio 7,78; se redondea a m= 8, es
decir, tendrá 8 intervalos de clase
7. El menor del primer intervalo izquierdo es
X’ min = (Xmin) - menor unidad/2 = 1265,5 – 0,1/2
X’ min = 1265,45
Solución
135. 8. Amplitud de clase
A = R / m = 22 / 8 = 2,75 = 2,8
9. Calcular la marca de clase
MC = X’min+(A/2)
MC1= 1265,45 + (2,8/2) = 1266,85
10. Se comienza a trabajar la Tabla de Frecuencia
Solución
137. Para datos
agrupados: n
MCxf
X
k
1i
ii
INTERVALOS MC fi fi * MC
[1265,45 - 1268,25 ) 1266,85 8 10134,80
[1268,25 - 1271,05 ) 1269,65 9 11426,85
[1271,05 - 1273,85 ) 1272,45 16 20359,20
[1273,65 - 1276,65 ) 1275,25 23 29330,75
[1276,65 - 1279,45 ) 1278,05 12 15336,60
[1279,45 - 1282,25 ) 1280,85 21 26897,85
[1282,25 - 1285,05 ) 1283,65 13 16687,45
[1285,05 - 1287,85 ] 1286,45 8 10291,60
110 140465,10
96,1276
110
10,140465
X
La Media Datos Agrupados
138. INTERVALOS MC fi Fi fi * MC
[1265,45 - 1268,25 ) 1266,85 8 8 10134,80
[1268,25 - 1271,05 ) 1269,65 9 17 11426,85
[1271,05 - 1273,85 ) 1272,45 16 33 20359,20
[1273,65 - 1276,65 ) 1275,25 23 56 29330,75
[1276,65 - 1279,45 ) 1278,05 12 68 15336,60
[1279,45 - 1282,25 ) 1280,85 21 89 26897,85
[1282,25 - 1285,05 ) 1283,65 13 102 16687,45
[1285,05 - 1287,85 ] 1286,45 8 110 10291,60
110 140465,10
Para datos
agrupados: e
1-e
e
n
n
2
n
aLMe
1276,33Me
23
33-
2
110
2,81273,65Me
Datos:
L : 1273,65
ne-1 :33
ne : 23
ae : 2,8
n : 110
Ne-1
Ne
L
La Mediana Datos Agrupados
139. Para datos
agrupados:
INTERVALOS MC fi
[1265,45 - 1268,25 ) 1266,85 8
[1268,25 - 1271,05 ) 1269,65 9
[1271,05 - 1273,85 ) 1272,45 16
[1273,65 - 1276,65 ) 1275,25 23
[1276,65 - 1279,45 ) 1278,05 12
[1279,45 - 1282,25 ) 1280,85 21
[1282,25 - 1285,05 ) 1283,65 13
[1285,05 - 1287,85 ] 1286,45 8
110
A*LMo
21
1
1274,74Mo
8,2*
11)(7
7
1273,65Mo
∆1 : 23 – 16 = 7
∆2 : 23 – 12 = 11
fi menor
fi mayor
Mayor fi
A : 2,8
L
La Moda Datos Agrupados
140. 1. Percentiles: Es cuando la distribución se divide en
100 partes.
2. Deciles: Es cuando la distribución se divide en 10
partes.
3. Cuartiles: Es cuando la distribución se divide en 4
partes.
Este tipo de medidas, nos permiten dividir a una
distribución en diferentes partes.
Según sea el número de partes o divisiones, se
clasifican en:
4. Mediana: Es cuando la distribución se divide en 2
partes.
Medidas de Posicionamiento
141. a) Las variables deben ser cuantitativas
b) Los resultados deben estar ordenados, es decir,
las variables deben ser ordinales.
Requisitos:
c) Las variables deben ser discretas
Cuando todas las medidas se refieren al mismo
grupo de datos se pueden hacer equivalencias entre
sí.
Equivalencias:
Medidas de Posición
142. El percentil 30 (P30), por ejemplo, es el valor en el
cual la variable bajo el cual se encuentra el 30 % de los
casos y sobre el cual se encuentra el 70 % de los casos
El decil 4 (D4) es el valor de la variable que deja bajo
él, el 40 % de los casos y sobre dicho decil el 60 %. Esto
permite ver las equivalencias entre percentiles y deciles.
D4 P40=
El cálculo del percentil cuando los datos no están
tabulados es directo. Se ubica el puntaje o valor que está
en la posición que corresponde al percentil deseado.
Ejemplo: 23 34 34 36 37 37 37 42 46 50
P60
D6
Medidas de Posición
143. Si los datos están en una tabla de intervalos, la
fórmula para calcular el percentil, es la siguiente:
i.
f
F.n
100
x
LPx
n : Tamaño de la muestra
L : Límite inferior Real del intervalo crítico
F : Frec. Acumulada hasta el intervalo anterior
f : Frecuencia relativa en el intervalo crítico
i : Amplitud del intervalo
Medidas de Posición
144. Son aquellas que permiten retratar la distancia de los
valores de la variable a un cierto valor central, o que
permiten identificar la concentración de los datos en un
cierto sector del recorrido de las variables. Se trata de
coeficientes para variables cuantitativas.
Medidas de Dispersión
145. Varianza Muestral:
1-n
)x-(xf
S
k
1i
2
ii
2
Datos Agrupados:
1-n
)x-(x
S
n
1i
2
i
2
Datos no Agrupados:
Datos:
s2 : frecuencia relativa clase i
xi : i-ésimo valor observado
x : media aritmética
n : tamaño de la muestra
Datos:
fi : frecuencia relativa clase i
xi : marca de clase i
x : media aritmética
n : tamaño de la muestra
k : número de clases
Amplitud Total: Valor mayor – valor menor
Amplitud total:
Medidas de Dispersión
147. Desviación Media:
Datos Agrupados:
n
x-x
MD
n
1i
i
Datos no Agrupados:
Datos:
s2 : frecuencia relativa clase i
xi : i-ésimo valor observado
x : media aritmética
n : tamaño de la muestra
Datos:
fi : frecuencia relativa clase i
xi : marca de clase i
x : media aritmética
n : tamaño de la muestra
k : número de clases
n
x-x.f
MD
n
1i
ii
Medidas de Dispersión
148. Se obtienen los siguientes datos:
80, 75, 56, 45, 80, 64, 53, 74, 34
El número total de datos se representa con la
letra n. En nuestro ejemplo n = 9.
Ejercicio
158. En un estudio de dos semanas sobre la productividad
de los trabajadores de una fundición, se obtuvieron los
siguientes datos sobre el número total de piezas
aceptables que produjeron los trabajadores:
Tabla de Frecuencias
Amplitud Total
Media Aritmética
Varianza Muestral
Desviación Muestral
Desviación Media
Ejercicio
164. Pearson propuso el concepto de curtosis calculándolo
mediante el coeficiente de curtosis de cuarto orden (a4):
3-
s
)x-(x
a 4
n
1i
4
i
4
Datos:
A4 > 0 --> Distribución de Frecuencias es leptocúrtica
A4 = 0 --> Distribución de Frecuencias es platicúrtica
A4 < 0 --> Distribución de Frecuencias es mesocrúrtica
Medidas de Apuntalamiento
165. Es cuando la distribución de frecuencias es más
apuntada que la normal.
Leptocúrtica:
leptocúrtica
Normal
Medidas de Apuntalamiento
166. Es cuando la distribución de frecuencias es menos
apuntada que la normal.
Platicúrtica:
Platicúrtica
Normal
Medidas de Apuntalamiento
168. Miden la mayor o menor simetría de la distribución.
Datos:
a1 < 0 --> Distribución de Frecuencias es positiva
a1 = 0 --> Distribución de Frecuencias es simétrica
a1 < 0 --> Distribución de Frecuencias es negativa
s
)x-(x
a 2
n
1i
2
i
1
n
Medidas de Asimetría