3. EJEMPLO DE ENCUESTA
REALIZA UNA ENCUESTA A DISTANCIA, CON NO MENOS DE 50 PARTICIPANTES; PARA SOLICITAR
INFORMACIÓN ACERCA DEL TIPO DE MUSICA QUE MÁS LES GUSTA ESCUCHAR. ORGANIZA LA
INFORMACIÓN OBTENIDA EN UNA TABLA Y CONSERVALA PARA EVENTOS POSTERIORES.
CLASICA 15
ROMANTICA 20
POP 25
CORRIDOS 5
BANDA 40
OTROS 20
4. ENCUESTA
CON TUS CONOCIDOS, AMISTADES O FAMILIARES, SOLICITA INFORMACIÓN REFERENTE AL NÚMERO DE
ALUMNOS POR GRADO DE UNA ESCUELA PRIMARIA DE LA LOCALIDAD O FORANEA. ESTA INFORMACIÓN
LA DEBES ORDENAR Y CONSERVAR PARA SER UTILIZADA POSTERIORMENTE.
GRADO MUJERES HOMBRES TOTAL
1° 23 15 38
2° 19 21 40
3°
4°
5°
6°
5. DEFINICIÓN DE
ESTADÍSTICA
Es la ciencia que se encarga de estudiar los
métodos científicos utilizados en la recolección,
organización, recopilación, presentación y análisis
de datos; utilizados en la deducción y toma de
decisiones razonables en base al análisis obtenido
de la población.
6. IMPORTANCIA DE LA
ESTADÍSTICA
La importancia de esta ciencia esta basada en el análisis de datos de
diversos problemas científicos de la población; para proporcionar
elementos empíricos que permitan la toma de decisiones que permita
resolver los problemas analizados.
El eso de la estadística es amplio debido a que las reglas y métodos
empíricos utilizados en la toma de decisiones se han hecho cada vez
menos dignos de confianza.
7. RAMAS DE LA ESTADÍSTICA
Para su estudio la estadística se clasifica en 2 grandes ramas.
• Estudia los métodos para describir un
conjunto de datos de una población
considerando una parte de la misma
ESTADÍSTICA
DESCRIPTIVA
• Estudia los métodos para conocer las
características de una población
basados en una muestra
ESTADÍSTICA
INFERENCIAL
10. ANÁLISIS DE DATOS
CUALITATIVOS
Los datos cualitativos son aquellos que nos proporcionan respuestas
categóricas y que se obtienen de la aplicación de encuestas, entrevistas
o cuestionarios.
Estos datos describen o detallan situaciones diversas, eventos,
personas, comportamientos, actitudes, creencias y pensamientos
Por ejemplo si se pregunta el estado civil de una persona, las posibles
respuestas categóricas serán: soltero, casado, viudo, divorciado, unión
libre
11. PROCEDIMIENTO
Una vez que se formulo y aplicó la encuesta para la obtención de los
datos cualitativos, se deben preparar para su análisis, presentación
gráfica e interpretación. Para ello se realizan las siguientes etapas:
1. Verificación de los datos
2. Edición de los datos
3. Análisis del conjunto de datos
4. Presentación grafica de los resultados
12. VERIFICACIÓN
En esta etapa, el investigador debe verificar que los datos este
completos, que no presenten errores y que el numero de datos
corresponda al numero de encuestas aplicadas.
Esta etapa es la mas tediosa ya que consiste en revisar cada una de las
encuestas aplicadas para tabular las respuestas obtenidas. Para ello
debe revisar cada una de las encuestas aplicadas.
13. EDICIÓN
Una vez que se revisaron que las encuestas estén completas y
correctamente contestadas, inicia la etapa de la edición de los datos.
Esta etapa consiste en pasar los datos cualitativos obtenidos a un
formato que permita al investigador su análisis.
Generalmente los datos cualitativos se ordenan en forma de lista en
dos columnas, en la primera se anotan las variables y en la segunda los
conteos de cada variable
14. ANÁLISIS
Una vez ordenados los datos cualitativos, inicia la etapa de análisis que
consiste en calcular los porcentajes de cada variable para realizar la
presentación gráfica de los resultados.
Los datos cualitativos se representan graficando los porcentajes de
cada una de las variables del problema. Para calcular el porcentaje se
divide el conteo de la variable entre el numero total de datos y el
resultado se multiplica por 100
15. PRESENTACIÓN GRÁFICA
Una vez que se tienen los porcentajes de cada una de las variables del
problema, se lleva a cabo la presentación gráfica de los resultados.
Comúnmente los datos cualitativos se representan gráficamente de
tres maneras:
1. Gráficas de barras
2. Gráficas circulares
3. Pictogramas
16. GRÁFICAS DE BARRAS
Llamaremos gráfico estadístico a la representación de datos por medio
de figuras geométricas cuyas dimensiones son proporcionales al
porcentaje de las variables analizadas.
El objetivo principal de estas gráficas es presentar de manera general la
comparación entre las variables del problema mediante la variación.
Una de las gráficas más utilizados para representar datos cualitativos
son las de barras, las cuales permiten una mayor apreciación
estadística de la información.
17. CRITERIOS
Para elaborar un grafico estadístico de barras, se deben considerar los
siguientes criterios:
1. Las barras de una misma gráfica deben ser del mismo ancho,
variando únicamente su longitud.
2. Las barras no deben esta pegadas a los ejes de la gráfica.
3. Los espacios entre barra y barra deben ser igual a la mitad del
ancho de la barra.
18. ELEMENTOS
Los elementos que debe presentar una gráfica de barras para permitir
su interpretación son los siguientes:
1. Los ejes de la gráfica deben estar marcados con claridad.
2. Todas las gráficas deben tener una escala de porcentajes.
3. Deben contener los siguientes elementos de interpretación:
1. Titulo de la gráfica
2. Fuente de información de los datos de la gráfica
3. Lugar y fecha de realización
4. Autor de la gráfica
19. TIPOS DE BARRAS
GRÁFICA DE BARRAS
HORIZONTALES
GRÁFICA DE BARRAS VERTICALES
GRÁFICA DE BARRAS DE
COMPONENTES
20. BARRAS HORIZONTALES
Estas gráficas representan una de las mejores formas
para presentar gráficamente los resultados del análisis
de un conjunto de datos cualitativos.
Para su elaboración se ubica sobre el eje horizontal la
escala de porcentajes y sobre el eje vertical las barras
que representan el porcentaje de cada variable del
problema. La gráfica se complementa con los datos
necesarios para su interpretación.
22. BARRAS VERTICALES
Al igual que las horizontales, las graficas de barras
verticales proporcionan una imagen detallada del
comportamiento de las variables de la población.
Para su elaboración se ubica en el eje vertical la escala
de porcentajes y el eje horizontal las barras que
representan el porcentaje de cada variable. La gráfica
se complementa con los datos necesarios para su
interpretación.
23.
24. BARRAS DE COMPONENTES
Esta gráfica consta de una solo barra horizontal ancha
donde se ubican, de manera consecutiva, los
porcentajes de cada una de las variables del problema.
Para su elaboración se traza una barra horizontal
amplia en donde se van marcando los porcentajes, de
manera consecutiva, de cada una de las variables de la
población; anotando los datos necesarios para su
interpretación.
25.
26. PROCEDIMIENTO
Para realizar gráficas de barras, se recomienda el siguiente
procedimiento:
1. Identificar las variables del problema
2. Sumar los conteos de cada variable para obtener el total de la
población.
3. Calcular los porcentajes de cada variable dividiendo el conteo de
cada variable entre el total de la población y multiplicando el
resultado por 100.
4. Realizar las gráficas de barras considerando las recomendaciones
indicadas en cada caso.
27. GRÁFICA CIRCULAR
La gráfica circular o diagrama de pastel, se utilizan con frecuencia para
representar datos cualitativos, siendo la grafica de mayor uso después
de las gráficas de barras.
Estas gráficas facilitan la interpretación de los resultados del problema
ya que permiten hacer comparaciones entre las variables a simple vista.
Los porcentajes se representan en una circunferencia que mide 360° y
que representa el 100% de la población.
28. ELABORACIÓN
En la construcción de una gráfica circular el investigador utiliza compas y
transportador; el primero para trazar el circulo y el segundo para medir los
sectores correspondientes del circulo.
Para determinar las medidas de las divisiones del sector circular, se divide el
conteo de cada variable entre el total de la muestra y el resultado se
multiplica por 360°. El valor obtenido serán los grados que se marcarán con
el transportador en el circulo y que representan el porcentaje de cada
variable
29. CRITERIOS
En la elaboración de gráficas circulares se deben considerar los siguientes
criterios:
1. Anotar el porcentaje que representa cada sector del circulo.
2. Escribir los elementos necesarios para la interpretación de la gráfica.
3. Utilizar colores diferentes para cada sector.
4. Los grados se utilizan para marcar los segmentos en el circulo, pero no se
deben de anotar en la gráfica.
30. CRITERIOS
1. El número de variables representadas en el diagrama
circular no deben ser mayores a 7.
2. Sin ser una condición los segmentos dentro del
circulo se ordenan de mayor a menor.
3. Se puede iniciar el trazado de segmentos desde
cualquier parte del circulo, sin embargo se
recomienda iniciar a partir de la posición de las 12
horas.
32. PICTOGRAMAS
DEFINICIÓN
Un pictograma se define como la representación de datos estadísticos
cualitativos con símbolos, que por su forma representan la naturaleza de los
datos. Es uno de los gráficos que más atrae la atención del lector, razón por
la cual se recurre a ellos con gran frecuencia. Un pictograma consiste en
representar determinadas magnitudes por medio de figuras, con la
desventaja de que no permite comparaciones satisfactorias.
33. ESTRUCTURA
Existen diversas manera de presentar un pictograma sin embargo, se
recomienda que se distribuyan en tres columnas imaginarias:
Columna 1: se anota el nombre de las variables en el orden en que aparecen
en el enunciado del problema.
Columna 2: incluir la figura seleccionada, en orden y en la cantidad que
representa a cada variable.
Columna 3: anotar la cantidad indicada en el problema de cada variable
35. PROCEDIMIENTO
Para realizar un pictograma se procede de la siguiente manera:
1) Se selecciona una figura alusiva al tema que se describe en el problema, se le asigna
un valor o una unidad de medida y se indica con claridad en el encabezado.
2) Las cantidades menores a la unidad elegida se representan con el símbolo mutilado.
3) Terminado el gráfico se le añaden las indicaciones necesarias para su lectura y
comprensión tales como título, fecha, lugar y responsable.
En esta clase de representaciones graficas hay que tener mucho cuidado en que la belleza
artística de la figura no opaque el objetivo técnico que con ello se persigue.
36. EJEMPLO
La oficina de control escolar de la UNICLA plantel Zitácuaro,
proporciono, en el mes de abril de 2022, la siguiente estadística
relacionada con el número de alumnos inscritos en preparatoria por
grado para el cuatrimestre mayo-agosto de 2022:
Segundo cuatrimestre 19
Cuarto cuatrimestre 24
Bachillerato sociales 15
Bachillerato químicos 10
Bachillerato Físicos 12
Realizar el análisis estadístico
37. EJEMPLO
El departamento de vinculación de la UNICLA plantel Zitácuaro, levanto la
estadística relacionada con el número de alumnos por primaria que visitaron
las instalaciones del plantel con motivo de los festejos de la semana
académica y cultural realizada en el mes de abril de 2022, los datos son los
siguientes:
Primaria Amado Nervo 70 alumnos
Primaria 20 de Noviembre 40 alumnos
Primaria Benito Juárez 50 alumnos
Primaria Revolución 45 alumnos
Primaria López Rayón 60 alumnos
Primaria Manuel Doblado 55 alumnos
38. EJEMPLO
La oficina de control escolar de la UNICLA plantel Zitácuaro, presento en el
mes de enero de 2022, la estadística del número de alumnos por licenciatura
inscritos para el semestre febrero-julio de 2022; con los siguientes datos:
Pedagogía 60
Nutrición 80
Derecho 100
Deportes 120 Realizar el análisis estadístico
Gastronomía 40
Psicología 70
Bachillerato 90
39. GRÁFICAS COMPARATIVAS
En ocasiones es necesario comparar dos o mas variables diferentes de
una población, para tomas decisiones con respecto a un criterio
establecido; cuando sucede este caso, se utilizan las graficas
comparativas que nos permiten establecer las diferencias entre las
variables evaluadas
40. CRITERIOS
Para la elaboración de gráficas comparativas se sugiere considerar los
siguientes criterios:
1. Usar un color diferente para cada una de las variables que se van a
comparar, para distinguir las diferencias entre ellas.
2. Marcar correctamente los ejes de las gráficas.
3. Anotar los elementos necesarios para la identificación de las variables
4. Indicar los datos necesarios para la interpretación de la gráfica.
42. GRÁFICA COMPARATIVA LINEAL
Esta gráfica permite comparar dos o más variables de una población por
medio de líneas que relacionan los datos de cada una de las variables.
Para su elaboración se ubica en el eje horizontal las variables y en el eje
vertical los valores, se relaciona cada variable con su valor y se indica
mediante un punto; una vez señalados todos los puntos de la variable se
unen mediante segmentos de recta de colores diferentes para cada
variable. La gráfica concluye con los datos necesarios para su
interpretación.
43.
44. GRÁFICA DE BARRAS COMPARATIVAS
Gráfica que nos permite comparar por medio de barras, las diferencias
entre dos o más variables de una población. Para su elaboración se
ubican en el eje horizontal las variables y en el vertical los valores, se
relaciona cada variable con su valor y se representa mediante barras
verticales del mismo ancho y de diferente color. La gráfica se
complementa con los datos necesarios para su interpretación.
45.
46. GRÁFICA COMPARATIVA
DE BARRAS COMPUESTAS
Esta gráfica nos permite comparar en una sola barra
vertical ancha, el comportamiento de dos o más variables
de una población. Para su elaboración se ubican en el eje
horizontal las variables a comparar y en el vertical los
valores; la comparación entre las variables se realiza
ubicando su valor dentro de una misma barra vertical. La
gráfica se completa con los datos necesarios para su
interpretación.
47.
48. PROCEDIMIENTO
Para realizar las graficas comparativas, se recomienda el siguiente
procedimiento:
1) Identificar las variables que se desean comparar.
2) Determinar el dato de mayor valor en la muestra.
3) Realizar la escala de valores considerando el dato mayor de la
muestra.
4) Trazar los ejes de la gráfica anotando en el vertical los valores y en
el horizontal las variables
5) Realizar las gráficas comparativas
49. EJERCICIO
El Sr. Gómez propietario de la frutería “el manguito” ubicada en la
colonia “pacifico” de la ciudad de Papanoa, Guerrero; desea realizar
una grafica que le permita comparar las ventas, en kilogramos,
realizadas en su negocio durante la última semana del mes de
diciembre de 2022; para lo cual registro los siguientes datos:
DÍA PLÁTANO MANGO PAPAYA
LUNES 200 75 125
MARTES 185 90 135
MIÉRCOLES 225 100 150
JUEVES 250 85 140
VIERNES 240 89 110
SÁBADO 210 110 120
DOMINGO 225 105 160
50. DATOS CUANTITATIVOS
En estadística llamamos datos cuantitativos a
aquel conjunto formado por datos numéricos que
se obtienen de un proceso de conteo o medición.
Para su análisis se dividen en dos tipos:
1. Datos no agrupados
2. Datos agrupados
51. DATOS NO AGRUPADOS
Los datos no agrupados son aquellos cuyo numero en
cantidad es menor de 50 elementos por muestra. Se
obtienen de la medición y el conteo de los parámetros de
una población.
Para sus análisis, se organizan en forma ascendente, del
menor al mayor; se elabora una tabla de frecuencias, para
determinar su características; y se construyen las
graficas correspondientes.
52. TABLA DE FRECUENCIAS
En el análisis de un conjunto de datos no agrupados, se elabora una
tabla de frecuencias para ordenar y determinar ciertas
características de los datos que nos facilitan su interpretación y nos
permiten graficarlos; esta tabla se elabora considerando los
siguientes criterios:
• Columna 1: contiene los DATOS de la población previamente
ordenados
• Columna 2: formada por las FRECUENCIAS de los datos, es decir,
el número de veces que aparece cada dato en la muestra.
53. • Columna 3: contiene a las FRECUENCIAS ACUMULADAS (FA) que se obtienen
sumando consecutivamente las frecuencias de la columna anterior y cuyo
resultado final debe ser igual al número de datos.
• Columna 4: representa a la FRECUENCIA RELATIVA (FR) que se obtiene
dividiendo la frecuencia de cada dato entre el número total de datos.
• Columna 5: se integra con la FRECUENCIA RELATIVA ACUMULADA (FRA) que
se obtiene al sumar consecutivamente las frecuencia relativas de la columna
anterior y cuyo resultado debe ser igual a la unidad.
• Columna 6: formada por el PORCENTAJE (P) de cada uno de los datos de la
muestra, que se obtiene multiplicando la frecuencia relativa por 100.
54. • Columna 7: formada por el PORCENTAJE ACUMULADO que se obtiene
sumando consecutivamente los porcentajes de la columna anterior y
cuyo resultado final debe ser igual a 100.
Existen 3 criterios para determinar si la tabla de frecuencias se realizo de
manera correcta:
1. El valor que aparece al final de la columna 3, debe ser igual al número
de datos de la muestra.
2. El valor que aparece al final de la columna 5, debe ser igual a la
unidad.
3. El valor que aparece al final de la columna 7, debe ser igual a 100.
55. ANÁLISIS GRÁFICO
Para presentar gráficamente un conjunto de datos cuantitativos no agrupados, se
utilizan 3 tipos de gráficas:
56. GRÁFICAS DE FRECUENCIAS
Son las gráficas más utilizadas para representar datos
cuantitativos no agrupados. Para su elaboración se ubica
en el eje horizontal los datos de la muestra y en el eje
vertical las frecuencias.
Se relaciona cada dato con su frecuencia y los puntos así
formados se unen mediante segmentos de recta para crear
la gráfica de frecuencias. Se complementa con los datos e
información necesaria para su interpretación.
57. GRÁFICA DE FRECUENCIAS ACUMULADAS
Este tipo de gráficas para representar datos cuantitativos
no agrupados, se construye colocando en el eje horizontal
los datos de la muestra y en el eje vertical las frecuencias
acumuladas. Se hace coincidir cada dato con su
frecuencia acumulada y se unen los puntos mediante
segmentos de recta formando una escalera. La gráfica se
complementa con los datos necesarios para su
interpretación.
58. GRÁFICAS DE PORCENTAJES
Para presentar los porcentajes de un conjunto de datos
cuantitativos no agrupados, se utiliza una gráfica de
porcentajes que se elabora ubicando en el eje horizontal los
datos de la muestra y en el vertical los porcentajes; se
relaciona cada dato con su porcentaje y se representa
mediante una barra vertical. La estructura de las barras se
realiza considerando los criterios ya conocidos y se
complementa la gráfica con los datos necesarios para su
interpretación.
59. EJEMPLO
Los siguientes datos corresponden a los resultados del examen de
Estadística aplicado durante el cuatrimestre mayo-agosto a los alumnos
del tercer grado de bachillerato de la UNICLA plantel Zitácuaro, en el
mes de mayo de 2022.
80 85 90 95 75 70 60 65 70
60 70 80 90 55 65 65 70 75
75 90
Realizar el análisis estadístico
60. DATOS AGRUPADOS
¿Qué harías si te solicitaran analizar los datos correspondientes a
la edad de todos los alumnos de tu escuela? o ¿Qué analices el
peso de los docentes y administrativos de tu plantel? o ¿analizar la
altura de los padres de familia de tu escuela? Parece algo
trabajoso, ¿verdad? Sin embargo, cuando se está trabajando con
una gran cantidad de datos es conveniente agruparlos en
intervalos, para facilitar su análisis.
61. PROCESO
Considerando la anterior, se llama datos cuantitativos
agrupados, al conjunto de datos numéricos cuya
cantidad en número es mayor a 50 elementos y su
análisis estadístico se desarrolla en las siguientes etapas:
1. Orden de rango
2. Realización de intervalos de frecuencia
3. Elaboración de una tabla de frecuencias
4. Representación gráfica de los resultados
62. ORDEN DE RANGO
Proceso de ordenamiento que consiste en ordenar de
forma ascendente los datos del problema, es decir, del
menor al mayor; teniendo en cuenta que el numero de
datos sea el mismo que aparece en el problema
63. INTERVALO DE CLASE
Un intervalo está formada por 2 números llamados límites, uno
superior y el otro inferior siendo la amplitud entre ellos igual para
cada intervalo. La amplitud del intervalo es el número de posibles
valores que los datos deben tener para pertenecer a esa clase. Los
intervalos se forman de manera que sus puntos medios sean múltiplos
de 5, por regla general no debe haber menos de 10 intervalos ni más
de 25.
Para calcular el número de intervalos se divide el rango entre la
amplitud del intervalo deseado que debe ser de 5 o múltiplo de 5, sin
olvidar que el número de intervalos debe ser mayor que 10 y menor
de 25.
64. PUNTO MEDIO DEL INTERVALO
Se obtiene sumando los límites del intervalo y
dividiendo el resultado entre 2. Por regla general el
primer punto medio del primer intervalo debe ser el
primer número del orden de Rango.
65. TABLA DE FRECUENCIAS
En seguida se constituye una tabla de frecuencias la cual está formada por las siguientes
columnas.
COLUMNA 1: Contiene los intervalos obtenidos previamente considerando el rango.
COLUMNA 2: se ubican los puntos medios del intervalo que se obtienen sumando los limites
del intervalo y dividiendo el resultado entre dos
COLUMNA 3: Está formada por las frecuencias de los datos, es decir, el número de veces que
aparece cada dato en la muestra.
COLUMNA 4: Representada por las frecuencias acumuladas que se obtienen sumando
consecutivamente cada una de las frecuencias de la columna anterior y cuyo resultado final
debe ser igual número de datos de la muestra.
66. TABLA DE FRECUENCIA
COLUMNA 5: Se refiere a la frecuencia relativa que se obtiene dividiendo la frecuencia de
cada dato entre el número total de datos.
COLUMNA 6: Es la frecuencia relativa acumulada que se obtiene al sumar
consecutivamente las frecuencias relativas de la columna anterior y cuyo resultado final
debe ser igual a la unidad.
COLUMNA 7: Representa al porcentaje de cada uno de los datos y se obtiene multiplicando
la frecuencia relativa por 100.
COLUMNA 8: Formada por el porcentaje acumulado que se obtiene sumando
consecutivamente los porcentajes de la columna anterior y cuyo resultado final debe ser
igual a 100.
67. HISTOGRAMA
Gráfico que relaciona los puntos medios del intervalo con su
frecuencia. Colocando en el eje horizontal los puntos medios y en el eje
vertical las frecuencias e indicando con barras verticales la relación
entre ellos. Anotar los datos necesarios para su interpretación.
68. OJIVA
Esta grafica se construye relacionando la frecuencia acumulada de cada
intervalo, para ello se coloca en el eje vertical las frecuencias
acumuladas y en el eje horizontal los datos del intervalo iniciando con
al dato izquierdo del primer intervalo y continuando con los datos
derechos de cada intervalo; se relacionan estos datos con su frecuencia
y se unen mediante segmentos de recta. Anotar los datos necesarios
para su interpretación.
69. GRAFICA DE PORCENTAJES
Esta gráfica relaciona el porcentaje de cada intervalo. Para su
construcción se coloca en el eje vertical los porcentajes y en el eje
horizontal los puntos medios de cada intervalo, se relaciona cada punto
medio con su porcentaje y se unen mediante segmentos de recta.
Anotar los elementos para interpretar la gráfica.
70. EJEMPLO
Los siguientes datos corresponden al puntaje obtenido por los alumnos
en el examen de admisión al ciclo escolar 2022-2023, aplicado en el
mes de agosto de 2022, en la UNICLA plantel Zitácuaro. Realizar el
análisis estadístico.
71. EJEMPLO
Los siguientes datos corresponden al número de visitas de los alumnos
de la UNICLA plantel Zitácuaro, a la plataforma educativa durante el
cuatrimestre enero-abril-2022. Realizar el análisis estadístico.
72. EJEMPLO
Los siguientes datos corresponden a la edad de los pacientes que
asistieron durante el mes de junio de 2022, al consultorio “a” del
hospital regional de la ciudad de Zitácuaro Michoacán. Realizar el
análisis estadístico.
73. MEDIDAS DE RESUMEN DESCRIPTIVAS
Una vez que los datos cuantitativos se organizaron en tablas y se
presentaron en gráficas, se procede a llevar a cabo en análisis
estadístico correspondiente, calculando una variedad de medidas
que nos permitirán describir las principales características del
conjuntos de datos analizado.
A estas medidas que se calculan mediante algoritmos
matemáticos, se les conoce como medidas de resumen
descriptivas.
74. IMPORTANCIA
Las medidas de resumen descriptivas son importantes porque
ayudan al investigador a analizar e interpretar un conjunto de
datos cuantitativos, permitiendo indicar la posición y dispersión
de las características sobresalientes del conjunto de datos con
respeto a un parámetro.
Para su estudio las medidas de resumen descriptivas se clasifican
en dos tipos:
1. Medidas de centralización o tendencia central
2. Medidas de dispersión.
77. MEDIDAS DE CENTRALIZACIÓN EN
DATOS NO AGRUPADOS
La característica más importante que describe a un conjunto de datos
cuantitativos, es su posición. La mayor parte de datos de una
población muestran una tendencia a agruparse o reunirse en torno a un
cierto punto o valor dado. Normalmente al calcular las medidas de
centralización, los resultados obtenidos coinciden en un valor, por lo
que se dice que tienden a dicho valor, que generalmente es el promedio
de los datos del conjunto. Por lo tanto, cada conjunto de datos
presenta un valor típico que lo describe y que se conoce como valor
promedio
78. MEDIA ARITMÉTICA
Representa la medida de tendencia central más conocida y
de mayor uso en la estadística. Su uso se remonta en el
tiempo ya que fue la primera medida usada para determinar el
“promedio” de un conjunto de datos o cantidades.
La media aritmética la utilizamos cuando deseamos
determinar el promedio de un conjunto de datos, para ello
sumamos las cantidades y dividimos el resultado entre el
numero de datos de la muestra.
79. FÓRMULA
La media aritmética es fácil de calcular a partir de un conjunto de datos no
agrupados, aplicando la siguiente fórmula:
𝑥 =
𝑥
𝑛
Donde:
x (“x” testada) = media aritmética
Σ (sigma) = sumatoria
x = datos de la muestra
n = total de datos de la muestra
80. MEDIA GEOMÉTRICA
Medida de tendencia central que representa la raíz enésima del
producto de los datos no agrupados de una muestra; su valor
es menor que la media aritmética y mayor que la media
armónica.
La importancia estadística de la media geométrica es que se
puede utilizar como referencia para promediar valores de
variables como porcentaje, tasas, índices y demás casos donde
la variable analizada presenta variaciones acumulativas.
81. VENTAJAS Y DESVENTAJAS
VENTAJAS
• Utiliza todos los valores de la muestra para su cálculo
• Los valores extremos de la muestra no influyen en el resultado
• Su valor es único
DESVENTAJAS
• Calcular su valor puede resultar complicado
• Si la muestra presenta un valor de cero, la medida se anula
• Si la muestra tiene un valor negativo, la medida no se
determina.
82. FÓRMULA
Para un conjunto de datos no agrupados, la media geométrica se
calcula con la siguiente fórmula:
𝐺 =
𝑛
𝑥1 𝑥2 𝑥3 … . (𝑥𝑛)
Donde
G = media geométrica
n = total de datos
x = datos de la muestra
83. MEDIA ARMÓNICA
Esta medida de centralización se utiliza para
determinar los promedios en las variaciones de las
variables con respecto al tiempo.
Su valor se encuentra por debajo del valor de las
medias aritmética y geométrica y se define como la
sumatoria del cociente de los datos de la muestra.
84. FÓRMULA
Para determinar la media armónica de un conjunto de datos no agrupados, se
aplica la siguiente fórmula:
𝐻 =
𝑁
1
𝑋
Donde
H = media armónica
n = total de datos de la muestra
Σ = sumatoria
x = datos de la muestra
85. MEDIANA
La mediana es la medida de tendencia central que aparece a la mitad de
una sucesión de datos ordenados de forma ascendente, es decir, de menor
a mayor; de tal manera que la mitad de los valores son mayores que la
mediana y la otra mitad menores.
Frecuentemente se utiliza esta medida para comparar poblaciones, sin
embargo, se recomienda acompañarla con una medida de dispersión.
Normalmente se interpreta como el punto de equilibrio de un conjunto de
datos.
86. VENTAJAS
• No es afectada por los valores extremos de la
muestra, ya que su valor depende del orden de los
datos
• Se calcula de manera rápida y su interpretación es
sencilla
• El valor de la mediana siempre esta representada
por un valor de la muestra.
87. FÓRMULA
Para determinar la mediana de un conjunto de datos no agrupados, se
aplica la siguiente fórmula
𝑀 =
𝑛 + 1
2
Donde
M = mediana
n = numero de datos de la muestra
Nota importante
Esta nos determina el lugar que ocupa la mediana en el orden de rango
88. CRITERIOS MEDIANA
1. Si el numero de datos de la muestra es IMPAR, la mediana
estará representada por el valor que ocupe el lugar
indicado por el resultado de la fórmula.
2. Si el número de datos de la muestra es PAR, la mediana
estará representada por el promedio de los dos valores
entre los que se encuentre el lugar indicado por el
resultado de la fórmula.
89. MODA
Al analizar un conjunto de datos no agrupados, se utiliza en
ocasiones la moda como una medida de centralización. La moda o
modo es la medida más común ya que representa al dato que se
repite más veces en la muestra.
Si en la muestra no existe un dato que repita más veces, no tendrá
moda; por el contrario, si en el conjunto de datos existen dos o más
datos que se repiten el mismo mayor número de veces, entonces la
muestra es bimodal (dos modas), trimodal (3 modas), etc.
90. MEDIDAS DE DISPERSIÓN EN
DATOS NO AGRUPADOS
La estadística nos permite tener una visión del comportamiento
de una serie de sucesos o eventos llamados “variables”,
calculando las medidas de centralización, sin embargo, estas no
son suficientes.
El análisis estadístico se complementa con las medidas de
dispersión, que se definen como los indicadores de la
variabilidad de los datos de una muestra.
91. IMPORTANCIA
La importancia de las medidas de dispersión
reside en que sus valores permiten tomar
decisiones basadas en la variación de los datos;
lo anterior debido a que estas medidas describen
la dispersión de los datos en relación a la media
aritmética.
93. RANGO
Medida de dispersión que nos indica la amplitud existente
entre una serie de datos. Es decir, el rango nos indica que
tan separado se encuentra el valor más pequeño de la
muestra con respecto al valor mayor de la misma.
Esta tiene la desventaja de que como depende de los
valores extremos de la muestra, no proporciona información
real de la dispersión entre ellos.
94. FÓRMULA
El rango se define como la diferencia entre los valores mayor y
menor de un conjunto de datos. Entonces para un conjunto de
datos no agrupados se calcula con la siguiente fórmula:
𝑹 = 𝑫𝑴 − 𝒅𝒎
Donde
R = Rango
DM = Dato mayor de la muestra
dm = Dato menor de la muestra
95. DESVIACIÓN MEDIA
Este valor es la medida de dispersión más importante y de mayor
utilidad práctica en el análisis estadístico de un conjunto de datos.
Lo anterior debido a que nos proporciona la mejor idea de la
variación de los datos con respecto a la media aritmética.
El valor de la desviación media nos indica que tan alejados se
encuentran los valores de la muestra con respecto a la media
aritmética, ya que se obtiene calculando la distancia promedio de
los valores con respecto a la media.
96. FÓRMULA
La desviación media se obtiene calculando el valor absoluto de la diferencia de
los datos de la muestra con respecto a la media aritmética. Para un conjunto de
datos no agrupados se utiliza la fórmula:
𝑫𝒎 =
𝒙 − 𝒙
𝒏
Donde
Dm = Desviación media ∑ = Sumatoria
x = datos de la muestra / / = Valor absoluto
ẋ (x testada) = media aritmética n = Total de datos
97. VALOR ABSOLUTO
El valor absoluto de un número se define como la
cantidad sin considerar el signo y se identifica con el
símbolo de dos barras diagonales / /.
EJEMPLOS
/ 7 / = 7 valor absoluto de 7 es igual a 7
/ -3 / = 3 valor absoluto de – 3 es igual a 3
98. VARIANZA
La varianza es la medida de dispersión más importante en el
análisis estadístico de un conjunto de datos; ya que nos
proporciona el grado de homogeneidad de un grupo de
observaciones.
Esta medida representa el promedio de las desviaciones
medias de un conjunto de datos y se define como la media de
las diferencias cuadráticas de un conjunto de datos con
respecto a la media aritmética. Se representa con el símbolo
ᵟ
99. IMPORTANCIA
La importancia estadística de la varianza es que se utiliza para
probar hipótesis sobre la variabilidad de un conjunto de datos,
de tal manera que mientras mayor sea la dispersión de las
observaciones, mayor es la magnitud de sus desviaciones con
respecto a la media aritmética y por consiguiente más alto el
valor de la varianza.
Por lo tanto, valores elevados de la varianza representan mayor
grado de dispersión de los datos con respecto a la media
aritmética.
100. PROPIEDADES
1. No tiene limites numéricos, puede estar representada
por cualquier valor
2. Su valor depende de las categorías de las variables
3. Su valor es positivo o cero, no presenta valore
negativos.
4. Su valor es afectado por modificaciones en los datos.
5. Como su valor depende de la media aritmética, no puede
calcularse sin conocer el valor de la media.
101. FÓRMULA
Para un conjunto de datos no agrupados, la varianza se obtiene con la siguiente
fórmula
𝝈𝟐 =
𝒙𝟐 −
( 𝒙)𝟐
𝒏
𝒏 − 𝟏
Donde:
ꝺ2 = varianza Σ (sigma) = sumatoria
x = datos de la muestra n = total de datos
102. DESVIACIÓN ESTANDAR
Esta medida de dispersión se define como la raíz
cuadrada de la varianza, es decir, la raíz cuadrada de la
media de las desviaciones de los datos de la muestra
con respecto a la media aritmética. Sus propiedades son:
1. Siempre es un valor positivo o cero cuando las
puntuaciones son iguales.
2. Su valor no cambia si se suma o se multiplica un valor
a todos lo datos de la muestra.
103. FÓRMULA
Para un conjunto de datos no agrupados, la
desviación estándar se calcula con la siguiente
fórmula:
Ds= 𝜎2
Donde
Ds = desviación estándar
ꝺ2 = varianza
104. CRITERIOS
1. Al igual que la media aritmética y la varianza, la desviación
estándar es un índice muy sensible a los valores extremos.
2. En los casos en los que no es posible calcular la media
aritmética, tampoco se puede obtener la desviación
estándar.
3. Entre menor sea el valor de la desviación estándar, menor
será la dispersión de los datos respecto a la media
aritmética.
105. COEFICIENTE DE VARIACIÓN
El coeficiente de variación de un conjunto de datos es una
medida de dispersión relativa, de gran importancia y gran
versatilidad debido a que su interpretación esta basada en
porcentajes.
El valor de esta medida de dispersión nos indica la relación
que existe entre la desviación estándar y la media
aritmética, expresada en porcentaje.
106. IMPORTANCIA
El coeficiente de variación mide la variación relativa con
respecto a la media en porcentajes, es decir, la proporción
de variación de una característica por cada unidad de la
media aritmética.
Su principal uso es para comparar las variaciones de dos o
mas conjuntos de datos, en base al porcentaje obtenido
que representa la distribución de los datos alrededor de la
media aritmética.
107. FÓRMULA
Para un conjunto de datos no agrupados, el coeficiente de variación
se determina aplicando la siguiente fórmula:
𝐶𝑣 =
𝜎
𝑥
∗ 100
Donde:
Cv = Coeficiente de variación
ꝺ = Desviación estándar
ẋ = Media aritmética