En este trabajo se presentan las diferentes representaciones graficas de un conjunto de datos, como bien se sabe ofrecen mensajes mas claros donde las conclusiones son fáciles de entender. A continuación se explicara el concepto de estadística descriptiva y las herramientas que comúnmente se utilizan para representar una muestra o una población de datos. Las graficas mas utilizadas en la rama de la estadística descriptiva son: el histograma, diagrama de caja, grafica de pastel, entre otras
1. ESTADISTICA DESCRIPTIVA
Martínez López Moises.
Ingeniería Mecatrónica, Instituto Tecnológico de Tlaxiaco.
mois_drump@hotmail.com
Resumen
En este trabajo se presentan las diferentes
representaciones graficas de un conjunto de
datos, como bien se sabe ofrecen mensajes mas
claros donde las conclusiones son fáciles de
entender. A continuación se explicara el concepto
de estadística descriptiva y las herramientas que
comúnmente se utilizan para representar una
muestra o una población de datos. Las graficas
mas utilizadas en la rama de la estadística
descriptiva son: el histograma, diagrama de caja,
grafica de pastel, entre otras
1. Introducción
La gran cantidad de datos que se suele
manejar en los estudios estadísticos dificulta su
estudio y comprensión, además de las medidas de
tendencia central y dispersión, la estadística
descriptiva cuenta con una herramienta de gran
utilidad para facilitar estas tareas, las graficas.
2.
Estadística Descriptiva.
La estadística descriptiva es aquella que se
encarga principalmente de la recolección,
organización y representación de un conjunto de
datos; para la parte de la representación se utilizan
las graficas, dentro de ellas se encuentran el
histograma, la grafica de pastel, el polígono de
frecuencias acumuladas y el diagrama de caja.
3. Histograma.
En la obra El Mentor de las Matemáticas [1]
define:”Los histogramas se emplean para
representar distribuciones de variables continuas y
discretas que, por su elevado numero de datos, se
suelen agrupar en clases.
El
principio
fundamental
de
representación que rige la construcción del
histograma es que la superficie de cada rectángulo
sea proporcional a la frecuencia.”
Gil Infante Said [2] exponen que: “Se
llamara histograma a la grafica de barras
verticales sin espaciamiento entre ellas, construida
colocando en el eje vertical a las frecuencias
absolutas o relativas y en el eje horizontal a los
limites de clase de una tabla de frecuencias.
Las etapas que se deben cubrir en la
construcción de un histograma son las siguientes:
1.
2.
3.
4.
Calcular el número de clases.
Colocar en el eje horizontal a los límites
de clase.
Colocar en el eje vertical las frecuencias
relativas o absolutas.
Erigir rectángulos cuya base son las
clases y su altura las frecuencias que
corresponden a cada clase.”
Vid. Kaoru Ishikawa [7] En la tabla 1 se
presenta una forma para determinar el número de
clases que se deben utilizar de acuerdo al tamaño
de la muestra.
Número de Datos (N)
Número de Clases (K)
Menos de 50
50-100
100-250
Más de 250
[7] Tabla 1. (Tomada
del autor)
5-7
6-10
7-12
10-20
sin autorización
Algunos autores utilizan el método
empírico, se basa en sacar la raíz cuadrada del
numero de la muestra, y el resultado que de se
redondea.
(1)
Esteban García Jesús et.al [10] utiliza
otro método para calcular el numero de clases es
la formula de Sturges.
2. Al construir el histograma de los datos
de las edades de los alumnos del I.T.T, este
quedo como se muestra en la Fig.1
Fig.2 Grafica de pastel de las edades de los
alumnos del I.T.T
De acuerdo con las definiciones anteriores se
llega a la conclusión que el diagrama de sectores
es una forma de representación grafica utilizada
en el área de la estadística, en el cual se
representan los datos de forma porcentual, se sabe
que el área de cada parte es proporcional a la
frecuencia relativa del conjunto de datos.
Fig.1 Histograma de las edades de los
alumnos del I.T.T
Analizando cada una de las definiciones
que presentan los diferentes autores se llega a la
conclusión que el histograma es la representación
grafica de las distribuciones de frecuencia, y para
su elaboración se colocan en el eje horizontal los
intervalos de clase, se dibujan los rectángulos,
tomando en cuenta que la base de cada rectángulo
debe tener la misma amplitud, y en el eje vertical
se colocan las frecuencias de cada intervalo.
5. Diagrama de Sectores.
En la obra el mentor de las matemáticas
[1]”Es una forma de representación grafica en la
que se utiliza un círculo dividido en sectores, de
forma que los ángulos y las áreas de cada sector
son proporcionales a las frecuencias de cada
clase.”
Gil Infante Said y Zárate de Lara
Guillermo P.[2] se refieren al diagrama de
sectores como: “Grafica de pastel; en estas
graficas, un circulo dividido en tajadas, cuya área
es proporcional a la frecuencia relativa de una
categoría dada. ”
Retomando los datos de las edades de los
alumnos del I.T.T se construyo la grafica de
pastel, la cual queda como se muestra en la Fig.2,
se puede observar que hay una mayor
concentración en dos tajadas.
6. Polígono
acumuladas.
de
frecuencias
En la obra El Mentor de las Matemáticas[1]
definen:“Para representar estos polígonos se
calcula, euujn primer lugar, la frecuencia
acumulada de la variable.”
Gil Infante Said y Zárate de Lara
Guillermo P.[2] definen que: “Una ojiva o
polígono de frecuencias acumuladas es una
grafica construida con segmentos de líneas recta
que unen los puntos obtenidos al colocar en el eje
horizontal a los limites superiores de clase y en el
vertical a las frecuencias acumuladas absolutas o
relativas.”
Spiegel Murray R. [3] expone que: “la
frecuencia total de todos los valores menores que
el límite real superior de la clase de un intervalo
de clase dado se conoce como frecuencia
acumulada hasta ese intervalo de clase inclusive.”
Se construyo el polígono de frecuencias o
grafica acumulada de las edades de los alumnos
del I.T.T, quedo como se muestra en la Fig.3, los
intervalos representan el valor medio de clase, y
las barras se van formando de manera creciente de
acuerdo con el numero de datos que cuenta.
3. Fig.3 histograma de frecuencias acumuladas de las
edades del I.T.T
Analizando cada una de las definiciones
se llega a la conclusión que el polígono de
frecuencias acumulada o histograma de
frecuencias acumuladas es la representación de
menor a mayor de un conjunto de datos.
7. Diagrama de Caja.
Neyra Peña[4] “El nombre original del
gráfico introducido por Jhon Tukey en 1977 es
Box and whisker plot, es decir, diagrama de caja y
bigote. En efecto, el gráfico consiste en un
rectángulo (caja) de cuyos lados superior e
inferior se derivan respectivamente, dos
segmentos: uno hacia arriba y uno hacia abajo
(bigotes).
La caja y los bigotes están ubicados
paralelos a un eje rotulado.
Las partes del diagrama de caja se
identifican como sigue:
1.-Límite superior
2.-Tercer cuartil (Q3)
Es el valor que sobrepasa el 75% de los datos
de la distribución.
3.-Segundo cuartil (mediana)(Q2)
En este se representa la mediana de un
conjunto de datos.
4.-Primer cuartil (Q1)
Es el valor que se encuentra entre el 25% de la
distribución.
5.-Límite inferior
6.-Valores atípicos
7.-Media aritmética”
Mendenhall [6] define que: “Un
diagrama de caja proporciona un segundo método
para identificar valores inusitados. En vez de
medir la distancia entre un posible valor inusitado
y la media muestral, se mide o evalua la distancia
entre el valor inusitado y el tercer cuartil
utilizando la amplitud intercuartlica, que es
ladistancia entre estos dos cuartiles muéstrales, a
diferencia de la media y de la desviación estándar
muestral, no dependen de las observaciones
inusitadas.”
Analizando cada una de las definiciones
antes mencionadas se llega a la conclusión que un
diagrama de caja es un gráfico, basado en
cuartiles, mediante el cual se visualiza un
conjunto de datos. Del cual podemos obtener
información de gran utilidad, ya que nos presentan
el comportamiento de los datos y permiten una
rápida
identificación
de
valores
En un gráfico que se suministra
información sobre la mediana, El cuartil Q1 y Q3,
sobre la existencia de atípicos y la simetría de la
distribución.
Retomando los datos de las edades del
I.T.T se construyo el diagrama de caja, este
quedo como se muestra en la Fig. 4; en este se
puede observar que hay mayor concentración de
datos por arriba de la media, es decir que la
mayoría de los alumnos del I.T.T tienen una edad
arriba de los 20 años, también se puede obtener el
valor minimo y máximo, en esta caso el valor
máximo es 25 y el minimo es 18.
Fig.4 Diagrama de Caja de las edades del I.T.T
Analizando cada una de las definiciones
antes mencionadas se llega a la conclusión que un
diagrama de caja es un gráfico, basado en
cuartiles, mediante el cual se visualiza un
conjunto
de
datos.
En un gráfico que se suministra
información sobre la mediana, El cuartil Q1 y Q3,
sobre la existencia de atípicos y la simetría de la
distribución.
4. 8.- Diagrama de Pareto.
Gutierrez Pulido Humberto et.al [8]
exponen: “El diagrama de pareto tiene como
objetivo ayudar a localizar el o los problemas
vitales, así como sus principales causas.”
Montgomery[9] define: “El diagrama de
pareto es tan solo una distribución de frecuencias
de datos de atributos ordenados por categoría.”
El diagrama de pareto es una herramienta
que se utiliza frecuentemente en los procesos de
control de calidad, es decir esta es útil para
observar en donde se encuentran los defectos y
sus principales causas..
En la Fig.5 se muestra el diagrama de
pareto de las edades del I.T.T, en la línea azul se
muestran las frecuencias acumuladas que tiene
cada intervalo y en el diagrama de barras se
muestran las frecuencias relativas del conjunto de
datos.
Referencias
[1] GRUPO OCEANO. Una obra: El Mentor de
Matematicas con ejercicos resueltos del GRUPO
OCEANO.
[2] Gil Infante Said y Zárate de Lara Guillermo P..Métodos Estadísticos; Edit. Trillas; México’ 1990.
[3] Spiegel Murray R..-ESTADISTICA TEORIA y 875
problemas resueltos; Edit. Mc Graw Hill;
México’1995.
[4] Prof. Neyra Peña (mayo 2006) En Universidad
Simón
Bolívar.
Recuperado
de
http://www.cesma.usb.ve/~npena/estadistica_1/BOXPL
OT-ayudaenlinea4.htm.
[5] Estadistica para todos. Recuperado de
http://www.estadisticaparatodos.es/taller/graficas/cajas.
html.
[6] Mendenhall William. .-ESTADISTICA PARA
ADMINISTRADORES; Edit. Iberoamérica; México
1990.
[7] Kaoru Ishikawa. Guide to Quality Control. Ed.
Asian Productivity Organization. Japan, 1993. Pag.8
[8] Gutiérrez Pulido Humberto, de la Vara Salazar
Román.- CONTROL ESTADISTICO DE CALIDAD Y
SEIS SIGMA.- Edit. Mc Graw Hill; México 2009.
Pp.140-144
[9] Montgomery C. Dougla.-Control estadístico de la
calidad.- Edit. LIMUSA, México 2009.
[10] Esteban García Jesús et.al Estadística Descriptiva
y Nociones de probabilidad.-Edit.thomson, España
2005.
Fig.5 Diagrama de Pareto de las edades de los alumnos
del I.T.T
Conclusión.
Las graficas son herramientas muy
importantes para la estadística, los procesos de
producción, control de calidad y diferentes
actividades publicas y políticas, estas nos sirven
para tener una idea más amplia del
comportamiento y las características de una
muestra o población de un conjunto de datos.