TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJO
Graficos estadisticos
1. UDH
REPRESENTACION DE DATOS Y GRAFICOS DESCRIPTIVOS
1
1. REPRESENTACION DE DATOS Y GRAFICOS ESTADISTICOS
En los análisis estadísticos, es frecuente utilizar representaciones visuales complementarias de las
tablas que resumen los datos de estudio. Con estas representaciones, adaptadas en cada caso a la
finalidad informativa que se persigue, se transmiten los resultados de los análisis de forma rápida,
directa y comprensible para un conjunto amplio de personas.
Los gráficos son medios popularizados y a menudo los más convenientes para presentar datos, se
emplean para tener una representación visual de la totalidad de la información. Los gráficos
estadísticos presentan los datos en forma de dibujo de tal modo que se pueda percibir fácilmente los
hechos esenciales y compararlos con otros.
1.1 TIPOS DE DATOS:
Cualitativos: Se refieren a cualidades o modalidades que no pueden expresarse numéricamente.
Pueden ser:
•Ordinales: Si siguen un orden o secuencia (ejemplo: El abecedario, los meses del año).
•Categóricos: Si no siguen ningún orden (ejemplo: El estado civil de las personas: solteros, casados,
viudos, divorciados y separados).
Cuantitativos: Se refieren a cantidades o valores numéricos. Pueden ser:
•Discretos: Si toman valores enteros (0, 1, 2, 3...). Ejemplo: El número de hijos, el número de alumnos
de una clase.
•Continuos: Si pueden tomar cualquier valor dentro de un intervalo. Ejemplo: La estatura o el peso
de las personas.
2. SINTESIS DE DATOS
Una vez organizados los datos en tablas y representados gráficamente, es útil sintetizarlos o
resumirlos en medidas o números que permitan trabajar cómodamente y que contengan el máximo
de información. Existen dos tipos de medidas que describen las características de la distribución de
frecuencias de los valores de una variable: las medidas de centralización y de dispersión.
2.1Medidas de Centralización: Las medidas de centralización definen los valores de la variable en
torno a los cuales tienden a concentrarse las observaciones. Son: media, mediana, moda y los
cuartiles, deciles y percentiles.
2. UDH
REPRESENTACION DE DATOS Y GRAFICOS DESCRIPTIVOS
2
2.1.1 Media: La media aritmética es la medida de centralización más conocida y utilizada. Se
calcula sumando todos los valores observados y dividiendo por el número de observaciones de la
muestra. Se representa como x.
Para datos no agrupados:
El promedio aritmético de un conjunto de valores (X1, X2, X3,….., Xn) es:
Ejemplo:
Durante los últimos 32 días el valor de las compras (soles) en periódicos fue:
El promedio aritmético del valor de las compras en periódicos es:
2.1.2 Mediana: Es al valor que ocupa la posición central de un conjunto de observaciones
ordenadas. El 50% de las observaciones son mayores que este valor y el otro 50% son menores.
Para datos no agrupados:
La ubicación de la mediana de n datos ordenados se determina por: (n+1)/2.
Ejemplos.
En los 7 datos ordenados: {4, 5, 5, 6, 7, 8, 9}
La ubicación de la mediana es:
(7+1)
2
= 4, Luego el valor de la mediana: Me = 6.
En los 8 datos ordenados: {3, 4, 5, 5, 6, 7, 8, 9}.
La mediana se ubica en el lugar
(8+1)
2
= 4.5, Luego el valor de la mediana es: 𝑀𝑒 =
(5+6)
2
= 5.5
3. UDH
REPRESENTACION DE DATOS Y GRAFICOS DESCRIPTIVOS
3
2.1.3 La Moda: La moda es el valor que se observa con más frecuencia, el más repetido y sus
características son:
Puede no existir o existir más de una moda.
Su valor no se ve afectado por los valores extremos en los datos.
Se utiliza para analizar tanto la información cualitativa como la cuantitativa.
Es una medida inestable cuando en número de datos es reducido
Para datos no agrupados:
Por ejemplo. Durante los últimos 32 días el valor de las compras en periódicos fue:
Moda =Mo= 7.1; es el valor más frecuente, ocurre tres veces.
Ejemplo: 2, 2, 5, 5, 7, 7, 7, 7, 9, 9, 9, 10 Mo = 7 y 9 Serie bimodal.
Ejemplo: 6, 5, 6, 6, 3, 4, 6, 6, 7 Mo = 6 Serie Unimodal.
Ejemplo: 13, 15, 12, 11, 20, 22 No tiene Moda o se dice que cada dato es una moda.
2.1.4 Media Geométrica: La media geométrica simple 𝑋̅ 𝐺 de n observaciones X1, X2, X3,….., Xn
positivos, está dado por la raíz enésima del producto de los n valores observados. El promedio
geométrico de los valores: (X1, X2, X3,….., Xn) es
Para datos no agrupados:
Ejemplo: Hallar la media geométrica de los números 3, 5, 8, 3, 5, 2.
Solución En este caso n = 6, entonces la media geométrica es:
2.1.5 Cuartiles, Deciles, Percentiles: Son medidas de localización, pero no central, sino que
localizan otros puntos de una distribución. Los cuartiles dividen los datos en cuatro partes iguales,
los deciles en diez partes iguales y los percentiles, en cien partes iguales. Por definición, el cuartil 2
coincide con el decil 5 y con el percentil 50, y todos ellos con la mediana.
4. UDH
REPRESENTACION DE DATOS Y GRAFICOS DESCRIPTIVOS
4
3. REPRESENTACION GRAFICA
Una vez obtenidos los datos es preciso mostrarlos de una forma ordenada y comprensible. La forma
más sencilla es colocarlos en una Tabla, donde se muestran las variables, las categorías de cada
variable y el número de eventos de cada categoría. En ciertas ocasiones, especialmente cuando
trabajamos con un gran número de datos, las tablas no son prácticas y es necesario una mejor visión
de los datos con una mirada rápida. Esto se consigue con los gráficos. La selección del gráfico
dependerá del tipo de datos empleados. Comenzaremos con los gráficos para datos cuantitativos.
3.1 HISTOGRAMA: Se utiliza para variables cuantitativas continuas. En el eje x se muestran los datos
de la variable, que por ser continuos requieren ser agrupados previamente en intervalos, y en el eje
y se representa la frecuencia con la que aparece cada dato. La anchura del intervalo y la altura que
alcanza determinan el área de cada intervalo, que es proporcional a la frecuencia de cada intervalo.
Da una idea muy aproximada de la forma de la distribución que sigue la variable
Ejemplo: El peso de un grupo de alumnos aparece recogido en la siguiente tabla:
.
5. UDH
REPRESENTACION DE DATOS Y GRAFICOS DESCRIPTIVOS
5
3.1.1 POLÍGONOS DE FRECUENCIAS: Utiliza la misma escala que el histograma, y se construye
uniendo los puntos medios de la zona más alta de los rectángulos. También aquí lo más importante
es el área existente debajo del polígono, que es igual al área del histograma correspondiente. En el
polígono de frecuencias acumuladas, la línea representa la frecuencia de cada intervalo sumada a
la de los intervalos anteriores. Es un método práctico para determinar percentiles.
Polígono de frecuencias sobre histograma para
representar variables continúas
Polígono de frecuencias acumuladas para
representar variables continúas
3.2 NUBE DE PUNTOS: Es un gráfico donde se muestran dos variables cuantitativas, una en el eje
X y otro en él Y, mostrando los valores mediante puntos o símbolos.
Nube de puntos para describir la relación entre dos variables continúas
6. UDH
REPRESENTACION DE DATOS Y GRAFICOS DESCRIPTIVOS
6
Para los datos cualitativos, los más utilizados son:
3.3 DIAGRAMA DE BARRAS: Se utiliza para variables cualitativas y cuantitativas discretas, y se
construyen de forma similar al histograma, pero las barras están separadas entre sí (indicando que
la variable no ocupa todo el eje de abscisas, precisamente por ser discreta o cualitativa). El diagrama
de barras compuesto representa dos o más variables en el mismo gráfico.
Ejemplo 1: Un estudio hecho en un conjunto de 25 personas con objeto de determinar su grupo
sanguíneo ha conducido a los siguientes resultados:
A, B, A, A, A, AB, O, A, A, A, O, B, O, A, B, O, B, O, A, B, B, A, A, O, B.
Ejemplo 2: Las notas obtenidas por un grupo de alumnos en una prueba de matemáticas vienen
resumida en la siguiente tabla
La orientación del gráfico puede ser:
7. UDH
REPRESENTACION DE DATOS Y GRAFICOS DESCRIPTIVOS
7
•Vertical: Las distintas categorías están situadas en el eje horizontal y las barras de frecuencias
crecen verticalmente.
•Horizontal: las categorías se sitúan en el eje vertical y las barras crecen horizontalmente. Suelen
usarse cuando hay muchas categorías o sus nombres son demasiado largos.
Las categorías pueden ordenarse alfabéticamente facilitando su búsqueda o por sus frecuencias
facilitando la comparación de los datos. Veamos el siguiente ejemplo del porcentaje habitantes
usuarios de internet del año 2007 por países (Fuente: Unión Internacional de Telecomunicaciones).
Se suele usar para:
♦Comparar magnitudes de varias categorías. ♦Ver la evolución en el tiempo
de una magnitud concreta
8. UDH
REPRESENTACION DE DATOS Y GRAFICOS DESCRIPTIVOS
8
Tipos de gráficos de barras:
Sencillo: Contiene una única
serie de datos.
Agrupado: Contiene varias
series de datos y cada una se
representa por un tipo de
barra de un mismo color o
textura.
Apilado: Contiene varias
series de datos. La barra se
divide en segmentos de
diferentes colores o texturas y
cada uno de ellos representa
una serie.
9. UDH
REPRESENTACION DE DATOS Y GRAFICOS DESCRIPTIVOS
9
3.4 GRÁFICO CIRCULAR O DE SECTORES: Un gráfico de sectores es una representación circular de
las frecuencias relativas de una variable cualitativa o discreta que permite, de una manera sencilla
y rápida, su comparación.
El círculo representa la totalidad que se quiere observar en el ejemplo, total de viajeros hospedados
en hoteles y cada porción, llamadas sectores, representan la proporción de cada categoría de la
variable (en el ejemplo, tipo de hotel) respecto el total. Suele expresarse en porcentajes
Obtención de los ángulos por cada sector:
Frecuencia relativa =
𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎
𝑆𝑢𝑚𝑎 𝑑𝑒 𝑡𝑜𝑑𝑎𝑠 𝑙𝑎𝑠 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎𝑠
Porcentaje = Frecuencia relativa X 100
Angulo = Frecuencia Relativa X 360°
10. UDH
REPRESENTACION DE DATOS Y GRAFICOS DESCRIPTIVOS
10
3.4 PICTOGRAMAS: Un pictograma es un gráfico que representa mediante figuras o símbolos las
frecuencias de una variable cualitativa o discreta. Al igual que los gráficos de barras suelen usarse
para comparar magnitudes o ver la evolución en el tiempo de una categoría concreta.
Tipos de pictogramas:
•Gráficas de barras cuyas barras están constituidas por símbolos o figuras distorsionadas que se
adaptan a la longitud de la barra.
Gráficas de barras cuyas barras
están constituidas por símbolos
o figuras del mismo tamaño que
representan una cantidad
específica (a mayor frecuencia,
más acumulación de figuras)
11. UDH
REPRESENTACION DE DATOS Y GRAFICOS DESCRIPTIVOS
11
3.5 GRAFICO DE DISPERSIÓN: Un gráfico de dispersión muestra en un eje cartesiano la relación
que existe entre dos variables.
En algunos gráficos se dibuja la recta de regresión obtenida gracias a un método matemático: el
ajuste lineal. Esta recta nos muestra más clara y rápidamente la tendencia de los puntos y, por tanto,
la relación.
En el ejemplo se puede
apreciar que los países con
más producción agrícola
consumen más
fertilizantes nitrogenados.
Se observa en principio
una relación lineal positiva
12. UDH
REPRESENTACION DE DATOS Y GRAFICOS DESCRIPTIVOS
12
3.5 GRÁFICO DE CAJA: Sirve para representar variables cualitativas en escala ordinal y cuantitativa
discretas. Se construye un rectángulo de altura igual al recorrido intercuartílico, dentro se traza un
segmento en el punto correspondiente a la mediana y se define los valores adyacentes o bigotes: el
valor adyacente inferior es el valor más pequeño de la distribución. El valor adyacente superior es
la observación más grande de la serie. Los valores de la distribución que sean menores que el valor
adyacente inferior o mayores que el superior se denominan observaciones extremas o “outliers”
.
Diagramas de caja (boxplot) para variables cualitativas ordinales y cuantitativas discretas
4. CONSIDERACIONES IMPORTANTES
Podemos considerar la estadística descriptiva como el conjunto de técnicas para ordenar y
representar los datos en tablas, y resumirlos mediante el cálculo de diferentes medidas. Por tanto,
podemos distinguir tres apartados:
-Tabulación, que consiste en ordenar los datos originales y presentarlos de forma que, sin perder
información, sea más fácil conocer la distribución de los mismos. El resultado final es una tabla
donde se muestran los valores de la variable que se tabula y sus frecuencias.
-Cálculo de medidas para resumir la distribución. Pueden ser de tendencia central, que indican
alrededor de que valores se agrupan los datos observados; y de variabilidad o dispersión, que
indican si los valores de la variable están muy dispersos o concentrados.
-Representación gráfica, que facilita un análisis visual de los datos y permite sacar conclusiones
acerca de las características globales de la distribución