Este documento presenta un ejercicio en Excel sobre el análisis de datos mediante histogramas. El objetivo es obtener la tabla de frecuencias y el histograma de la variable del consumo de alcohol a partir de los datos de una encuesta. Se explican los pasos para generar la tabla y el gráfico, incluyendo la configuración de las clases y la personalización del diagrama.
1. Materia: Excel
Sección: Análisis de Datos.
Nivel de Dificultad: Avanzado.
Objetivo de la Práctica: Manejo de las herramientas de Análisis de datos
(Histograma).
Fichero de referencia: histograma01.xlsx
En esta práctica vamos a obtener la tabla de frecuencias y el histograma de la variable C_alcohol
mediante las herramientas de Análisis de datos.
La tabla recoge, parcialmente, el resultado de una encuesta a la que fueron sometidas 250 personas
con edad igual o superior a 15 años (histograma01.xlsx).
Las variables y el significado de sus códigos asociados son los siguientes:
La primera columna indica el número de caso.
Sexo: indica el sexo del entrevistado, v = varón, h = mujer.
E_civil: indica el estado civil, 1 = casado/a, 2 = soltero/a, 3 = viudo/a, 4 = div/sep.
Edad: edad expresada en años.
Niv_ins: nivel de instrucción, 1 = analfabeto/a, 2 = sin estudios, 3 = est. primarios, 4 = BUP o similares, 5 = est. universitarios
Peso: peso expresado en kilogramos.
Altura: altura expresada en centímetros.
E_penal: opinión sobre el adelanto de la edad penal, 1 = a favor, 2 = en contra, 3 = ns/nc.
35horas: opinión sobre la semana laboral de 35 horas 1 = a favor, 2 = en contra, 3 = ns/nc.
C_alcohol: consumo medio diario de alcohol medido en el equivalente a vasos de vino de 200cc, la escala va de 1 a 5, indicando esta última
cifra 5 o más vasos diarios.
NUM SEXO NSEXO E_CIVIL EDAD PESO NIV_DE ALTURA NSEXO2 JUECES E_PENAL 35HORES C_ALCOHO
1 v 1 1 63 80 3 190 1 3 1 1 3
2 v 1 1 79 56 4 155 1 1 3 1 2
3 h 2 1 52 64 3 151 0 3 3 1 2
4 h 2 3 41 63 3 146 0 3 2 2 2
5 v 1 2 18 75 4 164 1 4 2 1 3
6 h 2 2 68 35 3 136 0 4 3 2 2
7 v 1 2 35 63 2 145 1 3 1 1 2
8 h 2 2 46 79 2 190 0 1 2 1 3
9 h 2 2 20 58 3 171 0 3 2 1 0
RESULTADO
Profesor: Juan Bautista Cascallar Lorenzo.
2. PROCESO
En primer lugar establecemos el rango de clases para la variable C_Alcohol (C_alcohol: consumo
medio diario de alcohol medido en el equivalente a vasos de vino de 200cc, la escala va de 1 a 5,
indicando esta última cifra 5 o más vasos diarios). Al ser C_Alcohol una variable cuantitativa discreta,
resulta fácil establecer el número de clases para el diagrama de barras (histograma).
Ahora vamos a (Ficha)Datos->(Grupo)Análisis->Análisis de datos y seleccionamos la herramienta
Histograma.
Marcamos la casilla puesto que la
primera columna del rango de datos
de entrada contiene rótulos.
Genera un gráfico de histograma.
Con lo cual se genera la tabla de frecuencias y el histograma.
Profesor: Juan Bautista Cascallar Lorenzo.
3. Nota: El procedimiento añade siempre una última clase "y mayor…", la de aquellos valores de la
variable que exceden la última de las clases fijadas por nosotros. Esta clase viene siempre etiquetada
como y mayor….
A continuación le damos un nombre a la serie de datos el cual se mostrará en la leyenda. Para ello
hacemos clic en la serie correspondiente en el gráfico y en el menú contextual elegimos la opción
"Seleccionar datos". En el cuadro de diálogo seleccionamos la serie, pulsamos en el botón "Editar" y
renombramos la serie.
Profesor: Juan Bautista Cascallar Lorenzo.
4. Añadimos una tabla de datos. (Contextual)Herramientas de gráficos->Presentación->Tablas de
datos->Mostrar tablas de datos.
Le aplicamos el Diseño "Estilo 44" al gráfico, (Ficha contextual Herramientas de gráficos)->Diseño
->(Grupo)Estilos de diseño->Estilo 44.
Profesor: Juan Bautista Cascallar Lorenzo.
5. Finalmente tenemos que duplicar la serie de datos y posteriormente cambiar el tipo de gráfico de
la serie duplicada por uno de tipo línea. Para ello hacemos clic con el botón derecho sobre la serie en
el gráfico->Seleccionar datos->Agregar. A continuación le damos un nombre a la serie y seleccio-
namos los valores.
… y para cambiar el tipo de gráfico de la serie duplicada, pinchamos en la serie
->botón derecho del ratón->cambiar tipo de gráfico de series. Seleccionamos un tipo de gráfico
Linea->Linea con marcadores.
Profesor: Juan Bautista Cascallar Lorenzo.
6. Anexo: Para realizar esta práctica necesitamos tener instalado el complemento "Análisis de datos".
Si no aparece, vamos a (Botón de Office) Opciones de Excel->Complementos.
En el combo "Administrar" con la opción "Complementos de Excel" pulsamos el botón "Ir…".
Profesor: Juan Bautista Cascallar Lorenzo.
7. En la figura anterior marcamos el complemento "Herramientas para análisis" y aceptamos. De esta
forma ya lo tendremos disponible en, (Ficha)Datos->(Grupo)Análisis->Análisis de datos.
Cuadro de diálogo Histograma
Rango de entrada Especifique la referencia de celda correspondiente al rango de datos que desee analizar.
Rango clases (opcional) Especifique la referencia de celda para un rango que contenga un conjunto opcional de
valores límite que definan rangos de clase. Estos valores deberán estar en orden ascendente. Microsoft Office
Excel contará el número de puntos de datos que hay entre el número de clases actual y el número de clases
mayor, si lo hay. Se contará un número de una clase determinada si es igual o menor que el número de clase
situado por debajo de la última clase. Todos los valores por debajo del primer valor de clase se contarán juntos,
como los valores por encima del último valor de clase.
Si omite el rango de clase, Excel creará un conjunto de clases distribuidas uniformemente entre los valores mínimo
y máximo de los datos.
Rótulos Active esta casilla si la primera fila o la primera columna del rango de entrada contienen rótulos.
Desactívela si el rango de entrada carece de rótulos. Excel generará los rótulos de datos correspondientes para la
tabla de resultados.
Rango de salida Especifique la referencia correspondiente a la celda superior izquierda de la tabla de resultados.
Excel determinará el tamaño del área de resultados y mostrará un mensaje si la tabla de resultados reemplaza los
datos existentes.
En una hoja nueva Haga clic en esta opción para insertar una hoja nueva en el libro actual y pegar los resultados
comenzando por la celda A1 de la nueva hoja de cálculo. Para darle un nombre a la nueva hoja de cálculo,
escríbalo en el cuadro.
En un libro nuevo Haga clic en esta opción para crear un libro nuevo en el que los resultados se agregarán a
una hoja nueva.
Pareto (Histograma ordenado) Active esta casilla para presentar los datos en orden de frecuencia descendente
en la tabla de resultados. Si esta casilla está desactivada, Excel presentará los datos en orden ascendente y
omitirá las tres columnas situadas más a la derecha que contienen los datos ordenados.
Porcentaje acumulado Active esta casilla para generar una columna de tabla de resultados con porcentajes
acumulados y para incluir una línea de porcentaje acumulado en el gráfico de histograma. Desactívela para omitir
los porcentajes acumulados.
Crear gráfico Active esta casilla para generar un gráfico de histograma incrustado con la tabla de resultados.
Profesor: Juan Bautista Cascallar Lorenzo.