2. Análisis de Datos 2
Introducción
Diversos sectores tienen ámbitos donde es propio
llevar a cabo procesos de recojo y análisis de
información para una implantación de los
mismos al nivel de toma de decisiones. Prácticamente
la totalidad de los estudios relacionados con el mundo
de la empresa y en cualquier área de la actividad
humana
tienen incorporada la Estadística como herramienta
imprescindible en el proceso de toma de decisiones.
Cada día son más las empresas y organizaciones que
recurren al análisis de los datos de la propia empresa u
organización y del mercado para mejorar
sus procesos de toma de decisiones.
¡Necesitoayuda!
3. Análisis de Datos 3
Estadística
Cuando se habla de ESTADISTICA, generalmente
nos referimos a números tales como, promedios,
medianas, porcentajes, máximos, mínimos, entre
otros, que nos ayudan a entender una gran
variedad de situaciones económicas y de negocios.
También se refiere al ARTE Y CIENCIA de
recolectar, analizar, presentar e interpretar datos.
4. Análisis de Datos 4
Datos
Los datos son los hechos y los números que se
reúnen, analizan y resumen para su presentación
e interpretación.
5. Análisis de Datos 5
Elementos, Variables,
Observaciones
El número total de datos es igual al número de
elementos multiplicado por el de variables.
Al conjunto de medidas recogidas de un elemento en
particular se le llama observación.
Una variable es una característica de interés de cada
elemento.
cuales
Los elementos son las entidades de las
recogemos los datos.
6. Análisis de Datos 6
Escalas de Medición
La escala indica además qué tipos de resúmenes de
datos y de análisis estadísticos son los más apropiados.
La escala determina la cantidad de información que debe
contener el dato.
Las escalas de medición son:
Nominal
Ordinal
De intervalo
De razón
7. Análisis de Datos 7
• Nominal
Se usan etiquetas no numéricas o códigos
numéricos.
Los Datos son etiquetas o nombres usados para
Identificar un atributo de un elemento.
Escalas de Medición
8. Análisis de Datos 8
Se pueden usar una etiqueta no numérica o un
código numérico.
• Ordinal
Los datos tienen las propiedades de una
medición nominal y adicionalmente el orden o
la posición relativa de cada categoría tiene
significado.
Escalas de Medición
9. Análisis de Datos 9
• De Intervalo
Datos de Intervalo son siempre numéricos.
Los datos tienen las propiedades de los ordinales
y las distancias que hay entre las observaciones se
miden en términos de una unidad de medida fija.
Esta escala tiene el cero relativo que indica que
para esta variable el punto cero depende de quien
evalúa. En el cero, no siempre no hay nada.
Escalas de Medición
10. Análisis de Datos 10
• De razón
Los datos tienen todas las propiedades de los de
intervalo y en este caso el cociente de dos
valores tiene un significado.
Variables como son distancia, altura, peso, y
tiempo usan la escala de razón.
Esta escala tiene el cero absoluto que indica que
para esta variable no existe nada en el punto
cero.
Escalas de Medición
11. Análisis de Datos 11
Cada escala provee diferente información
Nominal
Ordinal
Intervalo
Razón
Tercero Segundo Ganador
Tercero Segundo Ganador
Tercero Segundo Ganador
20 segundos 1 segundo
1 minuto 59 2/5 segundos para 11/4 millas
12. Análisis de Datos 12
Los datos se pueden clasificar también en:
Cualitativos o Cuantitativos.
El análisis estadístico apropiado depende de si
las variables son cualitativas o cuantitativas.
En general, hay más alternativas de análisis
estadístico si los datos son cuantitativos.
Datos Cualitativos y Cuantitativos
14. Análisis de Datos 13
Se usan nombres o etiquetas para identificar un
atributo de cada elemento.
Se les llama generalmente datos categóricos.
Son datos medidos en escala nominal u ordinal.
Pueden ser numéricos o no numéricos.
El análisis estadístico apropiado es bastante
limitado.
15. Análisis de Datos 14
Datos cuantitativos indican cuánto o cuántos:
discreto, si se mide cuantos
continuo, si se mide cuánto
Los datos cuantitativos son siempre numéricos.
Las operaciones aritméticas ordinarias tienen
significado para este tipo de datos.
Son datos medidos en escala de intervalo o de
razón.
16. Análisis de Datos 15
Cualitativo Cuantitativo
Numérico Numérico
No Numérico
Dato
Nominal Ordinal Nominal Ordinal De Intervalo De razón
Escalas de Medición
18. Análisis de Datos 16
Datos Transversales son aquellos que se colectan
al mismo tiempo o aproximadamente al mismo
punto en el tiempo.
Ejemplo: número de casas construidas
durante el mes de junio del 2003 en cada uno
de los distritos de Lima Metropolitana
19. Análisis de Datos 17
Series de Tiempo son datos recolectados en
diferentes momentos en el tiempo.
Ejemplo: número de casas construidas en Surco
en cada uno de los últimos 24 meses.
20. Análisis de Datos 18
• Fuentes existentes
Interior a la empresa – en casi todos los departamentos
Servicios de Bases de Datos – Dow Jones & Co.
Agencias de Gobierno
Gremios – Cámaras de Comercio, Sociedad Nacional de Industrias
Internet
Fuentes de Datos
21. Análisis de Datos 19
Fuentes de Datos
• Estudios Estadísticos
En estudios experimentales la variable de interés es
identificada primero. Luego, uno o más factores
son controlados y los datos que se obtienen nos
dicen cómo los factores controlados afectan a la
variable de interés.
En estudios no experimentales (observacionales) no
se hace ningún intento por controlar o afectar las
variables de interés.
Una encuesta es un buen ejemplo
22. Análisis de Datos 20
Estudios Estadísticos
Objetivo
Identificar
variables y sus
relaciones
Sin manipulación de la Variable
independiente
Diseños de Investigación
No experimentales
Estudios
de Campo
Encuestas
Diseño
Exploratorio
Revisión de literatura
Entrevistas a expertos
Grupos Focales
Estudio de casos
Diseño
Descriptivo
Cuestionarios
estructurados
Objetivo
Estudiar y
describir
poblaciones
grandes
Experimentos
de campo
Experimentos
en laboratorio
Diseños
Causales
Estudios en
entornos reales.
Alto grado de
realismo pero
poco control del
investigador
Estudios en
entornos
artificiales.
Total control de
potenciales
fuentes de
errores.
Con manipulación de la Variable
independiente
Diseños de Investigación
Experimentales
23. Análisis de Datos 21
Consideraciones para la
adquisición de datos
Requirimientos de Tiempo
Costo de Adquisición
Errores en la data
La búsqueda de información puede consumir mucho
tiempo. La información puede ya no ser útil en el momento
en que esté disponible.
la información,
Las organizaciones suelen cobrar por
incluso cuando no es su actividad principal.
Utilizar datos que están disponibles o han sido adquiridos
con poco cuidado puede llevarnos a información engañosa.
24. Análisis de Datos 22
Ø La mayoría de la información estadística en los
periódicos, revistas, informes de la compañía, y
otras publicaciones consiste en datos que se
resumen y presentan en una forma que es fácil
de entender.
Ø A dichos resúmenes de datos, que pueden ser
tabulares, gráficos, o numéricos, se les conoce
como estadística descriptiva.
Estadística Descriptiva
25. Análisis de Datos 23
Inferencia Estadística
es el conjunto total de elementos de
un estudio.
es un subconjunto de la
población.
es el proceso por el que se obtiene
información acerca de la población
partiendo de información contenida
en una muestra.
es recolectar datos de la población.
es recolectar datos de una muestra.
Población
Muestra
Inferencia
Estadística
Censo
Encuesta
26. Análisis de Datos 24
Población
con µ
parámetro
descono
cido
Calculamos X
estadístico
muestral
Proceso de Inferencia Estadística
1
Extraemos una
2 muestra
de “n”
elementos
3
Usamos el promedio
4 muestral para
estimar el parámetro
poblacional.
27. Análisis de Datos 25
Computadoras y análisis estadístico
Ø Los estadísticos a menudo utilizan programas
informáticos para realizar los cálculos estadísticos
necesarios con grandes cantidades de datos.
Ø Para facilitar el uso del ordenador, muchos de los
conjuntos de datos en este libro están disponibles
en el CD que acompaña al texto
Ø Los archivos de datos se encuentran en formatos
de Minitab o Excel.
Ø Anexos al final de cada capítulo con los
procedimientos paso a paso para el uso de Minitab
y Excel.
28. Análisis de Datos 26
Data Warehousing
Ø Las organizaciones obtienen grandes cantidades
de datos diariamente a través de lectores de
tarjetas magnéticas, lectores de códigos de barras,
terminales en punto de venta, y monitores de
pantalla táctil.
Ø Wal-Mart captura datos a razón de 20-30 millones
de transacciones por día.
Ø Visa procesa cerca de 6800 transacciones de
pago por segundo.
Ø Un proceso importante es capturar, almacenar y
mantener los datos. Esto es lo que se llama
Almacén de Datos (Data Warehousing).
29. Análisis de Datos 27
vagamente, por las consultas del usuario.
Data Mining
Ø Analizar los datos del almacén nos ayudaran en
las decisiones que permiten plantear nuevas
estrategias y obtener mayores beneficios para la
organización.
Ø Usando una combinación de procedimientos de
estadísticas, matemáticas y ciencias de la
computación, análisis de "minería de datos“, los
convierte en información útil.
Ø Los sistemas minería de datos más eficaces usan
procedimientos automatizados para descubrir las
relaciones en los datos y predecir resultados
futuros, impulsado por ... sólo en general, aunque
30. Análisis de Datos 28
volumen de compra anterior.
Ø Las principales aplicaciones de minería de datos
han sido realizados por empresas con un enfoque
fuerte en el consumidor, tales como empresas de
retail, financieras y de comunicación.
Ø La minería de datos se utiliza para identificar, por
ejemplo, productos relacionados con aquel que ya
ha sido adquirido por el cliente y que es probable
quiera comprarlos. (y luego usando elementos de
promoción se llama la atención del cliente sobre
dichos productos).
Ø Otro ejemplo, la minería de datos se usa para
identificar a los clientes que deben recibir
descuentos y ofertas especiales en función de su
Aplicaciones de Data Mining
32. Análisis de Datos 2
Estadística Descriptiva
Datos resumidos y presentados
convenientemente. Dichos resúmenes
pueden ser:
tabulares gráficos o numéricos
33. Análisis de Datos 3
Una distribución de frecuencias es una tabla
que resume los datos mostrando la frecuencia o
número de elementos que hay dentro de cada una
de sus clases, que deben ser mutuamente
excluyentes y colectivamente exhaustivas.
Distribución de frecuencias
34. El objetivo es proveer información acerca del
conjunto de datos que no podría obtenerse
rápidamente por simple observación de los datos
originales.
35. Análisis de Datos 4
La frecuencia relativa de una clase es la fracción
o proporción del total de datos que pertenecen a
una determinada clase.
Una distribución de frecuencias relativas es una
tabla que nos resume un conjunto de datos
mostrando la frecuencia relativa para cada clase.
Distribución de frecuencias relativas
36. Análisis de Datos 5
Un gráfico de barras es una herramienta gráfica
para trabajar con datos cualitativos.
En un eje (normalmente el horizontal), colocamos
las etiquetas con los nombres de las categorías.
En el otro eje (normalmente el vertical), se puede
usar la frecuencia, la frecuencia relativa.
Usamos una barra de ancho fijo que dibujamos
arriba de cada etiqueta, con una altura de acuerdo
con su correspondiente frecuencia.
Las barras están separadas para enfatizar que
cada clase es una categoría diferente.
Gráfico de Barras
37. Análisis de Datos 6
El gráfico de pie es una herramienta gráfica usada
generalmente para presentar distribuciones de
frecuencia relativa de datos cualitativos.
Primero se traza un círculo; luego usando
las frecuencias relativas se subdivide en sectores
que corresponden a la frecuencia relativa de cada
clase.
Dado que hay 360° en un circulo, una clase con una
frecuencia relativa de .25 consumirá .25(360) = 90°
de ese círculo.
Gráfico de Pie
38. Análisis de Datos 7
Guías para seleccionar el número de clases
Use entre 5 y 20 clases.
Conjuntos de datos con un número grande de
elementos, generalmente requieren un número
grande de clases.
Conjuntos de datos pequeños usualmente
requieren pocas clases
Distribución de Frecuencias Para Datos
Numéricos
39. Análisis de Datos 8
Guía para seleccionar el Ancho de Clase
Use clases de igual ancho Ancho
aproximado de clase =
Dato más grande - Dato más pequeño
Número de Clases
Distribución de Frecuencias Para Datos
Numéricos
40. Análisis de Datos 9
La función FRECUENCIA no es una función
“simple” de Excel.
FRECUENCIA nos proporciona valores múltiples.
En Excel, la formula que dan
como respuesta
múltiples valores se llaman fórmula matricial.
Una fórmula matricial tiene una forma
especial de ingresar.
Usando la función FRECUENCIA de Excel para Construir
una Distribución de Frecuencias
42. Cuando los valores de la variable son muchos, conviene agrupar
los datos en intervalos o clases para así realizar un mejor análisis
e interpretación de ellos.
43. • Para construir una tabla de frecuencias con datos agrupados, conociendo
los intervalos, se debe determinar la frecuencia absoluta (fi)
correspondiente a cada intervalo, contando la cantidad de datos cuyo valor
está entre los extremos del intervalo.
Luego se calculan las frecuencias relativas y acumuladas, si es pertinente.
La frecuencia absoluta se halla sumando los valores correspondientes a cada intervalo.
Contando con la cantidad de datos cuyo valor está entre los extremos del intervalo.
44. • Si no se conocen los intervalos, se pueden determinar:
Los intervalos de clase se emplean si las variables toman un
número grande de valores o la variable es continua.
- Se busca el valor máximo de la variable y el valor mínimo. Con
estos datos se determina el rango.
- Se divide el rango en la cantidad de intervalos que se desea
tener,(por lo general se determinan 5 intervalos de lo contrario
es ideal que sea un numero impar por ejemplo 5, 7, 9)
obteniéndose así la amplitud o tamaño de cada intervalo.
- Comenzando por el mínimo valor de la variable, que será el
extremo inferior del primer intervalo, se suma a este valor la
amplitud para obtener el extremo superior y así sucesivamente.
45. • Otra forma de calcular la cantidad de intervalos es aplicando
los siguientes metodos:
Método Sturges: k = 1 + 3,332 log n
donde:
k= número de clases
n= tamaño muestral
46. Debemos tener en cuenta 2 cosas.
Primero que el número de intervalos me tiene que dar impar,
segundo que el resultado se redondea generalmente a la baja.
Si al redondear a la baja nos da como resultado un número par
debemos redondear al alza. Este es el método que tiene mayor
precisión.
Método Empírico: este método depende del criterio del
evaluador de los datos, por lo tanto es arbitrario.
5 ≥ k ≥ 20
47. Ejemplo 1
En un circo se consultó la edad a todas las personas
que entraban entre las 12:00 h y 12:30 h. Los
resultados obtenidos fueron los siguientes:
48. - Construir una tabla de frecuencias cuyos datos estén agrupados
en ocho intervalos.
1°Para poder construir la tabla de frecuencias lo primero que
debemos hacer es calcular el rango.
49. ¿Qué es el Rango?
El rango da la idea de proximidad de los datos a la media.
Se calcula restando el dato mayor menos el dato menor
Dato mayor - dato menor = 73 - 1 = 72
Por lo tanto; Rango = 72
50. 2° En el problema nos dicen que debemos agruparlo en
8 intervalos o clases, con este dato podemos calcular la
amplitud o tamaño de cada intervalo, dividiendo el valor
del rango por la cantidad de intervalos que se desean
obtener (en este caso son 8).
51. ¿Qué es Amplitud?
Amplitud: La amplitud de un intervalo es la diferencia entre el límite superior y
el límite inferior.
La amplitud(A) de los intervalos puede calcularse mediante la expresión:
52. - El valor de la amplitud se redondea al número
inmediato superior de acuerdo a la cantidad de
decimales que tienen los datos o según la precisión
con que se desea trabajar.
- Puede haber intervalos con distinta amplitud.
- Puede haber intervalos con amplitud indefinida
(intervalos abiertos)
54. Depende del Tipo de Varible:
a) Variables cuantitativas discretas:
Pueden tomar un número finito de valores. Siendo por lo
general estos valores los números naturales 1, 2, 3...
Un ejemplo son el número de hijos, el número de
habitaciones de una vivienda, el número de matrimonios de
una persona.
Cuando categorizamos variables discretas los límites de
clase son idénticos a los límites reales. Por ejemplo, el
número de personas que viven en una familia podemos
agruparlo, De 1 hasta 2 (0 es imposible no hay ninguna
familia sin ningún miembro) De 3 hasta 4, De 5 hasta 7.
55. b) Variables cuantitativas continuas:
Toman un número infinito de valores en cualquier intervalo dado.
Los valores se agrupan en intervalos cuyos límites inferior y superior
serían los siguientes:
Inferior : Lii
Superior: Lsi-1
Habitualmente, los intervalos se consideran cerrados a la izquierda y
abiertos a la derecha, es decir que el extremo inferior está incluido en
el intervalo, pero el extremo superior no.
56. Es importante mencionar que las clases o intervalos para las variables
continuas pueden ser de tres tipos:
Abiertas: clases abiertas tienen límites determinados (a,b), pero los
valores que la contienen comprenden valores muy cercanos a estos
límites sin comprenderlos a ellos mismos, esto se representa con un
intervalo definido entre paréntesis ().
Esta clase contiene valores desde a hasta b pero no contiene exactamente
a ni b solo valores muy cercanos.
Cerradas: las clases cerradas, además de los valores que están entre a y
b y se representa con corchetes [a,b].
Semiabiertas: pueden contener a ó b más los valores que están entre
ellos, y se puede representar con un corchete y un paréntesis, por
ejemplo, (a,b], en este caso no contiene el valor a y si los valores de b,
además de los valores que están entre estos.
57. C) Registro discreto de variables continuas:
Cuando la variable es continua pero ocurre que la precisión del instrumento
de medida se limita a un número finito de datos, existe la opción de construir
los intervalos de tal forma que ambos extremos estén incluidos en él.
Ej 50 a 52, 53 a 55, 56 a 58, 59 al 61 y 62 al 64
Estos serían los límites aparentes de los intervalos.
→ Con ésta información se construye la tabla en esta ocasión con el último
método explicado.
58. Intervalo : i
Marca de Clase: Xi
Frecuencia Absoluta: fi
Frecuencia Acumulada: Fi
Frecuencia Relativa: hi
Frecuencia Relativa Acumulada: Hi
59. Ejemplo 1
En un circo se consultó la edad a todas las personas
que entraban entre las 12:00 h y 12:30 h. Los
resultados obtenidos fueron los siguientes:
Construye una tabla de frecuencias cuyos datos estén agrupados
en ocho intervalos
63. - Marca clase o centro de la clase:
Es la semisuma de los límites de cada clase. Representa a todos
los datos que están contenidos en una clase.
Responder las siguientes preguntas:
a) Del total de personas encuestadas, ¿cuántas personas tienen
entre 31 y 40 años?
Respuesta: Observamos los datos obtenidos en la tabla y
tenemos que:
El dato lo obtenemos de la columna de la frecuencia absoluta.
64. • Frecuencia absoluta:
Corresponde a la cantidad de veces que se repite un dato. Denotamos
este valor por fi.
Por lo tanto la respuesta es 6 personas.
b) Del total de personas encuestadas, ¿cuántas personas tienen 60 o
menos años?
Respuesta: Observamos los datos obtenidos en la tabla y tenemos que:
El dato lo obtenemos de la columna de frecuencia absoluta acumulada.
65. Frecuencia absoluta acumulada:
Es la suma de las frecuencias absolutas observadas hasta el intervalo i.
En este caso es el intervalo 6. Por lo tanto la respuesta es 36 personas
tienen 60 o menos años.
c) ¿Cuál es la probabilidad de, que al elegir al azar a un persona
consultada, esta tenga entre 11 y 20 años?
Respuesta: Observamos los datos obtenidos en la tabla y tenemos que:
El dato lo obtenemos de la columna de frecuencia relativa.
66. Frecuencia relativa
Corresponde a la probabilidad de pertenecer a cierta
categoría.
Se puede expresar en tantos por ciento.
En este caso es el intervalo 2, ya que es ahí donde se
encuentran las edades entre 11 y 20 años.
Entonces la respuesta es: La probabilidad es 14%.
67. Frecuencia relativa acumulada (Hi):
Es la probabilidad de observar un valor menor o igual al valor que toma la
variable en estudio en ese intervalo.
Se calcula dividiendo Fi por el número total de datos. También puedes
calcularlo Sumando la frecuencia relativa de cada grupo con la frecuencia
relativa acumulada del grupo anterior.
Si haces correctamente estos cálculos, el último grupo tendrá una frecuencia
acumulada de 1, o muy cerca de 1, permitiendo redondear el error.
Recuerda que este valor se puede expresar como porcentaje, para esto solo
debes multiplicar el valor obtenido por 100.
Este calculo sirve en el caso de que pregunten:
d) ¿Cuál es la probabilidad de que tenga 50 años o menos?
Respuesta: La probabilidad es de un 76%
71. Una tabla de frecuencias
Resume la información acerca de la cantidad de veces que
una variable toma un valor determinado.
Permite Organizar e interpretar de manera más rápida y
eficient
72. La frecuencia absoluta
Corresponde a la cantidad de veces que se repite un dato. Denotamos
este valor por fi.
La suma de las frecuencias absolutas es igual al número total de datos,
que se representa por N.
Por Ejemplo:
Si hacemos una encuesta a 20 personas para saber cuál es su color
favorito obtenemos lo siguiente:
73. La Frecuencia Absoluta Acumulada
Se obtiene sumando sucesivamente las frecuencias absolutas.
Denotamos este valor por Fi.
74. La Frecuencia Relativa
Es la probabilidad de obtener cierto dato, se obtiene calculando la
razón entre la frecuencia absoluta de un dato con el total. Se puede
expresar como fracción, decimal o porcentaje. Denotamos este valor
por hi.
75. Para obtener el numero en decimal se divide la frecuencia absoluta por
el total y para obtener el porcentaje se multiplica este decimal por 100.
Los ejemplos representan una tabla de frecuencias de datos No
agrupados, en el caso de las tablas de datos Agrupados representan
las frecuencias en rangos de datos, como en el siguiente caso.
Se entrevistan a 28 personas que realizan un taller preguntándoles la
edad que tengan:
76. Frecuencia relativa acumulada
La frecuencia relativa acumulada es el cociente entre la frecuencia
acumulada de un determinado valor y el número total de datos. Se
puede expresar en tantos por ciento. Denotamos este valor por Hi
Se calcula:
Fi /N
78. Los gráficos y las tablas representan e interpretan
información procedente de diferentes fuentes, de forma
clara, precisa y ordenada.
Casi todo tipos de información puede organizarse en
una tabla de datos y ser representada en algún tipo
de gráfico.
Según las características y la cantidad de datos, conviene
utilizar uno u otro gráfico.
79. Gráficos
Los gráficos permiten visualizar la información contenida
en las tablas de manera rápida y sencilla, demostrando
con mayor claridad la relación que estos datos tienen
entre sí.
80. Gráficos de barras
Son aquellos que emplean rectángulos (barras) que se colocan
paralelamente. La altura indica la frecuencia de ese dato. Los
gráficos de barras, permiten representar información numérica en
forma clara y ordenada, para comunicarla a otras personas. Con la
información representada en los gráficos puedes interpretar
rápidamente y de manera visual la información, facilitando su
posterior análisis.
Para construir un gráfico de barras,
dibujar un eje vertical y otro horizontal.
En el espacio libre se ubican las barras.
Los datos numéricos van en el eje
vertical (determinando la altura de las
barras) y las categorías en el eje
horizontal.
81. Gráficos de líneas o lineal
Es un conjunto de puntos conectados por una línea en un sistema
cartesiano, que muestran tendencias de una variable a lo largo de un
período de tiempo.
82. Gráfico de torta o por sectores
Es un diagrama en círculo que representa
visualmente información en tajadas imaginarias de una
torta.
83. Pictogramas
Son los más llamativos, ya que se representan por medio de dibujos, se
reemplaza las barras por dibujos. Se usan para lograr el interés
masivo del público.
84. Histograma
Es un gráfico formado por barras contiguas, donde cada una
representa un intervalo de valores, sirve para expresar información
sobre datos que están agrupados.
85. Tablas
Son las que organizan los datos para mostrar qué tan seguido
ocurre algo (frecuencia), permite organizar la información
numérica recogida, por ejemplo, a través de una encuesta.
86. Frecuencia
Tanto en las tablas como en los gráficos el número de veces
que se repite un dato se denomina frecuencia de ese dato.
En la tabla se organizan todos los datos junto a las frecuencias
que les corresponden.
Ej:
87. En el gráfico o diagrama de barras, cada dato se representa
mediante una barra cuya altura indica la frecuencia, es decir, cuantas
veces se repite ese dato.
Ej:
88. Ejemplo práctico
Para que comprendas mejor, revisaremos paso por paso un ejercicio:
A- Los niños de un curso, elaboraron una encuesta para saber
cual película era la preferida por el curso, los resultados que
obtuvieron fueron los siguientes:
- 12 alumnos dijeron: Los pitufos
- 16 alumnos dijeron: Thor
- 10 alumnos dijeron: Linterna verde
- 6 alumnos dijeron: Crepúsculo
Paso 1- Ahora esta encuesta la graficaremos en una tabla de
frecuencia, para ello realizaremos una tabla con 4 casillas, que son las
películas escogidas por los alumnos:
89. Paso 2- Ahora debemos agregar un título a la columna con el listado
de las películas al que llamaremos “Películas” y la columna de la
derecha donde aparecen los datos con la cantidad de alumnos a
quién le hicimos la encuesta, la llamaremos “Alumnos del curso”,
además colocaremos los resultados:
90. Con estos dato podemos observar de manera clara que la película que
prefieren los alumnos es Thor.
Paso 3- Con los datos de la tabla podemos realizar un gráfico. Para realizar el
gráfico, lo primero que debemos hacer es dibujar los ejes de coordenadas, uno
vertical y el otro horizontal, como se ve a continuación:
En el eje vertical, vamos a
representar el número de veces
que han elegido los alumnos sus
películas preferidas y en el eje
horizontal, vamos a representar
las películas.
Hora solo tenemos que marcar
en el gráfico los datos que
hemos recogido en la tabla.
La moda es el dato que
tiene mayor frecuencia, en este
caso es la película Thor.
91. Análisis de Datos 10
Pasos para ejecutar esta función:
Paso 1 Seleccionar la matriz donde deben
aparecer las frecuencias
Paso 2 Escribir la siguiente fórmula:
{= FRECUENCIA (Datos,Grupos)}
Paso 3 Presionar CTRL + SHIFT + ENTER
(La fórmula aparecerá en toda la matriz
seleccionada)
Usando la función FRECUENCIA de Excel para Construir
una Distribución de Frecuencias
93. a) Gráfico de Barras
El gráfico de barras, como su nombre lo indica, está constituido por barras
rectangulares de igual ancho, conservando la misma distancia de separación entre sí.
Se utiliza básicamente para mostrar y comparar frecuencias de variables
cuantitativas o comportamientos en el tiempo, cuando el número de ítems es
reducido.
94. Para elaborarlo debemos:
- Utilizar un sistema de coordenadas rectangulares y se llevan al eje de las "x" los
valores que toma la variable en estudio y en el eje de las "y" se colocan las
frecuencias de cada barra.
- Luego se construyen los rectángulos, tomando como base al eje de las abscisas,
cuya altura será igual a cada una de las diferentes frecuencias que presentan las
variables en estudio.
- La magnitud con que viene expresada la variable se observa en la longitud de las
barras (rectángulos). Es importante destacar que solamente la longitud de las
barras y no su anchura es lo que denota la diferencia de magnitud entre los
valores de la variable.
Todas las barras tienen que tener una anchura igual, separadas entre sí,
preferiblemente por una longitud igual a la mitad del ancho de estas o distancias
iguales entre barras.
Las barras se pueden graficar tanto verticalmente como horizontalmente. Se pueden
elaborar barras compuestas y barras agrupadas.
95.
96. Este tipo de gráfico se clasifican por:
- Barras simples: Compara valores entre categorías de una variable
- Barras dobles: Compara valores entre categorías de dos variables
- Barras múltiples: Compara valores entre categorías de dos o más
variables.
- Barras verticales: Las categorías de la variable deben ubicarse en el
eje x.
- Barras horizontales: Las categorías de la variable deben ubicarse en
el eje y.
- Barras Aplicadas: Compara entre categorías el aporte de cada valor en
el total.
97. b) Gráfico de sectores Circulares:
Usualmente llamado gráfico de torta, debido a su forma característica
de una circunferencia dividida en sectores, por medio de radios que dan
la sensación de un pastel cortado en porciones.
Se usa para representar variables cualitativas en porcentajes o cifras
absolutas cuando el número de ítems no es superior a 5 y se quiere
resaltar uno de ellos.
98. c) Gráfico de líneas o Tendencia:
Usado básicamente para mostrar el comportamiento de una
variable cuantitativa a través del tiempo. El gráfico de líneas
consiste en segmentos rectilíneos unidos entre sí, los cuales
resaltan las variaciones de la variable por unidad de tiempo.
Cuando se tienen varias variables a representar, con el fin de
establecer comparaciones entre ellas (siempre que su unidad de
medida sea la misma); se utiliza plasmarlos en un solo gráfico, el
cual es el resultado de representar varias variables en un mismo
plano. A este tipo de gráfico se le llama gráfico de líneas
compuesto.
99.
100. Criterios para elaborar un gráfico de líneas:
1- La utilización de la escala que se utilizará en el plano cartesiano
puede variar tomando en cuenta el fenómeno que se va a graficar. No
es necesario que las abscisas (ejes x) y las ordenadas (eje y) del plano
cartesiano lleven la misma escala; sin embargo, cuando las
magnitudes de las variables no se diferencian sustancialmente es
recomendable utilizar escalas iguales para obtener un gráfico con
mayor precisión.
2- Cuando una de las variables en estudio se inicia con valores muy
altos es recomendable no comenzar el eje por el origen cartesiano
sino por un valor próximo o por el mismo valor por donde comienza la
variable.
3- Es costumbre representar en el eje de las x del plano cartesiano la
variable independiente del estudio que se realiza y en el eje de las y la
variable dependiente.
En aquellos casos que se dificulta distinguir el tipo de variable se
recomienda colocar en la ordenada del plano cartesiano las
frecuencias de las variables en estudio y sobre la abscisa la variable
cronológica (años, semanas, días, horas, etc.)
101. d) Histograma de frecuencias:
El histograma es un diagrama en forma de columna, muy parecido
a los gráficos de barras. Se define como un conjunto de
rectángulos paralelos, en el que la base representa la clase de la
distribución y su altura la magnitud que alcanza la frecuencia de la
clase correspondiente. Son barras rectangulares levantadas sobre
el eje de las abscisas del plano cartesiano utilizando escalas
adecuadas para los valores que asume la variable en la
distribución de frecuencia.
102. El ancho de la base de los rectángulos es proporcional a cada clase de
la distribución, de tal manera que, cuando la distribución tiene clases
de igual tamaño, el tamaño de todos los rectángulos tendrá bases
iguales.
Los lados del rectángulo se levantan sobre los puntos del eje de las x
que corresponden a los límites de cada clase y la longitud de los
mismos será igual a la frecuencia que tenga esa clase, los lados por lo
tanto corresponden a la frecuencia de cada clase de la distribución de
frecuencia.
Cuando se elaboran gráficas estadísticas en el plano cartesiano es
recomendable que en el eje de las ordenadas se representen las
frecuencias y el eje de abscisas las variables independientes.
103. e) Polígono de frecuencias:
Se utiliza básicamente para mostrar la distribución de frecuencias de variables
cuantitativas. Para construir el polígono de frecuencia se toma la marca de
clase que coincide con el punto medio de cada rectángulo de un histograma.
104. Pasos para elaborar un polígono de frecuencias:
1- Se dibuja un plano cartesiano.
2- Se traza sobre el eje de las abscisas, a distancias iguales, los puntos
medios de las diferentes clases de la distribución de frecuencias.
3- Se levantan perpendiculares por cada una de las marcas de clase,
con una longitud igual a la frecuencia de cada una de las clases que
integran la distribución de frecuencia. Al final de cada perpendicular se
marca un punto.
4- Los puntos resultantes se unen por medio de una línea recta
obteniéndose una línea poligonal.
5- Con la finalidad de cerrar la línea poligonal se agrega una clase
imaginaria con frecuencia cero a cada extremo de la distribución de
frecuencia, por tal motivos ambos extremos del polígono se cortan con
el eje de las abscisas.
También se puede elaborar un polígono de frecuencia después de
haber graficado un histograma; si se determina el punto medio de
cada rectángulo de un histograma y esos puntos medios se unen por
medio de segmentos de recta dan como resultado el polígono de
frecuencia.
105.
106. f) Histograma de frecuencias acumuladas:
Se utiliza básicamente para mostrar la distribución de frecuencias
acumulada de variables cuantitativas. Es una gráfica que se elabora
con los valores de las frecuencias acumuladas (menor que y mayor
que) y los límites de las clases de una distribución de frecuencia. El
polígono de frecuencia acumulada se le conoce comúnmente como
ojiva.
La ojiva es una representación gráfica que consiste en una línea, que
puede ser ascendente o descendente y se utiliza para representar las
distribuciones de frecuencias acumuladas menor que y mayor que,
según los datos utilizados. En los estudios de análisis estadísticos la
ojiva es de gran utilidad porque permite obtener con gran
aproximación cierta información requerida, en un momento
determinado
109. Distribucióndefrecuencias:
Variablescuantitativascontinuas
§Los datos se agrupan en intervalos de clase.
§El rango: R = Xmax – X min
§Número de intervalos (regla de Sturges):
k = 1 + 3.322 log(n)
(redondeo al entero más cercano)
§La amplitud o ancho de cada intervalo:
w = R / k
(redondeo por exceso a la misma cantidad de
decimales que tienen los datos)
111. Ejercicio 1
De un grupo de 50 alumnos, 25 prefieren jugar al fútbol, 15 al baloncesto y 10
al balonmano
a) Hacer la tabla de frecuencias
b) Representa esta situación en un diagrama de sectores
Estas son las puntuaciones obtenidas por los alumnos en unas pruebas
deportivas:
Ejercicio 2
Organizar los datos en la siguiente tabla y representar en un diagrama de barras:
Puntuación Frecuencia Absoluta Frecuencia
Relativa
Punt X Frec
Rel Ac
112. Ejercicio 3
Ejercicio 4
A 100 empleados se les ha preguntado por el medio de
transporte que utilizan para ir a su trabajo. Los resultados son:
1. Autobús: 50
2. Tren: 15
3. Auto: 25
4. Motopcicleta: 10
Representa ésta situación en un diagrama de sectores
Representa en un diagrama de sectores el presupuesto de gastos de una
familia que destina el 30% para vivienda, el 15% para vestirm el 25% para
alimentación, el 10% para transporte y el 20% para ahorrar