El Gran Atractor, la misteriosa fuerza que está halando a la Vía Láctea.pptx
Estadística y Componentes
1. República Bolivariana de Venezuela
Ministerio de Educación Cultura y Deportes
Universidad de Carabobo - Núcleo la Morita
Facultad de Ciencias Económicas y Sociales
Maracay - Estado Aragua
Estadística
Y
Componentes
Integrantes:
Uzcategui, Evert C.I.N° 20.819.236
PROF:
Marcos Ugenio Villano
Maracay, Julio del 2014.
Introducción
2. En estadística denominamos gráficos a aquellas imágenes que, combinando la utilización
De sombreado, colores, puntos, líneas, símbolos, números, texto y un sistema De referencia
(coordenadas), permiten presentar información cuantitativa.
La utilidad De los gráficos es doble, ya que pueden servir no sólo como sustituto a las
tablas, sino que también constituyen por sí mismos una poderosa herramienta para el análisis De
los datos, siendo en ocasiones el medio más efectivo no sólo para describir y resumir la
información, sino también para analizarla.
En este sentido la estadística utiliza cada uno de los aspectos de gráficos para cada tipo de
datos, bien sea agrupado o no agrupado, constante o no constante.
En este trabajo solo nos vamos a centrar únicamente en los gráficos como vehículo de
presentación de datos, sin abordar su otra faceta como herramienta de análisis.
3. Gráfica
Una gráfica es una representación de datos, generalmente numéricos, mediante
líneas, superficies o símbolos, para ver la relación que guardan entre sí. También puede
ser un conjunto de puntos, que se plasman en coordenadas cartesianas, y sirven para
analizar el comportamiento de un proceso, o un conjunto de elementos o signos que
permiten la interpretación de un fenómeno. La estadística gráfica es una parte importante
y diferenciada de una aplicación de técnicas gráficas, a la descripción e interpretación de
datos e inferencias sobre éstos. Forma parte de los programas estadísticos usados con los
ordenadores. Autores como Edward R. Tufte han desarrollado nuevas soluciones de
análisis gráficos.
Existen diferentes tipos de gráficas, que se pueden clasificar en:
Gráficos de barras verticales
(Llamados por algúnos software de columnas)
Representan valores usando trazos verticales, aislados o no unos de otros, según la
variable a graficar sea discreta o continua. Pueden usarse para representar:
• una serie
• dos o más series (también llamado de barras comparativas)
4. Gráficos de barras horizontales
Representan valores discretos a base de trazos horizontales, aislados unos de otros. Se
utilizan cuando los textos correspondientes a cada categoría son muy extensos.
• para una serie
• para dos o más series
Gráficos de barras proporcionales
Se usan cuando lo que se busca es resaltar la representación de los porcentajes de
los datos que componen un total.
Las barras pueden ser:
• Verticales
• Horizontales
5. Gráficos de barras comparativas
Se utilizan para comparar dos o más series, para comparar valores entre
categorías.
Las barras pueden ser:
• Verticales
• horizontales
Gráficos de barras apiladas
Se usan para mostrar las relaciones entre dos o más series con el total. Las barras
pueden ser:
• verticales
• horizontales
6. Gráficos de líneas
En este tipo de gráfico se representan los valores de los datos en dos ejes
cartesianos ortogonales entre sí.
Se pueden usar para representar:
• una serie
• dos o más series
Estos gráficos se utilizan para representar valores con grandes incrementos entre sí.
Gráficos circulares
Estos gráficos nos permiten ver la
distribución interna de los datos que representan
un hecho, en forma de porcentajes sobre un
total. Se suele separar el sector correspondiente al
mayor o menor valor, según lo que se desee
destacar.
Se pueden ser:
• En dos dimensiones
• en tres dimensiones
7. Gráficos de Áreas
En estos tipos de gráficos se busca mostrar
la tendencia de la información generalmente
en un período de tiempo.
Pueden ser:
• Para representar una serie
• para representar dos o más series
• en dos dimensiones
• en tres dimensiones.
Cartogramas
Estos tipos de gráficos se utilizan
para mostrar datos sobre una base
geográfica. La densidad de datos se
puede marcar por círculos, sombreado,
rayado o color.
Gráficos Mixtos
En estos tipos de gráficos se representan
dos o más series de datos, cada una con un tipo
diferente de gráfico. Son gráficos más vistosos y se
usan para resaltar las diferencias entre las series.
Pueden ser:
• en dos dimensiones
• en tres dimensiones.
8. Histogramas
Estos tipos de gráficos se utilizan para
representa distribuciones de frecuencias. Algún
software específico para estadística grafican la
curva de gauss superpuesta con el histograma.
Tipos de histograma
• Diagramas de barras simples: Representa la frecuencia simple (absoluta o relativa)
mediante la altura de la barra la cual es proporcional a la frecuencia simple de la
categoría que representa.
• Diagramas de barras compuesta: Se usa para representar la información de una
tabla de doble entrada o sea a partir de dos variables, las cuales se representan así;
la altura de la barra representa la frecuencia simple de las modalidades o
categorías de la variable y esta altura es proporcional a la frecuencia simple de
cada modalidad.
• Diagramas de barras agrupadas: Se usa para representar la información de una
tabla de doble entrada o sea a partir de dos variables, el cual es representado
mediante un conjunto de barras como se clasifican respecto a las diferentes
modalidades.
• Polígono de frecuencias: Es un gráfico de líneas que se usa para presentar las
frecuencias absolutas de los valores de una distribución en el cual la altura del
punto asociado a un valor de las variables es proporcional a la frecuencia de dicho
valor.
• Ojiva porcentual: Es un gráfico acumulativo, el cual es muy útil cuando se quiere
representar el rango porcentual de cada valor en una distribución de frecuencias.
9. Otros Gráficos
En esta categoría se encuentran la mayoría de los gráficos utilizados en publicidad. Se los
complementa con un dibujo que esté relacionado con el origen de la información a
mostrar. Son gráficos llamativos, atraen la atención del lector.
Dispersograma
Los dispersogramas
Son gráficos que se construyen sobre dos ejes ortogonales de coordenadas,
llamados cartesianos, cada punto corresponde a un par de valores de datos x e y de un
mismo elemento suceso.
Pictogramas
Los pictogramas son gráficos similares a los gráficos de barras, pero empleando un dibujo
en una determinada escala para expresar la unidad de medida de los datos. Generalmente este
dibujo debe cortarse para representar los datos.
Es común ver gráficos de barras donde las barras se reemplazan por dibujos a diferentes escalas
con el único fin de hacer más vistoso el gráfico, estos tipos de gráficos no constituyen un
pictograma.
10. Pueden ser:
• En dos dimensiones
• En tres dimensiones.
Polígonos de frecuencia
Un polígono de frecuencia es un gráfico que se realiza a través de la unión de los puntos
más altos de las columnas en un histograma de frecuencia (que utiliza columnas verticales para
mostrar las frecuencias).
Los polígonos de frecuencia para datos agrupados, por su
parte, se construyen a partir de la marca de clase que coincide con el punto medio de cada
columna del histograma. Cuando se representan las frecuencias acumuladas de una tabla de datos
agrupados, se obtiene un histograma de frecuencias acumuladas, que permite diagramar su
correspondiente polígono.
11. Por ejemplo: un polígono de frecuencia permite reflejar las temperaturas máximas
promedio de un país en un periodo de tiempo. En el eje X (horizontal), pueden señalarse los meses
del año (enero, febrero, marzo, abril, etc.). En el eje Y (vertical), se indican las temperaturas
máximas promedio de cada mes (24º, 25º, 21º…). El polígono de frecuencia se crear al unir, con un
segmento, todas las temperaturas máximas promedio.
Los polígonos de frecuencia se suelen utilizar cuando se desea mostrar más de una
distribución o la clasificación cruzada de una variable cuantitativa continua con una cualitativa o
cuantitativa discreta en un mismo gráfico.
El punto con mayor altura de un polígono de frecuencia representa la mayor frecuencia,
mientras que el área bajo la curva incluye la totalidad de los datos existentes. Cabe recordar que la
frecuencia es la repetición menor o mayor de un suceso, o la cantidad de veces que un proceso
periódico se repite por unidad de tiempo.
Cálculo de frecuencias
Ordenamos los datos contando los alumnos que han sacado un 0 han sido 2, un 1 han sido
3 y así sucesivamente. Construimos la tabla correspondiente:
N: número total de datos N = 30.
xi: variable estadística, nota del examen.
fi: frecuencia absoluta, número de veces que se repite una nota. El sumatorio nos da los datos
totales N = 30.
Fi: frecuencia absoluta acumulada. F 2 = f 1 + f2= 2 + 3 = 5 F 3 = F 2 + f 3 = 5 + 1 = 6
hi: frecuencia relativa. Cociente f i / N
sumatorio (suma de todos los datos de la columna correspondiente)
x i
f i F i h i = f i / N H i
0 2 2 2 /30 2/30
1 3 5 3/30 5/30
2 1 6 1/30 6/30
3 1 7 1/30 7/30
4 1 8 1/30 8/30
12. 5 3 11 3/30 11/30
6 2 13 2/30 13/30
7 5 18 5/30 18/30
8 7 25 7/30 25/30
9 5 30 5/30 30/30
30 1
Diagrama de barras de frecuencia absoluta y polígono de frecuencias
En el diagrama de barras vemos que la barra más alta es la correspondiente a la nota 8, la
han obtenido 7 alumnos. La barra más baja se corresponde con las notas 2, 3 y 4 que sólo las han
obtenido un alumno. El polígono de frecuencias es bastante irregular, sube entre las notas 0 y 1
(más alumnos). Es constante en las notas 2, 3, y 4. El pico más alto se corresponde con la nota 8,
la más abundante, 7 alumnos es la moda.
Percentil
Representa el porcentaje de los casos de un grupo que alcanzó valores menores que el
citado porcentaje. Por ej. Si decimos que una calificación de 127 tiene un rango percentil de 79
13. significa que el 79% del grupo obtuvo una calificación menor que 127. El rango percentil se calcula
dividiendo la frecuencia acumulada entre el total de datos (N) multiplicado por 100. Un rango
percentil debe expresarse en relación a algún grupo de referencia. Por ejem. si una persona afirma
que ha obtenido un rango percentil de 93 en una prueba de aptitud matemática, la interpretación
depende del grupo de referencia:
Ese grupo puede estar constituido por individuos que únicamente han completado
el sexto año de primaria.
El grupo de referencia puede estar formado por individuos que recibirán un
doctorado en matemáticas.
Los percentiles representan los valores de la variable que están por debajo de un
porcentaje, el cual puede ser una valor de 1% a 100% (en otras palabras, el total de los datos es
divido en 100 partes iguales).
La notación empleada será:
Donde k es equivalente al porcentaje de datos acumulados, y Pk es el valor de la variable
que representa dicho porcentaje. Por ejemplo, P5 es el valor de la variable que deja por debajo el
5% de los datos. P78 será entonces el valor que agrupa el 78% de los datos. Podemos concluir que
P50 sería el valor que divide en dos parte iguales la cantidad de datos de la muestra o población
siendo equivalente a la mediana. Traslademos el gráfico de barra a su respectiva tabla de
frecuencia y tratemos de localizar los Percentiles expuestos en el ejemplo:
Nc Lm Ls f F h H
1 [ 5 15) 14 14 14,00% 14,00%
2 [15 25) 12 26 12,00% 26,00%
3 [25 35) 20 46 20,00% 46,00%
4 [35 45) 18 64 18,00% 64,00%
5 [45 55) 14 78 14,00% 78,00%
14. 6 [55 65) 12 90 12,00% 90,00%
7 [65 75] 10 100 10,00% 100,00%
TOTAL 100 100,00%
Podemos concluir fácilmente (con ayuda de las frecuencias acumuladas), que 14 personas
(14% del total) están por debajo de los 15 años (podemos aproximarlo a 15 años), lo cual
representaría al percentil 14:
El percentil 5 (P5) no puede ser calculado directamente, pero podemos concluir que dicho
valor se encuentra en el primer intervalo, ya que este acumula el 14% de las personas. No ocurre
lo mismo con el percentil 78 (P78) que aparece directamente en la tabla:
Nc Lm Ls f F h H
1 [ 5 15) 14 14 14,00% 14,00%
2 [15 25) 12 26 12,00% 26,00%
3 [25 35) 20 46 20,00% 46,00%
4 [35 45) 18 64 18,00% 64,00%
5 [45 55) 14 78 14,00% 78,00%
15. 6 [55 65) 12 90 12,00% 90,00%
7 [65 75] 10 100 10,00% 100,00%
TOTAL 100 100,00%
El 78% de las personas consultadas poseen una edad igual o inferior a los 55 años.
Ejemplo: Calculo de percentiles
A partir de la tabla de frecuencia anterior calcular el percentil 5 (P5)
SOLUCIÓN
PASO 1: Localizar en cuál de los intervalos de clase se encuentra el percentil
Como se había mencionado, el percentil 5 se encuentra en el primer intervalo.
Nc Lm Ls f F h H
1 [ 5 15) 14 14 14,00% 14,00%
2 [15 25) 12 26 12,00% 26,00%
3 [25 35) 20 46 20,00% 46,00%
4 [35 45) 18 64 18,00% 64,00%
5 [45 55) 14 78 14,00% 78,00%
6 [55 65) 12 90 12,00% 90,00%
16. 7 [65 75] 10 100 10,00% 100,00%
TOTAL 100 100,00%
PASO 2: Interpolar los datos para encontrar el percentil. En resumen tenemos que:
Límite Superior H
15,00 (Ls1) 14,00% (H1)
5,00 (Ls0) 0,00% (H0)
Diferencia
10,00 14,.00%
En este caso, suponemos un intervalo adicional cuyo límite superior llamaremos Ls0
equivalente a 5 el cual agrupa 0% de los datos. Entre los dos límites superiores abarcan un total de
14% de los datos. Si queremos llegar al 5% de los datos, debemos incrementar el porcentaje en
una cantidad igual.
10,00 14,00%
Incremento 5,00%
Para llegar al 5% de los datos, el límite 5 se debe aumentar en 3,57 unidades.
Cuadros Numéricos
Corresponde a una forma de expresar los datos (variables, indicadores, entre otros) de
manera sintetizada y de fácil comprensión. Los cuadros numéricos deben cumplir con una serie de
17. requisitos para que los resultados, en cuanto a la interpretación de la información que estos
suministran, sea fácil de lograr .
Un cuadro numérico esta formado de:
• Título: debe ser conciso e indicar el qué, dónde, cómo, y cuándo de la información, se
coloca en la parte superior, con letra mayúscula y centrada.
• Una columna principal en donde se anotan las categorías.
• Encabezados de columnas en donde se anotan el objeto de cada una de ellas.
• El cuerpo del cuadro, el cual contiene la información.
• Notas al pie: Se incluye información adicional o relevante que amplié la que aparece en el
cuadro, además de la fuente.
Ejemplo: