Este documento describe los conceptos de distribución de frecuencia y diferentes tipos de gráficas para representar distribuciones de frecuencia, incluyendo histogramas, polígonos de frecuencia, diagramas de dispersión y diagramas de Pareto. También cubre conceptos como media, mediana, moda y desviación estándar que son importantes para analizar distribuciones de datos.
2. Distribución de frecuencia
Una distribución de frecuencias (o tabla de frecuencias)
indica cómo un conjunto de datos se divide en varias
categorías (o clases) al listar todas las categorías junto con el
número de valores de los datos que hay en cada una.
Limite info Limite sup
Marcas de
clase
Fronteras de
clase
Anchura de la
clase
cifras más
pequeñas
que pueden
pertenecer a
las dif clases.
cifras más
pequeñas
que pueden
pertenecer a
las dif clases.
son los
puntos
medios de las
clases.
cifras que se
utilizan para
separar las
clases, sin los
espacios
creados por los
límites
dif entre 2 lím info de
clase consecutivos o dos
fronteras inferiores de
clase consecutivas en
una distribución de
3.
4. gráfica con barras de la misma anchura,
dibujadas una junto a la otra. La escala
horizontal representa clases de valores de
datos cuantitativos, en tanto que la escala
vertical representa frecuencias. Las alturas
de las barras corresponden a los valores
de frecuencia.
5. se suelen usar:
Polígono de
frecuencia
Grafica de
puntos
para ilustrar un número
reducido de datos, la cual
permite identificar con facilidad
dos características
se suelen usar cuando se
pretende retratar varias
distribuciones distintas o la
clasificación cruzada
Creado a
partir de
histograma
de
frecuencia
consiste en una gráfica
en la que los valores se
grafican como un punto
a lo largo de una escala
de valores
Consiste en:
Se toma la marca de clase que
coincide con el punto medio de
cada rectángulo de un
histograma.
De izquierda a derecha (valor
chico a valor mayor), dar con
intervalos y apilar si se repite un
dato
Ojiva
para determinar el
número de valores
abajo de algún
valor particular
inicia con la frontera
de clase inf de la 1ra
clase y termina con la
frontera sup de la
última clase.
Crear distribución
con intervalos de
clase y después las
frec acumuladas
Se hace
6. se suelen usar:
Circular
Diagrama de
dispersión
cuando se desea realizar un
análisis gráfico de datos
bivariados, es decir, los que se
refieren a dos conjuntos de
datos.
describe datos cualitativos
como rebanadas de un pastel.
Es útil para
contrastar varias
clases de datos
que aprox iguales
controlar mejor el proceso y
mejorarlo, indispensable conocer
como se comportan algunas
variables, descubrir si el
comportamiento depende entre
ellas
Consiste en:
dividir en las proporciones
apropiadas. Partiendo de der a
izq y acomodando de mas chico
a grande
1.- recolectar n parejas (Xi,Yi),
2.- diseñar escalar apropiadas X,Y
3.-Graficar parejas, si se rep
mostrar concentricidad
4.- documentar diagrama
Pareto
centra la atención
en las categorías
más importantes.
enfatizar unas
cuantas clases más
grandes de datos
Acomodar
frecuencias de
mayor a menor,
Se hace
De tallos y
hojas
se utilizan para analizar y
exponer datos al mismo
tiempo. Es una forma de
relacionar los datos con
otras variables
representa datos
cuantitativos
separando cada
valor en el tallo y la
hoja
En ordenan en orden
creciente (iniciando en
tallo), no en el orden en
que ellos aparecen en la
lista original.
7. Distorsión de información
Algunas gráficas están incorrectas en el sentido de que ellas
contienen errores, y algunas están mal porque, aunque son
técnicamente correctas son engañosas. Al dibujar objetos,
denominados pictogramas, con frecuencia estos son engañosos.
Cuando se comparan medidas unidimensionales, usando volúmenes
para compararlas se distorsionan las diferencias.
8. La media de un conjunto de datos es la medida de tendencia central
determinada sumando los valores y dividiendo el total entre el número
de valores.
La mediana de un conjunto de datos es la medida de tendencia central
que es el valor que se encuentra a la mitad cuando los valores de datos
originales son organizados en orden creciente (o decreciente) de
magnitud. Si hay un número par de valores, la mediana es la media de
los dos valores centrales.
9. La moda de un conjunto de datos es el valor que ocurre con la mayor
frecuencia. Si dos o más valores de datos ocurren con la misma
frecuencia, entonces hay múltiples modas. Si ningún valor está
repetido, se puede decir que no hay moda.
La mitad del rango de un conjunto de datos es la medida de tendencia
central que es el valor medio entre el valor mínimo y el valor máximo
en el conjunto original de datos. Se determina sumando el valor
máximo con el valor mínimo y luego dividiendo la suma entre 2.
10. La media geométrica es la raíz enésima del producto de n valores.
Luego tome la raíz enésima del producto, redondeando a cuatro
lugares decimales. Como hay tres valores, n =3.
Desviacion estándar varianza
Promedio de
Los valores entre si
Coeficiente de variación
No valores negativos,
Desv estándar/media