3. DATOS CUALITATIVOS
Gráficas de pastel (gráficas circulares), y gráficas
de barras: Se usan para resumir datos cualitativos,
atributos o categóricos.
Las gráficas de pastel muestran la cantidad de datos
que pertenecen a cada categoría como parte
proporcional de un circulo.
Las de barras muestran la cantidad de datos que
pertenecen a cada categoría como un área rectangular
de tamaño proporcional.
4. Gráfica de barras cuando se presenta en diagrama de
pareto presenta información y muy útil.
Diagrama de pareto: Gráfica de barras con las barras
ordenadas de la categoría más numerosa a la
categoría menos numerosa. Incluye una gráfica de
línea que muestra los porcentajes acumulados y
conteos de las barras.
Popular en aplicaciones de control.
5. EXCEL:
Escribe la categoría en la columna A y las frecuencias
correspondientes encabezados de columna son opcional,
después continua con:
Primero ordena la tabla:
Activa ambas columnas de la distribución:
Elige: DAT¨A AZ/ ZA Short
Selecciona: Story by: frecuency column.
Order: Largest to Samllest OK
Insert Column 1st picture
Chart Layouts
6. DATOS CUANTITATIVOS
Una de las razones para construir una gráfica de
datos cuantitativos es mostrar su distribución.
Distribución: Patrón de variabilidad que muestran
los datos de una variable.
Muestra la frecuencia de cada valor de la variable.
Una de las gráficas más simples usadas para
mostrar una distribución es la gráfica de puntos.
Esta describe los datos de una muestra al
representar cada valor de datos con un punto
colocado a lo largo de una escala; esta puede ser
horizontal o vertical.
7. Gráfica de puntos una técnica que se usa cuando uno
analiza los datos.
EXCEL:
La gráfica no esta disponible pero puedes hacer el paso
inicial de clasificar los datos. Escribe los datos en la
columna A y activa la columna de datos; después continúa
con:
Elige: Data AZ (Sort).
Use los datos ordenados para terminar de construir la
gráfica de puntos.
8. PRESENTACIÓN DE TALLO Y HOJAS
Para resumir datos.
Presenta los datos de una muestra con los dígitos reales
que constituyen los valores de datos. Cada valor de datos
se divide en dos partes: El (los) dígitos (s) inicial(es) es
(son) el tallo y los dígitos posteriores son las hojas.
Los tallos se ubican a lo largo del eje principal y para cada
valor de datos se ubica una hoja de modo que muestre la
distribución de los datos.
9.
10. DISTRIBUCIÓN DE FRECUENCIA E HISTOGRAMAS
La lista de grandes conjuntos de datos no presentan una
gran imagen, para condensar los datos se hace con
ayuda de una distribución de frecuencia.
Distribución de frecuencia: Listado, con frecuencia
expresado en forma de tabla, que relaciona los valores
de una variable con frecuencia.
La F es el número de veces que el valor x ocurre en la
muestra.
Distribución no agrupada, cada valor es independiente.
Distribución agrupada, agrupar los valores en un conjunto
de clases.
11. HISTOGRAMA
Gráfica de barras que representa una distribución de
frecuencias de una variable cuantitativa.
Se constituye de:
Un título, que identifica la población o la muestra.
Una escala vertical identifica la frecuencia en las diversas
clases.
Una escala horizontal que identifica a la variable x.
Frecuencia relativa: Es una medida proporcional de la
frecuencia para la ocurrencia.
12. Para describir los histogramas:
Simétrico: Ambos lados de distribución son idénticas.
Normal: Distribución simétrica que se amontona en
torno a la media y se dispersa en los extremos.
Uniforme: cada valor aparece con igual frecuencia.
Sesgado: Una cola se prolonga más que la otra.
Forma J: No hay cola al lado de la clase con frecuencia
más alta.
Bimodal: Las dos clase más pobladas están separadas
por una o más clases.
13. Moda: Es el valor de los datos que ocurre con mayor
frecuencia.
Clase modal: Clase con la frecuencia más alta.
Distribución bimodal: Tiene dos clases de frecuencia
alta, separadas por clases con frecuencias menores.
Distribución de frecuencias acumuladas: Distribución
de frecuencias que relaciona frecuencias acumuladas
con valores de variable.
Frecuencia acumulada: Es la suma de la frecuencia
para dicha clase y las frecuencias de todas las clases de
valores menores.
14. OJIVA
Gráfica de línea de una frecuencia acumulada o
distribución de frecuencias relativas acumuladas.
Puede usarse para enunciados porcentuales acerca
de datos numéricos, en gran medida como hace un
diagrama de Pareto para atribuirla.
15. MEDIDAS DE TENDENCIA CENTRAL
Son valores numéricos que ubican, en cierto sentido,
el centro de un conjunto de datos. Con frecuencia, el
término promedio se asocia con todas las medidas de
tendencia central.
Media: Se representa con
Y se encuentra al sumar todos los valores de la variable
x y dividir la suma entre el número de dichos valores.
16. Mediana: Valor de datos que ocupan la posición
media cuando los datos se clasifican en orden de
acuerdo con su tamaño.
Moda: Es el valor de x que ocurre con más
frecuencia.
Medio rango: Número exactamente a la mitad
entre un dato de valor más bajo, L y un valor más
alto, H. Se encuentra al promediar los valores bajo
y alto.
Medio rango = L+ H
2
17. MEDIDAS DE DISPERSIÓN
Rango: Diferencia en valor entre los datos con valor más
alto, H y los datos con valor más bajo, L.
Desviación de la media: Una desviación de la media, x-
x, es la diferencia entre el valor x y la media, x.
18. Varianza muestral: La varianza ,es la media de
las desviaciones al cuadrado, calculado con n-1 como
el divisor.
19. Desviación estándar muestral: La desviación
estándar de una muestra , s, es la raíz cuadrada
positiva de la varianza.
20. MEDIDAS DE POSICIÓN
Se usan para describir la posición que un valor de
datos especifico posee en relación con el resto de los
datos cuando están en orden clasificado.
Cuartiles: Valores de la variable que dividen los datos
clasificados en cuartos; cada conjunto de datos tiene
tres cuartiles.
21. Percentiles: Valores de la variable que dividen un
conjunto de datos 100 subconjuntos iguales; cada
conjunto de datos tiene 99 percentiles.
22. Rango intercuartílico: La diferencia entre el
primero y el tercer cuartiles. Es el rango de 50%
medio de los datos.
Diagrama de cajas y bigotes: Representación
gráfica del resumen de 5 números. Los cinco valores
numéricos (más pequeño, primer cuartil, mediano,
tercer cuartil y más grande) se ubican en escala
vertical u horizontal.
La caja se usa para mostrar la mitad media de los
datos que yacen entre los dos cuartiles.
los bigotes son segmentos de línea que se usan
para mostrar la otra mitad de los datos.
23.
24. Valor estándar o valor z: La posición que un valor x
tiene en relación con la media en desviación estándar.
El valor z se encuentra con la formula.
25. INTERPRETACIÓN Y COMPRENSIÓN DE LA
DESVIACIÓN ESTÁNDAR
La desviación estándar es una medida de variación
(dispersión) en los datos. Se define como valor
calculando con el uso de fórmulas. Esta medida se
relaciona con:
Regla empírica: Si una variable tiene distribución
normal, entonces: 1) Dentro de 1 desviación estándar
de la media, habrá aproximadamente 68% de los
datos; 2) Dentro de 2 desviaciones estándar de la
media, habrá aproximadamente 95% de los datos; y 3)
Dentro de 3 desviaciones estándar de la media, habrá
aproximadamente 99.7% de los datos.
26.
27. Teorema de Chebyshev: La proporción de cualquier
distribución que yazca dentro de K desviaciones
estándar de media es al menos 1. donde K es cualquier
número positivo mayor que. Este teorema se aplica a
todas las distribuciones de datos.