TEMA # 1. Análisis Bivariado..pptx

TEMA #1. ANALISIS Y PRESENTACION DE DATOS
BIVARIADOS

VARIANZA.- Es la Sumatoria de las desviaciones de la variable, que puede
ser x, y, z, p, q, r, s, t, u, v, w, etc., con respecto a su media, elevada al
cuadrado y todo dividido por n. La varianza son los datos de una sola
variable.
COVARIANZA.- Es la Sumatoria de la multiplicación de las desviaciones
de una variable con respecto a su media, por la multiplicación de las
desviaciones de la otra variable con respect a su media. La covarianza
son los datos de dos variables diferentes.
𝜎𝑥
2
=
𝑥 − 𝑢 2
𝑛
𝜎𝑥
2
=
𝑥 − 𝑢 𝑥 − 𝑢
𝑛
𝜎𝑥
2
=
𝑥 − 𝑥 2
𝑛
𝜎𝑥𝑦 =
𝑥 − 𝑥 𝑦 − 𝑦
𝑛
𝜎𝑥
2 = 𝜎𝑥𝑥 𝜎𝑦
2
= 𝜎𝑦𝑦 𝜎𝑆
2
= 𝜎𝑆𝑆 𝜎𝑤
2 = 𝜎𝑤𝑤
𝜎𝑡𝑤 =
𝑡 − 𝑡 𝑤 − 𝑤
𝑛

ANÁLISIS BIVARIADO
Se conocen como datos bivariados a los valores de dos variables
diferentes que se obtienen del mismo elemento poblacional.
Cada una de las dos variables puede ser cualitativa o cuantitativa.
En consecuencia, tres combinaciones de tipos de variable pueden
formar datos bivariados:
1. Ambas variables son cualitativas (atributos).
2. Una variable es cualitativa (atributo) y la otra es cuantitativa
(numérica).
3. Ambas variables son cuantitativas (ambas son numéricas).

TIPOS DE VARIABLES: CUALITATIVAS Y CUANTITATIVAS.
LAS VARIABLES CUALITATIVAS O NO NUMERICAS: NOMINAL Y ORDINAL.
La Variable Cualitativa, de característica o de Atributo .- No es numérica, son de tipo Nominal y
Ordinal.
-Variable Cualitativa Nominal.- Son aquellas que presentan una característica o atributo, ejemplos:
• Genero, olores, sabores, colores, Religiones, opiniones, Tipo de automóvil, etc.
-Variable Cualitativa Ordinal.- Son aquellas de características, atributos que presentan un orden,
jerarquía, que se subordinan en categorías, ejemplos:
• Rangos militares, Nombramientos eclesiásticos, Calificaciones, etc.
LAS VARIABLES CUANTITATIVAS O NUMERICAS: Discretas y Continuas.
1. Discreta.-Cuando solo asume ciertos valores enteros. Ejemplo: Número de hijos: 4
2. Continua.-Cuando asume cualquier valor con un rango especifico, incluye decimales. Ejemplo:
Peso de una persona: 172.50 libras

Cuando resultan datos bivariados de dos variables cualitativas
(de atributo o de categorias), es frecuente que los datos se
ordenen en una tabulación cruzada o tabla de contingencia.
Construcción de tablas de tabulación cruzada:
Ejemplo.
Treinta estudiantes de una universidad se identificaron y
organizaron al azar según dos variables:
Variable Cualitativa 1. Género Masculino y Femenino
Variable Cualitativa 2. Especialidad en Artes liberales (LA),
Administración de empresas (BA) y Tecnología(T).

Estos 30 datos bivariados pueden resumirse en una tabla de tabulación
cruzada de 2 × 3, donde las dos filas representan los dos géneros,
masculino y femenino, y las tres columnas representan las tres
categorías de especialidad de artes liberales (LA), administración de
empresas (BA), y tecnología (T).
La entrada en cada celda se encuentra al determinar cuántos
estudiantes caben en cada categoría.
Adams es masculino (M) y artes liberales (LA) y se clasifica en la celda
de la primera fila, primera columna.
Los otros 29 estudiantes están clasificados en forma semejante. La
tabla resultante de tabulación cruzada de 2 × 3 (de contingencia),
muestra la frecuencia para cada categoría cruzada de las dos variables
junto con los totales de fila y columna, llamados totales marginales. El
total de los totales marginales es igual a n que es el tamaño muestral.
Se representan de la siguiente manera:

2. Una variable es cualitativa (atributo) y la otra es
cuantitativa (numérica).
Cuando resultan datos bivariados de una variable cualitativa y
una cuantitativa, los valores cuantitativos se ven como
muestras separadas, con cada conjunto identiﬁcado por niveles
de la variable cualitativa. Los resultados se exhiben juntos para
fácil comparación.
Construcción de comparaciones de las dos variables.
Ejemplo:
Se midió la distancia necesaria para detener un automóvil de
3000 libras de peso en pavimento mojado, para comparar la
capacidad de frenado de tres diseños de la superﬁcie de
rodadura de neumáticos. Los neumáticos de cada uno de los
diseños fueron probados 6 veces en el mismo automóvil en un
pavimento mojado controlado, obteniendo los datos:

El diseño de la superficie de rodadura es una variable cualitativa con
tres niveles de respuesta, y la distancia de frenado es una variable
cuantitativa. La distribución de las distancias de frenado para el diseño
A de superficie de rodadura debe de compararse con la distribución de
distancias de frenado para cada uno de los otros diseños de superficie
de rodadura. Esta comparación se puede hacer con técnicas numéricas
y gráficas.

Ejemplo para elaborar un diagrama de caja.

DIAGRAMA DE CAJA

3. Ambas variables son cuantitativas (ambas son
numéricas).
La forma más básica de análisis de correlación y regresión, es el
caso lineal bivariado.
Cuando los datos bivariados son el resultado de dos variables
cuantitativas, se acostumbra expresar matemáticamente los datos
como pares ordenados (x, y), donde X es la variable de entrada (a
veces llamada variable independiente) y Y es la variable de salida
(a veces llamada variable dependiente). Se dice que los datos
están ordenados porque un valor, x, siempre se escribe primero.
Se llaman pareados porque para cada valor de X siempre hay un
valor correspondiente de Y de la misma fuente. Por ejemplo, si X
es la estatura y Y es el peso, entonces una estatura y un peso
correspondiente se registran para cada persona. La variable de
entrada X se mide o controla para pronosticar la variable de salida
Y.

numéricas).
Supongamos que unos médicos investigadores están
probando un nuevo medicamento al describir diferentes
dosis y observar los tiempos de recuperación de sus
pacientes. El investigador puede controlar la cantidad de
medicamento prescrita, de modo que la cantidad de
medicamento se designa como X. En el caso de estatura y
peso, cualquiera de las variables podría tratarse como
entrada y la otra como salida, dependiendo de la
pregunta que se formule. No obstante, se obtienen
diferentes resultados del análisis de regresión,
dependiendo de la selección que se haga. En problemas
que se reﬁeren a dos variables cuantitativas, se presentan
gráﬁcamente los datos muestrales en un diagrama de
dispersión.

numéricas).
El Diagrama de dispersión es una gráﬁca de todos los
pares ordenados de datos bivariados en un sistema de
ejes de coordenadas. La variable de entrada, X, se
localiza en el eje horizontal, y la variable de salida, Y, se
localiza en el eje vertical.
CONSTRUCCIÓN DE UN DIAGRAMA DE DISPERSIÓN
En el curso de educación física de Mr. Chamberlain se
tomaron varias notas. La siguiente muestra es el
número de “lagartijas” y “sentadillas” hechas por 10
estudiantes seleccionados al azar:
(27, 30) (22, 26) (15, 25) (35, 42) (30, 38) (52, 40) (35,
32) (55, 54) (40, 50) (40, 43)

numéricas).
La tabla 3.10 agrupa estos datos muestrales en pares ordenados (X,Y).

numéricas).
La ﬁgura 3.5 muestra un diagrama de dispersión
de los datos, es importante determinar si existe
correlación entre las dos variables.

¿Por qué es importante encontrar
correlaciones?
Encontrar correlaciones entre conjuntos de datos puede ayudarle a
tomar decisiones informadas en cualquier campo. A menudo es
importante saber si dos conjuntos de información están o no
relacionados según algún tipo de patrón observable.
También suele ser valioso saber en qué grado están relacionadas,
observar una correlación entre dos conjuntos de datos no significa
necesariamente que los cambios en uno provoquen cambios en el
otro. Determinar las correlaciones puede ser útil cada vez que
quiera analizar los datos en un gráfico de dispersión como parte de
un proceso de toma de decisiones.
En algunos trabajos se utilizan mucho los cálculos de correlación en
el día a día.
Los inversores, por ejemplo, pueden utilizar las correlaciones
positivas y negativas para intentar predecir el movimiento del
mercado de valores y tomar decisiones financieras, en
consecuencia, este tipo de cálculos puede ser muy complejo, por lo
que muchos profesionales utilizan programas informáticos o
calculadoras avanzadas como ayuda.

Ejemplos de correlaciones positivas
Materiales: La flexibilidad de un determinado metal puede aumentar
junto con la temperatura de ese material. Quienes analizan estos
procesos pueden utilizar esta información para tomar decisiones
sobre cómo fabricar determinados productos y qué equipos utilizar
al hacerlo.
Los profesionales de las finanzas y los inversores pueden buscar
correlaciones positivas por ejemplo: podría ser útil saber si existe
una correlación entre el aumento del precio de dos acciones y lo
estrecha que es esa correlación.
Se pueden observar correlaciones positivas en el mundo del
marketing. Por ejemplo, puede notar que su número de
seguidores aumenta con el número de un determinado tipo de
publicaciones en las redes sociales que crea. También puede
observar una correlación positiva entre las horas facturables
de su departamento de marketing y los ingresos de los
productos en los que trabajan

Ejemplos de correlaciones positivas (Relación lineal creciente):
•Ahorro y seguridad financiera.
•Horas extras trabajadas e ingresos totales.
•Beneficios para los empleados y moral en el trabajo.
•Salario y satisfacción laboral.
•Aumento de la humedad y de la producción de los cultivos.
•Aumento de ingesta de alimentos y aumento en el peso corporal.

Ejemplos de correlaciones negativas (Relación lineal decreciente):
•Aumento del precio de un producto y la demanda del mismo.
•Mayor velocidad de transporte y menor tiempo de viaje.
•Más ejercicio y menos gastos médicos.
•Pagos de préstamos más altos y menores intereses totales
adeudados.
•Aumento del absentismo y disminución de los ingresos totales.

TEMA # 1. Análisis Bivariado..pptx

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

Similar a TEMA # 1. Análisis Bivariado..pptx

Similar a TEMA # 1. Análisis Bivariado..pptx (20)

Último

Último (20)

TEMA # 1. Análisis Bivariado..pptx