SlideShare una empresa de Scribd logo
1 de 23
Descargar para leer sin conexión
UNSCH
Real, Pontificia y nacional
UNIVERSIDAD NACIONAL DE SAN CRISTOBAL DE HUAMANGA
DEPARTAMENTO ACADÉMICO
DE MATEMÁTICA Y FÍSICA
ESTADÍSTICA
RIVERA GARAMENDI, Freddy
ES-241
DISTRIBUCIÓN BIDIMENSIONALES
REGRESIÓN LINEL
RIVERA GARAMENDI, Freddy
DISTRIBUCIONES BIDIMENSIONALES
DISTRIBUCIÓN BIDIMENSIONAL
ESTADÍSTICA
En este caso, una muestra de tamaño (n) se representa como un conjunto de pares ordenados de
la forma ( 𝑥𝑥1, 𝑦𝑦1 , 𝑥𝑥2, 𝑦𝑦2 , ….., 𝑥𝑥𝑛𝑛, 𝑦𝑦𝑛𝑛 . El par ordenado 𝑥𝑥𝑖𝑖, 𝑦𝑦𝑖𝑖 representa a la estatura y el peso
de cada alumno 𝑥𝑥1, 𝑥𝑥2, …., 𝑥𝑥𝑛𝑛 son valores de la variable X, mientras que la representación de las
estaturas; 𝑦𝑦1, 𝑦𝑦2, …., 𝑦𝑦𝑛𝑛 son valores de la variable Y, y representa los pesos.
En las estadísticas bidimensionales no se trata de elegir dos variables cualesquiera, sino
observaciones simultaneas de variables que tengan entre si alguna relación afinidad o
dependencia.
Las distribuciones bidimensionales de frecuencias que se requieren a la presentación en tablas
de frecuencias y la reducción de datos bidimensionales a través del cálculo de estadígrafos o
medidas de resumen.
Estadísticamente en el caso bidimensional se puede considerar dos aspectos:
Determinar a construir modelos para expresar y medir la relación o asociación entre dos
variables.
RIVERA GARAMENDI, Freddy
DISTRIBUCIONES BIDIMENSIONALES ESTADÍSTICA
En esta unidad llamaremos de manera general X a la primera variable, y Y a la segunda variable. En el caso
bidimensional puede suceder que:
• X discreta e Y nominal y viceversa.
• X discreta e Y ordinal y viceversa.
• X continua e Y nominal y viceversa.
• X continua e Y ordinal y viceversa.
• X discreta e Y discreta.
• X continua e Y continua.
• X discreta e Y continua y viceversa.
• X nominal e Y nominal.
• X ordinal e Y ordinal.
• X nominal e Y ordinal y viceversa.
Ambas variables CUANTITATIVAS.
Ambas variables CUALITATIVAS.
Una variable CUANTITATIVA y otra variable CUALITATIVA.
RIVERA GARAMENDI, Freddy
DISTRIBUCIONES BIDIMENSIONALES ESTADÍSTICA
FRECUENCIA ABSOLUTA SIMMPLE
Denotaremos como:
Cuadro N° 01
𝑥𝑥𝑖𝑖, (𝑖𝑖 = 1𝑝𝑝), las distintas valores de X. con 𝑝𝑝 ≤ 𝑛𝑛 𝑦𝑦𝑗𝑗, (𝑗𝑗 = 1𝑞𝑞), las distintas valores de Y. con 𝑞𝑞 ≤ 𝑛𝑛
Las tablas bidimensionales de frecuencias se construyen colocando en el margen izquierdo las distintos valores de X
y en el margen superior las distintos valores de Y, como se ve en la siguiente tabla.
Cuadro de distribución bidimensional de frecuencia absoluta simple
RIVERA GARAMENDI, Freddy
DISTRIBUCIONES BIDIMENSIONALES ESTADÍSTICA
Donde:
𝑛𝑛𝑖𝑖𝑖𝑖: Frecuencia absoluta del par 𝑥𝑥𝑖𝑖, 𝑦𝑦𝑖𝑖 , (𝑖𝑖 = 1𝑝𝑝; 𝑗𝑗 = 1𝑞𝑞 )
𝑛𝑛𝑖𝑖∗: Frecuencia marginal del valor 𝑥𝑥𝑖𝑖 (𝑖𝑖 = 1𝑝𝑝 )
𝑛𝑛∗𝑗𝑗: Frecuencia marginal del valor 𝑦𝑦𝑗𝑗, (𝑗𝑗 = 1𝑞𝑞 )
𝑛𝑛 = �
𝑖𝑖=1
𝑝𝑝
�
𝑗𝑗=1
𝑞𝑞
𝑛𝑛𝑖𝑖𝑖𝑖 = �
𝑖𝑖=1
𝑝𝑝
𝑛𝑛𝑖𝑖∗ = �
𝑖𝑖=1
𝑞𝑞
𝑛𝑛∗𝑗𝑗 Número total de pares observado.
RIVERA GARAMENDI, Freddy
DISTRIBUCIONES BIDIMENSIONALES ESTADÍSTICA
EJEMPLO
En una muestra de 50 viviendas familiares se consideran como primera variable (X) el número de personas por vivienda
y como segunda variable (Y) el número de habitaciones por vivienda. Los valore obtenidos fueron:
𝑋𝑋 6 4 6 5 5 6 5 6 8 7 7 6 9 5 5 5 9 7 8 4 4 6 5 5 4
𝑌𝑌 2 2 3 4 3 3 3 3 4 4 3 4 5 2 3 3 6 3 5 2 4 3 3 3 4
𝑋𝑋 9 6 5 8 5 5 9 4 7 7 5 5 4 7 9 6 7 4 7 4 6 6 9 6 5
𝑌𝑌 5 2 2 6 2 3 6 4 6 4 2 4 2 5 3 2 4 3 5 3 5 3 4 4 3
Elabore una tabla bidimensional de frecuencias y determinar sus frecuencias marginales.
RIVERA GARAMENDI, Freddy
DISTRIBUCIONES BIDIMENSIONALES ESTADÍSTICA
X Y
4
5
6
7
8
9
2 3 4 5 6
3 2 3 0 0
4 8 2 0 0
3 5 2 1 0
𝑋𝑋 6 4 6 5 5 6 5 6 8 7 7 6 9 5 5 5 9 7 8 4 4 6 5 5 4
𝑌𝑌 2 2 3 4 3 3 3 3 4 4 3 4 5 2 3 3 6 3 5 2 4 3 3 3 4
𝑋𝑋 9 6 5 8 5 5 9 4 7 7 5 5 4 7 9 6 7 4 7 4 6 6 9 6 5
𝑌𝑌 5 2 2 6 2 3 6 4 6 4 2 4 2 5 3 2 4 3 5 3 5 3 4 4 3
RIVERA GARAMENDI, Freddy
DISTRIBUCIONES BIDIMENSIONALES ESTADÍSTICA
X Y 2 3 4 5 6 𝑛𝑛𝑖𝑖�
4 3 2 3 0 0 8
5 4 8 2 0 0 14
6 3 5 2 1 0 11
7 0 2 3 2 1 8
8 0 0 1 1 1 3
9 0 1 1 2 2 6
𝑛𝑛�𝑗𝑗 10 18 12 6 4 50
X: número de personas por vivienda.
𝑛𝑛32:
Y: Número de habitaciones por vivienda.
𝑛𝑛21:
𝑛𝑛21:
Hay 5 viviendas, con 3 habitaciones y 6 personas por vivienda..
Hay 4 viviendas con 2 habitaciones cada uno y tienen 5 personas por vivienda.
Hay 4 viviendas con 5 personas y 2 habitaciones.
RIVERA GARAMENDI, Freddy
DISTRIBUCIONES BIDIMENSIONALES ESTADÍSTICA
Distribuciones marginales
N° de personas
por vivienda
N° de viviendas
4 8
5 14
6 11
7 8
8 3
9 6
Total 50
N° de
Habitaciones
N° de viviendas
4 10
5 18
6 12
7 6
8 4
Total 50
RIVERA GARAMENDI, Freddy
DISTRIBUCIONES BIDIMENSIONALES ESTADÍSTICA
En las distribuciones unidimensionales se expresan las frecuencias relativas por ℎ𝑖𝑖. En el caso bidimensional las
frecuencias relativas se expresan se la siguiente manera:
FRECUENCIA RELATIVA
ℎ𝑖𝑖𝑖𝑖 =
𝑛𝑛𝑖𝑖𝑖𝑖
𝑛𝑛
; 𝑡𝑡𝑡𝑡𝑡𝑡 𝑞𝑞𝑞𝑞𝑞𝑞 0 ≤ ℎ𝑖𝑖𝑖𝑖 ≤ 1
ℎ𝑖𝑖∗ =
𝑛𝑛𝑖𝑖�
𝑛𝑛
; 𝑡𝑡𝑡𝑡𝑡𝑡 𝑞𝑞𝑞𝑞𝑞𝑞 0 ≤ ℎ𝑖𝑖� ≤ 1
ℎ∗𝑗𝑗 =
𝑛𝑛�𝑗𝑗
𝑛𝑛
; 𝑡𝑡𝑡𝑡𝑡𝑡 𝑞𝑞𝑞𝑞𝑞𝑞 0 ≤ ℎ�𝑗𝑗 ≤ 1
frecuencias relativas marginal del valor 𝑥𝑥𝑖𝑖 (𝑖𝑖 = 1𝑝𝑝 )
frecuencias relativas marginal del valor 𝑦𝑦𝑗𝑗, (𝑗𝑗 = 1𝑞𝑞 )
RIVERA GARAMENDI, Freddy
DISTRIBUCIONES BIDIMENSIONALES ESTADÍSTICA
Cuadro N°03
Distribución proporcional de números de personas y habitaciones por vivienda
X Y 2 3 4 5 6 𝐡𝐡𝑖𝑖�
4 0.06 0.04 0.06 0.00 0.00 0.16
5 0.08 0.16 0.04 0.00 0.00 0.28
6 0.06 0.10 0.04 0.02 0.00 0.22
7 0.00 0.04 0.06 0.04 0.02 0.16
8 0.00 0.00 0.02 0.02 0.02 0.06
9 0.00 0.02 0.02 0.04 0.04 0.12
𝐡𝐡�𝑗𝑗 0.20 0.36 0.24 0.12 0.08 1.00
RIVERA GARAMENDI, Freddy
DISTRIBUCIONES BIDIMENSIONALES ESTADÍSTICA
Distribuciones marginales de frecuencias relativas marginales
N° de personas
por vivienda
N° de
viviendas
𝒉𝒉𝒊𝒊∗
4 8 0.16
5 14 0.28
6 11 0.22
7 8 0.16
8 3 0.09
9 6 0.12
total 50 1.00
N° de
Habitaciones
N° de
viviendas
𝒉𝒉∗𝒋𝒋
4 10 0.20
5 18 0.36
6 12 0.24
7 6 0.12
8 4 0.08
total 50 1.00
RIVERA GARAMENDI, Freddy
DISTRIBUCIONES BIDIMENSIONALES ESTADÍSTICA
X Y [268 − ⟩
302 [302 − ⟩
336 [336 − ⟩
370 [370 − ⟩
404 [404 − ⟩
438 [438 − ⟩
472 𝑛𝑛𝑖𝑖�
[1 − ⟩
5 4 0 0 0 0 0 4
[5 − ⟩
9 1 3 2 0 0 0 6
[9 − ⟩
13 6 2 1 0 0 0 9
[13 − ⟩
17 1 4 1 0 0 0 6
[17 − ⟩
21 0 4 3 1 0 0 8
[21 − ⟩
25 1 2 0 0 0 0 3
[25 − ⟩
29 0 0 1 0 1 2 4
𝑛𝑛�𝑗𝑗 13 15 8 1 1 2 40
𝑛𝑛42:.
A continuación se indica el tiempo de servicios (en años) y los ingresos mensuales (en dólares) correspondiente
a 40 trabajadores bancarios.
EJEMPLO
𝑛𝑛53:
4 trabajadores tienen un tiempo de servicio entre 13 y 17y tiene un ingreso de 302 o menos de 336 dólares.
3 trabajadores tienen un tiempo de servicio de 17 o menos que 21 y tiene un ingreso de 336 o menos de
370 dólares.
RIVERA GARAMENDI, Freddy
DISTRIBUCIONES BIDIMENSIONALES ESTADÍSTICA
Sexo(Y) Estado civil (X) Masculino Femenino Total
Soltero 0.100 0.200 0.300
Casado 0.150 0.400 0.550
Viudo 0.050 0.025 0.075
Divorciado 0.025 0.050 0.075
Total 0.325 0.675 1.000
La siguiente tabla N° 03 muestra una distribución conjunta de trabajadores de una empresa por sexo
según estado civil. Construya la distribución bidimensional de las frecuencias relativas
EJEMPLO
INTERPRETACIÓN:
𝑛𝑛11:
𝑛𝑛22:
El 10% de los trabajadores son solteros y de sexo masculino.
El 40% de los trabajadores son casados y de sexo femenino.
RIVERA GARAMENDI, Freddy
DISTRIBUCIONES BIDIMENSIONALES ESTADÍSTICA
PROPIEDADES
La suma de las frecuencias absoluta simple es igual al total, es decir:
1. �
𝑖𝑖=1
𝑝𝑝
�
𝑗𝑗=1
𝑞𝑞
𝑛𝑛𝑖𝑖𝑖𝑖 = 𝑛𝑛
2. La suma de las frecuencias relativas es igual a la unidad, es decir:
�
𝑖𝑖=1
𝑝𝑝
�
𝑗𝑗=1
𝑞𝑞
ℎ𝑖𝑖𝑖𝑖 = 1
�
𝑖𝑖=1
𝑝𝑝
𝑛𝑛𝑖𝑖∗ = 𝑛𝑛
3.
4. �
𝑖𝑖=1
𝑞𝑞
𝑛𝑛∗𝑗𝑗 = 𝑛𝑛
5. �
𝑖𝑖=1
𝑝𝑝
ℎ𝑖𝑖∗ = 1
�
𝑖𝑖=1
𝑞𝑞
ℎ∗𝑗𝑗 = 1
6.
RIVERA GARAMENDI, Freddy
DISTRIBUCIONES BIDIMENSIONALES ESTADÍSTICA
MEDIDAS ESTADÍSTICAS EN UNA DISTRIBUCIÓN BIDIMENSIONAL
MEDIAS
Medias y varianzas marginales.
̅
𝑥𝑥 =
∑𝑖𝑖=1
𝑝𝑝
𝑥𝑥𝑖𝑖𝑛𝑛𝑖𝑖∗
𝑛𝑛
�
𝑦𝑦 =
∑𝑖𝑖=1
𝑞𝑞
𝑦𝑦𝑖𝑖𝑛𝑛∗𝑗𝑗
𝑛𝑛
VARIANZA
𝑆𝑆𝑥𝑥
2
=
∑𝑖𝑖=1
𝑝𝑝
𝑥𝑥𝑖𝑖 − ̅
𝑥𝑥 2
𝑛𝑛𝑖𝑖∗
𝑛𝑛
𝑆𝑆𝑦𝑦
2
=
∑𝑖𝑖=1
𝑞𝑞
𝑥𝑥𝑖𝑖 − �
𝑦𝑦 2
𝑛𝑛∗𝑗𝑗
𝑛𝑛
COVARIANZA
La covarianza detecta la existencia de algún tipo de relación lineal entre dos variables; si la covarianza es diferente
de cero, entonces hay alguna relación o dependencia funcional entre las variables.
𝐶𝐶𝐶𝐶𝐶𝐶 𝑥𝑥, 𝑦𝑦 =
∑𝑖𝑖=1
𝑝𝑝
∑𝑗𝑗=1
𝑞𝑞
𝑥𝑥𝑖𝑖𝑦𝑦𝑗𝑗𝑛𝑛𝑖𝑖𝑖𝑖
𝑛𝑛
−
∑𝑖𝑖=1
𝑝𝑝
𝑥𝑥𝑖𝑖𝑛𝑛𝑖𝑖∗
𝑛𝑛
.
∑𝑗𝑗=1
𝑞𝑞
𝑦𝑦𝑗𝑗𝑛𝑛∗𝑗𝑗
𝑛𝑛
𝐶𝐶𝐶𝐶𝐶𝐶 𝑥𝑥, 𝑦𝑦 =
∑𝑖𝑖=1
𝑝𝑝
∑𝑗𝑗=1
𝑞𝑞
𝑥𝑥𝑖𝑖𝑦𝑦𝑗𝑗
𝑛𝑛
−
∑𝑖𝑖=1
𝑝𝑝
𝑥𝑥𝑖𝑖
𝑛𝑛
.
∑𝑗𝑗=1
𝑞𝑞
𝑦𝑦𝑗𝑗
𝑛𝑛
PARA DATOS SIN AGRUPAR PARA DATOS AGRUPADOS
RIVERA GARAMENDI, Freddy
DISTRIBUCIONES BIDIMENSIONALES ESTADÍSTICA
CORRELACIÓN LINEAL
Se a dicho que la covarianza mide la relación lineal entre x e y. Para ilustrarlo. Dibujemos en los ejes coordenados
los diagramas de dispersión.
El inconveniente de la covarianza como medida de asociación lineal es su dependencia de las unidades de medida
de las variables.
RIVERA GARAMENDI, Freddy
DISTRIBUCIONES BIDIMENSIONALES ESTADÍSTICA
CORRELACIÓN LINEAL
En consecuencia, para construir una medida adimensional, tendremos que dividir la covarianza por un término con
sus mismas dimensiones. Si se divide por el producto de sus desviaciones típicas se define el coeficiente de
correlación entre dos variables.
ρ =
𝐶𝐶𝐶𝐶𝐶𝐶(𝑥𝑥, 𝑦𝑦)
𝑆𝑆𝑥𝑥𝑆𝑆𝑦𝑦
Donde: 𝑆𝑆𝑥𝑥 𝑆𝑆𝑦𝑦 Son las desviaciones típicas de x y de y respectivamente
y
PROPIEDAD
Si existe una relación lineal exacta ente ambas variables y todos los puntos están en la línea y = 𝑎𝑎 + 𝑏𝑏𝑏𝑏, el
coeficiente de correlación es igual a 1(si 𝑏𝑏 > 0) ó −1 (si 𝑏𝑏 < 0).
Si no existe relación lineal exacta: −1 < ρ < 1, el cual representa el grado de asociación
ρ = 0, cuando no hay ninguna correlación lineal entre x y y
RIVERA GARAMENDI, Freddy
DISTRIBUCIONES BIDIMENSIONALES ESTADÍSTICA
EJEMPLO La tabla adjunta muestra la altura de un padre y un hijo (en metros).
PADRE 1.65 1.60 1.70 1.63 1.73 1.57 1.80 1.93 1.73 1.70 1.75 1.78
HIJO 1.73 1.68 1.73 1.65 1.75 1.68 1.73 1.91 1.80 1.70 1.73 1.78
Calcule la covarianza de la estatura bajo el supuesto de que la estatura de un hijo es absolutamente
independiente de la estatura del padre, indica el signo de la dependencia.
Calcule el coeficiente de correlación.
a.
b.
En la tabla calculamos todos los valores que necesitamos:
PADRE(𝒙𝒙𝒊𝒊) HIJO(𝒚𝒚𝒊𝒊) 𝒙𝒙𝒊𝒊. 𝒚𝒚𝒊𝒊 𝒙𝒙𝒊𝒊
𝟐𝟐
𝒚𝒚𝒊𝒊
𝟐𝟐
1.65 1.73 2.85 2.72 2.99
1.6 1.68 2.69 2.56 2.82
1.7 1.73 2.94 2.89 2.99
1.63 1.65 2.69 2.66 2.72
1.73 1.75 3.03 2.99 3.06
1.57 1.68 2.64 2.46 2.82
1.8 1.73 3.11 3.24 2.99
1.93 1.91 3.69 3.72 3.65
1.73 1.8 3.11 2.99 3.24
1.7 1.7 2.89 2.89 2.89
1.75 1.73 3.03 3.06 2.99
1.78 1.78 3.17 3.17 3.17
20.57 20.87 35.84 35.37 36.35
SOLUCIÓN
RIVERA GARAMENDI, Freddy
DISTRIBUCIONES BIDIMENSIONALES ESTADÍSTICA
MEDIA
̅
𝑥𝑥 =
∑𝑖𝑖=1
𝑛𝑛
𝑥𝑥𝑖𝑖
𝑛𝑛 𝑆𝑆𝑥𝑥
2
=
∑𝑖𝑖=1
𝑛𝑛
𝑥𝑥𝑖𝑖
2
𝑛𝑛
− ̅
𝑥𝑥2
�
𝑦𝑦 =
∑𝑖𝑖=1
𝑛𝑛
𝑦𝑦𝑖𝑖
𝑛𝑛
=
20.57
12
= 1.71 𝑚𝑚
= 1.74 𝑚𝑚
=
20.87
12
VARIANZA
𝑆𝑆𝑦𝑦
2
=
∑𝑖𝑖=1
𝑛𝑛
𝑦𝑦𝑖𝑖
2
𝑛𝑛
− �
𝑦𝑦2
=
35.37
12
− 1.71 2 = 0.009 𝑚𝑚2
=
36.35
12
− 1.74 2
= 0.004 𝑚𝑚2
COVARIANZA
𝐶𝐶𝐶𝐶𝐶𝐶 𝑥𝑥, 𝑦𝑦 =
∑𝑖𝑖=1
𝑛𝑛
𝑥𝑥𝑖𝑖. 𝑦𝑦𝑖𝑖
𝑛𝑛
− ̅
𝑥𝑥. �
𝑦𝑦
Este valor indica una dependencia positiva directa, ya que la covarianza nos da también el signo de la relación.
= 0.005
=
35.84
12
− 1.71 1.74
𝜌𝜌 =
𝑐𝑐𝑜𝑜𝑣𝑣(𝑥𝑥; 𝑦𝑦)
𝑠𝑠𝑥𝑥. 𝑠𝑠𝑦𝑦
Calculemos, el coeficiente de correlación es:
Correlación con alto grado de asociación, ya que 𝜌𝜌 ≠ 0 −1 < 𝜌𝜌 < 1 .
=
0.005
0.009 0.004
= 0.86
Para ver el grado de dependencia debemos considerar 𝜌𝜌2
es decir 𝜌𝜌2
𝝆𝝆𝟐𝟐
es llamado coeficiente de determinación
= 0.86 2
= 0.75
es indica que el 75% de la variación de las estaturas de los hijos viene explicada por la estatura de los padre.
(existe relación lineal)
−𝟏𝟏. 𝟎𝟎 −𝟎𝟎. 𝟓𝟓 −𝟎𝟎. 𝟑𝟑 −𝟎𝟎. 𝟏𝟏 𝟎𝟎 𝟏𝟏. 𝟎𝟎
𝟎𝟎. 𝟓𝟓
𝟎𝟎. 𝟑𝟑
𝟎𝟎. 𝟏𝟏
Fuerte Fuerte
moderado moderado
Débil Débil
Ninguna o muy débil
RIVERA GARAMENDI, Freddy
DISTRIBUCIONES BIDIMENSIONALES ESTADÍSTICA
REGRESIÓN LINEAL SIMPLE
𝒚𝒚 = 𝜷𝜷𝒐𝒐 + 𝜷𝜷𝟏𝟏𝒙𝒙 , 𝛽𝛽𝑜𝑜 𝛽𝛽1 Son constantes
y
La regresión tiene dos significados: uno surge de la distribución conjunta de probabilidad de dos variables
aleatorias; el segundo empírico nace de la necesidad de ajustar alguna función a un conjunto de datos
Se llama regresión lineal simple de y en x. El valor 𝛽𝛽𝑜𝑜 se llama ordenada en el origen, puesto que es el punto
en que la línea recta corta al eje Y. La pendiente de la recta se mide por 𝛽𝛽1, que da el cambio en y por unidad
de cambio en el valor de x. El signo de 𝛽𝛽1 también indica el tipo de relación entre x e y.
ESTIMACIÓN POR EL MÉTODO DE MÍNIMOS CUADRADOS
Una tarea principal en el análisis de regresión, es estimar los parámetros 𝜷𝜷𝒐𝒐 y 𝜷𝜷𝟏𝟏de la recta ℓ: 𝑦𝑦 = 𝛽𝛽𝑜𝑜 + 𝛽𝛽1𝑥𝑥
basándonos en los datos muéstrales formado por los pares 𝑥𝑥1; 𝑦𝑦1 , 𝑥𝑥2; 𝑦𝑦2 ; 𝑥𝑥3𝑦𝑦3 ; ⋯ ; 𝑥𝑥𝑛𝑛𝑦𝑦𝑛𝑛
El método de mínimos cuadrados consiste en hallar la recta ℓ de tal manera que la suma de los cuadrados de las
diferencias de las ordenadas de puntos observados 𝑥𝑥𝑖𝑖𝑦𝑦𝑖𝑖 y los puntos de la recta sean mínimo. Es decir se trata
de hallar 𝜷𝜷𝒐𝒐 y 𝜷𝜷𝟏𝟏de tal manera que
RIVERA GARAMENDI, Freddy
DISTRIBUCIONES BIDIMENSIONALES ESTADÍSTICA
nota
Si los datos están tabuladas las expresiones de las ecuaciones normales aparecerán multiplicado por sus
respectivas frecuencias absolutas.
Llamada recta de mínimos cuadrados de 𝒚𝒚 en 𝒙𝒙
Resolviendo el sistema de ecuaciones normales para 𝜷𝜷𝒐𝒐 y 𝜷𝜷𝟏𝟏 obtenemos:
𝜷𝜷𝒐𝒐 = �
𝒚𝒚 + 𝜷𝜷𝟏𝟏�
𝒙𝒙
𝜷𝜷𝟏𝟏 =
∑ 𝒙𝒙𝒊𝒊𝒚𝒚𝒊𝒊−𝒏𝒏�
𝒙𝒙.�
𝒚𝒚
∑ 𝒙𝒙𝒊𝒊
𝟐𝟐−𝒏𝒏�
𝒙𝒙𝟐𝟐 c =
𝒄𝒄𝒄𝒄𝒄𝒄(𝒙𝒙; 𝒚𝒚)
𝒔𝒔𝒙𝒙
𝟐𝟐
Luego, la recta ℓ se escribe
𝒚𝒚 = �
𝒚𝒚 +
𝒄𝒄𝒐𝒐𝒗𝒗(𝒙𝒙; 𝒚𝒚)
𝒔𝒔𝒙𝒙
𝟐𝟐
𝒙𝒙 − �
𝒙𝒙
RIVERA GARAMENDI, Freddy
DISTRIBUCIONES BIDIMENSIONALES ESTADÍSTICA
EJEMPLO
Si los datos están tabuladas las expresiones de las ecuaciones normales aparecerán multiplicado por sus
respectivas frecuencias absolutas.
Llamada recta de mínimos cuadrados de 𝒚𝒚 en 𝒙𝒙
Resolviendo el sistema de ecuaciones normales para 𝜷𝜷𝒐𝒐 y 𝜷𝜷𝟏𝟏 obtenemos:
𝜷𝜷𝒐𝒐 = �
𝒚𝒚 − 𝜷𝜷𝟏𝟏�
𝒙𝒙
𝜷𝜷𝟏𝟏 =
∑ 𝒙𝒙𝒊𝒊𝒚𝒚𝒊𝒊−𝒏𝒏�
𝒙𝒙.�
𝒚𝒚
∑ 𝒙𝒙𝒊𝒊
𝟐𝟐−𝒏𝒏�
𝒙𝒙𝟐𝟐 c =
𝒄𝒄𝒄𝒄𝒄𝒄(𝒙𝒙; 𝒚𝒚)
𝒔𝒔𝒙𝒙
𝟐𝟐
Luego, la recta ℓ se escribe
𝒚𝒚 = �
𝒚𝒚 +
𝒄𝒄𝒐𝒐𝒗𝒗(𝒙𝒙; 𝒚𝒚)
𝒔𝒔𝒙𝒙
𝟐𝟐
𝒙𝒙 − �
𝒙𝒙

Más contenido relacionado

Similar a 06_Distribución_bidimensional.pdf

Instituto universitario politécnico estadistica ii
Instituto universitario politécnico estadistica iiInstituto universitario politécnico estadistica ii
Instituto universitario politécnico estadistica iiyessicasanchez232
 
análisis estadistico.pptx
análisis estadistico.pptxanálisis estadistico.pptx
análisis estadistico.pptxcarlosheredia87
 
CLASE-8 Regresión y correlación (dicotomicas).pdf
CLASE-8 Regresión y correlación (dicotomicas).pdfCLASE-8 Regresión y correlación (dicotomicas).pdf
CLASE-8 Regresión y correlación (dicotomicas).pdfjenniferps1
 
Presentacion 5 diapost_regresion-upg
Presentacion 5 diapost_regresion-upgPresentacion 5 diapost_regresion-upg
Presentacion 5 diapost_regresion-upgEdgar López
 
Utilicemos Proporcionalidad
Utilicemos ProporcionalidadUtilicemos Proporcionalidad
Utilicemos ProporcionalidadVidal Oved
 
Estadistica I Ii Bimestre
Estadistica I  Ii BimestreEstadistica I  Ii Bimestre
Estadistica I Ii Bimestrecarlina.cj
 
Presentacion 5 diapost_regresion-upg
Presentacion 5 diapost_regresion-upgPresentacion 5 diapost_regresion-upg
Presentacion 5 diapost_regresion-upgEdgar López
 
ESTADISTICA II (II Bimestre Abril agosto 2011)
ESTADISTICA II  (II Bimestre Abril agosto 2011)ESTADISTICA II  (II Bimestre Abril agosto 2011)
ESTADISTICA II (II Bimestre Abril agosto 2011)Videoconferencias UTPL
 
02 estadística bidimensional
02 estadística bidimensional02 estadística bidimensional
02 estadística bidimensionalklorofila
 

Similar a 06_Distribución_bidimensional.pdf (20)

Tarea 6
Tarea 6Tarea 6
Tarea 6
 
Instituto universitario politécnico estadistica ii
Instituto universitario politécnico estadistica iiInstituto universitario politécnico estadistica ii
Instituto universitario politécnico estadistica ii
 
análisis estadistico.pptx
análisis estadistico.pptxanálisis estadistico.pptx
análisis estadistico.pptx
 
CLASE-8 Regresión y correlación (dicotomicas).pdf
CLASE-8 Regresión y correlación (dicotomicas).pdfCLASE-8 Regresión y correlación (dicotomicas).pdf
CLASE-8 Regresión y correlación (dicotomicas).pdf
 
Presentacion 5 diapost_regresion-upg
Presentacion 5 diapost_regresion-upgPresentacion 5 diapost_regresion-upg
Presentacion 5 diapost_regresion-upg
 
Vectores y tensores para fenómenos de transporte
Vectores y tensores para fenómenos de transporteVectores y tensores para fenómenos de transporte
Vectores y tensores para fenómenos de transporte
 
Utilicemos Proporcionalidad
Utilicemos ProporcionalidadUtilicemos Proporcionalidad
Utilicemos Proporcionalidad
 
Prueba de Hipótesis.pdf
Prueba de Hipótesis.pdfPrueba de Hipótesis.pdf
Prueba de Hipótesis.pdf
 
Seminario 10 diapo pdf
Seminario 10 diapo pdfSeminario 10 diapo pdf
Seminario 10 diapo pdf
 
Seminario 10
Seminario 10Seminario 10
Seminario 10
 
Estadistica I
Estadistica IEstadistica I
Estadistica I
 
Estadistica I Ii Bimestre
Estadistica I  Ii BimestreEstadistica I  Ii Bimestre
Estadistica I Ii Bimestre
 
Presentacion 5 diapost_regresion-upg
Presentacion 5 diapost_regresion-upgPresentacion 5 diapost_regresion-upg
Presentacion 5 diapost_regresion-upg
 
ESTADISTICA II (II Bimestre Abril agosto 2011)
ESTADISTICA II  (II Bimestre Abril agosto 2011)ESTADISTICA II  (II Bimestre Abril agosto 2011)
ESTADISTICA II (II Bimestre Abril agosto 2011)
 
Clase 2
Clase 2Clase 2
Clase 2
 
Distribuciones Continuas de Probabilidad
Distribuciones Continuas de ProbabilidadDistribuciones Continuas de Probabilidad
Distribuciones Continuas de Probabilidad
 
Seminario 10 diapo
Seminario 10 diapoSeminario 10 diapo
Seminario 10 diapo
 
Seminario 10 diapo
Seminario 10 diapoSeminario 10 diapo
Seminario 10 diapo
 
Análisis estadístico.
Análisis estadístico.Análisis estadístico.
Análisis estadístico.
 
02 estadística bidimensional
02 estadística bidimensional02 estadística bidimensional
02 estadística bidimensional
 

Último

Tema 1 de la asignatura Sistema Fiscal Español I
Tema 1 de la asignatura Sistema Fiscal Español ITema 1 de la asignatura Sistema Fiscal Español I
Tema 1 de la asignatura Sistema Fiscal Español IBorjaFernndez28
 
Compañías aseguradoras presentacion power point
Compañías aseguradoras presentacion power pointCompañías aseguradoras presentacion power point
Compañías aseguradoras presentacion power pointAbiReyes18
 
El cheque 1 y sus tipos de cheque.pptx
El cheque  1 y sus tipos de  cheque.pptxEl cheque  1 y sus tipos de  cheque.pptx
El cheque 1 y sus tipos de cheque.pptxNathaliTAndradeS
 
PRUEBA PRE ICFES ECONOMIA. (4) - copia.doc
PRUEBA PRE ICFES ECONOMIA. (4) - copia.docPRUEBA PRE ICFES ECONOMIA. (4) - copia.doc
PRUEBA PRE ICFES ECONOMIA. (4) - copia.docmilumenko
 
Politicas publicas para el sector agropecuario en México.pptx
Politicas publicas para el sector agropecuario en México.pptxPoliticas publicas para el sector agropecuario en México.pptx
Politicas publicas para el sector agropecuario en México.pptxvladisse
 
Venezuela Entorno Social y Económico.pptx
Venezuela Entorno Social y Económico.pptxVenezuela Entorno Social y Económico.pptx
Venezuela Entorno Social y Económico.pptxJulioFernandez261824
 
Análisis de la Temporada Turística 2024 en Uruguay
Análisis de la Temporada Turística 2024 en UruguayAnálisis de la Temporada Turística 2024 en Uruguay
Análisis de la Temporada Turística 2024 en UruguayEXANTE
 
Situación Mercado Laboral y Desempleo.ppt
Situación Mercado Laboral y Desempleo.pptSituación Mercado Laboral y Desempleo.ppt
Situación Mercado Laboral y Desempleo.pptrubengpa
 
METODOS ESCALA SALARIAL EN ESTRUCTURAS.PPT
METODOS ESCALA SALARIAL EN ESTRUCTURAS.PPTMETODOS ESCALA SALARIAL EN ESTRUCTURAS.PPT
METODOS ESCALA SALARIAL EN ESTRUCTURAS.PPTrodrigolozanoortiz
 
44 RAZONES DE PORQUE SI ESTAMOS MAL (1).pdf
44 RAZONES DE PORQUE SI ESTAMOS MAL (1).pdf44 RAZONES DE PORQUE SI ESTAMOS MAL (1).pdf
44 RAZONES DE PORQUE SI ESTAMOS MAL (1).pdflupismdo
 
ejemplo de tesis para contabilidad- capitulos
ejemplo de tesis para contabilidad- capitulosejemplo de tesis para contabilidad- capitulos
ejemplo de tesis para contabilidad- capitulosguillencuevaadrianal
 
puntos-clave-de-la-reforma-pensional-2023.pdf
puntos-clave-de-la-reforma-pensional-2023.pdfpuntos-clave-de-la-reforma-pensional-2023.pdf
puntos-clave-de-la-reforma-pensional-2023.pdfosoriojuanpablo114
 
mercado de capitales universidad simon rodriguez - guanare (unidad I).pdf
mercado de capitales universidad simon rodriguez - guanare (unidad I).pdfmercado de capitales universidad simon rodriguez - guanare (unidad I).pdf
mercado de capitales universidad simon rodriguez - guanare (unidad I).pdfGegdielJose1
 
LOS MIMBRES HACEN EL CESTO: AGEING REPORT.
LOS MIMBRES HACEN EL CESTO: AGEING  REPORT.LOS MIMBRES HACEN EL CESTO: AGEING  REPORT.
LOS MIMBRES HACEN EL CESTO: AGEING REPORT.ManfredNolte
 
ejemplos de sistemas economicos en economia
ejemplos de sistemas economicos en economiaejemplos de sistemas economicos en economia
ejemplos de sistemas economicos en economiaKeiryMichelleMartine
 
Sistema de Control Interno aplicaciones en nuestra legislacion
Sistema de Control Interno aplicaciones en nuestra legislacionSistema de Control Interno aplicaciones en nuestra legislacion
Sistema de Control Interno aplicaciones en nuestra legislacionPedroSalasSantiago
 
Revista Estudiantil de la Carrera de Contaduría Pública de la Universidad May...
Revista Estudiantil de la Carrera de Contaduría Pública de la Universidad May...Revista Estudiantil de la Carrera de Contaduría Pública de la Universidad May...
Revista Estudiantil de la Carrera de Contaduría Pública de la Universidad May...VicenteAguirre15
 
UNIDAD 01 del area de comunicación 2do grado secundariax
UNIDAD 01 del area de comunicación 2do grado secundariaxUNIDAD 01 del area de comunicación 2do grado secundariax
UNIDAD 01 del area de comunicación 2do grado secundariaxLuzMaGuillenSalas
 
41 RAZONES DE PORQUE SI ESTAMOS MAL EN MÉXICO
41 RAZONES DE PORQUE SI ESTAMOS MAL EN MÉXICO41 RAZONES DE PORQUE SI ESTAMOS MAL EN MÉXICO
41 RAZONES DE PORQUE SI ESTAMOS MAL EN MÉXICOlupismdo
 

Último (20)

Tema 1 de la asignatura Sistema Fiscal Español I
Tema 1 de la asignatura Sistema Fiscal Español ITema 1 de la asignatura Sistema Fiscal Español I
Tema 1 de la asignatura Sistema Fiscal Español I
 
Mercado Eléctrico de Ecuador y España.pdf
Mercado Eléctrico de Ecuador y España.pdfMercado Eléctrico de Ecuador y España.pdf
Mercado Eléctrico de Ecuador y España.pdf
 
Compañías aseguradoras presentacion power point
Compañías aseguradoras presentacion power pointCompañías aseguradoras presentacion power point
Compañías aseguradoras presentacion power point
 
El cheque 1 y sus tipos de cheque.pptx
El cheque  1 y sus tipos de  cheque.pptxEl cheque  1 y sus tipos de  cheque.pptx
El cheque 1 y sus tipos de cheque.pptx
 
PRUEBA PRE ICFES ECONOMIA. (4) - copia.doc
PRUEBA PRE ICFES ECONOMIA. (4) - copia.docPRUEBA PRE ICFES ECONOMIA. (4) - copia.doc
PRUEBA PRE ICFES ECONOMIA. (4) - copia.doc
 
Politicas publicas para el sector agropecuario en México.pptx
Politicas publicas para el sector agropecuario en México.pptxPoliticas publicas para el sector agropecuario en México.pptx
Politicas publicas para el sector agropecuario en México.pptx
 
Venezuela Entorno Social y Económico.pptx
Venezuela Entorno Social y Económico.pptxVenezuela Entorno Social y Económico.pptx
Venezuela Entorno Social y Económico.pptx
 
Análisis de la Temporada Turística 2024 en Uruguay
Análisis de la Temporada Turística 2024 en UruguayAnálisis de la Temporada Turística 2024 en Uruguay
Análisis de la Temporada Turística 2024 en Uruguay
 
Situación Mercado Laboral y Desempleo.ppt
Situación Mercado Laboral y Desempleo.pptSituación Mercado Laboral y Desempleo.ppt
Situación Mercado Laboral y Desempleo.ppt
 
METODOS ESCALA SALARIAL EN ESTRUCTURAS.PPT
METODOS ESCALA SALARIAL EN ESTRUCTURAS.PPTMETODOS ESCALA SALARIAL EN ESTRUCTURAS.PPT
METODOS ESCALA SALARIAL EN ESTRUCTURAS.PPT
 
44 RAZONES DE PORQUE SI ESTAMOS MAL (1).pdf
44 RAZONES DE PORQUE SI ESTAMOS MAL (1).pdf44 RAZONES DE PORQUE SI ESTAMOS MAL (1).pdf
44 RAZONES DE PORQUE SI ESTAMOS MAL (1).pdf
 
ejemplo de tesis para contabilidad- capitulos
ejemplo de tesis para contabilidad- capitulosejemplo de tesis para contabilidad- capitulos
ejemplo de tesis para contabilidad- capitulos
 
puntos-clave-de-la-reforma-pensional-2023.pdf
puntos-clave-de-la-reforma-pensional-2023.pdfpuntos-clave-de-la-reforma-pensional-2023.pdf
puntos-clave-de-la-reforma-pensional-2023.pdf
 
mercado de capitales universidad simon rodriguez - guanare (unidad I).pdf
mercado de capitales universidad simon rodriguez - guanare (unidad I).pdfmercado de capitales universidad simon rodriguez - guanare (unidad I).pdf
mercado de capitales universidad simon rodriguez - guanare (unidad I).pdf
 
LOS MIMBRES HACEN EL CESTO: AGEING REPORT.
LOS MIMBRES HACEN EL CESTO: AGEING  REPORT.LOS MIMBRES HACEN EL CESTO: AGEING  REPORT.
LOS MIMBRES HACEN EL CESTO: AGEING REPORT.
 
ejemplos de sistemas economicos en economia
ejemplos de sistemas economicos en economiaejemplos de sistemas economicos en economia
ejemplos de sistemas economicos en economia
 
Sistema de Control Interno aplicaciones en nuestra legislacion
Sistema de Control Interno aplicaciones en nuestra legislacionSistema de Control Interno aplicaciones en nuestra legislacion
Sistema de Control Interno aplicaciones en nuestra legislacion
 
Revista Estudiantil de la Carrera de Contaduría Pública de la Universidad May...
Revista Estudiantil de la Carrera de Contaduría Pública de la Universidad May...Revista Estudiantil de la Carrera de Contaduría Pública de la Universidad May...
Revista Estudiantil de la Carrera de Contaduría Pública de la Universidad May...
 
UNIDAD 01 del area de comunicación 2do grado secundariax
UNIDAD 01 del area de comunicación 2do grado secundariaxUNIDAD 01 del area de comunicación 2do grado secundariax
UNIDAD 01 del area de comunicación 2do grado secundariax
 
41 RAZONES DE PORQUE SI ESTAMOS MAL EN MÉXICO
41 RAZONES DE PORQUE SI ESTAMOS MAL EN MÉXICO41 RAZONES DE PORQUE SI ESTAMOS MAL EN MÉXICO
41 RAZONES DE PORQUE SI ESTAMOS MAL EN MÉXICO
 

06_Distribución_bidimensional.pdf

  • 1. UNSCH Real, Pontificia y nacional UNIVERSIDAD NACIONAL DE SAN CRISTOBAL DE HUAMANGA DEPARTAMENTO ACADÉMICO DE MATEMÁTICA Y FÍSICA ESTADÍSTICA RIVERA GARAMENDI, Freddy ES-241 DISTRIBUCIÓN BIDIMENSIONALES REGRESIÓN LINEL
  • 2. RIVERA GARAMENDI, Freddy DISTRIBUCIONES BIDIMENSIONALES DISTRIBUCIÓN BIDIMENSIONAL ESTADÍSTICA En este caso, una muestra de tamaño (n) se representa como un conjunto de pares ordenados de la forma ( 𝑥𝑥1, 𝑦𝑦1 , 𝑥𝑥2, 𝑦𝑦2 , ….., 𝑥𝑥𝑛𝑛, 𝑦𝑦𝑛𝑛 . El par ordenado 𝑥𝑥𝑖𝑖, 𝑦𝑦𝑖𝑖 representa a la estatura y el peso de cada alumno 𝑥𝑥1, 𝑥𝑥2, …., 𝑥𝑥𝑛𝑛 son valores de la variable X, mientras que la representación de las estaturas; 𝑦𝑦1, 𝑦𝑦2, …., 𝑦𝑦𝑛𝑛 son valores de la variable Y, y representa los pesos. En las estadísticas bidimensionales no se trata de elegir dos variables cualesquiera, sino observaciones simultaneas de variables que tengan entre si alguna relación afinidad o dependencia. Las distribuciones bidimensionales de frecuencias que se requieren a la presentación en tablas de frecuencias y la reducción de datos bidimensionales a través del cálculo de estadígrafos o medidas de resumen. Estadísticamente en el caso bidimensional se puede considerar dos aspectos: Determinar a construir modelos para expresar y medir la relación o asociación entre dos variables.
  • 3. RIVERA GARAMENDI, Freddy DISTRIBUCIONES BIDIMENSIONALES ESTADÍSTICA En esta unidad llamaremos de manera general X a la primera variable, y Y a la segunda variable. En el caso bidimensional puede suceder que: • X discreta e Y nominal y viceversa. • X discreta e Y ordinal y viceversa. • X continua e Y nominal y viceversa. • X continua e Y ordinal y viceversa. • X discreta e Y discreta. • X continua e Y continua. • X discreta e Y continua y viceversa. • X nominal e Y nominal. • X ordinal e Y ordinal. • X nominal e Y ordinal y viceversa. Ambas variables CUANTITATIVAS. Ambas variables CUALITATIVAS. Una variable CUANTITATIVA y otra variable CUALITATIVA.
  • 4. RIVERA GARAMENDI, Freddy DISTRIBUCIONES BIDIMENSIONALES ESTADÍSTICA FRECUENCIA ABSOLUTA SIMMPLE Denotaremos como: Cuadro N° 01 𝑥𝑥𝑖𝑖, (𝑖𝑖 = 1𝑝𝑝), las distintas valores de X. con 𝑝𝑝 ≤ 𝑛𝑛 𝑦𝑦𝑗𝑗, (𝑗𝑗 = 1𝑞𝑞), las distintas valores de Y. con 𝑞𝑞 ≤ 𝑛𝑛 Las tablas bidimensionales de frecuencias se construyen colocando en el margen izquierdo las distintos valores de X y en el margen superior las distintos valores de Y, como se ve en la siguiente tabla. Cuadro de distribución bidimensional de frecuencia absoluta simple
  • 5. RIVERA GARAMENDI, Freddy DISTRIBUCIONES BIDIMENSIONALES ESTADÍSTICA Donde: 𝑛𝑛𝑖𝑖𝑖𝑖: Frecuencia absoluta del par 𝑥𝑥𝑖𝑖, 𝑦𝑦𝑖𝑖 , (𝑖𝑖 = 1𝑝𝑝; 𝑗𝑗 = 1𝑞𝑞 ) 𝑛𝑛𝑖𝑖∗: Frecuencia marginal del valor 𝑥𝑥𝑖𝑖 (𝑖𝑖 = 1𝑝𝑝 ) 𝑛𝑛∗𝑗𝑗: Frecuencia marginal del valor 𝑦𝑦𝑗𝑗, (𝑗𝑗 = 1𝑞𝑞 ) 𝑛𝑛 = � 𝑖𝑖=1 𝑝𝑝 � 𝑗𝑗=1 𝑞𝑞 𝑛𝑛𝑖𝑖𝑖𝑖 = � 𝑖𝑖=1 𝑝𝑝 𝑛𝑛𝑖𝑖∗ = � 𝑖𝑖=1 𝑞𝑞 𝑛𝑛∗𝑗𝑗 Número total de pares observado.
  • 6. RIVERA GARAMENDI, Freddy DISTRIBUCIONES BIDIMENSIONALES ESTADÍSTICA EJEMPLO En una muestra de 50 viviendas familiares se consideran como primera variable (X) el número de personas por vivienda y como segunda variable (Y) el número de habitaciones por vivienda. Los valore obtenidos fueron: 𝑋𝑋 6 4 6 5 5 6 5 6 8 7 7 6 9 5 5 5 9 7 8 4 4 6 5 5 4 𝑌𝑌 2 2 3 4 3 3 3 3 4 4 3 4 5 2 3 3 6 3 5 2 4 3 3 3 4 𝑋𝑋 9 6 5 8 5 5 9 4 7 7 5 5 4 7 9 6 7 4 7 4 6 6 9 6 5 𝑌𝑌 5 2 2 6 2 3 6 4 6 4 2 4 2 5 3 2 4 3 5 3 5 3 4 4 3 Elabore una tabla bidimensional de frecuencias y determinar sus frecuencias marginales.
  • 7. RIVERA GARAMENDI, Freddy DISTRIBUCIONES BIDIMENSIONALES ESTADÍSTICA X Y 4 5 6 7 8 9 2 3 4 5 6 3 2 3 0 0 4 8 2 0 0 3 5 2 1 0 𝑋𝑋 6 4 6 5 5 6 5 6 8 7 7 6 9 5 5 5 9 7 8 4 4 6 5 5 4 𝑌𝑌 2 2 3 4 3 3 3 3 4 4 3 4 5 2 3 3 6 3 5 2 4 3 3 3 4 𝑋𝑋 9 6 5 8 5 5 9 4 7 7 5 5 4 7 9 6 7 4 7 4 6 6 9 6 5 𝑌𝑌 5 2 2 6 2 3 6 4 6 4 2 4 2 5 3 2 4 3 5 3 5 3 4 4 3
  • 8. RIVERA GARAMENDI, Freddy DISTRIBUCIONES BIDIMENSIONALES ESTADÍSTICA X Y 2 3 4 5 6 𝑛𝑛𝑖𝑖� 4 3 2 3 0 0 8 5 4 8 2 0 0 14 6 3 5 2 1 0 11 7 0 2 3 2 1 8 8 0 0 1 1 1 3 9 0 1 1 2 2 6 𝑛𝑛�𝑗𝑗 10 18 12 6 4 50 X: número de personas por vivienda. 𝑛𝑛32: Y: Número de habitaciones por vivienda. 𝑛𝑛21: 𝑛𝑛21: Hay 5 viviendas, con 3 habitaciones y 6 personas por vivienda.. Hay 4 viviendas con 2 habitaciones cada uno y tienen 5 personas por vivienda. Hay 4 viviendas con 5 personas y 2 habitaciones.
  • 9. RIVERA GARAMENDI, Freddy DISTRIBUCIONES BIDIMENSIONALES ESTADÍSTICA Distribuciones marginales N° de personas por vivienda N° de viviendas 4 8 5 14 6 11 7 8 8 3 9 6 Total 50 N° de Habitaciones N° de viviendas 4 10 5 18 6 12 7 6 8 4 Total 50
  • 10. RIVERA GARAMENDI, Freddy DISTRIBUCIONES BIDIMENSIONALES ESTADÍSTICA En las distribuciones unidimensionales se expresan las frecuencias relativas por ℎ𝑖𝑖. En el caso bidimensional las frecuencias relativas se expresan se la siguiente manera: FRECUENCIA RELATIVA ℎ𝑖𝑖𝑖𝑖 = 𝑛𝑛𝑖𝑖𝑖𝑖 𝑛𝑛 ; 𝑡𝑡𝑡𝑡𝑡𝑡 𝑞𝑞𝑞𝑞𝑞𝑞 0 ≤ ℎ𝑖𝑖𝑖𝑖 ≤ 1 ℎ𝑖𝑖∗ = 𝑛𝑛𝑖𝑖� 𝑛𝑛 ; 𝑡𝑡𝑡𝑡𝑡𝑡 𝑞𝑞𝑞𝑞𝑞𝑞 0 ≤ ℎ𝑖𝑖� ≤ 1 ℎ∗𝑗𝑗 = 𝑛𝑛�𝑗𝑗 𝑛𝑛 ; 𝑡𝑡𝑡𝑡𝑡𝑡 𝑞𝑞𝑞𝑞𝑞𝑞 0 ≤ ℎ�𝑗𝑗 ≤ 1 frecuencias relativas marginal del valor 𝑥𝑥𝑖𝑖 (𝑖𝑖 = 1𝑝𝑝 ) frecuencias relativas marginal del valor 𝑦𝑦𝑗𝑗, (𝑗𝑗 = 1𝑞𝑞 )
  • 11. RIVERA GARAMENDI, Freddy DISTRIBUCIONES BIDIMENSIONALES ESTADÍSTICA Cuadro N°03 Distribución proporcional de números de personas y habitaciones por vivienda X Y 2 3 4 5 6 𝐡𝐡𝑖𝑖� 4 0.06 0.04 0.06 0.00 0.00 0.16 5 0.08 0.16 0.04 0.00 0.00 0.28 6 0.06 0.10 0.04 0.02 0.00 0.22 7 0.00 0.04 0.06 0.04 0.02 0.16 8 0.00 0.00 0.02 0.02 0.02 0.06 9 0.00 0.02 0.02 0.04 0.04 0.12 𝐡𝐡�𝑗𝑗 0.20 0.36 0.24 0.12 0.08 1.00
  • 12. RIVERA GARAMENDI, Freddy DISTRIBUCIONES BIDIMENSIONALES ESTADÍSTICA Distribuciones marginales de frecuencias relativas marginales N° de personas por vivienda N° de viviendas 𝒉𝒉𝒊𝒊∗ 4 8 0.16 5 14 0.28 6 11 0.22 7 8 0.16 8 3 0.09 9 6 0.12 total 50 1.00 N° de Habitaciones N° de viviendas 𝒉𝒉∗𝒋𝒋 4 10 0.20 5 18 0.36 6 12 0.24 7 6 0.12 8 4 0.08 total 50 1.00
  • 13. RIVERA GARAMENDI, Freddy DISTRIBUCIONES BIDIMENSIONALES ESTADÍSTICA X Y [268 − ⟩ 302 [302 − ⟩ 336 [336 − ⟩ 370 [370 − ⟩ 404 [404 − ⟩ 438 [438 − ⟩ 472 𝑛𝑛𝑖𝑖� [1 − ⟩ 5 4 0 0 0 0 0 4 [5 − ⟩ 9 1 3 2 0 0 0 6 [9 − ⟩ 13 6 2 1 0 0 0 9 [13 − ⟩ 17 1 4 1 0 0 0 6 [17 − ⟩ 21 0 4 3 1 0 0 8 [21 − ⟩ 25 1 2 0 0 0 0 3 [25 − ⟩ 29 0 0 1 0 1 2 4 𝑛𝑛�𝑗𝑗 13 15 8 1 1 2 40 𝑛𝑛42:. A continuación se indica el tiempo de servicios (en años) y los ingresos mensuales (en dólares) correspondiente a 40 trabajadores bancarios. EJEMPLO 𝑛𝑛53: 4 trabajadores tienen un tiempo de servicio entre 13 y 17y tiene un ingreso de 302 o menos de 336 dólares. 3 trabajadores tienen un tiempo de servicio de 17 o menos que 21 y tiene un ingreso de 336 o menos de 370 dólares.
  • 14. RIVERA GARAMENDI, Freddy DISTRIBUCIONES BIDIMENSIONALES ESTADÍSTICA Sexo(Y) Estado civil (X) Masculino Femenino Total Soltero 0.100 0.200 0.300 Casado 0.150 0.400 0.550 Viudo 0.050 0.025 0.075 Divorciado 0.025 0.050 0.075 Total 0.325 0.675 1.000 La siguiente tabla N° 03 muestra una distribución conjunta de trabajadores de una empresa por sexo según estado civil. Construya la distribución bidimensional de las frecuencias relativas EJEMPLO INTERPRETACIÓN: 𝑛𝑛11: 𝑛𝑛22: El 10% de los trabajadores son solteros y de sexo masculino. El 40% de los trabajadores son casados y de sexo femenino.
  • 15. RIVERA GARAMENDI, Freddy DISTRIBUCIONES BIDIMENSIONALES ESTADÍSTICA PROPIEDADES La suma de las frecuencias absoluta simple es igual al total, es decir: 1. � 𝑖𝑖=1 𝑝𝑝 � 𝑗𝑗=1 𝑞𝑞 𝑛𝑛𝑖𝑖𝑖𝑖 = 𝑛𝑛 2. La suma de las frecuencias relativas es igual a la unidad, es decir: � 𝑖𝑖=1 𝑝𝑝 � 𝑗𝑗=1 𝑞𝑞 ℎ𝑖𝑖𝑖𝑖 = 1 � 𝑖𝑖=1 𝑝𝑝 𝑛𝑛𝑖𝑖∗ = 𝑛𝑛 3. 4. � 𝑖𝑖=1 𝑞𝑞 𝑛𝑛∗𝑗𝑗 = 𝑛𝑛 5. � 𝑖𝑖=1 𝑝𝑝 ℎ𝑖𝑖∗ = 1 � 𝑖𝑖=1 𝑞𝑞 ℎ∗𝑗𝑗 = 1 6.
  • 16. RIVERA GARAMENDI, Freddy DISTRIBUCIONES BIDIMENSIONALES ESTADÍSTICA MEDIDAS ESTADÍSTICAS EN UNA DISTRIBUCIÓN BIDIMENSIONAL MEDIAS Medias y varianzas marginales. ̅ 𝑥𝑥 = ∑𝑖𝑖=1 𝑝𝑝 𝑥𝑥𝑖𝑖𝑛𝑛𝑖𝑖∗ 𝑛𝑛 � 𝑦𝑦 = ∑𝑖𝑖=1 𝑞𝑞 𝑦𝑦𝑖𝑖𝑛𝑛∗𝑗𝑗 𝑛𝑛 VARIANZA 𝑆𝑆𝑥𝑥 2 = ∑𝑖𝑖=1 𝑝𝑝 𝑥𝑥𝑖𝑖 − ̅ 𝑥𝑥 2 𝑛𝑛𝑖𝑖∗ 𝑛𝑛 𝑆𝑆𝑦𝑦 2 = ∑𝑖𝑖=1 𝑞𝑞 𝑥𝑥𝑖𝑖 − � 𝑦𝑦 2 𝑛𝑛∗𝑗𝑗 𝑛𝑛 COVARIANZA La covarianza detecta la existencia de algún tipo de relación lineal entre dos variables; si la covarianza es diferente de cero, entonces hay alguna relación o dependencia funcional entre las variables. 𝐶𝐶𝐶𝐶𝐶𝐶 𝑥𝑥, 𝑦𝑦 = ∑𝑖𝑖=1 𝑝𝑝 ∑𝑗𝑗=1 𝑞𝑞 𝑥𝑥𝑖𝑖𝑦𝑦𝑗𝑗𝑛𝑛𝑖𝑖𝑖𝑖 𝑛𝑛 − ∑𝑖𝑖=1 𝑝𝑝 𝑥𝑥𝑖𝑖𝑛𝑛𝑖𝑖∗ 𝑛𝑛 . ∑𝑗𝑗=1 𝑞𝑞 𝑦𝑦𝑗𝑗𝑛𝑛∗𝑗𝑗 𝑛𝑛 𝐶𝐶𝐶𝐶𝐶𝐶 𝑥𝑥, 𝑦𝑦 = ∑𝑖𝑖=1 𝑝𝑝 ∑𝑗𝑗=1 𝑞𝑞 𝑥𝑥𝑖𝑖𝑦𝑦𝑗𝑗 𝑛𝑛 − ∑𝑖𝑖=1 𝑝𝑝 𝑥𝑥𝑖𝑖 𝑛𝑛 . ∑𝑗𝑗=1 𝑞𝑞 𝑦𝑦𝑗𝑗 𝑛𝑛 PARA DATOS SIN AGRUPAR PARA DATOS AGRUPADOS
  • 17. RIVERA GARAMENDI, Freddy DISTRIBUCIONES BIDIMENSIONALES ESTADÍSTICA CORRELACIÓN LINEAL Se a dicho que la covarianza mide la relación lineal entre x e y. Para ilustrarlo. Dibujemos en los ejes coordenados los diagramas de dispersión. El inconveniente de la covarianza como medida de asociación lineal es su dependencia de las unidades de medida de las variables.
  • 18. RIVERA GARAMENDI, Freddy DISTRIBUCIONES BIDIMENSIONALES ESTADÍSTICA CORRELACIÓN LINEAL En consecuencia, para construir una medida adimensional, tendremos que dividir la covarianza por un término con sus mismas dimensiones. Si se divide por el producto de sus desviaciones típicas se define el coeficiente de correlación entre dos variables. ρ = 𝐶𝐶𝐶𝐶𝐶𝐶(𝑥𝑥, 𝑦𝑦) 𝑆𝑆𝑥𝑥𝑆𝑆𝑦𝑦 Donde: 𝑆𝑆𝑥𝑥 𝑆𝑆𝑦𝑦 Son las desviaciones típicas de x y de y respectivamente y PROPIEDAD Si existe una relación lineal exacta ente ambas variables y todos los puntos están en la línea y = 𝑎𝑎 + 𝑏𝑏𝑏𝑏, el coeficiente de correlación es igual a 1(si 𝑏𝑏 > 0) ó −1 (si 𝑏𝑏 < 0). Si no existe relación lineal exacta: −1 < ρ < 1, el cual representa el grado de asociación ρ = 0, cuando no hay ninguna correlación lineal entre x y y
  • 19. RIVERA GARAMENDI, Freddy DISTRIBUCIONES BIDIMENSIONALES ESTADÍSTICA EJEMPLO La tabla adjunta muestra la altura de un padre y un hijo (en metros). PADRE 1.65 1.60 1.70 1.63 1.73 1.57 1.80 1.93 1.73 1.70 1.75 1.78 HIJO 1.73 1.68 1.73 1.65 1.75 1.68 1.73 1.91 1.80 1.70 1.73 1.78 Calcule la covarianza de la estatura bajo el supuesto de que la estatura de un hijo es absolutamente independiente de la estatura del padre, indica el signo de la dependencia. Calcule el coeficiente de correlación. a. b. En la tabla calculamos todos los valores que necesitamos: PADRE(𝒙𝒙𝒊𝒊) HIJO(𝒚𝒚𝒊𝒊) 𝒙𝒙𝒊𝒊. 𝒚𝒚𝒊𝒊 𝒙𝒙𝒊𝒊 𝟐𝟐 𝒚𝒚𝒊𝒊 𝟐𝟐 1.65 1.73 2.85 2.72 2.99 1.6 1.68 2.69 2.56 2.82 1.7 1.73 2.94 2.89 2.99 1.63 1.65 2.69 2.66 2.72 1.73 1.75 3.03 2.99 3.06 1.57 1.68 2.64 2.46 2.82 1.8 1.73 3.11 3.24 2.99 1.93 1.91 3.69 3.72 3.65 1.73 1.8 3.11 2.99 3.24 1.7 1.7 2.89 2.89 2.89 1.75 1.73 3.03 3.06 2.99 1.78 1.78 3.17 3.17 3.17 20.57 20.87 35.84 35.37 36.35 SOLUCIÓN
  • 20. RIVERA GARAMENDI, Freddy DISTRIBUCIONES BIDIMENSIONALES ESTADÍSTICA MEDIA ̅ 𝑥𝑥 = ∑𝑖𝑖=1 𝑛𝑛 𝑥𝑥𝑖𝑖 𝑛𝑛 𝑆𝑆𝑥𝑥 2 = ∑𝑖𝑖=1 𝑛𝑛 𝑥𝑥𝑖𝑖 2 𝑛𝑛 − ̅ 𝑥𝑥2 � 𝑦𝑦 = ∑𝑖𝑖=1 𝑛𝑛 𝑦𝑦𝑖𝑖 𝑛𝑛 = 20.57 12 = 1.71 𝑚𝑚 = 1.74 𝑚𝑚 = 20.87 12 VARIANZA 𝑆𝑆𝑦𝑦 2 = ∑𝑖𝑖=1 𝑛𝑛 𝑦𝑦𝑖𝑖 2 𝑛𝑛 − � 𝑦𝑦2 = 35.37 12 − 1.71 2 = 0.009 𝑚𝑚2 = 36.35 12 − 1.74 2 = 0.004 𝑚𝑚2 COVARIANZA 𝐶𝐶𝐶𝐶𝐶𝐶 𝑥𝑥, 𝑦𝑦 = ∑𝑖𝑖=1 𝑛𝑛 𝑥𝑥𝑖𝑖. 𝑦𝑦𝑖𝑖 𝑛𝑛 − ̅ 𝑥𝑥. � 𝑦𝑦 Este valor indica una dependencia positiva directa, ya que la covarianza nos da también el signo de la relación. = 0.005 = 35.84 12 − 1.71 1.74 𝜌𝜌 = 𝑐𝑐𝑜𝑜𝑣𝑣(𝑥𝑥; 𝑦𝑦) 𝑠𝑠𝑥𝑥. 𝑠𝑠𝑦𝑦 Calculemos, el coeficiente de correlación es: Correlación con alto grado de asociación, ya que 𝜌𝜌 ≠ 0 −1 < 𝜌𝜌 < 1 . = 0.005 0.009 0.004 = 0.86 Para ver el grado de dependencia debemos considerar 𝜌𝜌2 es decir 𝜌𝜌2 𝝆𝝆𝟐𝟐 es llamado coeficiente de determinación = 0.86 2 = 0.75 es indica que el 75% de la variación de las estaturas de los hijos viene explicada por la estatura de los padre. (existe relación lineal) −𝟏𝟏. 𝟎𝟎 −𝟎𝟎. 𝟓𝟓 −𝟎𝟎. 𝟑𝟑 −𝟎𝟎. 𝟏𝟏 𝟎𝟎 𝟏𝟏. 𝟎𝟎 𝟎𝟎. 𝟓𝟓 𝟎𝟎. 𝟑𝟑 𝟎𝟎. 𝟏𝟏 Fuerte Fuerte moderado moderado Débil Débil Ninguna o muy débil
  • 21. RIVERA GARAMENDI, Freddy DISTRIBUCIONES BIDIMENSIONALES ESTADÍSTICA REGRESIÓN LINEAL SIMPLE 𝒚𝒚 = 𝜷𝜷𝒐𝒐 + 𝜷𝜷𝟏𝟏𝒙𝒙 , 𝛽𝛽𝑜𝑜 𝛽𝛽1 Son constantes y La regresión tiene dos significados: uno surge de la distribución conjunta de probabilidad de dos variables aleatorias; el segundo empírico nace de la necesidad de ajustar alguna función a un conjunto de datos Se llama regresión lineal simple de y en x. El valor 𝛽𝛽𝑜𝑜 se llama ordenada en el origen, puesto que es el punto en que la línea recta corta al eje Y. La pendiente de la recta se mide por 𝛽𝛽1, que da el cambio en y por unidad de cambio en el valor de x. El signo de 𝛽𝛽1 también indica el tipo de relación entre x e y. ESTIMACIÓN POR EL MÉTODO DE MÍNIMOS CUADRADOS Una tarea principal en el análisis de regresión, es estimar los parámetros 𝜷𝜷𝒐𝒐 y 𝜷𝜷𝟏𝟏de la recta ℓ: 𝑦𝑦 = 𝛽𝛽𝑜𝑜 + 𝛽𝛽1𝑥𝑥 basándonos en los datos muéstrales formado por los pares 𝑥𝑥1; 𝑦𝑦1 , 𝑥𝑥2; 𝑦𝑦2 ; 𝑥𝑥3𝑦𝑦3 ; ⋯ ; 𝑥𝑥𝑛𝑛𝑦𝑦𝑛𝑛 El método de mínimos cuadrados consiste en hallar la recta ℓ de tal manera que la suma de los cuadrados de las diferencias de las ordenadas de puntos observados 𝑥𝑥𝑖𝑖𝑦𝑦𝑖𝑖 y los puntos de la recta sean mínimo. Es decir se trata de hallar 𝜷𝜷𝒐𝒐 y 𝜷𝜷𝟏𝟏de tal manera que
  • 22. RIVERA GARAMENDI, Freddy DISTRIBUCIONES BIDIMENSIONALES ESTADÍSTICA nota Si los datos están tabuladas las expresiones de las ecuaciones normales aparecerán multiplicado por sus respectivas frecuencias absolutas. Llamada recta de mínimos cuadrados de 𝒚𝒚 en 𝒙𝒙 Resolviendo el sistema de ecuaciones normales para 𝜷𝜷𝒐𝒐 y 𝜷𝜷𝟏𝟏 obtenemos: 𝜷𝜷𝒐𝒐 = � 𝒚𝒚 + 𝜷𝜷𝟏𝟏� 𝒙𝒙 𝜷𝜷𝟏𝟏 = ∑ 𝒙𝒙𝒊𝒊𝒚𝒚𝒊𝒊−𝒏𝒏� 𝒙𝒙.� 𝒚𝒚 ∑ 𝒙𝒙𝒊𝒊 𝟐𝟐−𝒏𝒏� 𝒙𝒙𝟐𝟐 c = 𝒄𝒄𝒄𝒄𝒄𝒄(𝒙𝒙; 𝒚𝒚) 𝒔𝒔𝒙𝒙 𝟐𝟐 Luego, la recta ℓ se escribe 𝒚𝒚 = � 𝒚𝒚 + 𝒄𝒄𝒐𝒐𝒗𝒗(𝒙𝒙; 𝒚𝒚) 𝒔𝒔𝒙𝒙 𝟐𝟐 𝒙𝒙 − � 𝒙𝒙
  • 23. RIVERA GARAMENDI, Freddy DISTRIBUCIONES BIDIMENSIONALES ESTADÍSTICA EJEMPLO Si los datos están tabuladas las expresiones de las ecuaciones normales aparecerán multiplicado por sus respectivas frecuencias absolutas. Llamada recta de mínimos cuadrados de 𝒚𝒚 en 𝒙𝒙 Resolviendo el sistema de ecuaciones normales para 𝜷𝜷𝒐𝒐 y 𝜷𝜷𝟏𝟏 obtenemos: 𝜷𝜷𝒐𝒐 = � 𝒚𝒚 − 𝜷𝜷𝟏𝟏� 𝒙𝒙 𝜷𝜷𝟏𝟏 = ∑ 𝒙𝒙𝒊𝒊𝒚𝒚𝒊𝒊−𝒏𝒏� 𝒙𝒙.� 𝒚𝒚 ∑ 𝒙𝒙𝒊𝒊 𝟐𝟐−𝒏𝒏� 𝒙𝒙𝟐𝟐 c = 𝒄𝒄𝒄𝒄𝒄𝒄(𝒙𝒙; 𝒚𝒚) 𝒔𝒔𝒙𝒙 𝟐𝟐 Luego, la recta ℓ se escribe 𝒚𝒚 = � 𝒚𝒚 + 𝒄𝒄𝒐𝒐𝒗𝒗(𝒙𝒙; 𝒚𝒚) 𝒔𝒔𝒙𝒙 𝟐𝟐 𝒙𝒙 − � 𝒙𝒙