1. UNSCH
Real, Pontificia y nacional
UNIVERSIDAD NACIONAL DE SAN CRISTOBAL DE HUAMANGA
DEPARTAMENTO ACADÉMICO
DE MATEMÁTICA Y FÍSICA
ESTADÍSTICA
RIVERA GARAMENDI, Freddy
ES-241
DISTRIBUCIÓN BIDIMENSIONALES
REGRESIÓN LINEL
2. RIVERA GARAMENDI, Freddy
DISTRIBUCIONES BIDIMENSIONALES
DISTRIBUCIÓN BIDIMENSIONAL
ESTADÍSTICA
En este caso, una muestra de tamaño (n) se representa como un conjunto de pares ordenados de
la forma ( 𝑥𝑥1, 𝑦𝑦1 , 𝑥𝑥2, 𝑦𝑦2 , ….., 𝑥𝑥𝑛𝑛, 𝑦𝑦𝑛𝑛 . El par ordenado 𝑥𝑥𝑖𝑖, 𝑦𝑦𝑖𝑖 representa a la estatura y el peso
de cada alumno 𝑥𝑥1, 𝑥𝑥2, …., 𝑥𝑥𝑛𝑛 son valores de la variable X, mientras que la representación de las
estaturas; 𝑦𝑦1, 𝑦𝑦2, …., 𝑦𝑦𝑛𝑛 son valores de la variable Y, y representa los pesos.
En las estadísticas bidimensionales no se trata de elegir dos variables cualesquiera, sino
observaciones simultaneas de variables que tengan entre si alguna relación afinidad o
dependencia.
Las distribuciones bidimensionales de frecuencias que se requieren a la presentación en tablas
de frecuencias y la reducción de datos bidimensionales a través del cálculo de estadígrafos o
medidas de resumen.
Estadísticamente en el caso bidimensional se puede considerar dos aspectos:
Determinar a construir modelos para expresar y medir la relación o asociación entre dos
variables.
3. RIVERA GARAMENDI, Freddy
DISTRIBUCIONES BIDIMENSIONALES ESTADÍSTICA
En esta unidad llamaremos de manera general X a la primera variable, y Y a la segunda variable. En el caso
bidimensional puede suceder que:
• X discreta e Y nominal y viceversa.
• X discreta e Y ordinal y viceversa.
• X continua e Y nominal y viceversa.
• X continua e Y ordinal y viceversa.
• X discreta e Y discreta.
• X continua e Y continua.
• X discreta e Y continua y viceversa.
• X nominal e Y nominal.
• X ordinal e Y ordinal.
• X nominal e Y ordinal y viceversa.
Ambas variables CUANTITATIVAS.
Ambas variables CUALITATIVAS.
Una variable CUANTITATIVA y otra variable CUALITATIVA.
4. RIVERA GARAMENDI, Freddy
DISTRIBUCIONES BIDIMENSIONALES ESTADÍSTICA
FRECUENCIA ABSOLUTA SIMMPLE
Denotaremos como:
Cuadro N° 01
𝑥𝑥𝑖𝑖, (𝑖𝑖 = 1𝑝𝑝), las distintas valores de X. con 𝑝𝑝 ≤ 𝑛𝑛 𝑦𝑦𝑗𝑗, (𝑗𝑗 = 1𝑞𝑞), las distintas valores de Y. con 𝑞𝑞 ≤ 𝑛𝑛
Las tablas bidimensionales de frecuencias se construyen colocando en el margen izquierdo las distintos valores de X
y en el margen superior las distintos valores de Y, como se ve en la siguiente tabla.
Cuadro de distribución bidimensional de frecuencia absoluta simple
5. RIVERA GARAMENDI, Freddy
DISTRIBUCIONES BIDIMENSIONALES ESTADÍSTICA
Donde:
𝑛𝑛𝑖𝑖𝑖𝑖: Frecuencia absoluta del par 𝑥𝑥𝑖𝑖, 𝑦𝑦𝑖𝑖 , (𝑖𝑖 = 1𝑝𝑝; 𝑗𝑗 = 1𝑞𝑞 )
𝑛𝑛𝑖𝑖∗: Frecuencia marginal del valor 𝑥𝑥𝑖𝑖 (𝑖𝑖 = 1𝑝𝑝 )
𝑛𝑛∗𝑗𝑗: Frecuencia marginal del valor 𝑦𝑦𝑗𝑗, (𝑗𝑗 = 1𝑞𝑞 )
𝑛𝑛 = �
𝑖𝑖=1
𝑝𝑝
�
𝑗𝑗=1
𝑞𝑞
𝑛𝑛𝑖𝑖𝑖𝑖 = �
𝑖𝑖=1
𝑝𝑝
𝑛𝑛𝑖𝑖∗ = �
𝑖𝑖=1
𝑞𝑞
𝑛𝑛∗𝑗𝑗 Número total de pares observado.
6. RIVERA GARAMENDI, Freddy
DISTRIBUCIONES BIDIMENSIONALES ESTADÍSTICA
EJEMPLO
En una muestra de 50 viviendas familiares se consideran como primera variable (X) el número de personas por vivienda
y como segunda variable (Y) el número de habitaciones por vivienda. Los valore obtenidos fueron:
𝑋𝑋 6 4 6 5 5 6 5 6 8 7 7 6 9 5 5 5 9 7 8 4 4 6 5 5 4
𝑌𝑌 2 2 3 4 3 3 3 3 4 4 3 4 5 2 3 3 6 3 5 2 4 3 3 3 4
𝑋𝑋 9 6 5 8 5 5 9 4 7 7 5 5 4 7 9 6 7 4 7 4 6 6 9 6 5
𝑌𝑌 5 2 2 6 2 3 6 4 6 4 2 4 2 5 3 2 4 3 5 3 5 3 4 4 3
Elabore una tabla bidimensional de frecuencias y determinar sus frecuencias marginales.
8. RIVERA GARAMENDI, Freddy
DISTRIBUCIONES BIDIMENSIONALES ESTADÍSTICA
X Y 2 3 4 5 6 𝑛𝑛𝑖𝑖�
4 3 2 3 0 0 8
5 4 8 2 0 0 14
6 3 5 2 1 0 11
7 0 2 3 2 1 8
8 0 0 1 1 1 3
9 0 1 1 2 2 6
𝑛𝑛�𝑗𝑗 10 18 12 6 4 50
X: número de personas por vivienda.
𝑛𝑛32:
Y: Número de habitaciones por vivienda.
𝑛𝑛21:
𝑛𝑛21:
Hay 5 viviendas, con 3 habitaciones y 6 personas por vivienda..
Hay 4 viviendas con 2 habitaciones cada uno y tienen 5 personas por vivienda.
Hay 4 viviendas con 5 personas y 2 habitaciones.
9. RIVERA GARAMENDI, Freddy
DISTRIBUCIONES BIDIMENSIONALES ESTADÍSTICA
Distribuciones marginales
N° de personas
por vivienda
N° de viviendas
4 8
5 14
6 11
7 8
8 3
9 6
Total 50
N° de
Habitaciones
N° de viviendas
4 10
5 18
6 12
7 6
8 4
Total 50
10. RIVERA GARAMENDI, Freddy
DISTRIBUCIONES BIDIMENSIONALES ESTADÍSTICA
En las distribuciones unidimensionales se expresan las frecuencias relativas por ℎ𝑖𝑖. En el caso bidimensional las
frecuencias relativas se expresan se la siguiente manera:
FRECUENCIA RELATIVA
ℎ𝑖𝑖𝑖𝑖 =
𝑛𝑛𝑖𝑖𝑖𝑖
𝑛𝑛
; 𝑡𝑡𝑡𝑡𝑡𝑡 𝑞𝑞𝑞𝑞𝑞𝑞 0 ≤ ℎ𝑖𝑖𝑖𝑖 ≤ 1
ℎ𝑖𝑖∗ =
𝑛𝑛𝑖𝑖�
𝑛𝑛
; 𝑡𝑡𝑡𝑡𝑡𝑡 𝑞𝑞𝑞𝑞𝑞𝑞 0 ≤ ℎ𝑖𝑖� ≤ 1
ℎ∗𝑗𝑗 =
𝑛𝑛�𝑗𝑗
𝑛𝑛
; 𝑡𝑡𝑡𝑡𝑡𝑡 𝑞𝑞𝑞𝑞𝑞𝑞 0 ≤ ℎ�𝑗𝑗 ≤ 1
frecuencias relativas marginal del valor 𝑥𝑥𝑖𝑖 (𝑖𝑖 = 1𝑝𝑝 )
frecuencias relativas marginal del valor 𝑦𝑦𝑗𝑗, (𝑗𝑗 = 1𝑞𝑞 )
12. RIVERA GARAMENDI, Freddy
DISTRIBUCIONES BIDIMENSIONALES ESTADÍSTICA
Distribuciones marginales de frecuencias relativas marginales
N° de personas
por vivienda
N° de
viviendas
𝒉𝒉𝒊𝒊∗
4 8 0.16
5 14 0.28
6 11 0.22
7 8 0.16
8 3 0.09
9 6 0.12
total 50 1.00
N° de
Habitaciones
N° de
viviendas
𝒉𝒉∗𝒋𝒋
4 10 0.20
5 18 0.36
6 12 0.24
7 6 0.12
8 4 0.08
total 50 1.00
13. RIVERA GARAMENDI, Freddy
DISTRIBUCIONES BIDIMENSIONALES ESTADÍSTICA
X Y [268 − ⟩
302 [302 − ⟩
336 [336 − ⟩
370 [370 − ⟩
404 [404 − ⟩
438 [438 − ⟩
472 𝑛𝑛𝑖𝑖�
[1 − ⟩
5 4 0 0 0 0 0 4
[5 − ⟩
9 1 3 2 0 0 0 6
[9 − ⟩
13 6 2 1 0 0 0 9
[13 − ⟩
17 1 4 1 0 0 0 6
[17 − ⟩
21 0 4 3 1 0 0 8
[21 − ⟩
25 1 2 0 0 0 0 3
[25 − ⟩
29 0 0 1 0 1 2 4
𝑛𝑛�𝑗𝑗 13 15 8 1 1 2 40
𝑛𝑛42:.
A continuación se indica el tiempo de servicios (en años) y los ingresos mensuales (en dólares) correspondiente
a 40 trabajadores bancarios.
EJEMPLO
𝑛𝑛53:
4 trabajadores tienen un tiempo de servicio entre 13 y 17y tiene un ingreso de 302 o menos de 336 dólares.
3 trabajadores tienen un tiempo de servicio de 17 o menos que 21 y tiene un ingreso de 336 o menos de
370 dólares.
14. RIVERA GARAMENDI, Freddy
DISTRIBUCIONES BIDIMENSIONALES ESTADÍSTICA
Sexo(Y) Estado civil (X) Masculino Femenino Total
Soltero 0.100 0.200 0.300
Casado 0.150 0.400 0.550
Viudo 0.050 0.025 0.075
Divorciado 0.025 0.050 0.075
Total 0.325 0.675 1.000
La siguiente tabla N° 03 muestra una distribución conjunta de trabajadores de una empresa por sexo
según estado civil. Construya la distribución bidimensional de las frecuencias relativas
EJEMPLO
INTERPRETACIÓN:
𝑛𝑛11:
𝑛𝑛22:
El 10% de los trabajadores son solteros y de sexo masculino.
El 40% de los trabajadores son casados y de sexo femenino.
15. RIVERA GARAMENDI, Freddy
DISTRIBUCIONES BIDIMENSIONALES ESTADÍSTICA
PROPIEDADES
La suma de las frecuencias absoluta simple es igual al total, es decir:
1. �
𝑖𝑖=1
𝑝𝑝
�
𝑗𝑗=1
𝑞𝑞
𝑛𝑛𝑖𝑖𝑖𝑖 = 𝑛𝑛
2. La suma de las frecuencias relativas es igual a la unidad, es decir:
�
𝑖𝑖=1
𝑝𝑝
�
𝑗𝑗=1
𝑞𝑞
ℎ𝑖𝑖𝑖𝑖 = 1
�
𝑖𝑖=1
𝑝𝑝
𝑛𝑛𝑖𝑖∗ = 𝑛𝑛
3.
4. �
𝑖𝑖=1
𝑞𝑞
𝑛𝑛∗𝑗𝑗 = 𝑛𝑛
5. �
𝑖𝑖=1
𝑝𝑝
ℎ𝑖𝑖∗ = 1
�
𝑖𝑖=1
𝑞𝑞
ℎ∗𝑗𝑗 = 1
6.
16. RIVERA GARAMENDI, Freddy
DISTRIBUCIONES BIDIMENSIONALES ESTADÍSTICA
MEDIDAS ESTADÍSTICAS EN UNA DISTRIBUCIÓN BIDIMENSIONAL
MEDIAS
Medias y varianzas marginales.
̅
𝑥𝑥 =
∑𝑖𝑖=1
𝑝𝑝
𝑥𝑥𝑖𝑖𝑛𝑛𝑖𝑖∗
𝑛𝑛
�
𝑦𝑦 =
∑𝑖𝑖=1
𝑞𝑞
𝑦𝑦𝑖𝑖𝑛𝑛∗𝑗𝑗
𝑛𝑛
VARIANZA
𝑆𝑆𝑥𝑥
2
=
∑𝑖𝑖=1
𝑝𝑝
𝑥𝑥𝑖𝑖 − ̅
𝑥𝑥 2
𝑛𝑛𝑖𝑖∗
𝑛𝑛
𝑆𝑆𝑦𝑦
2
=
∑𝑖𝑖=1
𝑞𝑞
𝑥𝑥𝑖𝑖 − �
𝑦𝑦 2
𝑛𝑛∗𝑗𝑗
𝑛𝑛
COVARIANZA
La covarianza detecta la existencia de algún tipo de relación lineal entre dos variables; si la covarianza es diferente
de cero, entonces hay alguna relación o dependencia funcional entre las variables.
𝐶𝐶𝐶𝐶𝐶𝐶 𝑥𝑥, 𝑦𝑦 =
∑𝑖𝑖=1
𝑝𝑝
∑𝑗𝑗=1
𝑞𝑞
𝑥𝑥𝑖𝑖𝑦𝑦𝑗𝑗𝑛𝑛𝑖𝑖𝑖𝑖
𝑛𝑛
−
∑𝑖𝑖=1
𝑝𝑝
𝑥𝑥𝑖𝑖𝑛𝑛𝑖𝑖∗
𝑛𝑛
.
∑𝑗𝑗=1
𝑞𝑞
𝑦𝑦𝑗𝑗𝑛𝑛∗𝑗𝑗
𝑛𝑛
𝐶𝐶𝐶𝐶𝐶𝐶 𝑥𝑥, 𝑦𝑦 =
∑𝑖𝑖=1
𝑝𝑝
∑𝑗𝑗=1
𝑞𝑞
𝑥𝑥𝑖𝑖𝑦𝑦𝑗𝑗
𝑛𝑛
−
∑𝑖𝑖=1
𝑝𝑝
𝑥𝑥𝑖𝑖
𝑛𝑛
.
∑𝑗𝑗=1
𝑞𝑞
𝑦𝑦𝑗𝑗
𝑛𝑛
PARA DATOS SIN AGRUPAR PARA DATOS AGRUPADOS
17. RIVERA GARAMENDI, Freddy
DISTRIBUCIONES BIDIMENSIONALES ESTADÍSTICA
CORRELACIÓN LINEAL
Se a dicho que la covarianza mide la relación lineal entre x e y. Para ilustrarlo. Dibujemos en los ejes coordenados
los diagramas de dispersión.
El inconveniente de la covarianza como medida de asociación lineal es su dependencia de las unidades de medida
de las variables.
18. RIVERA GARAMENDI, Freddy
DISTRIBUCIONES BIDIMENSIONALES ESTADÍSTICA
CORRELACIÓN LINEAL
En consecuencia, para construir una medida adimensional, tendremos que dividir la covarianza por un término con
sus mismas dimensiones. Si se divide por el producto de sus desviaciones típicas se define el coeficiente de
correlación entre dos variables.
ρ =
𝐶𝐶𝐶𝐶𝐶𝐶(𝑥𝑥, 𝑦𝑦)
𝑆𝑆𝑥𝑥𝑆𝑆𝑦𝑦
Donde: 𝑆𝑆𝑥𝑥 𝑆𝑆𝑦𝑦 Son las desviaciones típicas de x y de y respectivamente
y
PROPIEDAD
Si existe una relación lineal exacta ente ambas variables y todos los puntos están en la línea y = 𝑎𝑎 + 𝑏𝑏𝑏𝑏, el
coeficiente de correlación es igual a 1(si 𝑏𝑏 > 0) ó −1 (si 𝑏𝑏 < 0).
Si no existe relación lineal exacta: −1 < ρ < 1, el cual representa el grado de asociación
ρ = 0, cuando no hay ninguna correlación lineal entre x y y
19. RIVERA GARAMENDI, Freddy
DISTRIBUCIONES BIDIMENSIONALES ESTADÍSTICA
EJEMPLO La tabla adjunta muestra la altura de un padre y un hijo (en metros).
PADRE 1.65 1.60 1.70 1.63 1.73 1.57 1.80 1.93 1.73 1.70 1.75 1.78
HIJO 1.73 1.68 1.73 1.65 1.75 1.68 1.73 1.91 1.80 1.70 1.73 1.78
Calcule la covarianza de la estatura bajo el supuesto de que la estatura de un hijo es absolutamente
independiente de la estatura del padre, indica el signo de la dependencia.
Calcule el coeficiente de correlación.
a.
b.
En la tabla calculamos todos los valores que necesitamos:
PADRE(𝒙𝒙𝒊𝒊) HIJO(𝒚𝒚𝒊𝒊) 𝒙𝒙𝒊𝒊. 𝒚𝒚𝒊𝒊 𝒙𝒙𝒊𝒊
𝟐𝟐
𝒚𝒚𝒊𝒊
𝟐𝟐
1.65 1.73 2.85 2.72 2.99
1.6 1.68 2.69 2.56 2.82
1.7 1.73 2.94 2.89 2.99
1.63 1.65 2.69 2.66 2.72
1.73 1.75 3.03 2.99 3.06
1.57 1.68 2.64 2.46 2.82
1.8 1.73 3.11 3.24 2.99
1.93 1.91 3.69 3.72 3.65
1.73 1.8 3.11 2.99 3.24
1.7 1.7 2.89 2.89 2.89
1.75 1.73 3.03 3.06 2.99
1.78 1.78 3.17 3.17 3.17
20.57 20.87 35.84 35.37 36.35
SOLUCIÓN
20. RIVERA GARAMENDI, Freddy
DISTRIBUCIONES BIDIMENSIONALES ESTADÍSTICA
MEDIA
̅
𝑥𝑥 =
∑𝑖𝑖=1
𝑛𝑛
𝑥𝑥𝑖𝑖
𝑛𝑛 𝑆𝑆𝑥𝑥
2
=
∑𝑖𝑖=1
𝑛𝑛
𝑥𝑥𝑖𝑖
2
𝑛𝑛
− ̅
𝑥𝑥2
�
𝑦𝑦 =
∑𝑖𝑖=1
𝑛𝑛
𝑦𝑦𝑖𝑖
𝑛𝑛
=
20.57
12
= 1.71 𝑚𝑚
= 1.74 𝑚𝑚
=
20.87
12
VARIANZA
𝑆𝑆𝑦𝑦
2
=
∑𝑖𝑖=1
𝑛𝑛
𝑦𝑦𝑖𝑖
2
𝑛𝑛
− �
𝑦𝑦2
=
35.37
12
− 1.71 2 = 0.009 𝑚𝑚2
=
36.35
12
− 1.74 2
= 0.004 𝑚𝑚2
COVARIANZA
𝐶𝐶𝐶𝐶𝐶𝐶 𝑥𝑥, 𝑦𝑦 =
∑𝑖𝑖=1
𝑛𝑛
𝑥𝑥𝑖𝑖. 𝑦𝑦𝑖𝑖
𝑛𝑛
− ̅
𝑥𝑥. �
𝑦𝑦
Este valor indica una dependencia positiva directa, ya que la covarianza nos da también el signo de la relación.
= 0.005
=
35.84
12
− 1.71 1.74
𝜌𝜌 =
𝑐𝑐𝑜𝑜𝑣𝑣(𝑥𝑥; 𝑦𝑦)
𝑠𝑠𝑥𝑥. 𝑠𝑠𝑦𝑦
Calculemos, el coeficiente de correlación es:
Correlación con alto grado de asociación, ya que 𝜌𝜌 ≠ 0 −1 < 𝜌𝜌 < 1 .
=
0.005
0.009 0.004
= 0.86
Para ver el grado de dependencia debemos considerar 𝜌𝜌2
es decir 𝜌𝜌2
𝝆𝝆𝟐𝟐
es llamado coeficiente de determinación
= 0.86 2
= 0.75
es indica que el 75% de la variación de las estaturas de los hijos viene explicada por la estatura de los padre.
(existe relación lineal)
−𝟏𝟏. 𝟎𝟎 −𝟎𝟎. 𝟓𝟓 −𝟎𝟎. 𝟑𝟑 −𝟎𝟎. 𝟏𝟏 𝟎𝟎 𝟏𝟏. 𝟎𝟎
𝟎𝟎. 𝟓𝟓
𝟎𝟎. 𝟑𝟑
𝟎𝟎. 𝟏𝟏
Fuerte Fuerte
moderado moderado
Débil Débil
Ninguna o muy débil
21. RIVERA GARAMENDI, Freddy
DISTRIBUCIONES BIDIMENSIONALES ESTADÍSTICA
REGRESIÓN LINEAL SIMPLE
𝒚𝒚 = 𝜷𝜷𝒐𝒐 + 𝜷𝜷𝟏𝟏𝒙𝒙 , 𝛽𝛽𝑜𝑜 𝛽𝛽1 Son constantes
y
La regresión tiene dos significados: uno surge de la distribución conjunta de probabilidad de dos variables
aleatorias; el segundo empírico nace de la necesidad de ajustar alguna función a un conjunto de datos
Se llama regresión lineal simple de y en x. El valor 𝛽𝛽𝑜𝑜 se llama ordenada en el origen, puesto que es el punto
en que la línea recta corta al eje Y. La pendiente de la recta se mide por 𝛽𝛽1, que da el cambio en y por unidad
de cambio en el valor de x. El signo de 𝛽𝛽1 también indica el tipo de relación entre x e y.
ESTIMACIÓN POR EL MÉTODO DE MÍNIMOS CUADRADOS
Una tarea principal en el análisis de regresión, es estimar los parámetros 𝜷𝜷𝒐𝒐 y 𝜷𝜷𝟏𝟏de la recta ℓ: 𝑦𝑦 = 𝛽𝛽𝑜𝑜 + 𝛽𝛽1𝑥𝑥
basándonos en los datos muéstrales formado por los pares 𝑥𝑥1; 𝑦𝑦1 , 𝑥𝑥2; 𝑦𝑦2 ; 𝑥𝑥3𝑦𝑦3 ; ⋯ ; 𝑥𝑥𝑛𝑛𝑦𝑦𝑛𝑛
El método de mínimos cuadrados consiste en hallar la recta ℓ de tal manera que la suma de los cuadrados de las
diferencias de las ordenadas de puntos observados 𝑥𝑥𝑖𝑖𝑦𝑦𝑖𝑖 y los puntos de la recta sean mínimo. Es decir se trata
de hallar 𝜷𝜷𝒐𝒐 y 𝜷𝜷𝟏𝟏de tal manera que
22. RIVERA GARAMENDI, Freddy
DISTRIBUCIONES BIDIMENSIONALES ESTADÍSTICA
nota
Si los datos están tabuladas las expresiones de las ecuaciones normales aparecerán multiplicado por sus
respectivas frecuencias absolutas.
Llamada recta de mínimos cuadrados de 𝒚𝒚 en 𝒙𝒙
Resolviendo el sistema de ecuaciones normales para 𝜷𝜷𝒐𝒐 y 𝜷𝜷𝟏𝟏 obtenemos:
𝜷𝜷𝒐𝒐 = �
𝒚𝒚 + 𝜷𝜷𝟏𝟏�
𝒙𝒙
𝜷𝜷𝟏𝟏 =
∑ 𝒙𝒙𝒊𝒊𝒚𝒚𝒊𝒊−𝒏𝒏�
𝒙𝒙.�
𝒚𝒚
∑ 𝒙𝒙𝒊𝒊
𝟐𝟐−𝒏𝒏�
𝒙𝒙𝟐𝟐 c =
𝒄𝒄𝒄𝒄𝒄𝒄(𝒙𝒙; 𝒚𝒚)
𝒔𝒔𝒙𝒙
𝟐𝟐
Luego, la recta ℓ se escribe
𝒚𝒚 = �
𝒚𝒚 +
𝒄𝒄𝒐𝒐𝒗𝒗(𝒙𝒙; 𝒚𝒚)
𝒔𝒔𝒙𝒙
𝟐𝟐
𝒙𝒙 − �
𝒙𝒙
23. RIVERA GARAMENDI, Freddy
DISTRIBUCIONES BIDIMENSIONALES ESTADÍSTICA
EJEMPLO
Si los datos están tabuladas las expresiones de las ecuaciones normales aparecerán multiplicado por sus
respectivas frecuencias absolutas.
Llamada recta de mínimos cuadrados de 𝒚𝒚 en 𝒙𝒙
Resolviendo el sistema de ecuaciones normales para 𝜷𝜷𝒐𝒐 y 𝜷𝜷𝟏𝟏 obtenemos:
𝜷𝜷𝒐𝒐 = �
𝒚𝒚 − 𝜷𝜷𝟏𝟏�
𝒙𝒙
𝜷𝜷𝟏𝟏 =
∑ 𝒙𝒙𝒊𝒊𝒚𝒚𝒊𝒊−𝒏𝒏�
𝒙𝒙.�
𝒚𝒚
∑ 𝒙𝒙𝒊𝒊
𝟐𝟐−𝒏𝒏�
𝒙𝒙𝟐𝟐 c =
𝒄𝒄𝒄𝒄𝒄𝒄(𝒙𝒙; 𝒚𝒚)
𝒔𝒔𝒙𝒙
𝟐𝟐
Luego, la recta ℓ se escribe
𝒚𝒚 = �
𝒚𝒚 +
𝒄𝒄𝒐𝒐𝒗𝒗(𝒙𝒙; 𝒚𝒚)
𝒔𝒔𝒙𝒙
𝟐𝟐
𝒙𝒙 − �
𝒙𝒙