2. Variables estadísticas bidimensionales
Se trata de variables que surgen cuando se estudian dos
características asociadas a la observación de un mismo
fenómeno.
3. Ejemplo 1.- Estudiamos la talla, medida en cm. y el peso, medido en kg. de un
grupo de 10 personas, podemos obtener los siguientes valores
Talla
(cms) 160 165 168 170 171 175 175 180 180 182
Peso
(kgs) 55 58 58 61 67 62 66 74 79 83
Podemos llamar X a la talla e Y al peso con lo que
se obtendría la variable bidimensional (X, Y)
que toma 10 valores, que son las 10 parejas de
valores de la tabla anterior: (160,55), (165,58), etc.
4. Variables estadísticas bidimensionales
En algunos casos el número de "parejas" de valores (x,y) es
grande y además muchos de ellos aparecen repetidos; en
este caso se utiliza una "Tabla de doble entrada" como la
que se muestra a continuación en el ejemplo 2
En la primera fila se colocan los valores de una de las
características o variable que componen la variable
bidimensional y en la primera columna los de la otra.
5. Variables estadísticas bidimensionales
Ejemplo 2.- Se representa por X el número de hijos de 100
familias y por Y el número de hijas
Nº de hijas (y) Frecuencias
Nº de hijos (x) 0 1 2 3 Marginales (x)
0 10 15 15 3 43
1 10 12 7 2 31
2 8 4 3 1 16
3 3 2 1 0 6
4 2 1 1 0 4
Frecuencias
Marginales(y)
33 34 27 6 100
6. Representación gráfica
Diagramas de dispersión o nubes de puntos: En
unos ejes de coordenadas representaremos la
posición y frecuencia de cada pareja de datos
7. Diagramas de dispersión o nubes de puntos
En el ejemplo 1 anterior en el que se estudiaba la talla y el peso de 10
personas se obtendría el siguiente diagrama de dispersión: (En el eje X
se representa la talla en cm. y en el eje Y el peso en kg.)
8. En el caso de tablas de doble entrada
3
2 1
3
7 3
15 1 1
2
12 4 2 1
15
1
3 2
10 10 8
0
0 1 2 3 4
9. Diagramas de dispersión o nubes de puntos
Se puede ver en el primera figura que correspondía al
diagrama de talla - peso que la serie de puntos presenta
una tendencia "ascendente" . Se dice en este caso que
existen entre las dos variables una "dependencia directa"
.
En caso en que la tendencia sea "descendente" se diría que
estaríamos ante una " dependencia inversa "
Naturalmente en caso en que no se pueda observar una
tendencia clara estaríamos ante una dependencia muy débil
que no se puede observar mediante la nube de puntos
16. Peso (kg)
90
80
70
60
50 Como vemos la relación es
40
30
Positiva (creciente) y parece
20 que es bastante fuerte, pero
10 ¿cuánto?
0
155 160 165 170 175 180 185
Talla (cm)
17. Coeficiente de Correlación
Para cuantificar la relación usaremos el coeficiente de correlación:
xy
r
x y
Propiedades:
• Es un valor entre -1 y 1
• Si es positivo la relación es directa y si es negativa es inversa
• Cuando se acerca a cero no hay relación
18. En el ejemplo 1
Talla (cm) Peso kg) x-X y-Y (x-X)(y-Y) (x-X)2 (y-Y)2
160 55 -12,6 -11,3 142,38 158,76 127,69
165 58 -7,6 -8,3 63,08 57,76 68,89
168 58 -4,6 -8,3 38,18 21,16 68,89
170 61 -2,6 -5,3 13,78 6,76 28,09
171 67 -1,6 0,7 -1,12 2,56 0,49
175 62 2,4 -4,3 -10,32 5,76 18,49
175 66 2,4 -0,3 -0,72 5,76 0,09
180 74 7,4 7,7 56,98 54,76 59,29
180 79 7,4 12,7 93,98 54,76 161,29
182 83 9,4 16,7 156,98 88,36 278,89
10 553,2 456,4 812,1
Media x 172,6 Cov 55,32 Var x 45,64
Media y 66,3 Var x 81,21
Des x 6,7557383
Des y 9,01165911
Coef. Correl. 0,91
Mucha relación directa
19. Recta de regresión
Relación entre dos variables
Variable independiente x
Variable dependiente y
función lineal del tipo y = ax + b, su gráfica
correspondería a una recta de regresión.
Ajuste por mínimos cuadrados
20. Se deduce que la recta de regresión debe pasar por el punto correspondiente a
xy
las medias de ambas variables X ,Y y que debe tener por pendiente
2
Con ello la expresión de la recta de regresión utilizando la ecuación x
punto-pendiente será:
xy
y Y 2
x X
x
Esta es la llamada "Recta de regresión de y sobre x". Si se deseara estudiar la
dependencia de x respecto a y sólo habría que cambiar en la expresión de la
recta x por y, obteniéndose la recta regresión de x sobre y
xy
x X 2
y Y
y
21. En la imagen siguiente se muestra la recta de regresión de y (peso) sobre x (talla)
del ejemplo 1 de este tema. En este caso se supone que represente cómo depende
el peso de una persona de su talla
Peso (kg)
100
80
60
40
20
0
155 160 165 170 175 180 185
Talla (cm)
Si recordamos que entre la talla y el peso decíamos que existía una dependencia
directa, la recta de regresión lo confirma ya que su pendiente es positiva: a medida
que aumenta la talla aumenta el peso. Por tanto:
Dependencia directa - Pendiente de la recta positiva - Función creciente
22. Peso (kg)
( X ,Y )
90
80
70
60
50
40
30 ( X ,Y )
20
10
0
155 160 165 170 175 180 185
Talla (cm)
Media x 172,6
Media y 66,3
23. Utilidad tiene la recta de regresión
Mediante la recta de regresión podríamos obtener de manera
aproximada el valor de la variable dependiente (y) de la que
conociéramos la variable independiente (x), en una población
semejante a aquella de la que se ha obtenido la muestra
De manera más precisa, si conocemos la expresión de la recta de
regresión, se pueden calcular valores para la variable y, conocidos los de
x, como si se tratara de una función
24. Ejemplo :
Si observamos la gráfica, podríamos suponer por ejemplo que una persona de 185
cm pesaría algo más de 80 kg
Peso (kg)
90
80
De acuerdo a la fórmula 70
60
50
xy
y Y 2
x X 40
30
20
x 10
0
155 160 165 170 175 180 185
Talla (cm)
La recta de regresión de la variable y (peso) sobre x (talla) será la recta:
-que pasa por el punto (172,6 ; 66,3) (medias respectivas de (x,y))
-tiene de pendiente: 55.32 / 50.71 = 1.0909
Recta: y – 66.3 = 1.0909 ( x – 172.6) que operando y simplificando queda:
y = 1.0909x – 121.9
25. El valor del peso que suponíamos aproximado para una talla de 185 cm
sería:
Peso= 1.0909 · 185 – 121.9 = 79.9
Este valor obtenido es algo menor al esperado. Eso quiere decir que las
predicciones hechas con la recta de regresión no son exactas.
Por tanto la recta de regresión se puede utilizar para realizar predicciones
para la variable y a partir de valores conocidos de la variable x.
26. Resumen:
• Variables bidimensionales
• Coeficiente de correlación
• Regresión
• Recta de regresión