SlideShare una empresa de Scribd logo
1 de 5
Descargar para leer sin conexión
Matemáticas aplicadas a las ciecias sociales I
Parte I
Estadística bidimensional
1. Variable bidimensional
En éste capítulo estudiaremos las técnicas para:
Elegir cuál es la variable independiente (x) y cuál es la dependiente (y).
Resumir información mediante las tablas de frecuencia: Simples y de doble entrada.
Comprobar los cálculos de las tablas de frecuencia tanto con la calculadora como con el ordenador.
Representar datos mediante la correspondiente nube de puntos, nombrando los ejes e intuyendo el tipo
de regresión así como el denominado centro de gravedad (x̄, ȳ).
Calcular parámetros (medias, desviaciones, covarianza, coeciente de correlación,...) de las distribucio-
nes de dos variables X, Y.
Calcular la recta de regresión de y sobre x.
Utilizar dicha recta para realizar estimaciones, principal objetivo de este tema.
Dos variables X e Y están relacionadas estadísticamente cuando conocida la primera se puede estimar aproximadamente
el valor de la segunda. Por ejemplo:
ˆ La estatura y el peso de unos jugadores de un equipo de baloncesto.
ˆ Calicaciones en Física y Matemáticas de los alumnos de una clase.
ˆ Ingresos y gastos de una familia.
ˆ Producción y ventas de una fábrica.
ˆ Gastos en publicidad y benecios de una empresa.
Variable estadística bidimensional: Una variable bidimensional es una variable en la que cada individuo está
denido por un par de caracteres, (X, Y). Estos dos caracteres son a su vez variables estadísticas en las que sí existe
relación entre ellas, una de las dos variables es la variable independiente y la otra variable dependiente.
Distribuciones bidimensionales: Son aquellas en las que a cada individuo le corresponden los valores de dos variables,
las representamos por el par (xi, yi).
Las tablas de frecuencia pueden darse de dos maneras:
ˆ Tablas simples o marginales: Recogen en las o columnas las frecuencias de los datos.
ˆ Tablas de doble entrada: Recoge en cada casilla la frecuencia correspondiente a cada la y cada columna de
los valores de cada variable.
ˆ Si representamos cada par de valores como las coordenadas de un punto, el conjunto de todos ellos se llama nube
de puntos o diagrama de dispersión. Sobre la nube de puntos puede trazarse una recta que se ajuste a ellos
lo mejor posible, llamada recta de regresión.
1.1. Cálculo de parámetros de las variables marginales
Para realizar un estudio cuantitativo (con números) de una distribución bidimensional se utilizan las correspondiente
distribuciones marginales (estudio de las dos variables por separado), repasando por tanto los contenidos de la estadística
descriptiva. Para ello, la información de las tablas de frecuencias deben pasarse a las correspondientes tablas marginales.
Con ello, calculamos las medias y desviaciones marginales de X, Y respectivamente.
ˆ Media de la variable X:
x =
P
xi · fi
N
(1)
ˆ Media de la variable Y:
y =
P
yi · fi
N
(2)
ˆ Varianza de la variable X:
nherrodj@canariaseducacion.es
Matemáticas aplicadas a las ciecias sociales I
σ2
x =
P
x2
i · fi
N
− x2
(3)
ˆ Varianza de la variable Y:
σ2
y =
P
y2
i · fi
N
− y2
(4)
1.2. La covarianza y el coeciente de correlación lineal
ˆ La covarianza de una variable bidimensional es la media aritmética de los productos de las desviaciones de cada
una de las variables respecto a sus medias respectivas. La covarianza se representa por σxy.
σxy =
P
xi · yi · fi
N
− X · Y (5)
La covarianza indica el sentido de la correlación entre las variables:
◦ Si σxy  0 la correlación es positiva (o directa). En éste caso cuando la variable independiente aumenta, la
variable dependiente también aumenta.
◦ Si σxy  0 la correlación es negativa (o inversa).En éste caso cuando la variable independiente aumenta, la
variable dependiente disminuye (hace lo contrario).
La covarianza presenta como inconveniente, el hecho de que su valor depende de la escala elegida para los ejes.
Es decir, la covarianza variará si expresamos el dinero en euros o en céntimos. Por tanto, para realizar un estudio
sin que importe la unidad en que se miden las variables, utilizaremos el coeciente de correlación:
ˆ El coeciente de correlación lineal es el cociente entre la covarianza y el producto de las desviaciones típicas
de ambas variables. Su fórmula es:
r =
σxy
σx · σy
(6)
Las propiedades del coeciente de correlación son:
◦ El coeciente de correlación no varía al hacerlo la escala de medición. Es decir, si expresamos el dinero en
euros o en céntimo, el coeciente de correlación no varía.
◦ El signo del coeciente de correlación es el mismo que el de la covarianza. Si la covarianza es positiva, la
correlación es directa, si la covarianza es negativa, la correlación es inversa y si la covarianza es nula, no existe
correlación.
◦ El coeciente de correlación lineal es un número real comprendido entre =1 y 1, es decir: −1 ≤ r ≤ 1.
◦ Si el coeciente de correlación lineal toma valores cercanos a =1 la correlación es fuerte e inversa, y será tanto
más fuerte cuanto más se aproxime a −1.
◦ Si el coeciente de correlación lineal toma valores cercanos a 1 la correlación es fuerte y directa, y será tanto
más fuerte cuanto más se aproxime a 1.
◦ Si el coeciente de correlación lineal toma valores cercanos a 0, la correlación es débil.
◦ Si r = 1 ó r = −1, los puntos de la nube están sobre la recta creciente o decreciente. Entre ambas variables
hay dependencia funcional.
ˆ Si analizamos lo que ocurre grácamente, seguro que nos va a dejar más clara el coeciente de correlación y la
covarianza:
nherrodj@canariaseducacion.es
Matemáticas aplicadas a las ciecias sociales I
Se nota el alto grado de correlación lineal
negativa (porque se agrupan los datos a una
recta con pendiente negativa), por tanto la
covarianza debe ser negativa. El coeciente de
correlación lineal toma valores cercanos a -1, por
tanto la correlación es fuerte e inversa, y será
tanto más fuerte cuanto más se aproxime a −1.
Se nota el altísimo grado de correlación lineal
positiva (porque se agrupan los datos a una recta
de pendiente positiva), por tanto la covarianza
debe ser positiva. El coeciente de correlación
lineal toma valores cercanos a 1, la correlación es
fuerte y directa, y será tanto más fuerte cuanto
más se aproxime a 1.
Se nota que los datos están muy dispersos por lo
que no existe prácticamente corelación y por
tanto la covarianza debe ser un valor próximo a
cero.
Se nota que los datos están bastante dispersos
por lo que la correlación es poca y negativa, por
tanto la covarianza debe ser un valor negativo.
Se nota que los valores están muy dispersos (no se paroximan a una recta), no existe prácticamente
correlación y por tanto la covarianza y coeciente de correlación toma valores cercanos a 0, la
correlación es débil.
1.3. La recta de regresión lineal
La recta de regresión es la que mejor se ajusta a la nube de puntos. La recta de regresión pasa SIEMPRE por el
punto(x, y) llamado centro de gravedad.
ˆ La recta de regresión de Y sobre X se utiliza para estimar los valores de la Y a partir de los de la X.
y − y =
σxy
σ2
x
· (x − x) (7)
ˆ Si la correlación es nula, r = 0, las rectas de regresión son perpendiculares entre sí.
ˆ A partir de estas rectas podemos calcular los valores de x conocidos los de y (o viceversa), es decir, realizar
predicciones para valores que no se encuentran en nuestra tabla de valores. La abilidad que podemos conceder a
los cálculos obtenidos viene dada por el valor numérico del coeciente de correlación:
◦ Si r está muy cerca de 0, no tiene sentido realizar ningún tipo de estimaciones.
◦ Si r es próximo a 1 o 1, las estimaciones realizadas estarán cerca de los valores reales.
◦ Si r = 1 ó r = −1 , las estimaciones realizadas coincidirán con los valores reales.
nherrodj@canariaseducacion.es
Matemáticas aplicadas a las ciecias sociales I
2. Ficha de problemas
1. El número de horas de estudio de una materia y la calicación obtenida en un examen de 8 personas es:
x: Horas de estudio 20 16 34 23 27 32 18 22
y: Calicación obtenida 6.5 6 8.5 7 9 9.5 5 8
a) Dibuja la nube de puntos.
b) Calcula el coeciente de correlación lineal e interprétalo.
c) Calcula la recta de regresión y representa.
d) Estima la nota que obtendría una persona que estudiase 28 horas.
2. Encuestadas 50 personas sobre el número de horas que duermen y el número de horas que ven la televisión, se obtuvieron
los siguientes datos:
Nº horas dormidas 6 7 8 9 10
Nº de horas de TV 4 3 3 2 1
Frecuencias 3 16 20 10 1
a) Calcula el coeciente de correlación lineal e interprétalo.
b) Si una persona duerme 8,5 horas, ¾Cuántas se debe esperar que vez TV?, ¾es able la estimación?
3. -Se ha medido el peso (X) y la estatura en centímetros (Y) de los alumnos de una clase. Su peso medio ha sido de 56
kg con una desviación típica de 2.5 kg. La ecuación de la recta de regresión que relaciona la estatura y el peso es:
y = 1,8 · x + 62
a) La pendiente de esa recta es positiva, ¾qué signica esto?
b) ¾Cuál sería el centro de gravedad? Señálalo sobre la gráca correspondiente.
c) ¾Cuál es la estatura media de esos alumnos?
d) ¾Qué estatura puede estimarse en un alumno que pesa 64 kg?
e) ¾Y si pesara 44 kg?
4. Una compañía discográca ha recopilado la siguiente información sobre el número de conciertos dados durante el
verano por 15 grupos musicales y las ventas de discos de estos grupos(expresadas en miles de discos):
y = Discos  x = Conciertos [10, 30) [30, 40) [40, 80)
[1, 5) 3 - -
[5, 10) 1 4 1
[10, 20) - 1 5
a) Realiza la correspondiente tabla de frecuencias.
b) Representa dichos datos mediante su correspondiente nube de puntos.
c) ¾Cómo es el grado de dependencia del número de conciertos dados por el grupo y el número de discos vendidos?
Para ello calcula el coeciente de correlación.
d) Obtener la recta de regresión que explica la dependencia anterior.
e) Si un grupo musical ha realizado 33 conciertos, ¾cuántos discos venderá?
5. --En dos estudios realizados sobre los datos de una variable bidimensional, las rectas de regresión fueron las siguientes:
a) Primer estudio:
Recta de regresión de Y sobre X: 8x − 3y − 61 = 0 Recta de regresión de X sobre Y: x − y + 18 = 0
b) Segundo estudio:
Recta de regresión de Y sobre X: 8x − 5y + 20 = 0 Recta de regresión de X sobre Y: 5x − 2y − 10 = 0
Si conocemos que x = 23 ,y = 41 , y r = 0,8, comprueba cuál de los estudios es válido.
6. -Nico arma que si una nube de puntos se aproxima a una recta, el coeciente de correlación siempre vale 1 o -1.
Como Tere no está de cuerdo, Nico prueba con los puntos de la recta cuya ecuación es y = −5x + 20 y Tere hace lo
mismo con los puntos de y = 2x − x2
. ¾Quién tiene razón?, ¾por qué?
7. Representa , sin hallar su ecuación, la recta de regresión correspondiente a las nubes de puntos siguientes:
nherrodj@canariaseducacion.es
Matemáticas aplicadas a las ciecias sociales I
8. Para cada una de las variables bidimensionales siguientes, se ha hecho un estudio para investigar la correlación existente
entre los datos recogidos. Los coecientes de correlación obtenidos han sido:
σ1 = 0,9 σ2 = 0,83 σ3 = 1 σ4 = 0,6 σ5 = 0
Asigna a cada par de variables el correspondiente coeciente.
a) Horas diarias que ve la televisión un alumno y asig-
naturas aprobadas en una evaluación.
b) Peso de un recién nacido y color de sus ojos.
c) Número de partidos ganados y número de canastas
conseguidas por un equipo de baloncesto.
d) Nota nal de matemáticas y nota nal de lengua de
1º bachillerato.
e) Espacio recorrido por un coche en un tiempo deter-
minado y velocidad del mismo en dicho tiempo.
9. Tenemos dos variables aleatorias bidimensionales representadas por estas nubes de puntos:
a) Elige los coecientes de correlación de ambas y razónalo.
-0.92 0.95 0.6 -0.65
b) Ahora decide cuáles son las ecuaciones de las dos rectas de regresión correspondientes. Justica tu respuesta.
y = 3x + 0, 2 y = 1,3x − 0,9 y = −0,6x + 10 y = −2x − 12,6
10. Práctica a ordenador. La distribución bidimensional que se obtiene al estudiar la estatura y el peso de 10 personas
es:
Peso ( kg) 70 65 85 60 70 75 90 80 60 70
Estatura (cm) 175 160 180 155 165 180 185 175 160 170
a) Analiza que variable es la independiente y la dependiente.
b) Realiza la correspondiente tabla de doble entrada o tabla conjunta.
c) Representa dichos datos en un diagrama de dispersión (o nube de puntos).
d) Calcula la distribución marginal de X así como su media y desviación.
e) Calcula la distribución marginal de Y así como su media y desviación.
f ) Calcula la covarianza. el coeciente de correlación e interpreta el resultado.
g) Calcula la recta de regresión de Y sobre X. Representa dicha recta sobre la nube de puntos.
h) Estima la estatura para una persona cuyo peso sea de 87 kilos. Señala sobre la recta de regresión.
nherrodj@canariaseducacion.es

Más contenido relacionado

Similar a tema2-estadistica-bidimensional.pdf

Representación de datos experimentales
Representación de datos experimentalesRepresentación de datos experimentales
Representación de datos experimentalesFabio Dorta
 
Medidas de asoación entre variables
Medidas de asoación entre variablesMedidas de asoación entre variables
Medidas de asoación entre variablesSanty D
 
Fisica...
Fisica...Fisica...
Fisica...ZHYP
 
Unidad nº 1 regresion y correlacion monica
Unidad nº 1 regresion y correlacion monicaUnidad nº 1 regresion y correlacion monica
Unidad nº 1 regresion y correlacion monicamovapa
 
Expocap5tablas bidimengresion upg-110916181018-phpapp01
Expocap5tablas bidimengresion upg-110916181018-phpapp01Expocap5tablas bidimengresion upg-110916181018-phpapp01
Expocap5tablas bidimengresion upg-110916181018-phpapp01Edgar López
 
Trabajo investigación estadística
Trabajo investigación estadísticaTrabajo investigación estadística
Trabajo investigación estadísticaMarita Alvarez
 
Mapa conceptual de estadistica
Mapa conceptual de estadisticaMapa conceptual de estadistica
Mapa conceptual de estadisticawilmerp17
 
Regresion lineal
Regresion linealRegresion lineal
Regresion linealjorge chami
 
Tema 9.pdf
Tema 9.pdfTema 9.pdf
Tema 9.pdfRenanPM1
 
Regresion simple
Regresion simpleRegresion simple
Regresion simpleluismelgar
 

Similar a tema2-estadistica-bidimensional.pdf (20)

Representación de datos experimentales
Representación de datos experimentalesRepresentación de datos experimentales
Representación de datos experimentales
 
Regresion estadistica
Regresion estadisticaRegresion estadistica
Regresion estadistica
 
Estadisticamandut3
Estadisticamandut3Estadisticamandut3
Estadisticamandut3
 
Estadística tema 3
Estadística tema 3Estadística tema 3
Estadística tema 3
 
Gráficos y funciones
Gráficos y funcionesGráficos y funciones
Gráficos y funciones
 
Medidas de asoación entre variables
Medidas de asoación entre variablesMedidas de asoación entre variables
Medidas de asoación entre variables
 
Fisica...
Fisica...Fisica...
Fisica...
 
Unidad nº 1 regresion y correlacion monica
Unidad nº 1 regresion y correlacion monicaUnidad nº 1 regresion y correlacion monica
Unidad nº 1 regresion y correlacion monica
 
4. estadística descriptiva
4.  estadística descriptiva4.  estadística descriptiva
4. estadística descriptiva
 
Expocap5tablas bidimengresion upg-110916181018-phpapp01
Expocap5tablas bidimengresion upg-110916181018-phpapp01Expocap5tablas bidimengresion upg-110916181018-phpapp01
Expocap5tablas bidimengresion upg-110916181018-phpapp01
 
Trabajo investigación estadística
Trabajo investigación estadísticaTrabajo investigación estadística
Trabajo investigación estadística
 
Probabilidad 3
Probabilidad 3 Probabilidad 3
Probabilidad 3
 
Tema 3 estadística
Tema 3 estadísticaTema 3 estadística
Tema 3 estadística
 
Análisis estadístico.
Análisis estadístico.Análisis estadístico.
Análisis estadístico.
 
Regresión lineal (1).pdf
Regresión lineal (1).pdfRegresión lineal (1).pdf
Regresión lineal (1).pdf
 
Mapa conceptual de estadistica
Mapa conceptual de estadisticaMapa conceptual de estadistica
Mapa conceptual de estadistica
 
ANALISIS DE CORRELACION
ANALISIS DE CORRELACIONANALISIS DE CORRELACION
ANALISIS DE CORRELACION
 
Regresion lineal
Regresion linealRegresion lineal
Regresion lineal
 
Tema 9.pdf
Tema 9.pdfTema 9.pdf
Tema 9.pdf
 
Regresion simple
Regresion simpleRegresion simple
Regresion simple
 

Último

Hanns Recabarren Diaz (2024), Implementación de una herramienta de realidad v...
Hanns Recabarren Diaz (2024), Implementación de una herramienta de realidad v...Hanns Recabarren Diaz (2024), Implementación de una herramienta de realidad v...
Hanns Recabarren Diaz (2024), Implementación de una herramienta de realidad v...Francisco Javier Mora Serrano
 
Centro Integral del Transporte de Metro de Madrid (CIT). Premio COAM 2023
Centro Integral del Transporte de Metro de Madrid (CIT). Premio COAM 2023Centro Integral del Transporte de Metro de Madrid (CIT). Premio COAM 2023
Centro Integral del Transporte de Metro de Madrid (CIT). Premio COAM 2023ANDECE
 
CAP4-TEORIA EVALUACION DE CAUDALES - HIDROGRAMAS.pdf
CAP4-TEORIA EVALUACION DE CAUDALES - HIDROGRAMAS.pdfCAP4-TEORIA EVALUACION DE CAUDALES - HIDROGRAMAS.pdf
CAP4-TEORIA EVALUACION DE CAUDALES - HIDROGRAMAS.pdfReneBellido1
 
Exposicion. del documentos de YPFB corporación
Exposicion. del documentos de YPFB corporaciónExposicion. del documentos de YPFB corporación
Exposicion. del documentos de YPFB corporaciónjas021085
 
PRESENTACION DE CLASE. Factor de potencia
PRESENTACION DE CLASE. Factor de potenciaPRESENTACION DE CLASE. Factor de potencia
PRESENTACION DE CLASE. Factor de potenciazacariasd49
 
AMBIENTES SEDIMENTARIOS GEOLOGIA TIPOS .pptx
AMBIENTES SEDIMENTARIOS GEOLOGIA TIPOS .pptxAMBIENTES SEDIMENTARIOS GEOLOGIA TIPOS .pptx
AMBIENTES SEDIMENTARIOS GEOLOGIA TIPOS .pptxLuisvila35
 
produccion de cerdos. 2024 abril 20..pptx
produccion de cerdos. 2024 abril 20..pptxproduccion de cerdos. 2024 abril 20..pptx
produccion de cerdos. 2024 abril 20..pptxEtse9
 
Historia de la Arquitectura II, 1era actividad..pdf
Historia de la Arquitectura II, 1era actividad..pdfHistoria de la Arquitectura II, 1era actividad..pdf
Historia de la Arquitectura II, 1era actividad..pdfIsbelRodrguez
 
estadisticasII Metodo-de-la-gran-M.pdf
estadisticasII   Metodo-de-la-gran-M.pdfestadisticasII   Metodo-de-la-gran-M.pdf
estadisticasII Metodo-de-la-gran-M.pdfFlorenciopeaortiz
 
CICLO DE DEMING que se encarga en como mejorar una empresa
CICLO DE DEMING que se encarga en como mejorar una empresaCICLO DE DEMING que se encarga en como mejorar una empresa
CICLO DE DEMING que se encarga en como mejorar una empresaSHERELYNSAMANTHAPALO1
 
Cadenas de Markov investigación de operaciones
Cadenas de Markov investigación de operacionesCadenas de Markov investigación de operaciones
Cadenas de Markov investigación de operacionesal21510263
 
CONSTRUCCIONES II - SEMANA 01 - REGLAMENTO NACIONAL DE EDIFICACIONES.pdf
CONSTRUCCIONES II - SEMANA 01 - REGLAMENTO NACIONAL DE EDIFICACIONES.pdfCONSTRUCCIONES II - SEMANA 01 - REGLAMENTO NACIONAL DE EDIFICACIONES.pdf
CONSTRUCCIONES II - SEMANA 01 - REGLAMENTO NACIONAL DE EDIFICACIONES.pdfErikNivor
 
COMPONENTES DE LA VIA FERREA UAJMS - BOLIVIA
COMPONENTES DE LA VIA FERREA UAJMS - BOLIVIACOMPONENTES DE LA VIA FERREA UAJMS - BOLIVIA
COMPONENTES DE LA VIA FERREA UAJMS - BOLIVIARafaelPaco2
 
Topografía 1 Nivelación y Carretera en la Ingenierías
Topografía 1 Nivelación y Carretera en la IngenieríasTopografía 1 Nivelación y Carretera en la Ingenierías
Topografía 1 Nivelación y Carretera en la IngenieríasSegundo Silva Maguiña
 
Flujo multifásico en tuberias de ex.pptx
Flujo multifásico en tuberias de ex.pptxFlujo multifásico en tuberias de ex.pptx
Flujo multifásico en tuberias de ex.pptxEduardoSnchezHernnde5
 
Manual de Usuario Estacion total Sokkia SERIE SET10K.pdf
Manual de Usuario Estacion total Sokkia SERIE SET10K.pdfManual de Usuario Estacion total Sokkia SERIE SET10K.pdf
Manual de Usuario Estacion total Sokkia SERIE SET10K.pdfSandXmovex
 
Edificio residencial Becrux en Madrid. Fachada de GRC
Edificio residencial Becrux en Madrid. Fachada de GRCEdificio residencial Becrux en Madrid. Fachada de GRC
Edificio residencial Becrux en Madrid. Fachada de GRCANDECE
 
Fisiología del azufre en plantas S.S.pdf
Fisiología del azufre en plantas S.S.pdfFisiología del azufre en plantas S.S.pdf
Fisiología del azufre en plantas S.S.pdfJessLeonelVargasJimn
 
VIRUS FITOPATÓGENOS (GENERALIDADES EN PLANTAS)
VIRUS FITOPATÓGENOS (GENERALIDADES EN PLANTAS)VIRUS FITOPATÓGENOS (GENERALIDADES EN PLANTAS)
VIRUS FITOPATÓGENOS (GENERALIDADES EN PLANTAS)ssuser6958b11
 
Linealización de sistemas no lineales.pdf
Linealización de sistemas no lineales.pdfLinealización de sistemas no lineales.pdf
Linealización de sistemas no lineales.pdfrolandolazartep
 

Último (20)

Hanns Recabarren Diaz (2024), Implementación de una herramienta de realidad v...
Hanns Recabarren Diaz (2024), Implementación de una herramienta de realidad v...Hanns Recabarren Diaz (2024), Implementación de una herramienta de realidad v...
Hanns Recabarren Diaz (2024), Implementación de una herramienta de realidad v...
 
Centro Integral del Transporte de Metro de Madrid (CIT). Premio COAM 2023
Centro Integral del Transporte de Metro de Madrid (CIT). Premio COAM 2023Centro Integral del Transporte de Metro de Madrid (CIT). Premio COAM 2023
Centro Integral del Transporte de Metro de Madrid (CIT). Premio COAM 2023
 
CAP4-TEORIA EVALUACION DE CAUDALES - HIDROGRAMAS.pdf
CAP4-TEORIA EVALUACION DE CAUDALES - HIDROGRAMAS.pdfCAP4-TEORIA EVALUACION DE CAUDALES - HIDROGRAMAS.pdf
CAP4-TEORIA EVALUACION DE CAUDALES - HIDROGRAMAS.pdf
 
Exposicion. del documentos de YPFB corporación
Exposicion. del documentos de YPFB corporaciónExposicion. del documentos de YPFB corporación
Exposicion. del documentos de YPFB corporación
 
PRESENTACION DE CLASE. Factor de potencia
PRESENTACION DE CLASE. Factor de potenciaPRESENTACION DE CLASE. Factor de potencia
PRESENTACION DE CLASE. Factor de potencia
 
AMBIENTES SEDIMENTARIOS GEOLOGIA TIPOS .pptx
AMBIENTES SEDIMENTARIOS GEOLOGIA TIPOS .pptxAMBIENTES SEDIMENTARIOS GEOLOGIA TIPOS .pptx
AMBIENTES SEDIMENTARIOS GEOLOGIA TIPOS .pptx
 
produccion de cerdos. 2024 abril 20..pptx
produccion de cerdos. 2024 abril 20..pptxproduccion de cerdos. 2024 abril 20..pptx
produccion de cerdos. 2024 abril 20..pptx
 
Historia de la Arquitectura II, 1era actividad..pdf
Historia de la Arquitectura II, 1era actividad..pdfHistoria de la Arquitectura II, 1era actividad..pdf
Historia de la Arquitectura II, 1era actividad..pdf
 
estadisticasII Metodo-de-la-gran-M.pdf
estadisticasII   Metodo-de-la-gran-M.pdfestadisticasII   Metodo-de-la-gran-M.pdf
estadisticasII Metodo-de-la-gran-M.pdf
 
CICLO DE DEMING que se encarga en como mejorar una empresa
CICLO DE DEMING que se encarga en como mejorar una empresaCICLO DE DEMING que se encarga en como mejorar una empresa
CICLO DE DEMING que se encarga en como mejorar una empresa
 
Cadenas de Markov investigación de operaciones
Cadenas de Markov investigación de operacionesCadenas de Markov investigación de operaciones
Cadenas de Markov investigación de operaciones
 
CONSTRUCCIONES II - SEMANA 01 - REGLAMENTO NACIONAL DE EDIFICACIONES.pdf
CONSTRUCCIONES II - SEMANA 01 - REGLAMENTO NACIONAL DE EDIFICACIONES.pdfCONSTRUCCIONES II - SEMANA 01 - REGLAMENTO NACIONAL DE EDIFICACIONES.pdf
CONSTRUCCIONES II - SEMANA 01 - REGLAMENTO NACIONAL DE EDIFICACIONES.pdf
 
COMPONENTES DE LA VIA FERREA UAJMS - BOLIVIA
COMPONENTES DE LA VIA FERREA UAJMS - BOLIVIACOMPONENTES DE LA VIA FERREA UAJMS - BOLIVIA
COMPONENTES DE LA VIA FERREA UAJMS - BOLIVIA
 
Topografía 1 Nivelación y Carretera en la Ingenierías
Topografía 1 Nivelación y Carretera en la IngenieríasTopografía 1 Nivelación y Carretera en la Ingenierías
Topografía 1 Nivelación y Carretera en la Ingenierías
 
Flujo multifásico en tuberias de ex.pptx
Flujo multifásico en tuberias de ex.pptxFlujo multifásico en tuberias de ex.pptx
Flujo multifásico en tuberias de ex.pptx
 
Manual de Usuario Estacion total Sokkia SERIE SET10K.pdf
Manual de Usuario Estacion total Sokkia SERIE SET10K.pdfManual de Usuario Estacion total Sokkia SERIE SET10K.pdf
Manual de Usuario Estacion total Sokkia SERIE SET10K.pdf
 
Edificio residencial Becrux en Madrid. Fachada de GRC
Edificio residencial Becrux en Madrid. Fachada de GRCEdificio residencial Becrux en Madrid. Fachada de GRC
Edificio residencial Becrux en Madrid. Fachada de GRC
 
Fisiología del azufre en plantas S.S.pdf
Fisiología del azufre en plantas S.S.pdfFisiología del azufre en plantas S.S.pdf
Fisiología del azufre en plantas S.S.pdf
 
VIRUS FITOPATÓGENOS (GENERALIDADES EN PLANTAS)
VIRUS FITOPATÓGENOS (GENERALIDADES EN PLANTAS)VIRUS FITOPATÓGENOS (GENERALIDADES EN PLANTAS)
VIRUS FITOPATÓGENOS (GENERALIDADES EN PLANTAS)
 
Linealización de sistemas no lineales.pdf
Linealización de sistemas no lineales.pdfLinealización de sistemas no lineales.pdf
Linealización de sistemas no lineales.pdf
 

tema2-estadistica-bidimensional.pdf

  • 1. Matemáticas aplicadas a las ciecias sociales I Parte I Estadística bidimensional 1. Variable bidimensional En éste capítulo estudiaremos las técnicas para: Elegir cuál es la variable independiente (x) y cuál es la dependiente (y). Resumir información mediante las tablas de frecuencia: Simples y de doble entrada. Comprobar los cálculos de las tablas de frecuencia tanto con la calculadora como con el ordenador. Representar datos mediante la correspondiente nube de puntos, nombrando los ejes e intuyendo el tipo de regresión así como el denominado centro de gravedad (x̄, ȳ). Calcular parámetros (medias, desviaciones, covarianza, coeciente de correlación,...) de las distribucio- nes de dos variables X, Y. Calcular la recta de regresión de y sobre x. Utilizar dicha recta para realizar estimaciones, principal objetivo de este tema. Dos variables X e Y están relacionadas estadísticamente cuando conocida la primera se puede estimar aproximadamente el valor de la segunda. Por ejemplo: ˆ La estatura y el peso de unos jugadores de un equipo de baloncesto. ˆ Calicaciones en Física y Matemáticas de los alumnos de una clase. ˆ Ingresos y gastos de una familia. ˆ Producción y ventas de una fábrica. ˆ Gastos en publicidad y benecios de una empresa. Variable estadística bidimensional: Una variable bidimensional es una variable en la que cada individuo está denido por un par de caracteres, (X, Y). Estos dos caracteres son a su vez variables estadísticas en las que sí existe relación entre ellas, una de las dos variables es la variable independiente y la otra variable dependiente. Distribuciones bidimensionales: Son aquellas en las que a cada individuo le corresponden los valores de dos variables, las representamos por el par (xi, yi). Las tablas de frecuencia pueden darse de dos maneras: ˆ Tablas simples o marginales: Recogen en las o columnas las frecuencias de los datos. ˆ Tablas de doble entrada: Recoge en cada casilla la frecuencia correspondiente a cada la y cada columna de los valores de cada variable. ˆ Si representamos cada par de valores como las coordenadas de un punto, el conjunto de todos ellos se llama nube de puntos o diagrama de dispersión. Sobre la nube de puntos puede trazarse una recta que se ajuste a ellos lo mejor posible, llamada recta de regresión. 1.1. Cálculo de parámetros de las variables marginales Para realizar un estudio cuantitativo (con números) de una distribución bidimensional se utilizan las correspondiente distribuciones marginales (estudio de las dos variables por separado), repasando por tanto los contenidos de la estadística descriptiva. Para ello, la información de las tablas de frecuencias deben pasarse a las correspondientes tablas marginales. Con ello, calculamos las medias y desviaciones marginales de X, Y respectivamente. ˆ Media de la variable X: x = P xi · fi N (1) ˆ Media de la variable Y: y = P yi · fi N (2) ˆ Varianza de la variable X: nherrodj@canariaseducacion.es
  • 2. Matemáticas aplicadas a las ciecias sociales I σ2 x = P x2 i · fi N − x2 (3) ˆ Varianza de la variable Y: σ2 y = P y2 i · fi N − y2 (4) 1.2. La covarianza y el coeciente de correlación lineal ˆ La covarianza de una variable bidimensional es la media aritmética de los productos de las desviaciones de cada una de las variables respecto a sus medias respectivas. La covarianza se representa por σxy. σxy = P xi · yi · fi N − X · Y (5) La covarianza indica el sentido de la correlación entre las variables: ◦ Si σxy 0 la correlación es positiva (o directa). En éste caso cuando la variable independiente aumenta, la variable dependiente también aumenta. ◦ Si σxy 0 la correlación es negativa (o inversa).En éste caso cuando la variable independiente aumenta, la variable dependiente disminuye (hace lo contrario). La covarianza presenta como inconveniente, el hecho de que su valor depende de la escala elegida para los ejes. Es decir, la covarianza variará si expresamos el dinero en euros o en céntimos. Por tanto, para realizar un estudio sin que importe la unidad en que se miden las variables, utilizaremos el coeciente de correlación: ˆ El coeciente de correlación lineal es el cociente entre la covarianza y el producto de las desviaciones típicas de ambas variables. Su fórmula es: r = σxy σx · σy (6) Las propiedades del coeciente de correlación son: ◦ El coeciente de correlación no varía al hacerlo la escala de medición. Es decir, si expresamos el dinero en euros o en céntimo, el coeciente de correlación no varía. ◦ El signo del coeciente de correlación es el mismo que el de la covarianza. Si la covarianza es positiva, la correlación es directa, si la covarianza es negativa, la correlación es inversa y si la covarianza es nula, no existe correlación. ◦ El coeciente de correlación lineal es un número real comprendido entre =1 y 1, es decir: −1 ≤ r ≤ 1. ◦ Si el coeciente de correlación lineal toma valores cercanos a =1 la correlación es fuerte e inversa, y será tanto más fuerte cuanto más se aproxime a −1. ◦ Si el coeciente de correlación lineal toma valores cercanos a 1 la correlación es fuerte y directa, y será tanto más fuerte cuanto más se aproxime a 1. ◦ Si el coeciente de correlación lineal toma valores cercanos a 0, la correlación es débil. ◦ Si r = 1 ó r = −1, los puntos de la nube están sobre la recta creciente o decreciente. Entre ambas variables hay dependencia funcional. ˆ Si analizamos lo que ocurre grácamente, seguro que nos va a dejar más clara el coeciente de correlación y la covarianza: nherrodj@canariaseducacion.es
  • 3. Matemáticas aplicadas a las ciecias sociales I Se nota el alto grado de correlación lineal negativa (porque se agrupan los datos a una recta con pendiente negativa), por tanto la covarianza debe ser negativa. El coeciente de correlación lineal toma valores cercanos a -1, por tanto la correlación es fuerte e inversa, y será tanto más fuerte cuanto más se aproxime a −1. Se nota el altísimo grado de correlación lineal positiva (porque se agrupan los datos a una recta de pendiente positiva), por tanto la covarianza debe ser positiva. El coeciente de correlación lineal toma valores cercanos a 1, la correlación es fuerte y directa, y será tanto más fuerte cuanto más se aproxime a 1. Se nota que los datos están muy dispersos por lo que no existe prácticamente corelación y por tanto la covarianza debe ser un valor próximo a cero. Se nota que los datos están bastante dispersos por lo que la correlación es poca y negativa, por tanto la covarianza debe ser un valor negativo. Se nota que los valores están muy dispersos (no se paroximan a una recta), no existe prácticamente correlación y por tanto la covarianza y coeciente de correlación toma valores cercanos a 0, la correlación es débil. 1.3. La recta de regresión lineal La recta de regresión es la que mejor se ajusta a la nube de puntos. La recta de regresión pasa SIEMPRE por el punto(x, y) llamado centro de gravedad. ˆ La recta de regresión de Y sobre X se utiliza para estimar los valores de la Y a partir de los de la X. y − y = σxy σ2 x · (x − x) (7) ˆ Si la correlación es nula, r = 0, las rectas de regresión son perpendiculares entre sí. ˆ A partir de estas rectas podemos calcular los valores de x conocidos los de y (o viceversa), es decir, realizar predicciones para valores que no se encuentran en nuestra tabla de valores. La abilidad que podemos conceder a los cálculos obtenidos viene dada por el valor numérico del coeciente de correlación: ◦ Si r está muy cerca de 0, no tiene sentido realizar ningún tipo de estimaciones. ◦ Si r es próximo a 1 o 1, las estimaciones realizadas estarán cerca de los valores reales. ◦ Si r = 1 ó r = −1 , las estimaciones realizadas coincidirán con los valores reales. nherrodj@canariaseducacion.es
  • 4. Matemáticas aplicadas a las ciecias sociales I 2. Ficha de problemas 1. El número de horas de estudio de una materia y la calicación obtenida en un examen de 8 personas es: x: Horas de estudio 20 16 34 23 27 32 18 22 y: Calicación obtenida 6.5 6 8.5 7 9 9.5 5 8 a) Dibuja la nube de puntos. b) Calcula el coeciente de correlación lineal e interprétalo. c) Calcula la recta de regresión y representa. d) Estima la nota que obtendría una persona que estudiase 28 horas. 2. Encuestadas 50 personas sobre el número de horas que duermen y el número de horas que ven la televisión, se obtuvieron los siguientes datos: Nº horas dormidas 6 7 8 9 10 Nº de horas de TV 4 3 3 2 1 Frecuencias 3 16 20 10 1 a) Calcula el coeciente de correlación lineal e interprétalo. b) Si una persona duerme 8,5 horas, ¾Cuántas se debe esperar que vez TV?, ¾es able la estimación? 3. -Se ha medido el peso (X) y la estatura en centímetros (Y) de los alumnos de una clase. Su peso medio ha sido de 56 kg con una desviación típica de 2.5 kg. La ecuación de la recta de regresión que relaciona la estatura y el peso es: y = 1,8 · x + 62 a) La pendiente de esa recta es positiva, ¾qué signica esto? b) ¾Cuál sería el centro de gravedad? Señálalo sobre la gráca correspondiente. c) ¾Cuál es la estatura media de esos alumnos? d) ¾Qué estatura puede estimarse en un alumno que pesa 64 kg? e) ¾Y si pesara 44 kg? 4. Una compañía discográca ha recopilado la siguiente información sobre el número de conciertos dados durante el verano por 15 grupos musicales y las ventas de discos de estos grupos(expresadas en miles de discos): y = Discos x = Conciertos [10, 30) [30, 40) [40, 80) [1, 5) 3 - - [5, 10) 1 4 1 [10, 20) - 1 5 a) Realiza la correspondiente tabla de frecuencias. b) Representa dichos datos mediante su correspondiente nube de puntos. c) ¾Cómo es el grado de dependencia del número de conciertos dados por el grupo y el número de discos vendidos? Para ello calcula el coeciente de correlación. d) Obtener la recta de regresión que explica la dependencia anterior. e) Si un grupo musical ha realizado 33 conciertos, ¾cuántos discos venderá? 5. --En dos estudios realizados sobre los datos de una variable bidimensional, las rectas de regresión fueron las siguientes: a) Primer estudio: Recta de regresión de Y sobre X: 8x − 3y − 61 = 0 Recta de regresión de X sobre Y: x − y + 18 = 0 b) Segundo estudio: Recta de regresión de Y sobre X: 8x − 5y + 20 = 0 Recta de regresión de X sobre Y: 5x − 2y − 10 = 0 Si conocemos que x = 23 ,y = 41 , y r = 0,8, comprueba cuál de los estudios es válido. 6. -Nico arma que si una nube de puntos se aproxima a una recta, el coeciente de correlación siempre vale 1 o -1. Como Tere no está de cuerdo, Nico prueba con los puntos de la recta cuya ecuación es y = −5x + 20 y Tere hace lo mismo con los puntos de y = 2x − x2 . ¾Quién tiene razón?, ¾por qué? 7. Representa , sin hallar su ecuación, la recta de regresión correspondiente a las nubes de puntos siguientes: nherrodj@canariaseducacion.es
  • 5. Matemáticas aplicadas a las ciecias sociales I 8. Para cada una de las variables bidimensionales siguientes, se ha hecho un estudio para investigar la correlación existente entre los datos recogidos. Los coecientes de correlación obtenidos han sido: σ1 = 0,9 σ2 = 0,83 σ3 = 1 σ4 = 0,6 σ5 = 0 Asigna a cada par de variables el correspondiente coeciente. a) Horas diarias que ve la televisión un alumno y asig- naturas aprobadas en una evaluación. b) Peso de un recién nacido y color de sus ojos. c) Número de partidos ganados y número de canastas conseguidas por un equipo de baloncesto. d) Nota nal de matemáticas y nota nal de lengua de 1º bachillerato. e) Espacio recorrido por un coche en un tiempo deter- minado y velocidad del mismo en dicho tiempo. 9. Tenemos dos variables aleatorias bidimensionales representadas por estas nubes de puntos: a) Elige los coecientes de correlación de ambas y razónalo. -0.92 0.95 0.6 -0.65 b) Ahora decide cuáles son las ecuaciones de las dos rectas de regresión correspondientes. Justica tu respuesta. y = 3x + 0, 2 y = 1,3x − 0,9 y = −0,6x + 10 y = −2x − 12,6 10. Práctica a ordenador. La distribución bidimensional que se obtiene al estudiar la estatura y el peso de 10 personas es: Peso ( kg) 70 65 85 60 70 75 90 80 60 70 Estatura (cm) 175 160 180 155 165 180 185 175 160 170 a) Analiza que variable es la independiente y la dependiente. b) Realiza la correspondiente tabla de doble entrada o tabla conjunta. c) Representa dichos datos en un diagrama de dispersión (o nube de puntos). d) Calcula la distribución marginal de X así como su media y desviación. e) Calcula la distribución marginal de Y así como su media y desviación. f ) Calcula la covarianza. el coeciente de correlación e interpreta el resultado. g) Calcula la recta de regresión de Y sobre X. Representa dicha recta sobre la nube de puntos. h) Estima la estatura para una persona cuyo peso sea de 87 kilos. Señala sobre la recta de regresión. nherrodj@canariaseducacion.es