El documento presenta información sobre correlación y regresión lineal con el objetivo de dar solución a problemas relacionados con estas temáticas. Se explican conceptos como coeficiente de correlación, regresión lineal, diagrama de dispersión, entre otros. Además, contiene varios ejemplos y ejercicios resueltos para mostrar la aplicación práctica de estos métodos estadísticos en la solución de problemas.
1. UNIVERSIDAD POLITÉCNICA ESTATAL DEL CARCHI
ESCUELA DE COMERCIO EXTERIOR Y NEGOCIACIÓN COMERCIAL
INTERNACIONAL
COMPETENCIA ESPECÍFICA
Capacidad para utilizar las ciencias exactas y dar solución a problemas del
contexto aplicando la estadística con rigor científico y responsabilidad.
MSC. JORGE POZO
Integrantes:
AMANDA ORTIZ
NIVEL: 6TO“B”
Periodo – 2012
2. TEMA: CORRELACIÓN Y REGRESIÓN LINEAL
Problema: Desconocimiento de la correlación y regresión lineal para la aplicación
en problemas del contexto.
OBJETIVOS.
GENERAL
Dar solución a problemas planteados de acuerdo a la correlación y regresión
lineal.
ESPECÍFICOS
Investigar bibliográficamenteinformación de correlación y regresión lineal
para fortalecer el conocimientoadquirido y aplicarlo adecuadamente en la
solución de problemas
Realizar un análisis sobre el tema tratado para mejor comprensión
Poner en práctica los conocimientos adquiridos en la resolución de
problemas relacionados al ámbito de comercio exterior.
PLANTEAMIENTO
Con el tema de regresión y correlación trataremos el análisis de situaciones que
se representa en una distribución que contienen 2 variables X Y.
Nuestro principal objetivo, al analizar las dos variables X Y, es el poder determinar
la relación entre estas dos variables, es decir cómo se comportan las dos variables
una con respecto a otra, además de determinar si están o no correlacionadas y en
caso afirmativo, en hallar que tan fuerte es este grado de relación.
3. JUSTIFICACION
El presente tema se lo realizacon la finalidad de solucionar los ejercicios
planteados y así lograr tener una idea mas clara en cuestiones relacionadas al
comercio exterior, adquiriendo conocimientos profundos sobre la correlación y
relación lineal.
Los ejercicios a resolver nos permitirán ahondar los conocimientos adquiridos en
relación al tema y así poder analizar las variables establecidas y determinar su
comportamiento, además de establecer la correlación existente entre dichas
variables a analizar
CORRELACIÓN Y REGRESIÓN LINEAL
El coeficiente de correlación lineal mide el grado de intensidad de esta posible
relación entre las variables. Este coeficiente se aplica cuando la relación que
puede existir entre las variables es lineal (es decir, si representáramos en un
gráfico los pares de valores de las dos variables la nube de puntos se aproximaría
a una recta).
Permite determinar o analizar acerca de que es lo que pasa con la variable
dependiente o variable independiente, permitiendo llegar a una toma de
decisiones.
El objeto de un análisis de regresión es investigar la relación estadística que existe
entre una variable dependiente (Y) y una o más variables independientes (
,...). Para poder realizar esta investigación, se debe postular una
relación funcional entre las variables. Debido a su simplicidad analítica, la forma
funcional que más se utiliza en la práctica es la relación lineal. Cuando solo existe
una variable independiente, esto se reduce a una línea recta:
Donde los coeficientes b0 y b1 son parámetros que definen la posición
e inclinación de la recta. (Nótese que hemos usado el símbolo especial para
4. representar el valor de Y calculado por la recta. Como veremos, el valor real
de Y rara vez coincide exactamente con el valor calculado, por lo que es
importante hacer esta distinción.)
El parámetro b0, conocido como la "ordenada en el origen," nos indica cuánto
es Y cuando X = 0. El parámetro b1, conocido como la "pendiente," nos indica
cuánto aumenta Y por cada aumento de una unidad en X. Nuestro problema
consiste en obtener estimaciones de estos coeficientes a partir de una muestra de
observaciones sobre las variables Y y X. En el análisis de regresión, estas
estimaciones se obtienen por medio del método de mínimos cuadrados.
Como ejemplo, consideremos las cifras del Cuadro 1, que muestra datos
mensuales de producción y costos de operación para una empresa británica de
transporte de pasajeros por carretera durante los años 1949-52 (la producción se
mide en términos de miles de millas-vehículo recorridas por mes, y los costos se
miden en términos de miles de libras por mes).
Para poder visualizar el grado de relación que existe entre las variables, como
primer paso en el análisis es conveniente elaborar un diagrama de dispersión, que
es una representación en un sistema de coordenadas cartesianas de los datos
numéricos observados. En el diagrama resultante, en el eje X se miden las millas-
vehículo recorridas, y en el eje Y se mide el costo de operación mensual. Cada
punto en el diagrama muestra la pareja de datos (millas-vehículo y costos de
operación) que corresponde a un mes determinado.
Diagrama de Dispersión
5. Operaciones Mensuales en una Empresa de Transporte de Pasajeros.
1. En un largo curso de introducción a la sociología, un profesor hace
dos exámenes. El profesor quiere determinar si las calificaciones de
los estudiantes en el segundo examen correlacionadas con las
calificaciones del primero. Para facilitar la los, se elige una muestra de
ocho estudiar calificaciones aparecen en la siguiente tabla.
ESTUDIANTE EXÁMEN 1 EXÁMEN 2
1 60 60
2 75 100
3 70 80
4 72 68
5 54 73
6 83 97
7 80 85
8 65 90
6. a. Construya una gráfica de dispersión para datos, utilizando la
calificación del primer examen como la variable X. ¿Parece lineal la
relación?
b. Suponga que existe una relación lineal en calificaciones de los dos
exámenes, calcule la r de Pearson.
c. ¿Qué tan bien explican la relación, las calificaciones del segundo
examen?
GRAFICA
120
100
80
60
Series1
40
20
0
0 20 40 60 80 100
7. 0,629531757
Se puede decir que es una relación Baja y positiva que los dos exámenes tienen
entre si
2. Un investigador realiza un estudio de la relación entre el consumo de
cigarros y las enfermedades determinan la cantidad de cigarros
fumados diariamente y de días de ausencia en el trabajo dura último
año debido a una enfermedad para 13 individuos en la compañía
donde trabaja este investigador. Los datos aparecen en la tabla anexa.
SUJETO CIGARROS DÍAS DE
CONSUMIDOS AUSENCIA
1 0 1
2 0 3
3 0 8
4 10 10
5 13 4
6 20 14
7 27 5
8 35 6
9 35 12
8. 10 44 16
11 53 10
12 60 16
a. Construya una gráfica de dispersión para estos datos: ¿Se ve una
relación lineal?
b. Calcule el valor de la r de Pearson.
c. Elimine los datos de los sujetos 1, 2, 3, 10, 11 y 12. Esto disminuye el
rango de ambas variables. Vuelva a calcular r para los sujetos
restantes. ¿Qué afecto tiene la disminución del rango sobre r?
d. A utilizar todo el conjunto de datos, ¿qué porcentaje de la variabilidad
en el número de días de ausencia es explicado por la cantidad de
cigarros fumados diariamente? ¿De qué sirve ese valor?
18
16
14
12
10
8 Series1
6
4
2
0
0 20 40 60 80
11. 3. Un educador ha construido un examen para las aptitudes mecánicas y
desea determinar si éste es confiable, mediante dos administraciones
con un lapso de 1 mes entre ellas. Se realiza un estudio en el cual 10
estudiantes reciben dos administraciones del examen, donde la
segunda administración ocurre un mes después que la primera. Los
datos aparecen en la tabla.
a. Construya una gráfica de dispersión para las parejas de datos.
b. Determine el valor de r.
c. ¿Sería justo decir que éste es un examen confiable? Explique esto al
utilizar .
SUJETO ADMINISTRACIÓN 1 ADMINISTRACIÓN 2
1 10 10
2 12 15
3 20 17
4 25 25
5 27 32
6 35 37
7 43 40
8 40 38
9 32 30
10 47 49
13. La investigación no es confiable por que los datos son tomados en dos fecha
totalmente distintas
4. Un grupo de investigadores ha diseñado un cuestionario sobre la
tensión, consistente en 15 sucesos. Ellos están interesados en
determinar si existe una coincidencia entre dos culturas acerca de la
cantidad relativa de ajustes que acarrea cada suceso. El cuestionario
se aplica a 300 estadounidenses y 300 italianos. Cada individuo debe
utilizar el evento “matrimonio” como estándar y juzgar los demás
eventos en relación con el ajuste necesario para el matrimonio. El
matrimonio recibe un valor arbitrario de 50 puntos. Si se considera
que un evento requiere de más ajustes que el matrimonio, el evento
debe recibir más de 50 puntos. El número de puntos excedentes
depende de la cantidad de ajustes requeridos. Después de que cada
sujeto de cada cultura ha asignado puntos a todos los eventos, se
promedian los puntos de cada evento. Los resultados aparecen en la
siguiente tabla
14. EVENTOS ESTADOUNIDENSES ITALIANOS
Muerte de la esposa 100 80
Divorcio 73 95
Separación de la pareja 65 85
Temporada en prisión 63 52
Lesiones personales 53 72
Matrimonio 50 50
Despedido del trabajo 47 40
Jubilación 45 30
Embarazo 40 28
Dificultades sexuales 39 42
Reajustes económicos 39 36
Problemas con la familia
política 29 41
Problemas con el jefe 23 35
Vacaciones 13 16
Navidad 12 10
a. Suponga que los datos tienen al menos una escala de intervalo y
calcule la correlación entre los datos estadounidenses y la de los
italianos.
b. Suponga que los datos sólo tienen una escala ordinal y calcule la
correlación entre los datos de ambas culturas.
100
80
60
40 Series1
20
0
0 50 100 150
15. 0,8519
La r es alta y positiva es decir que los comportamiento de las dos nacionalidades
son bastante similares
16. INDIVIDUO EXÁMEN CON LÁPIZ SIQUIATRA SIQUIATRA
Y PAPEL A B
1 48 12 9
2 37 11 12
3 30 4 5
4 45 7 8
5 31 10 11
6 24 8 7
7 28 3 4
8 18 1 1
9 35 9 6
10 15 2 2
11 42 6 10
12 22 5 3
5. Un psicólogo ha construido un examen lápiz - papel, a fin de medir la
depresión. Para comparar los datos del examen con los datos de los
expertos, 12 individuos “con perturbaciones emocionales” realizan el
examen lápiz – papel. Los individuos también son calificados de
manera independiente por dos siquiatras, de acuerdo con el grado de
depresión determinado por cada uno como resultado de entrevistas
detalladas. Los datos aparecen a continuación. Los datos mayores
corresponden a una mayor depresión.
a. ¿Cuál es la correlación entre los datos de los dos siquiatras?
b. ¿Cuál es la correlación entre las calificaciones del examen con lápiz
y papel y los datos de cada siquiatra?
18. La relación se da con un mismo criterio por los psiquiatras
14
12
10
8
6 Series1
4
2
0
0 20 40 60
0,6973
19. La relación entre las dos variables es baja y positiva
14
12
10
8
6 Series1
4
2
0
0 20 40 60
0,697
20. 6. Para este problema, suponga que usted es un psicólogo que labora en
el departamento de recursos humanos de una gran corporación. El
presidente de la compañía acaba de hablar con usted acerca de la
importancia de contratar personal productivo en la sección de
manufactura de la empresa y le ha pedido que ayude a mejorar la
capacidad de la institución para hacer esto. Existen 300 empleados en
esta sección y cada obrero fabrica el mismo artículo. Hasta ahora, la
corporación sólo ha recurrido a entrevistas para elegir a estos
empleados. Usted busca bibliografía y descubre dos pruebas de
desempeño, lápiz – papel, bien estandarizadas, y piensa que podrían
estar relacionados con los requisitos desempeño de esta sección.
Para determinar si alguna de ellas se puede utilizar como dispositivo
de selección, elige 10 empleados representativos de la sección de
manufactura, garantizando que un amplio rango de desempeño quede
representado en la muestra, y realiza las dos pruebas con cada
empleado. Los datos aparecen en la siguiente tabla.
Mientras mayor sea la calificación, mejor será el desempeño. Las
calificaciones de desempeño en el trabajo. Las calificaciones de
desempeño fabricados por cada empleado por semana, promediados
durante los últimos 6 meses.
a. Construya una gráfica de dispersión del desempeño en el trabajo y la
primera prueba, utilizando la prueba 1 como la variable X. ¿Parece
lineal la relación?
b. Suponga que la relación anterior es lineal y calcule el valor de la r de
Pearson.
c. Construya una gráfica de dispersión del desempeño en el trabajo y la
segunda prueba, utilizando la prueba 2 como la variable X. ¿Parece
lineal la relación?
d. Suponga que la relación anterior es lineal, calcule el valor de la r de
Pearson.
21. e. Si sólo pudiera utilizar una de las pruebas para la selección de los
empleados, ¿utilizaría alguna de ellas? En tal caso, ¿cuál de ellas?
Explique.
EMPLEADO
1 2 3 4 5 6 7 8 9 10
Desempeño en el
trabajo 50 74 62 90 98 52 68 80 88 76
Examen 1 10 19 20 20 21 14 10 24 16 14
Examen 2 25 35 40 49 50 29 32 44 46 35
120
100
80
60
Series1
40
20
0
0 10 20 30
23. 0,9076
CONCLUSION
El coeficiente de correlación lineal nos permite medir el grado de intensidad de
esta posible relación entre las variables. Este coeficiente se aplica cuando la
relación que puede existir entre las variables es lineal (es decir, si
representáramos en un gráfico los pares de valores de las dos variables la nube
de puntos se aproximaría a una recta). Permite determinar o analizar acerca de
que es lo que pasa con la variable dependiente o variable independiente,
permitiendo llegar a una toma de decisiones.
24. RECOMENDACIÓN
Se debe conocer cual es la relación que existe entre las variables, para así poder
medir dicha relación y de esta manera poder analizar acerca de que es lo que
pasa tanto con la variable dependiente e independiente, para poder tomar las
decisiones mas adecuadas.
CRONOGRAMA DE ACTIVIDADES:
TIEMPO
ACTIVIDAD M J V S L M M J
investigación libros
Investigación internet
Elaboración de inicio de
formato
Realizar de ejercicios
Entrega de tarea
BIBLIOGRAFÍA:
Campo, F. (1982). Instituto Internacional de Coorporacón. costa rica: llca.
Quintanar, E. (2001). TU Y LA QUIMICA. Mexico: ISBN.
Vallejo, P., & Zambrano, J. (2010). Fisica Vectorial 1. Ediciones RODIN.
ANEXOS
Según la Subsecretaría de Comercio Exterior de una región A, se exportaron (en
miles de dólares), durante el período comprendido entre 1993 y 1997, los valores
que se indican en la siguiente tabla:
Año (x) 1993 1994 1995 1996 1997
Exportaciones (y) 1640 1763 1875 1987 2006
25. r: 0.976168
En el siguiente gráfico mostramos la línea recta que se ajusta mejor (en cierto
sentido) a la nube de puntos que aparecen en el gráfico anterior. La línea recta se
denomina línea de regresión, y está dada por:
Un investigador realiza un estudio de la relación entre el consumo de frutas
frescas y frutas en conserva determinan la cantidad de mayor producto
demandado.
SUJETO FRUTAS FRUTAS EN
FRESCAS CONSERVA
1 0 1
26. 2 0 3
3 0 8
4 10 10
5 13 4
6 20 14
7 27 5
8 35 6
9 35 12
10 44 16
11 53 10
12 60 16
a.- Construya una gráfica de dispersión para estos datos: ¿Se ve una
relación lineal?
b.- Calcule el valor de la r de Pearson.
18
16
14
12
10
8 Series1
6
4
2
0
0 20 40 60 80
TOTALM
LMENTE
PARCIA
MAYOR
MATRIZ PARA TRABAJOS Y PRODUCTOS FINALES
PARTE
EN SU
APLICA
POCO
NADA
ENTE
NO
NIVEL.- FECHA.-
Asignatura.- 1 2 3 4 5
1 Utiliza el método científico en la planificación de la investigación y/o trabajos
2 Utiliza el método científico en la ejecución de la investigación y/o trabajos
3 Utiliza el método científico en el informe de la investigación y/o trabajos
4 Identifica las causas del problema
27. 5 Identifica los efectos del problema
6 Expresa claramente los antecedentes del problema (planteamiento)
7 Formula el problema identificando claramente las variables
8 Analiza la factibilidad económica del proyecto y/o trabajo
9 Analiza la factibilidad tecnológica del proyecto y/o trabajo
10 Analiza la factibilidad bibliográfica del proyecto y/o trabajo
11 Plantea soluciones al problema de investigación
12 Herramientas utilizadas en los trabajos y/o investigación: Tics. en la redacción del informe
13 Herramientas utilizadas en los trabajos y/o investigación: Sintaxis
14 Herramientas utilizadas en los trabajos y/o investigación: Ortografía
15 Herramientas utilizadas en los trabajos y/o investigación: Redacción (citas)
16 Herramientas utilizadas en los trabajos y/o investigación: Estadística
17 Análisis de resultados
18 Herramientas utilizadas en los trabajos y/o investigación: matemática
19 Herramientas utilizadas en los trabajos y/o investigación: Protocolos de redacción
20 Conclusiones y Recomendaciones
21 Herramientas utilizadas en los trabajos y/o investigación: Bibliografía
22 Informa los resultados de las investigaciones y/o trabajos: Comunicación oral con facilidad.
23 Informa los resultados de las investigaciones y/o trabajos: Comunicación oral con claridad
24 Informa los resultados de las investigaciones y/o trabajos: Comunicación oral con coherencia.
25 Informa los resultados de las investigaciones y/o trabajos: Comunicación digital precisa y pertinente
26 Informa los resultados de las investigaciones y/o trabajos: Comunicación escrita precisa y pertinente
27 Informa los resultados de las investigaciones y/o trabajos: Comunicación escrita (ABSTRACT)
28 Las investigaciones y/o trabajos son temas de actualidad
29 Las investigaciones y/o trabajos ayudan a la solución de problemas contemporáneos
30 Utiliza información actualizada para los trabajos y/o investigación
31 Trabajo en equipo: Es colaborador (a)
32 Trabajo en equipo: Es creativo (a)
33 Trabajo en equipo: Es propositivo (a)
34 Trabajo en equipo: Acepta propuestas
35 Trabajo en equipo: Es puntual
36 Trabajo en equipo: Plantea estrategias de trabajo
37 Trabajo en equipo: Es operativo (a)
TOTAL
SUMAN TOTAL
NOTA FINAL
Nombre.-
PROTOCOLO DE REDACCION.
TAMAÑO DE PAPEL A4
PESO 75 GMS
ESPACIO INTERLINEAL 1,5 FIRMA ESTUDIANTE
TAMAÑO LETRA 12
TIPO DE LETRA ARIAL
COLOR LETRA NEGRO
MARGENES
Superior 2,5
Izquierdo 4
inferior y derecho 2,5
INFERIOR
NÚMERO DE PÁGINA CENTRO FIRMA DOCENTE
ROMANOS
PÁGINAS PRELIMINARES MINÚSCULA
CUERPO DEL INFORME arábigos -2-
TÍTULO DEL CAPÍTULO SIN NÚMERO