SlideShare una empresa de Scribd logo
1 de 38
UNIVERSIDAD POLITÉCNICA ESTATAL DEL CARCHI




    ESCUELA DE COMERCIO EXTERIOR Y NEGOCIACIÓN
                  COMERCIAL INTERNACIONAL



       TEMA: Ejercicios de Correlación y Relación lineal


Msc. Jorge pozo


Integrantes:


Aguirre Jonathan
Ayala Maricela
Gordón María
López Iván
                        NIVEL: 6TO “A”

                             2012
TEMA: Correlación y Relación Lineal




Problema:

La dificultad del estudiante para calcular la correlación y relación lineal




Objetivos:

Objetivo General.

Identificar comocalcular la correlación y relación lineal




Objetivos Específicos.




    Recopilar conceptos sobre correlación y relación lineal


    Analizar los conceptos sobre correlación y relación lineal



    Poner en práctica los conocimientos sobre correlación y relación lineal
Justificación

Este trabajo se realiza para que el estudiante sea práctico en el cálculo de la
correlación     y relación lineal y domine bien el tema y se involucre en
investigaciones cada vez más profundas analizando algunas características
generales como es la de calcular el coeficiente de correlación rdePearson de
acuerdo a los datos planteados, al observar los resultados se puede sacar
importantes análisis con el fin de determinar si es aceptable o no el tipo de caso
aplicado,
Desarrollo

CORRELACIÓN ENTRE DOS CONJUNTOS DE DATOS AGRUPADOS EN
CLASES

El presente tema nos conduce a calcular el coeficiente de correlación r, que nos
proporciona información de la fuerza de la relación que existe entre dos
conjuntos de datos que se encuentran agrupados, cada uno de ellos formando
por separados una distribución de frecuencias, mejor dicho teniendo por
separado sus intervalos de clase con sus respectivas frecuencias.

Para realizar una exposición del tema en forma más entendible, presentamos el
ejemplo del Cuadro Nº 4.1.7.

Ejemplo:

Calcular el grado de correlación entre las puntaciones obtenidas en inventario
de hábitos de estudio y los puntajes obtenidos en un examen de Matemática,
aplicados a un total de 134 alumnos de un colegio de la localidad.




                                   CUADRO Nº 4.1.7

 X Hábitos de estudio
                          20 30       30 40   40 50   50 60      Total
Y Matemática
        70 80                            3      2        2           7
        60 70                  1         0      4        5           10
        50 60                  2         6      16       3           27
        40 50                  4        14      19      10           47
        30 40                  7        15      6        0           28
        20 30                  8         2      0        1           11
        10 20                  1                1        2           4
Total                   23       40      48      23      134



Podemos notar que el problema no es tan simple, como el caso anterior, dado
que ahora los datos se han clasificado en una tabla de doble entrada Nº 4.1.7.
Este cuadro muestra, en la primera columna del lado izquierdo los intervalos de
clase de la variable Y, los que cubren todos los posibles datos acerca de las
puntuaciones alcanzadas por los estudiantes en la prueba de Matemática.
Nótese que los intervalos crecen de abajo hacia arriba. En la fila superior se
presentan los intervalos de clase todos los 134 posibles datos acerca de los
puntajes obtenidos por los estudiantes en la variable hábitos de estudios
representados por la letra X.

Dentro del Cuadro Nº 4.1.7 en los casilleros interiores o celdas de la tabla, se
encuentran las frecuencias de celdas           que corresponden a puntajes que
pertenecen tanto a un intervalo de la variable Y como a un intervalo de la
variable X.

En la fila interior del Cuadro se presentan los totales de los puntajes de la
variable X, hábitos de estudio. Esos totales se llaman frecuencias marginales de
la variable X y se representan por   .

En la última columna de la derecha se encuentran los totales de los puntajes de
la variable rendimiento en matemática. Estos totales se denominan frecuencias
marginales de la variable Y.

Cuando los datos se presentan tal como el presente caso, formando tablas de
doble entrada, es conveniente usar el método clave que expondremos a
continuación porque con este procedimiento se evita manejar grandes números,
como sería el caso si se emplearán las fórmulas para trabajar con la
calculadora de bolsillo.

La fórmula que utilizaremos es la siguiente:
Para obtener los datos que deben aplicarse en la fórmula Nº 4.1.2., vamos a
construir el cuadro auxiliar Nº 4.1.8, al mismo tiempo que se explica el
significado de los símbolos de esa fórmula.

Lo primero que hacemos es reemplazar los intervalos horizontales y verticales
por sus respectivas marcas de clase; a continuación adicionaremos al Cuadro
Nº 4.1.7, cinco columnas por el lado derecho; cuyos encabezamientos son:
    para la primera     para la segunda,       para la tercera,        para la cuarta
y          para la quinta columna.

Por la parte inferior del cuadro le adicionamos cuatro filas que se nombran:
para la primera       para la segunda fila que está debajo de la anterior,      para
la tercera fila y por último,       para la cuarta fila que está debajo de todas; de
esta manera se va elaborando el Cuadro Auxiliar Nº 4.1.8.

1) Para determinar las frecuencias marginales que se deben colocar en la
     columna      para la primera       para la segunda,          para la tercera,
     sumamos las frecuencias de las celdas que están en la misma fila de la
     marca de clase 75, obtenemos: 3+2+2=7, número que se escribe en el
     primer casillero o celda de la columna    para la primera      para la segunda,
          para la tercera,       En la fila de la marca de clase 65, sumamos
     1+4+5=10, número que se escribe debajo del 7.
     Para la fila de la marca de clase 55, tenemos: 2+6+16+3=27.
     Para la fila de la marca de clase 45, se tiene: 4+14+19+10=47.
     En igual forma: 7+15+6=28.
     Lo mismo: 8+2+1=11
     Y en la última fila: 1+1+2=4
A continuación sumamos estas frecuencias marginales de la variable Y:
   7+10+27+47+28+11+4=134 es el total general.


2) Ahora a determinar las frecuencias marginales de la variable X: En columna
   encabezada con la marca de clase 25 sumemos verticalmente las
   frecuencias: 1+2+4+7+8+1=23.
   En la columna encabezada con 35, tenemos: 3+6+14+15+2=40
   En la siguiente: 2+4+16+19+6+1=48
   En la última: 2+5+3+10+1+2=23


3) Centremos nuestra atención en la columna encabezada            para la primera
      para la segunda,        para la tercera,    este signo significa desviación
   unitaria, y procedemos en la misma forma que en las Tablas Nº 2.1.2 y Nº
   2.1.3 (b). recuerden que las desviaciones unitarias positivas: +1, +2, y +3
   corresponden a los intervalos mayores y por el contrario las desviaciones
   unitarias negativas: -1, -2 y -3 corresponden a los intervalos menores. Como
   origen de trabajo se tomó la marca de clase 45 y por lo tanto su desviación
   unitaria es cero.


4) Luego vamos a determinar las desviaciones unitarias horizontales de la
   variable X. el origen de trabajo es la marca de clase 45 que se halla en la fila
   superior del cuadro, por esa razón, escribimos cero debajo de la frecuencia
   marginal 48. Las desviaciones unitarias negativas: -1 y -2 se escriben a la
   izquierda cero, porque se corresponden con los intervalos de clase que
   tienen menores marcas de clase y que están a la izquierda de 45. La
   desviación unitaria positiva, se corresponde con el intervalo de mayor marca
   de clase, 55 (en parte superior del Cuadro Nº 4.1.8.)



5) A continuación vamos a determinar los valores que deben colocarse en la
   columna encabezada          ; este símbolo indica que se debe multiplicar cada
valor de      por su correspondiente valor de          , así: 7(+3)=21; 10(+2)=20;
    27(+1)=27;     47(0)=0;    28(-1)=-28;    11(-2)=-22     y   4(-3)=-12.   Sumando
    algebraicamente, tenemos: 21+20+27=68 los positivos: y                (-28)+ (-22)+
    (-12)=-62 los negativos.


    Por último: 68-62=6 total, que se coloca en la parte inferior de la columna




Para obtener los valores de la cuarta columna encabezada                      debemos
tener en cuenta que (                        , por lo tanto basta multiplicar cada valor
de la segunda columna por su correspondiente valor de la tercera columna así
se obtiene el respectivo valor de la cuarta columna. En efecto:

(+3)(21)=63; (+2)(20)=40; (+1)(27)=27; 0*0=0; (-1)(-28)=28; (-2)(-22)=44 y (-3)(-
12)=36

La suma: 63+40+27+28+44+36=238

Ahora nos fijamos horizontalmente en la tercera fila. Tenemos que
(        =       por consiguiente basta multiplicar verticalmente un valor de la
primera fila por su correspondiente valor de la segunda dila para obtener el
respectivo valor de la tercera fila.

(23)(-2)=-46; (40)(-1)=-40; (48)(0)=0 y (23)(+1)=23




Sumando horizontalmente:

(-46)+ (-40)+ (23)=-86+23=-63




Vamos por la cuarta fila; vemos que                           . Luego basta multiplicar
cada elemento de la segunda fila por su correspondiente elemento de la tercera
fila para obtener el respectivo elemento de la cuarta fila así:
(-2)(46)=92; (-1) (-40)=40; 0*0=0 y (+1) (23)=23




Para obtener los valores de la quinta columna                 observamos que hay
tres factores; el 1º es la frecuencia         de la celda o casillero que se está
considerando, el segundo factor es la desviación unitaria      , el tercer factor es
la desviación unitaria    . Por tanto el procedimiento será el siguiente: Tomemos
el número 3 que es la frecuencia de la celda determinada por el cruce de los
intervalos que tienen la marcha de clase 75 horizontalmente y 35 verticalmente.




Bajemos la vista del número 3 hacia donde se halla el respectivo valor (-1) de la
desviación unitaria      (ver la línea punteada).




Para indicar el tercer factor corremos la vista del número 3 hacia su derecha
hasta llegar a la columna de las desviaciones unitarias     y ubicamos el número
+3 (ver la línea punteada) formemos el producto de estos tres números: (3) (-1)
(+3)=-9. Este número -9 encerrado en un semicírculo lo escribimos en la celda
elegida.

En la misma fila tomamos la celda siguiente: (2) (0) (+3)=0

Continuando hacia la derecha: (2) (+1) (+3)=6
CUADRO AUXILIAR Nº 4.1.8




           CUADRO CORREGIDO DELCUADRO AUXILIAR Nº 4.1.8




La fórmula del paso (9) lleva el signo para indicar que se deben sumar
horizontalmente los números que están encerrados en los semicírculos de esa
primera fila elegida, así: -9+0+6=-3. Este número se escribe en la quinta
columna.
Trabajemos con la siguiente fila: (1) (-2) (+2)=-4 se encierra en un semicírculo.

(0)(-1)(+2)=0

(4)(0)8+2)=0

(5)(+1)(+2)=10

Sumando 0+0+10=10

Ahora con la tercera fila:

(2)(-2)(+1)=-4

(6)(-1)(+1)=-6

(16)(0)(+1)=0

(3)(+1)(+1)=3

Sumando: (-4)+(-6)+0+3=-7

Cuarta fila:

(7)(-2)(-1)=14

(15)(-1)(-1)=15

(6)(0)(-1)=0

(0)(+1)(-1)=0

La suma es: 14+15=29

(8)(-2)(-2)=32

(2)(-1)(-2)=4

(0)(0)(-2)=0

(1)(+1)(-2)=-2
La suma es: 32+4-2=34

Séptima fila:

(1)(-2)(-3)=6

(1)(0)(-3)=-6

(2)(1)(-3)=-6

Sumando: 6+0-6=0

Sumando los valores de la columna quinta.

        -3+6-7+0+29+34+0=69-10=59

Reuniendo los resultados anteriores, se tienen los datos para aplicar en fórmula
Nº 4.1.2.

n=134
RELACIONES




La correlación se ocupa de establecer la magnitud y la dirección de las
relaciones. Antes de profundizar en estos aspectos particulares de las
relaciones, analizaremos algunas características generales de éstas, con las
cuales podemos comprender mejor el material específico acerca de la
correlación.




                          RELACIONES LINEALES




Para iniciar nuestro análisis de las relaciones, veamos una relación entre dos
variables. La siguiente tabla muestra el salario mensual que percibieron cinco
agentes ventas y el valor en dólares de la mercancía vendida por cada uno de
ellos en ese mes.

AGENTE VARIABLE          X MERCANCÍA        Y VARIABLE
                          VENDIDA ($)       SALARIO ($)
           1                    0                500
           2                  1000               900
           3                  2000              1300
           4                  3000              1700
           5                  4000              2100
Podemos analizar mejor la relación entre estas variables si trazamos una
gráfica utilizando los valores X y Y, para cada agente de ventas, como los
puntos de dicha gráfica. Él es una gráfica de dispersión o dispersigrama.




   Una gráfica de dispersión o dispersigrama es una gráfica de parejas de
   valores X y Y.


   La gráfica de dispersión para los datos de los agentes de ventas aparece en
   la figura 6.1. En relación con esta figura, vemos que todos los puntos caen
   sobre una línea recta. Cuando una línea recta describe la relación entre dos
   variables, se dice que esta relación lineal.


   Una relación lineal entre dos variables es aquella que puede representarse
   con la mejor exactitud mediante una línea recta.


   Observe que no todas las relaciones son lineales; algunas son curvilíneas.
   En este caso, al trazar una gráfica de dispersión para las variables X y Y,
   una línea curva ajusta mejor a los datos que una línea recta.
CÁLCULO DE LA (r) DE PEARSON




La ecuación para calcular la r de Pearson mediante datos:




Donde          es la suma de los productos de cada pareja de puntajes z.


Para utilizar esta ecuación, primero hay que convertir cada dato en bruto en su
valor transformado. Esto puede tardar mucho tiempo y crear errores de
redondeo. Con algún álgebra, esta ecuación se puede transformar en una
ecuación de cálculo que utilice datos en bruto:

ECUACIÓN PARA EL CÁLCULO DE LA (r) DE PEARSON




Donde:        es la suma de los productos de cada pareja X y Y,          también
se llama la suma de productos cruzados.

La tabla 6.4 contiene algunos de los datos hipotéticos reunidos a partir de cinco
sujetos.

Datos hipotéticos para el cálculo de la r de Pearson

                                    TABLA 6.4

                 SUBJETIVO       X     Y                    XY
                       A        1     2     1      4      2
                       B        3     5     9      25     15
                       C        4     3     16     9      12
D        6     7       36    49     42
                       E        7     5       49    25     35
                    TOTAL       21    22      111   112    106




Utilicemos estos datos para calcular la r de Pearson:




    es la suma de los productos cruzados; se determina multiplicando los
datos X y Y para cada sujeto y luego sumando los productos resultantes. El
cálculo de      y de los otros términos aparece en la tabla 6.4. al sustituir estos
valores en la ecuación anterior, obtenemos.
PROBLEMA DE PRÁCTICA 6.1




Resolvamos otro ejercicio. Esta utilizaremos los datos de la tabla 6.1. Para su
conveniencia, hemos reproducido estos datos en las primeras tres columnas de
la tabla 6.5. En este ejemplo tenemos una relación lineal imperfecta y estemos
interesados en calcular la magnitud y dirección de la relación mediante la r de
Pearson. La solución también aparece en la tabla 6.5.




IQ y el promedio de las calificaciones: cálculo de la r de Pearson

                                 TABLA 6.5

       ESTUDIANTE       IQX    PROMEDIO
         NÚMERO                DE DATOS Y
              1         110         1.0        12,100    1.00    110.0
              2         112         1.6        12,544    2.56    179.2
              3         118         1.2        13,924    1.44    141.6
              4         119         2.1        14,161    4.41    249.9
              5         122         2.6        14,884    6.76    317.2
              6         125         1.8        15,625    3.24    225.0
              7         127         2.6        16,129    6.76    330.2
              8         130         2.0        16,900    4.00    260.0
9          132         3.2         17,424      10.24   422.4
              10          134         2.6         17,956      6.76    384.4
              11          136         3.0         18,496      9.00    408.0
              12          138         3.6         19,044      12.96   496.8
           TOTAL         1503         27.3       189,187 69.13 3488.7




Una segunda interpretación de la r de Pearson. La r de Pearson también se
puede interpretar en términos de la variabilidad de Y explicada por medio de X.
este punto de vista produce más información importante acerca de r            y la
relación entre X y Y. Considere, por ejemplo, la figura 6.9, en la cual se muestra
una relación imperfecta entre X y Y. En este ejemplo, la variable X representa
una competencia de ortografía y la variable Y la habilidad en la escritura de seis
estudiantes de tercer grado. Suponga que queremos predecir la calificación en
la escritura de María, la estudiante cuya calificación en ortografía es de 88. Si
no hubiese una relación entre la escritura y la ortografía.
EJERCICIOS DE APLICACIÓN

1. En un largo curso de introducción a la sociología, un profesor hace dos
   exámenes. El profesor quiere determinar si las calificaciones de los
   estudiantes en el segundo examen correlacionadas con las calificaciones
   del primero. Para facilitar la los, se elige una muestra de ocho estudiar
   calificaciones aparecen en la siguiente tabla.




        ESTUDIANTE          EXÁMEN 1            EXÁMEN 2
        1                   60                  60
        2                   75                  100
        3                   70                  80
        4                   72                  68
        5                   54                  73
        6                   83                  97
        7                   80                  85
        8                   65                  90




      a. Construya una gráfica de dispersión para datos, utilizando la
         calificación del primer examen como la variable X. ¿Parece lineal
         la relación?
      b. Suponga que existe una relación lineal en calificaciones de los dos
         exámenes, calcule la r de Pearson.
      c. ¿Qué tan bien explican la relación, las calificaciones del segundo
         examen?
120
       100
        80
        60
                                           Series1
        40
        20
         0
             0   20   40   60   80   100




0,629531757
Se puede decir que es una relación Baja y positiva que los dos exámenes
tienen entre si




   2. Un investigador realiza un estudio de la relación entre el consumo de
       cigarros y las enfermedades determinan la cantidad de cigarros fumados
       diariamente y de días de ausencia en el trabajo dura último año debido a
       una enfermedad para 13 individuos en la compañía donde trabaja este
       investigador. Los datos aparecen en la tabla anexa.


                  SUJETO         CIGARROS           DÍAS        DE
                                 CONSUMIDOS         AUSENCIA
                      1               0                    1
                      2               0                    3
                      3               0                    8
                      4               10                   10
                      5               13                   4
                      6               20                   14
                      7               27                   5
                      8               35                   6
                      9               35                   12
                     10               44                   16
                     11               53                   10
                     12               60                   16


          a. Construya una gráfica de dispersión para estos datos: ¿Se ve una
              relación lineal?
          b. Calcule el valor de la r de Pearson.
          c. Elimine los datos de los sujetos 1, 2, 3, 10, 11 y 12. Esto
              disminuye el rango de ambas variables. Vuelva a calcular r para
los sujetos restantes. ¿Qué afecto tiene la disminución del rango
  sobre r?
d. A utilizar todo el conjunto de datos, ¿qué porcentaje de la
  variabilidad en el número de días de ausencia es explicado por la
  cantidad de cigarros fumados diariamente? ¿De qué sirve ese
  valor?




     18
     16
     14
     12
     10
      8                                       Series1
      6
      4
      2
      0
          0    20      40      60      80
0,6753



         16
         14
         12
         10
         8
         6                            Series1

         4
         2
         0
              0   10   20   30   40
0,0318



3. Un educador ha construido un examen para las aptitudes mecánicas y
   desea determinar si éste es confiable, mediante dos administraciones
   con un lapso de 1 mes entre ellas. Se realiza un estudio en el cual 10
   estudiantes reciben dos administraciones del examen, donde la segunda
   administración ocurre un mes después que la primera. Los datos
   aparecen en la tabla.




a. Construya una gráfica de dispersión para las parejas de datos.
b. Determine el valor de r.
c. ¿Sería justo decir que éste es un examen confiable? Explique esto al
   utilizar    .




              SUJETO   ADMINISTRACIÓN 1    ADMINISTRACIÓN 2
                   1          10                   10
                   2          12                   15
                   3          20                   17
                   4          25                   25
5             27             32
6             35             37
7             43             40
8             40             38
9             32             30
10            47             49



60
50
40
30
                              Series1
20
10
 0
     0   20        40   60
0,9881



La investigación no es confiable por que los datos son tomados en dos fecha
totalmente distintas



   4. Un grupo de investigadores ha diseñado un cuestionario sobre la tensión,
      consistente en 15 sucesos. Ellos están interesados en determinar si
      existe una coincidencia entre dos culturas acerca de la cantidad relativa
      de ajustes que acarrea cada suceso. El cuestionario se aplica a 300
      estadounidenses y 300 italianos. Cada individuo debe utilizar el evento
      “matrimonio” como estándar y juzgar los demás eventos en relación con
      el ajuste necesario para el matrimonio. El matrimonio recibe un valor
      arbitrario de 50 puntos. Si se considera que un evento requiere de más
      ajustes que el matrimonio, el evento debe recibir más de 50 puntos. El
      número de puntos excedentes depende de la cantidad de ajustes
      requeridos. Después de que cada sujeto de cada cultura ha asignado
      puntos a todos los eventos, se promedian los puntos de cada evento. Los
      resultados aparecen en la siguiente tabla:
EVENTOS                          ESTADOUNIDENSES            ITALIANOS
Muerte de la esposa                        100                   80
Divorcio                                   73                    95
Separación de la pareja                    65                    85
Temporada en prisión                       63                    52
Lesiones personales                        53                    72
Matrimonio                                 50                    50
Despedido del trabajo                      47                    40
Jubilación                                 45                    30
Embarazo                                   40                    28
Dificultades sexuales                      39                    42
Reajustes económicos                       39                    36
Problemas con la familia
política                                   29                    41
Problemas con el jefe                      23                    35
Vacaciones                                 13                    16
Navidad                                    12                    10



    a. Suponga que los datos tienen al menos una escala de intervalo y
           calcule la correlación entre los datos estadounidenses y la de los
           italianos.
    b. Suponga que los datos sólo tienen una escala ordinal y calcule la
           correlación entre los datos de ambas culturas.

                100

                 80

                 60

                 40                                    Series1

                 20

                  0
                      0     50       100         150
77,70+0,46X

   0,8519



(Y-Ӯ )^2
La     r es alta   y positiva es decir que los comportamiento de las dos
nacionalidades son bastante similares




      INDIVIDUO     EXÁMEN CON LÁPIZ         SIQUIATRA      SIQUIATRA
                           Y PAPEL                A               B
           1                  48                  12              9
           2                  37                  11             12
           3                  30                   4              5
           4                  45                   7              8
           5                  31                  10             11
           6                  24                   8              7
           7                  28                   3              4
           8                  18                   1              1
           9                  35                   9              6
          10                  15                   2              2
          11                  42                   6             10
          12                  22                   5              3




     5. Un psicólogo ha construido un examen lápiz - papel, a fin de medir la
        depresión. Para comparar los datos del examen con los datos de los
        expertos, 12 individuos “con perturbaciones emocionales” realizan el
        examen lápiz – papel. Los individuos también son calificados de manera
        independiente por dos siquiatras, de acuerdo con el grado de depresión
        determinado por cada uno como resultado de entrevistas detalladas. Los
        datos aparecen a continuación. Los datos mayores corresponden a una
        mayor depresión.
a. ¿Cuál es la correlación entre los datos de los dos siquiatras?
b. ¿Cuál es la correlación entre las calificaciones del examen con
   lápiz y papel y los datos de cada siquiatra?




      14
      12
      10
       8
       6                                          Series1
       4
       2
       0
           0        5          10         15
0,8519

La relación se da con un mismo criterio por los psiquiatras

                  14
                  12
                  10
                   8
                   6                                     Series1
                   4
                   2
                   0
                       0       20        40        60
0,6973

La relación entre las dos variables es baja y positiva



                14

                12

                10

                 8

                 6                                       Series1

                 4

                 2

                 0
                     0        20         40        60
0,697

6. Para este problema, suponga que usted es un psicólogo que labora en el
   departamento de recursos humanos de una gran corporación. El
   presidente de la compañía acaba de hablar con usted acerca de la
   importancia de contratar personal productivo en la sección de
   manufactura de la empresa y le ha pedido que ayude a mejorar la
   capacidad de la institución para hacer esto. Existen 300 empleados en
   esta sección y cada obrero fabrica el mismo artículo. Hasta ahora, la
   corporación sólo ha recurrido a entrevistas para elegir a estos
   empleados. Usted busca bibliografía y descubre dos pruebas de
   desempeño, lápiz – papel, bien estandarizadas, y piensa que podrían
   estar relacionados con los requisitos desempeño de esta sección. Para
   determinar si alguna de ellas se puede utilizar como dispositivo de
   selección, elige 10 empleados representativos de la sección de
   manufactura, garantizando que un amplio rango de desempeño quede
   representado en la muestra, y realiza las dos pruebas con cada
   empleado. Los datos aparecen en la siguiente tabla.
   Mientras mayor sea la calificación, mejor será el desempeño. Las
   calificaciones de desempeño en el trabajo. Las calificaciones de
   desempeño fabricados por cada empleado por semana, promediados
   durante los últimos 6 meses.
        a. Construya una gráfica de dispersión del desempeño en el trabajo
           y la primera prueba, utilizando la prueba 1 como la variable X.
           ¿Parece lineal la relación?
        b. Suponga que la relación anterior es lineal y calcule el valor de la r
           de Pearson.
c. Construya una gráfica de dispersión del desempeño en el trabajo
   y la segunda prueba, utilizando la prueba 2 como la variable X.
   ¿Parece lineal la relación?
d. Suponga que la relación anterior es lineal, calcule el valor de la r
   de Pearson.
e. Si sólo pudiera utilizar una de las pruebas para la selección de los
   empleados, ¿utilizaría alguna de ellas? En tal caso, ¿cuál de
   ellas? Explique.




                                    EMPLEADO
                       1   2   3   4 5 6 7       8    9 10
   Desempeño en el
   trabajo            50 74 62 90 98 52 68 80 88 76
   Examen 1           10 19 20 20 21 14 10 24 16 14
   Examen 2           25 35 40 49 50 29 32 44 46 35



    120

    100

     80

     60
                                                     Series1
     40

     20

      0
          0           10           20       30
0,5917



         120

         100

          80

          60
                                  Series1
          40

          20

           0
               0   20   40   60
0,9076
Análisis




El trabajo realizado acerca de cómo realizar calcular la correlación y relación
lineal se analizado que es un método el cual permite comparar e interpretar
resultados a través de la recolección de datos de cualquier institución con el
objetivo de llegar a establecer deducciones.




Conclusión.




Al realizar el trabajo permite que cada uno de nosotros tenga conocimientos
claros acerca de la correlación y relación lineal para poner en práctica en los
problemas que se presentan el mundo en especial de comercio exterior, ayudan
a interpretar datos en forma resumida los datos planteados y a dar solución al
problema.




Recomendación




El tema de investigación es de mucha relevancia porque la correlación        y
relación lineal nos permiten determinar un promedio         de algunos datos
estadísticos, tomando variables correspondientes para la interpretación de los
datos.




Lincografía.

www.profesorenlinea.cl/.../EstadisticaMediaMedianaModa.htm

Más contenido relacionado

La actualidad más candente

Guía de clase de matemáticas primero bloque 2
Guía de clase de matemáticas primero bloque 2Guía de clase de matemáticas primero bloque 2
Guía de clase de matemáticas primero bloque 2JEDANNIE Apellidos
 
Medidas de Orden o Posición y Dispersión
Medidas de Orden o Posición y DispersiónMedidas de Orden o Posición y Dispersión
Medidas de Orden o Posición y Dispersióneradio2508
 
Guía de matemáticas primero bloque 1- ejercicios
Guía de matemáticas primero bloque 1- ejerciciosGuía de matemáticas primero bloque 1- ejercicios
Guía de matemáticas primero bloque 1- ejerciciosJEDANNIE Apellidos
 
Proyecto de aula de matematicas
Proyecto de aula de matematicasProyecto de aula de matematicas
Proyecto de aula de matematicasAmanda Tamay
 
Guía de clase primero bloque 3
Guía de clase primero bloque 3Guía de clase primero bloque 3
Guía de clase primero bloque 3JEDANNIE Apellidos
 
Matemáticas 2ºeso.ud12
Matemáticas 2ºeso.ud12Matemáticas 2ºeso.ud12
Matemáticas 2ºeso.ud12alfonnavarro
 
Sistemas de ecuaciones lineales.
Sistemas de ecuaciones lineales. Sistemas de ecuaciones lineales.
Sistemas de ecuaciones lineales. turbinasxd
 
Ud 12 distribuciones bidimensionales
Ud 12 distribuciones bidimensionalesUd 12 distribuciones bidimensionales
Ud 12 distribuciones bidimensionalesalfonnavarro
 
Medidas de tendencia central y dispersion cobach
Medidas de tendencia central y dispersion cobachMedidas de tendencia central y dispersion cobach
Medidas de tendencia central y dispersion cobachNoe Galea
 
Medidas de Dispersión..pdf
Medidas de Dispersión..pdfMedidas de Dispersión..pdf
Medidas de Dispersión..pdfCarlos Franco
 
Asimetria y Curtosis, Resumen de Medidas de Dispersión.pdf
Asimetria y Curtosis, Resumen de Medidas de Dispersión.pdfAsimetria y Curtosis, Resumen de Medidas de Dispersión.pdf
Asimetria y Curtosis, Resumen de Medidas de Dispersión.pdfCarlos Franco
 
Cuartiles_deciles_y_percentiles.Ppalpdf.pdf
Cuartiles_deciles_y_percentiles.Ppalpdf.pdfCuartiles_deciles_y_percentiles.Ppalpdf.pdf
Cuartiles_deciles_y_percentiles.Ppalpdf.pdfCarlos Franco
 
Estadística
EstadísticaEstadística
EstadísticaNiykko
 
Estadistica descriptiva presentación (ito)
Estadistica descriptiva presentación (ito)Estadistica descriptiva presentación (ito)
Estadistica descriptiva presentación (ito)Benito Santiago
 
Medidas de tendencia central
Medidas de tendencia centralMedidas de tendencia central
Medidas de tendencia centraleradio2508
 

La actualidad más candente (20)

Guía de clase de matemáticas primero bloque 2
Guía de clase de matemáticas primero bloque 2Guía de clase de matemáticas primero bloque 2
Guía de clase de matemáticas primero bloque 2
 
Organizacion de datos
Organizacion de datosOrganizacion de datos
Organizacion de datos
 
Medidas de Orden o Posición y Dispersión
Medidas de Orden o Posición y DispersiónMedidas de Orden o Posición y Dispersión
Medidas de Orden o Posición y Dispersión
 
Guía de matemáticas primero bloque 1- ejercicios
Guía de matemáticas primero bloque 1- ejerciciosGuía de matemáticas primero bloque 1- ejercicios
Guía de matemáticas primero bloque 1- ejercicios
 
Tema5 typ 4
Tema5 typ 4Tema5 typ 4
Tema5 typ 4
 
Proyecto de aula de matematicas
Proyecto de aula de matematicasProyecto de aula de matematicas
Proyecto de aula de matematicas
 
Guía de clase primero bloque 3
Guía de clase primero bloque 3Guía de clase primero bloque 3
Guía de clase primero bloque 3
 
Tablas de frecuencia y grafico
Tablas de frecuencia y graficoTablas de frecuencia y grafico
Tablas de frecuencia y grafico
 
Matemáticas 2ºeso.ud12
Matemáticas 2ºeso.ud12Matemáticas 2ºeso.ud12
Matemáticas 2ºeso.ud12
 
Sistemas de ecuaciones lineales.
Sistemas de ecuaciones lineales. Sistemas de ecuaciones lineales.
Sistemas de ecuaciones lineales.
 
Ud 12 distribuciones bidimensionales
Ud 12 distribuciones bidimensionalesUd 12 distribuciones bidimensionales
Ud 12 distribuciones bidimensionales
 
Variables
VariablesVariables
Variables
 
Medidas de tendencia central y dispersion cobach
Medidas de tendencia central y dispersion cobachMedidas de tendencia central y dispersion cobach
Medidas de tendencia central y dispersion cobach
 
Medidas de Dispersión..pdf
Medidas de Dispersión..pdfMedidas de Dispersión..pdf
Medidas de Dispersión..pdf
 
Asimetria y Curtosis, Resumen de Medidas de Dispersión.pdf
Asimetria y Curtosis, Resumen de Medidas de Dispersión.pdfAsimetria y Curtosis, Resumen de Medidas de Dispersión.pdf
Asimetria y Curtosis, Resumen de Medidas de Dispersión.pdf
 
Cuartiles_deciles_y_percentiles.Ppalpdf.pdf
Cuartiles_deciles_y_percentiles.Ppalpdf.pdfCuartiles_deciles_y_percentiles.Ppalpdf.pdf
Cuartiles_deciles_y_percentiles.Ppalpdf.pdf
 
Estadística
EstadísticaEstadística
Estadística
 
Estadistica descriptiva presentación (ito)
Estadistica descriptiva presentación (ito)Estadistica descriptiva presentación (ito)
Estadistica descriptiva presentación (ito)
 
Medidas de tendencia central
Medidas de tendencia centralMedidas de tendencia central
Medidas de tendencia central
 
Estadistica I 03
Estadistica  I 03Estadistica  I 03
Estadistica I 03
 

Destacado (20)

Estudio dofa
Estudio dofaEstudio dofa
Estudio dofa
 
Topología de red
Topología de redTopología de red
Topología de red
 
Herramientas web 2.0
Herramientas web 2.0Herramientas web 2.0
Herramientas web 2.0
 
Presentación del segundo indicador de desempeño
Presentación del segundo indicador de desempeño Presentación del segundo indicador de desempeño
Presentación del segundo indicador de desempeño
 
Programa feuda 2012 .... mae
Programa feuda 2012 .... maePrograma feuda 2012 .... mae
Programa feuda 2012 .... mae
 
Uso del las tic's en educacion
Uso del las tic's en educacionUso del las tic's en educacion
Uso del las tic's en educacion
 
EL CRISTIANISMO
EL CRISTIANISMOEL CRISTIANISMO
EL CRISTIANISMO
 
Presentacion venecia
Presentacion veneciaPresentacion venecia
Presentacion venecia
 
Ortiz oñate, carlos
Ortiz oñate, carlosOrtiz oñate, carlos
Ortiz oñate, carlos
 
Catalogo virtual nicolette pet fashion
Catalogo virtual nicolette pet fashionCatalogo virtual nicolette pet fashion
Catalogo virtual nicolette pet fashion
 
Competencia perfecta
Competencia perfectaCompetencia perfecta
Competencia perfecta
 
Una historia mas
Una historia masUna historia mas
Una historia mas
 
Cumpleaños de lka normal
Cumpleaños de lka normalCumpleaños de lka normal
Cumpleaños de lka normal
 
Drames Rurals
Drames RuralsDrames Rurals
Drames Rurals
 
Diapo
DiapoDiapo
Diapo
 
Guia de referencia
Guia de referenciaGuia de referencia
Guia de referencia
 
Documento de vision
Documento de visionDocumento de vision
Documento de vision
 
Trabajo de tecnología sobre robótica
Trabajo de tecnología sobre robóticaTrabajo de tecnología sobre robótica
Trabajo de tecnología sobre robótica
 
CasaAzuma_ TadaoAndo
CasaAzuma_ TadaoAndoCasaAzuma_ TadaoAndo
CasaAzuma_ TadaoAndo
 
Bitacora
BitacoraBitacora
Bitacora
 

Similar a Correlación y relación lineal: ejercicios prácticos

Estadística Cálculo de Media y desviación 009
Estadística Cálculo de Media y desviación 009Estadística Cálculo de Media y desviación 009
Estadística Cálculo de Media y desviación 009CESAR A. RUIZ C
 
Ejercicios detallados del obj 6 mat i (175 176-177
Ejercicios detallados del obj 6 mat i (175 176-177Ejercicios detallados del obj 6 mat i (175 176-177
Ejercicios detallados del obj 6 mat i (175 176-177Jonathan Mejías
 
Tabla de distribución de frecuencias
Tabla de distribución de frecuenciasTabla de distribución de frecuencias
Tabla de distribución de frecuenciasAnderson Subero
 
Organización de datos (estadística)
Organización de datos (estadística)Organización de datos (estadística)
Organización de datos (estadística)Luiscarlys Maican
 
Ejercicio de Estadística: Construcción de un Histograma.
Ejercicio de Estadística: Construcción de un Histograma.Ejercicio de Estadística: Construcción de un Histograma.
Ejercicio de Estadística: Construcción de un Histograma.David Torres
 
Practica de power point
Practica de power pointPractica de power point
Practica de power pointRUBENTORRES77
 
Datos cuantitativos agrupados
Datos cuantitativos  agrupadosDatos cuantitativos  agrupados
Datos cuantitativos agrupadosALANIS
 
Organizacion de los datos jose felix rodriguez 26632429
Organizacion de los datos jose felix rodriguez 26632429Organizacion de los datos jose felix rodriguez 26632429
Organizacion de los datos jose felix rodriguez 26632429JOSEFELIX94
 
Sucesiones y expresiones algebraicas.docx
Sucesiones y expresiones algebraicas.docxSucesiones y expresiones algebraicas.docx
Sucesiones y expresiones algebraicas.docxMarcoAntonioSarianaS1
 
Organizacion de datos roberto montes
Organizacion de datos roberto montesOrganizacion de datos roberto montes
Organizacion de datos roberto montesAlbrescaAlfonzo
 
Proceso estadistico
Proceso estadisticoProceso estadistico
Proceso estadisticoAlexandxer
 
Proceso estadistico
Proceso estadisticoProceso estadistico
Proceso estadisticoAlexandxer
 
Proceso estadistico
Proceso estadisticoProceso estadistico
Proceso estadisticoAlexandxer
 
Proceso estadistico
Proceso estadisticoProceso estadistico
Proceso estadisticoAlexandxer
 
Medidas de tendencia NEPTALI AVILA
Medidas de tendencia NEPTALI AVILAMedidas de tendencia NEPTALI AVILA
Medidas de tendencia NEPTALI AVILABEATRIZ GRANADO
 

Similar a Correlación y relación lineal: ejercicios prácticos (20)

Estadística Cálculo de Media y desviación 009
Estadística Cálculo de Media y desviación 009Estadística Cálculo de Media y desviación 009
Estadística Cálculo de Media y desviación 009
 
Ejercicios detallados del obj 6 mat i (175 176-177
Ejercicios detallados del obj 6 mat i (175 176-177Ejercicios detallados del obj 6 mat i (175 176-177
Ejercicios detallados del obj 6 mat i (175 176-177
 
Tabla de frecuencia.pptx
Tabla de frecuencia.pptxTabla de frecuencia.pptx
Tabla de frecuencia.pptx
 
Tabla de distribución de frecuencias
Tabla de distribución de frecuenciasTabla de distribución de frecuencias
Tabla de distribución de frecuencias
 
Organización de datos (estadística)
Organización de datos (estadística)Organización de datos (estadística)
Organización de datos (estadística)
 
Ejercicio de Estadística: Construcción de un Histograma.
Ejercicio de Estadística: Construcción de un Histograma.Ejercicio de Estadística: Construcción de un Histograma.
Ejercicio de Estadística: Construcción de un Histograma.
 
Nueva de la 3ra
Nueva de la 3raNueva de la 3ra
Nueva de la 3ra
 
Practica de power point
Practica de power pointPractica de power point
Practica de power point
 
Datos cuantitativos agrupados
Datos cuantitativos  agrupadosDatos cuantitativos  agrupados
Datos cuantitativos agrupados
 
Organizacion de los datos jose felix rodriguez 26632429
Organizacion de los datos jose felix rodriguez 26632429Organizacion de los datos jose felix rodriguez 26632429
Organizacion de los datos jose felix rodriguez 26632429
 
Eu2 equiponro 2
Eu2 equiponro 2Eu2 equiponro 2
Eu2 equiponro 2
 
Sucesiones y expresiones algebraicas.docx
Sucesiones y expresiones algebraicas.docxSucesiones y expresiones algebraicas.docx
Sucesiones y expresiones algebraicas.docx
 
Py e 9
Py e 9Py e 9
Py e 9
 
Organizacion de datos roberto montes
Organizacion de datos roberto montesOrganizacion de datos roberto montes
Organizacion de datos roberto montes
 
Proceso estadistico
Proceso estadisticoProceso estadistico
Proceso estadistico
 
Proceso estadistico
Proceso estadisticoProceso estadistico
Proceso estadistico
 
Proceso estadistico
Proceso estadisticoProceso estadistico
Proceso estadistico
 
Proceso estadistico
Proceso estadisticoProceso estadistico
Proceso estadistico
 
Medidas de tendencia NEPTALI AVILA
Medidas de tendencia NEPTALI AVILAMedidas de tendencia NEPTALI AVILA
Medidas de tendencia NEPTALI AVILA
 
Metodos estadisticos
Metodos estadisticosMetodos estadisticos
Metodos estadisticos
 

Más de Ivan Romeo Lopez Yar (14)

Proyecto de estadística inferencial con aplicación a spss 4
Proyecto de estadística inferencial con aplicación a spss 4Proyecto de estadística inferencial con aplicación a spss 4
Proyecto de estadística inferencial con aplicación a spss 4
 
Proyecto de estadística inferencial con aplicación a spss 4
Proyecto de estadística inferencial con aplicación a spss 4Proyecto de estadística inferencial con aplicación a spss 4
Proyecto de estadística inferencial con aplicación a spss 4
 
Actividad 3 ivan
Actividad  3 ivanActividad  3 ivan
Actividad 3 ivan
 
Ejercicios valoracion 14, 04
Ejercicios valoracion 14, 04Ejercicios valoracion 14, 04
Ejercicios valoracion 14, 04
 
Libro ivan
Libro ivanLibro ivan
Libro ivan
 
Ejercicico de valoracion 25 junio
Ejercicico de valoracion  25  junioEjercicico de valoracion  25  junio
Ejercicico de valoracion 25 junio
 
Ejercicios 24 de mayo
Ejercicios 24 de mayoEjercicios 24 de mayo
Ejercicios 24 de mayo
 
Base legal ivan
Base legal ivanBase legal ivan
Base legal ivan
 
Ivan lopez ecuador y el mundo
Ivan lopez  ecuador y el mundoIvan lopez  ecuador y el mundo
Ivan lopez ecuador y el mundo
 
Presentacion g20 ivan
Presentacion  g20 ivanPresentacion  g20 ivan
Presentacion g20 ivan
 
Presentacion g20 ivan
Presentacion  g20 ivanPresentacion  g20 ivan
Presentacion g20 ivan
 
Cuestionario finanzas
Cuestionario finanzasCuestionario finanzas
Cuestionario finanzas
 
Portafolio finanzas internacionales ii
Portafolio finanzas internacionales iiPortafolio finanzas internacionales ii
Portafolio finanzas internacionales ii
 
Finanzas expo
Finanzas expoFinanzas expo
Finanzas expo
 

Correlación y relación lineal: ejercicios prácticos

  • 1. UNIVERSIDAD POLITÉCNICA ESTATAL DEL CARCHI ESCUELA DE COMERCIO EXTERIOR Y NEGOCIACIÓN COMERCIAL INTERNACIONAL TEMA: Ejercicios de Correlación y Relación lineal Msc. Jorge pozo Integrantes: Aguirre Jonathan Ayala Maricela Gordón María López Iván NIVEL: 6TO “A” 2012
  • 2. TEMA: Correlación y Relación Lineal Problema: La dificultad del estudiante para calcular la correlación y relación lineal Objetivos: Objetivo General. Identificar comocalcular la correlación y relación lineal Objetivos Específicos.  Recopilar conceptos sobre correlación y relación lineal  Analizar los conceptos sobre correlación y relación lineal  Poner en práctica los conocimientos sobre correlación y relación lineal
  • 3. Justificación Este trabajo se realiza para que el estudiante sea práctico en el cálculo de la correlación y relación lineal y domine bien el tema y se involucre en investigaciones cada vez más profundas analizando algunas características generales como es la de calcular el coeficiente de correlación rdePearson de acuerdo a los datos planteados, al observar los resultados se puede sacar importantes análisis con el fin de determinar si es aceptable o no el tipo de caso aplicado,
  • 4. Desarrollo CORRELACIÓN ENTRE DOS CONJUNTOS DE DATOS AGRUPADOS EN CLASES El presente tema nos conduce a calcular el coeficiente de correlación r, que nos proporciona información de la fuerza de la relación que existe entre dos conjuntos de datos que se encuentran agrupados, cada uno de ellos formando por separados una distribución de frecuencias, mejor dicho teniendo por separado sus intervalos de clase con sus respectivas frecuencias. Para realizar una exposición del tema en forma más entendible, presentamos el ejemplo del Cuadro Nº 4.1.7. Ejemplo: Calcular el grado de correlación entre las puntaciones obtenidas en inventario de hábitos de estudio y los puntajes obtenidos en un examen de Matemática, aplicados a un total de 134 alumnos de un colegio de la localidad. CUADRO Nº 4.1.7 X Hábitos de estudio 20 30 30 40 40 50 50 60 Total Y Matemática 70 80 3 2 2 7 60 70 1 0 4 5 10 50 60 2 6 16 3 27 40 50 4 14 19 10 47 30 40 7 15 6 0 28 20 30 8 2 0 1 11 10 20 1 1 2 4
  • 5. Total 23 40 48 23 134 Podemos notar que el problema no es tan simple, como el caso anterior, dado que ahora los datos se han clasificado en una tabla de doble entrada Nº 4.1.7. Este cuadro muestra, en la primera columna del lado izquierdo los intervalos de clase de la variable Y, los que cubren todos los posibles datos acerca de las puntuaciones alcanzadas por los estudiantes en la prueba de Matemática. Nótese que los intervalos crecen de abajo hacia arriba. En la fila superior se presentan los intervalos de clase todos los 134 posibles datos acerca de los puntajes obtenidos por los estudiantes en la variable hábitos de estudios representados por la letra X. Dentro del Cuadro Nº 4.1.7 en los casilleros interiores o celdas de la tabla, se encuentran las frecuencias de celdas que corresponden a puntajes que pertenecen tanto a un intervalo de la variable Y como a un intervalo de la variable X. En la fila interior del Cuadro se presentan los totales de los puntajes de la variable X, hábitos de estudio. Esos totales se llaman frecuencias marginales de la variable X y se representan por . En la última columna de la derecha se encuentran los totales de los puntajes de la variable rendimiento en matemática. Estos totales se denominan frecuencias marginales de la variable Y. Cuando los datos se presentan tal como el presente caso, formando tablas de doble entrada, es conveniente usar el método clave que expondremos a continuación porque con este procedimiento se evita manejar grandes números, como sería el caso si se emplearán las fórmulas para trabajar con la calculadora de bolsillo. La fórmula que utilizaremos es la siguiente:
  • 6. Para obtener los datos que deben aplicarse en la fórmula Nº 4.1.2., vamos a construir el cuadro auxiliar Nº 4.1.8, al mismo tiempo que se explica el significado de los símbolos de esa fórmula. Lo primero que hacemos es reemplazar los intervalos horizontales y verticales por sus respectivas marcas de clase; a continuación adicionaremos al Cuadro Nº 4.1.7, cinco columnas por el lado derecho; cuyos encabezamientos son: para la primera para la segunda, para la tercera, para la cuarta y para la quinta columna. Por la parte inferior del cuadro le adicionamos cuatro filas que se nombran: para la primera para la segunda fila que está debajo de la anterior, para la tercera fila y por último, para la cuarta fila que está debajo de todas; de esta manera se va elaborando el Cuadro Auxiliar Nº 4.1.8. 1) Para determinar las frecuencias marginales que se deben colocar en la columna para la primera para la segunda, para la tercera, sumamos las frecuencias de las celdas que están en la misma fila de la marca de clase 75, obtenemos: 3+2+2=7, número que se escribe en el primer casillero o celda de la columna para la primera para la segunda, para la tercera, En la fila de la marca de clase 65, sumamos 1+4+5=10, número que se escribe debajo del 7. Para la fila de la marca de clase 55, tenemos: 2+6+16+3=27. Para la fila de la marca de clase 45, se tiene: 4+14+19+10=47. En igual forma: 7+15+6=28. Lo mismo: 8+2+1=11 Y en la última fila: 1+1+2=4
  • 7. A continuación sumamos estas frecuencias marginales de la variable Y: 7+10+27+47+28+11+4=134 es el total general. 2) Ahora a determinar las frecuencias marginales de la variable X: En columna encabezada con la marca de clase 25 sumemos verticalmente las frecuencias: 1+2+4+7+8+1=23. En la columna encabezada con 35, tenemos: 3+6+14+15+2=40 En la siguiente: 2+4+16+19+6+1=48 En la última: 2+5+3+10+1+2=23 3) Centremos nuestra atención en la columna encabezada para la primera para la segunda, para la tercera, este signo significa desviación unitaria, y procedemos en la misma forma que en las Tablas Nº 2.1.2 y Nº 2.1.3 (b). recuerden que las desviaciones unitarias positivas: +1, +2, y +3 corresponden a los intervalos mayores y por el contrario las desviaciones unitarias negativas: -1, -2 y -3 corresponden a los intervalos menores. Como origen de trabajo se tomó la marca de clase 45 y por lo tanto su desviación unitaria es cero. 4) Luego vamos a determinar las desviaciones unitarias horizontales de la variable X. el origen de trabajo es la marca de clase 45 que se halla en la fila superior del cuadro, por esa razón, escribimos cero debajo de la frecuencia marginal 48. Las desviaciones unitarias negativas: -1 y -2 se escriben a la izquierda cero, porque se corresponden con los intervalos de clase que tienen menores marcas de clase y que están a la izquierda de 45. La desviación unitaria positiva, se corresponde con el intervalo de mayor marca de clase, 55 (en parte superior del Cuadro Nº 4.1.8.) 5) A continuación vamos a determinar los valores que deben colocarse en la columna encabezada ; este símbolo indica que se debe multiplicar cada
  • 8. valor de por su correspondiente valor de , así: 7(+3)=21; 10(+2)=20; 27(+1)=27; 47(0)=0; 28(-1)=-28; 11(-2)=-22 y 4(-3)=-12. Sumando algebraicamente, tenemos: 21+20+27=68 los positivos: y (-28)+ (-22)+ (-12)=-62 los negativos. Por último: 68-62=6 total, que se coloca en la parte inferior de la columna Para obtener los valores de la cuarta columna encabezada debemos tener en cuenta que ( , por lo tanto basta multiplicar cada valor de la segunda columna por su correspondiente valor de la tercera columna así se obtiene el respectivo valor de la cuarta columna. En efecto: (+3)(21)=63; (+2)(20)=40; (+1)(27)=27; 0*0=0; (-1)(-28)=28; (-2)(-22)=44 y (-3)(- 12)=36 La suma: 63+40+27+28+44+36=238 Ahora nos fijamos horizontalmente en la tercera fila. Tenemos que ( = por consiguiente basta multiplicar verticalmente un valor de la primera fila por su correspondiente valor de la segunda dila para obtener el respectivo valor de la tercera fila. (23)(-2)=-46; (40)(-1)=-40; (48)(0)=0 y (23)(+1)=23 Sumando horizontalmente: (-46)+ (-40)+ (23)=-86+23=-63 Vamos por la cuarta fila; vemos que . Luego basta multiplicar cada elemento de la segunda fila por su correspondiente elemento de la tercera fila para obtener el respectivo elemento de la cuarta fila así:
  • 9. (-2)(46)=92; (-1) (-40)=40; 0*0=0 y (+1) (23)=23 Para obtener los valores de la quinta columna observamos que hay tres factores; el 1º es la frecuencia de la celda o casillero que se está considerando, el segundo factor es la desviación unitaria , el tercer factor es la desviación unitaria . Por tanto el procedimiento será el siguiente: Tomemos el número 3 que es la frecuencia de la celda determinada por el cruce de los intervalos que tienen la marcha de clase 75 horizontalmente y 35 verticalmente. Bajemos la vista del número 3 hacia donde se halla el respectivo valor (-1) de la desviación unitaria (ver la línea punteada). Para indicar el tercer factor corremos la vista del número 3 hacia su derecha hasta llegar a la columna de las desviaciones unitarias y ubicamos el número +3 (ver la línea punteada) formemos el producto de estos tres números: (3) (-1) (+3)=-9. Este número -9 encerrado en un semicírculo lo escribimos en la celda elegida. En la misma fila tomamos la celda siguiente: (2) (0) (+3)=0 Continuando hacia la derecha: (2) (+1) (+3)=6
  • 10. CUADRO AUXILIAR Nº 4.1.8 CUADRO CORREGIDO DELCUADRO AUXILIAR Nº 4.1.8 La fórmula del paso (9) lleva el signo para indicar que se deben sumar horizontalmente los números que están encerrados en los semicírculos de esa primera fila elegida, así: -9+0+6=-3. Este número se escribe en la quinta columna.
  • 11. Trabajemos con la siguiente fila: (1) (-2) (+2)=-4 se encierra en un semicírculo. (0)(-1)(+2)=0 (4)(0)8+2)=0 (5)(+1)(+2)=10 Sumando 0+0+10=10 Ahora con la tercera fila: (2)(-2)(+1)=-4 (6)(-1)(+1)=-6 (16)(0)(+1)=0 (3)(+1)(+1)=3 Sumando: (-4)+(-6)+0+3=-7 Cuarta fila: (7)(-2)(-1)=14 (15)(-1)(-1)=15 (6)(0)(-1)=0 (0)(+1)(-1)=0 La suma es: 14+15=29 (8)(-2)(-2)=32 (2)(-1)(-2)=4 (0)(0)(-2)=0 (1)(+1)(-2)=-2
  • 12. La suma es: 32+4-2=34 Séptima fila: (1)(-2)(-3)=6 (1)(0)(-3)=-6 (2)(1)(-3)=-6 Sumando: 6+0-6=0 Sumando los valores de la columna quinta. -3+6-7+0+29+34+0=69-10=59 Reuniendo los resultados anteriores, se tienen los datos para aplicar en fórmula Nº 4.1.2. n=134
  • 13. RELACIONES La correlación se ocupa de establecer la magnitud y la dirección de las relaciones. Antes de profundizar en estos aspectos particulares de las relaciones, analizaremos algunas características generales de éstas, con las cuales podemos comprender mejor el material específico acerca de la correlación. RELACIONES LINEALES Para iniciar nuestro análisis de las relaciones, veamos una relación entre dos variables. La siguiente tabla muestra el salario mensual que percibieron cinco agentes ventas y el valor en dólares de la mercancía vendida por cada uno de ellos en ese mes. AGENTE VARIABLE X MERCANCÍA Y VARIABLE VENDIDA ($) SALARIO ($) 1 0 500 2 1000 900 3 2000 1300 4 3000 1700 5 4000 2100
  • 14. Podemos analizar mejor la relación entre estas variables si trazamos una gráfica utilizando los valores X y Y, para cada agente de ventas, como los puntos de dicha gráfica. Él es una gráfica de dispersión o dispersigrama. Una gráfica de dispersión o dispersigrama es una gráfica de parejas de valores X y Y. La gráfica de dispersión para los datos de los agentes de ventas aparece en la figura 6.1. En relación con esta figura, vemos que todos los puntos caen sobre una línea recta. Cuando una línea recta describe la relación entre dos variables, se dice que esta relación lineal. Una relación lineal entre dos variables es aquella que puede representarse con la mejor exactitud mediante una línea recta. Observe que no todas las relaciones son lineales; algunas son curvilíneas. En este caso, al trazar una gráfica de dispersión para las variables X y Y, una línea curva ajusta mejor a los datos que una línea recta.
  • 15.
  • 16. CÁLCULO DE LA (r) DE PEARSON La ecuación para calcular la r de Pearson mediante datos: Donde es la suma de los productos de cada pareja de puntajes z. Para utilizar esta ecuación, primero hay que convertir cada dato en bruto en su valor transformado. Esto puede tardar mucho tiempo y crear errores de redondeo. Con algún álgebra, esta ecuación se puede transformar en una ecuación de cálculo que utilice datos en bruto: ECUACIÓN PARA EL CÁLCULO DE LA (r) DE PEARSON Donde: es la suma de los productos de cada pareja X y Y, también se llama la suma de productos cruzados. La tabla 6.4 contiene algunos de los datos hipotéticos reunidos a partir de cinco sujetos. Datos hipotéticos para el cálculo de la r de Pearson TABLA 6.4 SUBJETIVO X Y XY A 1 2 1 4 2 B 3 5 9 25 15 C 4 3 16 9 12
  • 17. D 6 7 36 49 42 E 7 5 49 25 35 TOTAL 21 22 111 112 106 Utilicemos estos datos para calcular la r de Pearson: es la suma de los productos cruzados; se determina multiplicando los datos X y Y para cada sujeto y luego sumando los productos resultantes. El cálculo de y de los otros términos aparece en la tabla 6.4. al sustituir estos valores en la ecuación anterior, obtenemos.
  • 18. PROBLEMA DE PRÁCTICA 6.1 Resolvamos otro ejercicio. Esta utilizaremos los datos de la tabla 6.1. Para su conveniencia, hemos reproducido estos datos en las primeras tres columnas de la tabla 6.5. En este ejemplo tenemos una relación lineal imperfecta y estemos interesados en calcular la magnitud y dirección de la relación mediante la r de Pearson. La solución también aparece en la tabla 6.5. IQ y el promedio de las calificaciones: cálculo de la r de Pearson TABLA 6.5 ESTUDIANTE IQX PROMEDIO NÚMERO DE DATOS Y 1 110 1.0 12,100 1.00 110.0 2 112 1.6 12,544 2.56 179.2 3 118 1.2 13,924 1.44 141.6 4 119 2.1 14,161 4.41 249.9 5 122 2.6 14,884 6.76 317.2 6 125 1.8 15,625 3.24 225.0 7 127 2.6 16,129 6.76 330.2 8 130 2.0 16,900 4.00 260.0
  • 19. 9 132 3.2 17,424 10.24 422.4 10 134 2.6 17,956 6.76 384.4 11 136 3.0 18,496 9.00 408.0 12 138 3.6 19,044 12.96 496.8 TOTAL 1503 27.3 189,187 69.13 3488.7 Una segunda interpretación de la r de Pearson. La r de Pearson también se puede interpretar en términos de la variabilidad de Y explicada por medio de X. este punto de vista produce más información importante acerca de r y la relación entre X y Y. Considere, por ejemplo, la figura 6.9, en la cual se muestra una relación imperfecta entre X y Y. En este ejemplo, la variable X representa una competencia de ortografía y la variable Y la habilidad en la escritura de seis estudiantes de tercer grado. Suponga que queremos predecir la calificación en la escritura de María, la estudiante cuya calificación en ortografía es de 88. Si no hubiese una relación entre la escritura y la ortografía.
  • 20. EJERCICIOS DE APLICACIÓN 1. En un largo curso de introducción a la sociología, un profesor hace dos exámenes. El profesor quiere determinar si las calificaciones de los estudiantes en el segundo examen correlacionadas con las calificaciones del primero. Para facilitar la los, se elige una muestra de ocho estudiar calificaciones aparecen en la siguiente tabla. ESTUDIANTE EXÁMEN 1 EXÁMEN 2 1 60 60 2 75 100 3 70 80 4 72 68 5 54 73 6 83 97 7 80 85 8 65 90 a. Construya una gráfica de dispersión para datos, utilizando la calificación del primer examen como la variable X. ¿Parece lineal la relación? b. Suponga que existe una relación lineal en calificaciones de los dos exámenes, calcule la r de Pearson. c. ¿Qué tan bien explican la relación, las calificaciones del segundo examen?
  • 21. 120 100 80 60 Series1 40 20 0 0 20 40 60 80 100 0,629531757
  • 22. Se puede decir que es una relación Baja y positiva que los dos exámenes tienen entre si 2. Un investigador realiza un estudio de la relación entre el consumo de cigarros y las enfermedades determinan la cantidad de cigarros fumados diariamente y de días de ausencia en el trabajo dura último año debido a una enfermedad para 13 individuos en la compañía donde trabaja este investigador. Los datos aparecen en la tabla anexa. SUJETO CIGARROS DÍAS DE CONSUMIDOS AUSENCIA 1 0 1 2 0 3 3 0 8 4 10 10 5 13 4 6 20 14 7 27 5 8 35 6 9 35 12 10 44 16 11 53 10 12 60 16 a. Construya una gráfica de dispersión para estos datos: ¿Se ve una relación lineal? b. Calcule el valor de la r de Pearson. c. Elimine los datos de los sujetos 1, 2, 3, 10, 11 y 12. Esto disminuye el rango de ambas variables. Vuelva a calcular r para
  • 23. los sujetos restantes. ¿Qué afecto tiene la disminución del rango sobre r? d. A utilizar todo el conjunto de datos, ¿qué porcentaje de la variabilidad en el número de días de ausencia es explicado por la cantidad de cigarros fumados diariamente? ¿De qué sirve ese valor? 18 16 14 12 10 8 Series1 6 4 2 0 0 20 40 60 80
  • 24. 0,6753 16 14 12 10 8 6 Series1 4 2 0 0 10 20 30 40
  • 25. 0,0318 3. Un educador ha construido un examen para las aptitudes mecánicas y desea determinar si éste es confiable, mediante dos administraciones con un lapso de 1 mes entre ellas. Se realiza un estudio en el cual 10 estudiantes reciben dos administraciones del examen, donde la segunda administración ocurre un mes después que la primera. Los datos aparecen en la tabla. a. Construya una gráfica de dispersión para las parejas de datos. b. Determine el valor de r. c. ¿Sería justo decir que éste es un examen confiable? Explique esto al utilizar . SUJETO ADMINISTRACIÓN 1 ADMINISTRACIÓN 2 1 10 10 2 12 15 3 20 17 4 25 25
  • 26. 5 27 32 6 35 37 7 43 40 8 40 38 9 32 30 10 47 49 60 50 40 30 Series1 20 10 0 0 20 40 60
  • 27. 0,9881 La investigación no es confiable por que los datos son tomados en dos fecha totalmente distintas 4. Un grupo de investigadores ha diseñado un cuestionario sobre la tensión, consistente en 15 sucesos. Ellos están interesados en determinar si existe una coincidencia entre dos culturas acerca de la cantidad relativa de ajustes que acarrea cada suceso. El cuestionario se aplica a 300 estadounidenses y 300 italianos. Cada individuo debe utilizar el evento “matrimonio” como estándar y juzgar los demás eventos en relación con el ajuste necesario para el matrimonio. El matrimonio recibe un valor arbitrario de 50 puntos. Si se considera que un evento requiere de más ajustes que el matrimonio, el evento debe recibir más de 50 puntos. El número de puntos excedentes depende de la cantidad de ajustes requeridos. Después de que cada sujeto de cada cultura ha asignado puntos a todos los eventos, se promedian los puntos de cada evento. Los resultados aparecen en la siguiente tabla:
  • 28. EVENTOS ESTADOUNIDENSES ITALIANOS Muerte de la esposa 100 80 Divorcio 73 95 Separación de la pareja 65 85 Temporada en prisión 63 52 Lesiones personales 53 72 Matrimonio 50 50 Despedido del trabajo 47 40 Jubilación 45 30 Embarazo 40 28 Dificultades sexuales 39 42 Reajustes económicos 39 36 Problemas con la familia política 29 41 Problemas con el jefe 23 35 Vacaciones 13 16 Navidad 12 10 a. Suponga que los datos tienen al menos una escala de intervalo y calcule la correlación entre los datos estadounidenses y la de los italianos. b. Suponga que los datos sólo tienen una escala ordinal y calcule la correlación entre los datos de ambas culturas. 100 80 60 40 Series1 20 0 0 50 100 150
  • 29. 77,70+0,46X 0,8519 (Y-Ӯ )^2
  • 30. La r es alta y positiva es decir que los comportamiento de las dos nacionalidades son bastante similares INDIVIDUO EXÁMEN CON LÁPIZ SIQUIATRA SIQUIATRA Y PAPEL A B 1 48 12 9 2 37 11 12 3 30 4 5 4 45 7 8 5 31 10 11 6 24 8 7 7 28 3 4 8 18 1 1 9 35 9 6 10 15 2 2 11 42 6 10 12 22 5 3 5. Un psicólogo ha construido un examen lápiz - papel, a fin de medir la depresión. Para comparar los datos del examen con los datos de los expertos, 12 individuos “con perturbaciones emocionales” realizan el examen lápiz – papel. Los individuos también son calificados de manera independiente por dos siquiatras, de acuerdo con el grado de depresión determinado por cada uno como resultado de entrevistas detalladas. Los datos aparecen a continuación. Los datos mayores corresponden a una mayor depresión.
  • 31. a. ¿Cuál es la correlación entre los datos de los dos siquiatras? b. ¿Cuál es la correlación entre las calificaciones del examen con lápiz y papel y los datos de cada siquiatra? 14 12 10 8 6 Series1 4 2 0 0 5 10 15
  • 32. 0,8519 La relación se da con un mismo criterio por los psiquiatras 14 12 10 8 6 Series1 4 2 0 0 20 40 60
  • 33. 0,6973 La relación entre las dos variables es baja y positiva 14 12 10 8 6 Series1 4 2 0 0 20 40 60
  • 34. 0,697 6. Para este problema, suponga que usted es un psicólogo que labora en el departamento de recursos humanos de una gran corporación. El presidente de la compañía acaba de hablar con usted acerca de la importancia de contratar personal productivo en la sección de manufactura de la empresa y le ha pedido que ayude a mejorar la capacidad de la institución para hacer esto. Existen 300 empleados en esta sección y cada obrero fabrica el mismo artículo. Hasta ahora, la corporación sólo ha recurrido a entrevistas para elegir a estos empleados. Usted busca bibliografía y descubre dos pruebas de desempeño, lápiz – papel, bien estandarizadas, y piensa que podrían estar relacionados con los requisitos desempeño de esta sección. Para determinar si alguna de ellas se puede utilizar como dispositivo de selección, elige 10 empleados representativos de la sección de manufactura, garantizando que un amplio rango de desempeño quede representado en la muestra, y realiza las dos pruebas con cada empleado. Los datos aparecen en la siguiente tabla. Mientras mayor sea la calificación, mejor será el desempeño. Las calificaciones de desempeño en el trabajo. Las calificaciones de desempeño fabricados por cada empleado por semana, promediados durante los últimos 6 meses. a. Construya una gráfica de dispersión del desempeño en el trabajo y la primera prueba, utilizando la prueba 1 como la variable X. ¿Parece lineal la relación? b. Suponga que la relación anterior es lineal y calcule el valor de la r de Pearson.
  • 35. c. Construya una gráfica de dispersión del desempeño en el trabajo y la segunda prueba, utilizando la prueba 2 como la variable X. ¿Parece lineal la relación? d. Suponga que la relación anterior es lineal, calcule el valor de la r de Pearson. e. Si sólo pudiera utilizar una de las pruebas para la selección de los empleados, ¿utilizaría alguna de ellas? En tal caso, ¿cuál de ellas? Explique. EMPLEADO 1 2 3 4 5 6 7 8 9 10 Desempeño en el trabajo 50 74 62 90 98 52 68 80 88 76 Examen 1 10 19 20 20 21 14 10 24 16 14 Examen 2 25 35 40 49 50 29 32 44 46 35 120 100 80 60 Series1 40 20 0 0 10 20 30
  • 36. 0,5917 120 100 80 60 Series1 40 20 0 0 20 40 60
  • 38. Análisis El trabajo realizado acerca de cómo realizar calcular la correlación y relación lineal se analizado que es un método el cual permite comparar e interpretar resultados a través de la recolección de datos de cualquier institución con el objetivo de llegar a establecer deducciones. Conclusión. Al realizar el trabajo permite que cada uno de nosotros tenga conocimientos claros acerca de la correlación y relación lineal para poner en práctica en los problemas que se presentan el mundo en especial de comercio exterior, ayudan a interpretar datos en forma resumida los datos planteados y a dar solución al problema. Recomendación El tema de investigación es de mucha relevancia porque la correlación y relación lineal nos permiten determinar un promedio de algunos datos estadísticos, tomando variables correspondientes para la interpretación de los datos. Lincografía. www.profesorenlinea.cl/.../EstadisticaMediaMedianaModa.htm