SlideShare una empresa de Scribd logo
1 de 152
5
          Análisis de los datos
Vamos a ampliar en qué consiste la fase de analizar los datos
            empleando medidas descriptivas
                     www.auladeeconomia.com
¿Cómo se puede analizar la información?

Haga una lista de diferentes formas en las cuales se podría analizar la
información estadística con el fin de describir el conjunto de datos.
Indique tipos de datos que podrían calcularse.
Anote aquí los pasos que usted cree que se deben hacer.




                                  www.auladeeconomia.com
Estatura de
               jugadores de futbol




Kaká   Tévez   Villa   Messi   Zlatan Cristiano Ronaldinho Crouch
1,83   1,73     1,75    1,69    1,94    1,83       1,81     2,01
Estatura de
          jugadores de basketbol




Bryant   Gasol   James   Ming   Paul   O´Neal
 2,01    2,15    1,90    2,28   1,83    2,15
1,83   1,73
                               1,75   1,69
                               1,94   1,83
   Conjuntos de datos          1,81   2,01
                               2,01   2,15
                               1,90   2,28
                               1,83   2,15

¿Cómo describimos estos conjuntos de datos?
     Medidas de posición
     Medidas de variabilidad
Medidas de posición
       Medidas de posición central




Kaká   Tévez   Villa   Messi   Zlatan Cristiano Ronaldinho Crouch
1,83    1,73   1,75     1,69    1,94    1,83       1,81     2,01


 Moda: Dato más frecuente:       1,83
Medidas de posición
   Medidas de posición central




Bryant    Gasol   James     Ming   Paul   O´Neal
 2,01     2,15    1,90      2,28   1,83    2,15


Moda: Dato más frecuente:   2,15
Medidas de posición
       Medidas de posición central




Kaká   Tévez    Villa    Messi   Zlatan Cristiano Ronaldinho Crouch
1,83    1,73     1,75     1,69    1,94    1,83       1,81      2,01


 Mediana: La mitad de los datos son menores y
               la mitad de los datos son mayores:           1,82
Medidas de posición
   Medidas de posición central




Bryant    Gasol   James      Ming      Paul    O´Neal
 2,01      2,15    1,90       2,28      1,83    2,15


Mediana: La mitad de los datos son menores y
          la mitad de los datos son mayores:   2,08
Medidas de posición
       Medidas de posición central




Kaká    Tévez     Villa     Messi     Zlatan Cristiano Ronaldinho Crouch
1,83    1,73       1,75       1,69     1,94      1,83        1,81       2,01

 Media: Promedio: Suma de datos dividido entre
               número de datos:
 1,83 + 1,73 + 1,75 + 1,69 + 1,94 + 1,83 + 1,81 + 2,01 = 14,59 / 8 =   1,82
Medidas de posición
   Medidas de posición central




Bryant      Gasol    James          Ming        Paul        O´Neal
 2,01        2,15     1,90           2,28        1,83        2,15

Media: Promedio: Suma de datos dividido entre
         número de datos:
    2,01 + 2,15 + 1,90 + 2,28 + 1,83 + 2,15 = 12,32 / 6 =   2,05
Medidas de posición
        Medidas de posición no central




 Kaká   Tévez   Villa   Messi   Zlatan Cristiano Ronaldinho Crouch
 1,83    1,73   1,75     1,69    1,94    1,83       1,81     2,01


Cuartiles: Dividen el conjunto de datos en cuatro partes.
Medidas de posición
        Medidas de posición no central




 Kaká   Tévez       Villa   Messi   Zlatan Cristiano Ronaldinho Crouch
 1,83    1,73       1,75     1,69    1,94    1,83       1,81     2,01


Cuartil 1: La cuarta parte de los datos son menores y
                tres cuartas partes de los datos son mayores:   1,74
Medidas de posición
        Medidas de posición no central




 Kaká   Tévez       Villa   Messi   Zlatan Cristiano Ronaldinho Crouch
 1,83    1,73       1,75     1,69    1,94    1,83       1,81     2,01


Cuartil 3: Tres cuartas partes de los datos son menores y
                una cuarta parte de los datos son mayores:      1,89
1,83   1,73
                            1,75   1,69
                            1,94   1,83
   Conjuntos de datos       1,81   2,01
                            2,01   2,15
                            1,90   2,28
                            1,83   2,15

¿Cómo describimos estos conjuntos de datos?
     Medidas de posición
Medidas de posición



Moda                          1,83   2,15
Mediana                       1,82   2,08
Media                         1,82   2,05
Primer cuartil                1,74   1,93
Tercer cuartil                1,89   2,15
1,83   1,73
                               1,75   1,69
                               1,94   1,83
   Conjuntos de datos          1,81   2,01
                               2,01   2,15
                               1,90   2,28
                               1,83   2,15

¿Cómo describimos estos conjuntos de datos?
     Medidas de posición
     Medidas de variabilidad
Medidas de variabilidad




Kaká   Tévez   Villa   Messi   Zlatan Cristiano Ronaldinho Crouch
1,83    1,73   1,75     1,69    1,94    1,83       1,81     2,01


 Rango: Dato mayor menos dato menor:
                  2,01 - 1,69 = 0,32
Medidas de variabilidad




Bryant    Gasol    James     Ming     Paul   O´Neal
 2,01     2,15      1,90     2,28     1,83    2,15


Rango: Dato mayor menos dato menor:
                 2,28 - 1,83 = 0,55
Medidas de variabilidad
       Desviación media, Varianza y Desviación estándar




Kaká    Tévez   Villa   Messi   Zlatan Cristiano Ronaldinho Crouch
1,83     1,73   1,75     1,69    1,94    1,83       1,81     2,01

 Promedio: 1,82

 Desviación: Diferencia entre un valor de una serie y su media
   1,83 - 1,82 = 0,01               1,73 - 1,82 = -0,09
Desviación
   media: Desviación absoluta promedio
             = Suma de los valores absolutos de las desviaciones
               dividido entre el número de datos

     1,83 - 1,82 = 0,01    => 0,01
     1,73 - 1,82 = -0,09   => 0,09
     1,75 - 1,82 = -0,07   => 0,07
     1,69 - 1,82 = -0,13   => 0,13
     1,94 - 1,82 = 0,12    => 0,12
                                      Suma =   0,63
     1,83 - 1,82 = 0,01    => 0,01             8
     1,81 - 1,82 = -0,01   => 0,01             = 0,0788
     2,01 - 1,82 = 0,19    => 0,19
Varianza = Suma de los cuadrados de las desviaciones
            dividido entre el número de datos

    1,83 - 1,82 = 0,01    => 0,0001
    1,73 - 1,82 = -0,09   => 0,0081
    1,75 - 1,82 = -0,07   => 0,0049
    1,69 - 1,82 = -0,13   => 0,0169
    1,94 - 1,82 = 0,12    => 0,0144
                                       Suma =   0,0807
    1,83 - 1,82 = 0,01    => 0,0001             8
    1,81 - 1,82 = -0,01   => 0,0001             = 0,0101
    2,01 - 1,82 = 0,19    => 0,0361
Desviación
 estándar = Raíz cuadrada de la varianza


            Varianza = 0,0101

            Raíz cuadrada de 0,0101
            = 0,1004
Medidas de posición

      www.auladeeconomia.com
Medidas de posición


    Hay medidas que se ubican                   Otras medidas de posición no
alrededor del centro del conjunto                tienden a ubicarse en el centro
           de datos.                            del conjunto ordenado de datos.

  A estas medidas se les llama                Estas medidas se conocen como
medidas de posición central                              cuantilos

       Estas medidas son:                             Los cuantilos son:
                                                           Cuartiles
       Media o promedio                                  Percentiles
          Mediana                                           Deciles
            Moda                                          Quintiles.


                             www.auladeeconomia.com
Media aritmética


  Es la suma de los datos entre el           La fórmula para calcular la media es:
          número de datos.
                                             Población:         N

 Se denota por , si corresponde a                              X       i

         una población.                                       i 1

                                                                     N

Se denota por cuando se refiere a            Muestra:            n

           una muestra.                                         x       i
                                                           x   i 1

                                                                     n




                               www.auladeeconomia.com
En calculadora

Casio fx-570 ES
Pasos para calcular la media:
1. Presionar: Mode 3
2. Presionar AC
3. Presionar: Shift 1 2
4. Introducir datos en la columna:
  •   Usar tecla = para introducir cada dato
5. Presionar AC
6. Presionar: Shift 1 5 2 =


                           www.auladeeconomia.com
En calculadora

Casio fx-95 MS o fx-82 MS:
Pasos para calcular la media:
1. Presionar: Mode 2
2. Introducir datos:
  •   dato   M+
  •   Etc.
3. Presionar: Shift 2 1 =




                      www.auladeeconomia.com
Ejercicio:

 Suponga que se tienen los siguientes datos correspondientes a las ventas
 mensuales que ha realizado un vendedor durante los últimos siete meses
 (en millones de dólares):

                            20, 33, 42, 40, 19, 23, 28

 Calcule la media aritmética.

Respuesta:
El cálculo de la media sería:

                         20  33  42  40  19  23  28
                    x                                     29.29
                                        7
Según ese resultado, sus ventas mensuales promedio son de 29.29 millones de dólares.




                                  www.auladeeconomia.com
Ejercicio:

 Suponga que se tienen los siguientes datos correspondientes a las ventas
 mensuales que ha realizado un vendedor durante los últimos siete meses (en
 millones de dólares):
                           20, 33, 42, 40, 19, 23, 2800

 Calcule la media aritmética. ¿Representa adecuadamente la media al
 conjunto de datos?
Respuesta:
El cálculo de la media sería:

                       20  33  42  40  19  23  2800
                  x                                       425,29
                                       7
Según ese resultado, sus ventas mensuales promedio son de 425,29 millones de
dólares.
El valor extremo de 2800 “distorsiona” el valor de la media, ocasionando que no
represente bien al conjunto de datos.

                                  www.auladeeconomia.com
Media aritmética


Las principales características de la                  Otras características son:
       media aritmética son:
                                                           Es única para cada caso.
Depende de cada una de las medidas
   que forman la serie de datos                   Permite representar mediante un
                                                   solo valor de la serie de valores.
Se halla afectada excesivamente por
los valores extremos del conjunto de             Se calcula con todos los datos de la
     datos (principal desventaja).                         serie de valores.

      Se calcula con facilidad.                     Es susceptible de operaciones
                                                             algebraicas.


                                  www.auladeeconomia.com
Media aritmética ponderada


Se emplea cuando hay datos que se           La fórmula para calcular la media es:
      repiten varias veces.
                                            Caso de valores repetidos:
                                                              k

  También cuando hay datos con                              x           i   fi
 diferente importancia o diferente                     x   i 1

                                                                    n
              peso.
                                            Caso de valores con diferente peso:
                                                                   k

                                                              x w           i       i
                                                         x       i 1
                                                                     k

                                                                   w
                                                                   i 1
                                                                                 i




                              www.auladeeconomia.com
Ejercicio:

 Suponga que una empresa posee quince vendedores de un determinado
 producto.

 Cuatro de los vendedores lograron vender 50 unidades, 6 vendieron 40
 unidades, tres vendieron 35 unidades y 2 vendieron 20 unidades.

 ¿Cuál es el número de unidades promedio de cada vendedor?

Respuesta: Dado que existen valores repetidos, entonces se aplica la fórmula:
 Unidades (X)      Frecuencia             k
      50                4                x         i   fi
                                                                 4  50  6  40  3  35  2  20
      40                6           x   i 1
                                                                                                   39
                                                n                               15
      35                3
                                       Es decir, el número de unidades promedio
      20                2              vendidas por cada vendedor es de 39
     Total             15              unidades.


                                  www.auladeeconomia.com
Ejercicio:
Una empresa obtiene distintos márgenes de utilidad según los diferentes
productos que vende. Suponiendo que vende 3 productos diferentes A, B y C,
con rentabilidades de 20%, 30% y 40% respectivamente, de acuerdo con los
siguientes datos: las ventas de A son de $200 millones, las de B de $100
millones y las de C de $60 millones.
¿Cuál es el margen de utilidad promedio?

Respuesta:
Para responder a esta pregunta es necesario calcular la media ponderada, ya que el
volumen de ventas de cada producto es distinto, y eso afecta al promedio. El cálculo
debe ser el siguiente:
  Utilidad Ventas           k

   20%        200           x w    i       i
                                                    20%  200  30%  100  40%  60
                       x   i 1
                                                                                     26.11%
   30%        100              k

                             w
                                                                  360
                                        i
   40%         60            i 1

   Total      360     El margen de utilidad promedio es de 26.11%.

                                            www.auladeeconomia.com
Mediana


Es una medida de posición que divide         Si el número N es el número de
  a la serie de valores en dos partes        datos de la serie, entonces la
                iguales:                     posición de la mediana será:

un cincuenta por ciento que es mayor                             N 1
                                                        PMed 
        o igual a la mediana                                      2

 y otro cincuenta por ciento que es          Cuando el número N de datos es una
       menor o igual que ella.               cantidad par, se requerirá obtener el
                                             punto medio para poder obtener la
          Se denota Med.                     mediana.



                               www.auladeeconomia.com
Ejercicio:
 Sean los siguientes datos:
                               5, 12, 7, 8, 10, 6, y 9
 los años de servicios de un grupo de trabajadores.
 ¿Cuál es la mediana?
Respuesta:
Lo primero que se hace es ordenar los datos en forma creciente o decreciente:

                                   5, 6, 7, 8, 9, 10, 12

Dado que se tienen 7 datos, una cantidad impar de datos, se aplica la formula:

                                       N 1 7 1
                              PMed             4
                                        2     2
Ese resultado indica que la mediana será el cuarto dato de la serie, es decir, la mediana
será 8, Med = 8.

                                   www.auladeeconomia.com
Ejercicio:
 Sean los siguientes datos:
                              5, 12, 7, 8, 11, 10, 6, y 9
 los años de servicios de un grupo de trabajadores.
 ¿Cuál es la mediana?
Respuesta:
Lo primero que se hace es ordenar los datos en forma creciente o decreciente:

                                  5, 6, 7, 8, 9, 10, 11, 12

Dado que se tienen 8 datos, una cantidad par de datos, se aplica la formula:

                                    N 1 8 1
                          PMed               4,5
                                     2     2
Ese resultado indica que la mediana estará entre el cuarto y el quinto dato de la serie, y
por tanto será necesario calcular el punto medio entre 8 y 9, es decir, la mediana será
(8+9)/2, Med = 8,5.
                                    www.auladeeconomia.com
Moda


Es el valor de la variable que más se         Sus principales características son:
   repite en el conjunto de datos.
                                               No se afecta por valores extremos
    Se designa como Mo o Mod.
                                                Se puede obtener en una forma
Es posible que un conjunto de datos                aproximada con facilidad.
     posea dos o más modas.
                                               Tiene poca utilidad si hay pocos
 En estos casa se habla de serie de           datos y si no hay tendencia central.
 datos bimodales o multimodales.
                                             Se utiliza principalmente con escalas
                                                           nominales .


                               www.auladeeconomia.com
Ejercicio:
 Con base en los siguientes conjuntos de datos, obtenga la moda:

                                      Conjunto 1:
                          12, 14, 14, 15, 18, 18, 18, 22, 25
                                      Conjunto 2:
                       12, 14, 14, 14, 15, 18, 18, 18, 22, 25

                                      Conjunto 3:
                                12, 14, 15, 18, 22, 25

                                      Conjunto 4:
                        12, 14, 14, 15, 18, 18, 18, 22, 2500
Respuesta:
1. El dato que más veces aparece es el 18, por tanto la moda es 18.
2. El dato que más veces aparece es el 14 y el 18, por tanto la moda es 14 y 18.
3. No tiene moda.
4. El dato que más veces aparece es el 18, por tanto la moda es 18.

                                   www.auladeeconomia.com
Ejercicios




www.auladeeconomia.com
Ejercicio:

 La media aritmética del siguiente conjunto de datos
 7, 20, 13, 14, 6, 9, 1
 es:

 ( a ) 70
 ( b ) 20
 ( c ) 14
 ( d ) 10

Respuesta:
La respuesta correcta es:
( d ) 10




                            www.auladeeconomia.com
Ejercicio:

 En el conjunto de valores 3, 4, 5, 5, 4, 7, 8, 4, 6, 9, 10, la
 mediana es:

 (a)4
 (b)7
 ( c ) 5,5
 (d)5
 (e)6

Respuesta:
La respuesta correcta es:
Se ordena: 3, 4, 4, 4, 5, 5, 6, 7, 8, 9, 10
N = 11, PMed = (N + 1) / 2 = (11 + 1) / 2 = 6 => Med = 5
(d)5


                                    www.auladeeconomia.com
Ejercicio:

 La moda del siguiente conjunto de datos
 7, 7, 20, 20, 13, 14, 13, 6, 9, 13, 6 es:

 (a)7
 ( b ) 20
 ( c ) 13
 (d)6


Respuesta:
La respuesta correcta es:
( c ) 13




                            www.auladeeconomia.com
Ejercicio:

A continuación se presentan tres conjuntos de datos. En cada caso, calcule la
media aritmética, la mediana y la moda del siguiente conjunto de datos:

                                     Conjunto 1:
 12, 13, 14, 14, 15, 15, 15, 16, 16, 16, 16, 16, 17, 17, 17, 18, 18, 19, 20
                                   Conjunto 2:
12, 13, 14, 15, 15, 16, 16, 17, 17, 17, 18, 18, 18, 19, 19, 19, 19, 19, 20, 20, 20
                                   Conjunto 3:
 12, 12, 12, 13, 13, 13, 13, 13, 14, 14, 14, 15, 15, 16, 16, 17, 17, 18, 19, 20

Además en cada caso:
Construya una gráfica (histograma) para representar a este conjunto de datos.
Observe la gráfica. Si dividiera la gráfica por la “mitad”, ¿es igual la parte derecha
a la parte izquierda?
Observe la relación entre la media, la mediana y la moda.
¿Cuál de las tres es mayor?

                                 www.auladeeconomia.com
Ejercicio:

 Calcule la media aritmética, la mediana y la moda del siguiente conjunto de datos:

         12, 13, 14, 14, 15, 15, 15, 16, 16, 16, 16, 16, 17, 17, 17, 18, 18, 19, 20

 Construya una gráfica (histograma) para representar a este conjunto de datos.
 Observe la gráfica. Si dividiera la gráfica por la “mitad”, ¿es igual la parte derecha a
 la parte izquierda?
 Observe la relación entre la media, la mediana y la moda.
 ¿Cuál de las tres es mayor?

Respuesta:                                    F
La respuesta correcta es:
Media = 16                                    5
Mediana = 16                                  4
Moda = 16                                     3
Esta es una distribución simétrica.           2
La media, la mediana y la moda son            1
iguales.
                                                    12 13 14 15 16 17 18 19 20 X

                                    www.auladeeconomia.com
Ejercicio:

 Calcule la media aritmética, la mediana y la moda del siguiente conjunto de datos:

      12, 13, 14, 15, 15, 16, 16, 17, 17, 17, 18, 18, 18, 19, 19, 19, 19, 19, 20, 20, 20

 Construya una gráfica (histograma) para representar a este conjunto de datos.
 Observe la gráfica. Si dividiera la gráfica por la “mitad”, ¿es igual la parte derecha a
 la parte izquierda?
 Observe la relación entre la media, la mediana y la moda.
 ¿Cuál de las tres es mayor?

Respuesta:                                      F
La respuesta correcta es:
Media = 17,19                                   5
Mediana = 18                                    4
Moda = 19                                       3
Esta es una distribución asimétrica             2
negativa:                                       1
 media < mediana < moda
                                                      12 13 14 15 16 17 18 19 20 X

                                      www.auladeeconomia.com
Ejercicio:

 Calcule la media aritmética, la mediana y la moda del siguiente conjunto de datos:

       12, 12, 12, 13, 13, 13, 13, 13, 14, 14, 14, 15, 15, 16, 16, 17, 17, 18, 19, 20

 Construya una gráfica (histograma) para representar a este conjunto de datos.
 Observe la gráfica. Si dividiera la gráfica por la “mitad”, ¿es igual la parte derecha a
 la parte izquierda?
 Observe la relación entre la media, la mediana y la moda.
 ¿Cuál de las tres es mayor?

Respuesta:                                      F
La respuesta correcta es:
Media = 14,8                                    5
Mediana = 14                                    4
Moda = 13                                       3
Esta es una distribución asimétrica             2
positiva:                                       1
 media > mediana > moda
                                                      12 13 14 15 16 17 18 19 20 X

                                      www.auladeeconomia.com
Simetría y asimetría


    Hay medidas para determinar el
   grado y tipo de la asimetría de un
          conjunto de datos.

    En este curso no se estudian esas
    medidas, por lo que la simetría o
     asimetría se determinará por la
 relación entre moda, mediana y media

               Entonces:
     Si Media = Med = Mo, simetría
Si Media > Med > Mo, asimetría positiva
Si Media < Med < Mo, asimetría negativa

                              www.auladeeconomia.com
Ejercicio:
Los siguientes son los ingresos de siete personas (en $/mes):

                   300, 450, 500, 250, 600, 550, 3000

Calcule e interprete la media, moda y mediana.
¿Cuál de las tres medidas describe mejor al conjunto de datos?

Respuesta:
La respuesta correcta es:
Media = 807.14 ->El ingreso promedio mensual es de $807,14.
Mediana = 500 ->La mitad de estas personas tiene un ingreso mensual inferior a $500.
Moda = No hay..
Dada la presencia de un valor extremo, entonces la mediana describe al conjunto mejor
que la media.



                                 www.auladeeconomia.com
Ejercicio:
Los siguientes son los pesos, en gramos, de una muestra de frascos de
mermelada que se envasan en una empresa:
                  252, 260, 266, 248, 240, 246, 255, 260,
                  270, 258, 259, 260, 264, 254, 256, 262
Calcule e interprete la media, moda y mediana.
¿Qué se puede concluir sobre la simetría o asimetría de los pesos?
Si cada frasco debe contener 250 gramos, ¿qué indican los datos calculados y
el tipo de simetría o asimetría que se presenta?
Respuesta:
La respuesta correcta es:
Media = 256,9 -> El peso promedio de los frascos es de 256,9 grs.
Mediana = 258,5 -> El 50% de los frascos contiene más de 258,5 grs., y el resto menos.
Moda = 260 -> El peso más frecuente es 260 grs.
Esta es una distribución asimétrica negativa (media < mediana < moda).
La empresa está “regalando” producto, pues la mayoría de los frascos contienen más de
lo especificado. La asimetría negativa indica que son pocos los pesos bajos y muchos los
pesos altos.

                                   www.auladeeconomia.com
Cuantiles


 Son medidas de posición tales que           Cuartiles: tres valores que dividen al
      superan a no más de cierta               conjunto ordenado de datos en
 proporción de las observaciones y a                    4 partes iguales.
la vez quedan superados por no más            Percentiles: 99 valores que dividen
  de la proporción complementaria,            al conjunto ordenado de datos en
 cuando las observaciones han sido                    100 partes iguales.
             ordenadas.
                                             Deciles: nueve valores que dividen al
Las principales de estas medidas son:          conjunto ordenado de datos en
               Cuartiles                               10 partes iguales.
              Percentiles
                                             Quintiles: cuatro valores que dividen
                Deciles
                                              al conjunto ordenado de datos en
               Quintiles
                                                        5 partes iguales.

                               www.auladeeconomia.com
Cuantiles

                       Conjunto ordenado de datos



P5 P10 P16    P25          P40      P50              P63        P75        P90   P95
   D1      D2     D3        D4      D5         D6          D7         D8    D9

              Q1                    Med                         Q3
                                     Q2




                            www.auladeeconomia.com
Relaciones entre cuantilos

  Cuartil Percentil           Decil Percentil            Quintil Percentil
   Q1       P25                D1     P10                 K1       P20
   Q3       P75                D2     P20                 K2       P40
                               D3     P30                  K3      P60
 Cuartil x 25 = Percentil      D4     P40                  K4      P80
                               D5     P50
                                                        Quintil x 20 = Percentil
                               D6     P60
                               D7     P70
                               D8     P80
                               D9     P90
                            Decil x 10 = Percentil

Recuerde que para calcular mediana, cuartiles, percentiles, quintiles y deciles,
              los datos deben ordenarse ascendentemente.
                               www.auladeeconomia.com
Ejercicio:
 Sean los siguientes datos:
         20, 40, 70, 80, 90, 100, 100, 100, 120, 120, 140, 150

 Determine el percentil 80.
Respuesta:
Lo primero que se hace es verificar que los datos estén ordenados en forma creciente:
                    1   2 3    4    5    6    7     8     9   10   11   12
                  20, 40, 70, 80, 90, 100, 100, 100, 120, 120, 140, 150

Se aplica la formula con n = 12 y m = 80:

   Pm  100 n  1
          m


   P  100 12  1  0,8(13)  10,4
    80
         80                                                        Posición del percentil

                                   décimo dato
                                          120 + 0,4 * 20 = 128
                                     www.auladeeconomia.com
Ejercicio:
 Sean los siguientes datos:
         20, 40, 70, 80, 90, 100, 100, 100, 120, 120, 140, 150

 Determine el cuartil 1.
Respuesta:
Lo primero que se hace es verificar que los datos estén ordenados en forma creciente:
                    1   2 3    4     5    6    7     8     9   10   11   12
                  20, 40, 70, 80, 90, 100, 100, 100, 120, 120, 140, 150

Se sabe que Q1 = P25 y se aplica la formula con n = 12 y m = 25:

    Pm  100 n  1
            m


   P25  100 12  1  0,25(13)  3,25
           25

                                   tercer dato
                                              70 + 0,25 *10 = 72,5
                                      www.auladeeconomia.com
Ejercicio:
 Sean los siguientes datos:
         20, 40, 70, 80, 90, 100, 100, 100, 120, 120, 140, 150

 Determine el cuartil 3.
Respuesta:
Lo primero que se hace es verificar que los datos estén ordenados en forma creciente:
                    1   2 3    4    5    6     7    8     9   10   11   12
                  20, 40, 70, 80, 90, 100, 100, 100, 120, 120, 140, 150

Se sabe que Q3 = P75 y se aplica la formula con n = 12 y m = 75:

    Pm  100 n  1
            m


   P75  100 12  1  0,75(13)  9,75
           75

                                   noveno dato
                                             120 + 0,75 * 0 = 120
                                     www.auladeeconomia.com
Ejercicio:
 Sean los siguientes datos:
         20, 40, 70, 80, 90, 100, 100, 100, 120, 120, 140, 150

 Determine el decil 4.
Respuesta:
Lo primero que se hace es verificar que los datos estén ordenados en forma creciente:
                    1   2 3    4    5    6    7     8     9   10   11   12
                  20, 40, 70, 80, 90, 100, 100, 100, 120, 120, 140, 150

Se sabe que D4 = P40 y se aplica la formula con n = 12 y m = 40:

    Pm  100 n  1
            m


   P40  100 12  1  0,40(13)  5,2
           40

                                   quinto dato
                                             90 + 0,2 * 10 = 92
                                     www.auladeeconomia.com
Ejercicio:

 Sean los siguientes datos:

              45, 56, 72, 81, 43, 62, 55, 90,
             49, 52, 60, 75, 66, 72, 58, 50, 88

 Calcule e interprete:
 • Cuartil 1
 • Cuartil 3
 • Decil 7
 • Percentil 42
 • Percentil 93
 • Quintil 3
                         www.auladeeconomia.com
Ejercicio:
 Sean los siguientes datos:

             45, 56, 72, 81, 43, 62, 55, 90, 49, 52, 60, 75, 66, 72, 58, 50, 88

 Calcule e interprete el cuartil 1.

Respuesta:
Lo primero que se hace es verificar que los datos estén ordenados en forma creciente:
              1   2 3     4   5       6     7 8     9 10 11 12 13 14 15 16 17
              43, 45, 49, 50, 52, 55, 56, 58, 60, 62, 66, 72, 72, 75, 81, 88, 90

Se sabe que Q1 = P25 y se aplica la formula con n = 17 y m = 25:

    Pm  100 n  1
            m


   P25  100 17  1  0,25(18)  4,5
           25

                                  cuarto dato
                                                  50 + 0,5 * 2 = 51
                                          www.auladeeconomia.com
Ejercicio:
 Sean los siguientes datos:

             45, 56, 72, 81, 43, 62, 55, 90, 49, 52, 60, 75, 66, 72, 58, 50, 88

 Calcule e interprete el cuartil 3.

Respuesta:
Lo primero que se hace es verificar que los datos estén ordenados en forma creciente:
              1   2 3     4   5       6     7 8     9 10 11 12 13 14 15 16 17
              43, 45, 49, 50, 52, 55, 56, 58, 60, 62, 66, 72, 72, 75, 81, 88, 90

Se sabe que Q3 = P75 y se aplica la formula con n = 17 y m = 75:

    Pm  100 n  1
            m


   P75  100 17  1  0,75(18)  13,5
           75

                                  13er dato
                                                  72 + 0,5 * 3 = 73,5
                                          www.auladeeconomia.com
Ejercicio:
 Sean los siguientes datos:

             45, 56, 72, 81, 43, 62, 55, 90, 49, 52, 60, 75, 66, 72, 58, 50, 88

 Calcule e interprete el decil 7.

Respuesta:
Lo primero que se hace es verificar que los datos estén ordenados en forma creciente:
              1   2 3     4   5     6     7 8     9 10 11 12 13 14 15 16 17
              43, 45, 49, 50, 52, 55, 56, 58, 60, 62, 66, 72, 72, 75, 81, 88, 90

Se sabe que D7 = P70 y se aplica la formula con n = 17 y m = 70:

    Pm  100 n  1
            m


   P70  100 17  1  0,70(18)  12,6
           70

                                    12º. dato
                                              72 + 0,6 * 0 = 72
                                        www.auladeeconomia.com
Ejercicio:
 Sean los siguientes datos:

             45, 56, 72, 81, 43, 62, 55, 90, 49, 52, 60, 75, 66, 72, 58, 50, 88

 Calcule e interprete el percentil 42.

Respuesta:
Lo primero que se hace es verificar que los datos estén ordenados en forma creciente:
              1   2 3    4    5   6      7 8    9 10 11 12 13 14 15 16 17
             43, 45, 49, 50, 52, 55, 56, 58, 60, 62, 66, 72, 72, 75, 81, 88, 90

Se sabe que P42 y se aplica la formula con n = 17 y m = 42:

    Pm  100 n  1
            m


   P42  100 17  1  0,42(18)  7,56
           42

                                  sétimo dato
                                               56 + 0,56 * 2 = 57,12
                                      www.auladeeconomia.com
Ejercicio:
 Sean los siguientes datos:

             45, 56, 72, 81, 43, 62, 55, 90, 49, 52, 60, 75, 66, 72, 58, 50, 88

 Calcule e interprete el percentil 93.

Respuesta:
Lo primero que se hace es verificar que los datos estén ordenados en forma creciente:
              1   2 3    4    5   6      7 8    9 10 11 12 13 14 15 16 17
             43, 45, 49, 50, 52, 55, 56, 58, 60, 62, 66, 72, 72, 75, 81, 88, 90

Se sabe que P93 y se aplica la formula con n = 17 y m = 93:

   Pm  100 n  1
          m


   P  100 17  1 0,93(18)  16,74
    93
         93

                                  16º. dato
                                            88 + 0,74 * 2 = 89,48
                                      www.auladeeconomia.com
Ejercicio:
 Sean los siguientes datos:

             45, 56, 72, 81, 43, 62, 55, 90, 49, 52, 60, 75, 66, 72, 58, 50, 88

 Calcule e interprete el quintil 3.

Respuesta:
Lo primero que se hace es verificar que los datos estén ordenados en forma creciente:
              1   2 3     4   5   6     7 8     9 10 11 12 13 14 15 16 17
              43, 45, 49, 50, 52, 55, 56, 58, 60, 62, 66, 72, 72, 75, 81, 88, 90

Se sabe que K3 = P60 y se aplica la formula con n = 17 y m = 60:

    Pm  100 n  1
            m


   P60  100 17  1  0,60(18)  10,8
           60

                                  décimo dato
                                              62 + 0,8 * 4 = 65,2
                                      www.auladeeconomia.com
Ejercicio:

 Un instituto de idiomas ha contratado un estudio de
 salarios de profesores (salarios mensuales). En dicho
 estudio se obtuvieron los siguientes resultados:

 Percentil 12 = $600         Cuartil 1 = $650
 Mediana = $725              Cuartil 3 = $800
 Quintil 4 = $1000           Decil 9 = $1200

 ¿Qué significan estos resultados?




                       www.auladeeconomia.com
Ejercicio – Respuesta:

• Percentil 12 = $600 => Un 12% de los profesores tiene un salario mensual
  inferior a $600, y un 88% de los profesores gana más de $600 al mes.
• Cuartil 1 = $650 => Un 25% (una cuarta parte) de los profesores tiene un
  salario mensual inferior a $650, y el 75% de los profesores gana más de
  $650 al mes.
• Mediana = $725 => Un 50% (la mitad) de los profesores tiene un salario
  menor que $725 al mes, y la otra mitad tiene un salario mayor que $725
  al mes.
• Cuartil 3 = $800 => Un 75% (tres cuartas partes) de los profesores tiene
  un salario menor que $800 al mes, y el 25% gana más de $800 al mes.
• Quintil 4 = $1000 => Un 80% (cuatro quintas partes) de los profesores
  tiene un salario menor de $1000 al mes, y el 20% gana más de $1000 al
  mes.
• Decil 9 = $1200 => Un 90% (nueve décimas) de los profesores tiene un
  salario mensual inferior a $1200, y un 10% de los profesores gana más de
  $1200 al mes.
                             www.auladeeconomia.com
Medidas de variabilidad o dispersión

              www.auladeeconomia.com
Medidas de variabilidad




 “Donde yo vivo el clima es muy      “Yo vivo cerca de una playa en un
 agradable, las temperaturas se          país del norte de Europa.
              ¿Sería indiferente paraLa temperaturaen
ubican entre los 18º y 22º, con un    usted vivir también tiene un
        promedio de 20º. estos dos lugares, promedio de 20º.
         cualquiera de                       dado que la
                                          A veces llega hasta 35º.
              temperatura promedioPero la misma? -5º o menos.
                                      es otras veces es
     Observe que no solo el promedio es importante,
              sino también la variabilidad.
                           www.auladeeconomia.com
Medidas de variabilidad


 La variabilidad, o dispersión de los           Las medidas de dispersión pueden
datos, es el grado en que los valores                  ser clasificadas en:
de una distribución o serie numérica
   tienden a acercarse o alejarse               - Medidas de dispersión absolutas
     alrededor de un promedio.                   - Medidas de dispersión relativas

 Cuando la dispersión es baja indica           Las medidas absolutas se expresan
     que la serie de valores es               en las mismas unidades de los datos.
    relativamente homogénea.
                                                 Como el recorrido, la desviación
Una variabilidad alta indica una serie          cuartil, la desviación estándar y la
      de valores heterogénea.                                 varianza.


                                www.auladeeconomia.com
Medidas de variabilidad


La varianza consiste en el promedio                      La desviación estándar es una
del cuadrado de las desviaciones de                    medida de variabilidad que consiste
un conjunto de datos con respecto a                     en la raíz cuadrada de la varianza.
             su media.

Se calcula como:                                      Se calcula como:
Varianza poblacional:                                 Desviación estándar poblacional:
                        N

                        (X     i     )2
                                                                     2
                
                 2      i 1
                               N
Varianza muestral:                                    Desviación estándar muestral:
                          n

                         (x    i    x )2
                                                                    s     s2
                s 
                 2      i 1
                               n 1

                                        www.auladeeconomia.com
Ejercicio:
 Suponga que se tiene el siguiente conjunto de cinco datos: 1, 1, 3, 10, 10 y se desea
 calcular la varianza y la desviación estándar de dicha población.
                                                n
Respuesta:
Primero calcular la media aritmética:
                                               X     1  1  3  10  10 25
                                                      i
                                             i 1
                                                                           5
                                                N               5          5
Se calcula la diferencia entre cada dato y la media, y luego se elevan al cuadrado:
                 Dato          Dato menos media               Se eleva al cuadrado
                   1              1 – 5 = -4                      (-4)² = 16
                   1              1 – 5 = -4                      (-4)² = 16
                   3              3 – 5 = -2                       (-2)² = 4
                  10              10 – 5 = 5                       (5)² = 25
                  10              10 – 5 = 5                       (5)² = 25
                                          Suma: =                     86
La suma se divide entre n : Varianza = 86 / 5 = 17,2
                            Desviación estándar = raíz(17,2) = 4,15

                                   www.auladeeconomia.com
Ejercicio:
 Suponga que se tiene el siguiente conjunto de cinco datos: 1, 1, 3, 10, 10 y se desea
 calcular la varianza y la desviación estándar de dicha muestra.
                                                n
Respuesta:
Primero calcular la media aritmética:          x     1  1  3  10  10 25
                                                      i
                                         x    i 1
                                                                            5
                                                n              5            5
Se calcula la diferencia entre cada dato y la media, y luego se elevan al cuadrado:
                 Dato          Dato menos media               Se eleva al cuadrado
                   1              1 – 5 = -4                      (-4)² = 16
                   1              1 – 5 = -4                      (-4)² = 16
                   3              3 – 5 = -2                       (-2)² = 4
                  10              10 – 5 = 5                       (5)² = 25
                  10              10 – 5 = 5                       (5)² = 25

                                          Suma: =              86
La suma se divide entre n -1: Varianza = 86 / 4 = 21,5
                              Desviación estándar = raíz(21,5) = 4,64

                                   www.auladeeconomia.com
En calculadora
Casio fx-570 ES
Pasos para calcular la desviación estándar:
1. Presionar: Mode 3
2. Presionar AC
3. Presionar: Shift 1 2
4. Introducir datos en la columna:
  •     Usar tecla = para introducir cada dato
5. Presionar AC
6. Presionar:
      Shift 1 5 3 = desviación estándar poblacional
      Shift 1 5 4 = desviación estándar muestral
      Para obtener la variancia, eleve al cuadrado el resultado anterior.

                              www.auladeeconomia.com
En calculadora

Casio fx-95 MS o fx-82 MS
Pasos para calcular la desviación
estándar:
1. Presionar: Mode 2
2. Introducir datos:
   •   dato     M+
   •   Etc.
3. Presionar:
   Shift 2 2 = desviación estándar poblacional
   Shift 2 3 = desviación estándar muestral
   Para obtener la variancia, eleve al cuadrado el resultado
     anterior.
                          www.auladeeconomia.com
Ejercicio:

 Sea la siguiente muestra de datos:
             45, 56, 72, 81, 43, 62, 55, 90, 49,
               52, 60, 75, 66, 72, 58, 50, 88
 Calcule la varianza y la desviación estándar.
Respuesta:
Promedio = (45 + 56 + … + 88)/17 = 63,17

Varianza = ((45 – 63,17)2 + (56 – 63,17)2 + … + (88 – 63,17)2) / (17 – 1) = 209,40

Desviación estándar = raiz(209,40) = 14,47




                                    www.auladeeconomia.com
Variabilidad relativa
                   Considere los dos siguientes conjuntos:




 ¿En cuál de los dos conjuntos se presenta mayor variabilidad?
  Observe que una hormiga puede ser hasta más de 4 veces más
            larga que otra, pero una persona no es 4 veces
            ¿Por qué en el conjunto de menor variabilidad
                         se obtuvo un que otra.
                               más alta valor mayor?
     Para milímetros devalores mayores, poren centímetros de presidentes:
      Es7porque son 5
                           hormigas:     Estatura
Longitud ensaberlo, calcule la desviación estándar en cada caso.
                                                   tanto la desviación 165
 9                2               6     185       180     163       165
                       estándar de un valor más alto.
    Para compararmm necesita una medida de variacióncm
          Media = 5,8 se                            Media = 171,6 relativa,
   Desviación estándar = 2,59 mm             Desviación estándar = 10,14 cm
                    como el coeficiente de variación.
                             www.auladeeconomia.com
Variabilidad relativa


Permiten comparar grupos de series              La medida de variabilidad relativa
 distintas en cuanto a su variación.                    más usada es el
                                                    coeficiente de variación.
Son independientes de las unidades
   en que se midan las variables.                    Se designa con las letras CV.

   Generalmente se expresan en                     Consiste en el cociente de la
porcentajes, facilitando así el estudio         desviación estándar entre la media:
 con medidas procedentes de otras
         series de valores.                      CV = Desviación estándar / Media




                                 www.auladeeconomia.com
Variabilidad relativa
                     Considere los dos siguientes conjuntos:




Longitud en milímetros de hormigas:        Estatura en centímetros de presidentes:
 9       7       2       5       6        185      180       163      165       165
         Media = 5,8 mm                                Media = 171,6 cm
  Desviación estándar = 2,59 mm                  Desviación estándar = 10,14 cm
           CV = 44,7%                                      CV = 5,9%
                               www.auladeeconomia.com
Ejercicio:

 Sean las siguientes muestras de datos:
      Muestra 1: 45, 56, 72, 81, 43, 62, 55, 90, 49
      Muestra 2: 67, 52, 60, 70, 66, 72, 58, 50, 58
 ¿Cuál posee mayor variabilidad relativa?
Respuesta:
Promedio muestra 1 = 61,44
Promedio muestra 2 = 61,44

Desviación estándar muestra 1 = 16,38
Desviación estándar muestra 2= 7,76

Coeficiente de variación muestra 1 = 26,7%
Coeficiente de variación muestra 2 = 12,6%

La muestra 1 tiene mayor variabilidad relativa.


                                   www.auladeeconomia.com
Otras medidas de variabilidad


 Se puede calcular medidas de                   El rango intercuartílico es la
variabilidad relacionadas con la              diferencia entre el tercer cuartil
           mediana.                               menos el primer cuartil:

                                                        RIC = Q3 – Q1
       Estas pueden ser:
                                              La desviación cuartil consiste en
     Rango intercuartílico                 dividir el rango intercuartil entre dos:
      Desviación cuartil
                                                         Q = RIC / 2




                             www.auladeeconomia.com
Ejercicio:

 Sea la siguiente muestra de datos:
             45, 56, 72, 81, 43, 62, 55, 90, 49,
               52, 60, 75, 66, 72, 58, 50, 88
 Calcule el rango intercuartil y la desviación cuartil.
Respuesta:
Cuartil 1 = 51

Cuartil 3 = 73,5

Rango intercuartil = 73,5 – 51 = 22,5
El 50% de los datos se encuentran en un rango de 22,5 unidades alrededor de su
mediana.

Desviación cuartil = 22,5 / 2 = 11,25
La mediana tiene un rango de variación de 11,25 unidades.


                                 www.auladeeconomia.com
Medidas de variabilidad


 Medidas de variabilidad absoluta:            Medidas de variabilidad relativa:
se expresan en unidades de medida,             no se expresan en unidades de
     como metros, gramos, etc.                medida, sino que por lo general se
                                                expresan como porcentajes.
Pueden ser con respecto a la media:
        Rango o recorrido                       La principal es el coeficiente de
       Desviación estándar                               variación (CV).
             Varianza
                                               El CV se emplea para comparar
También con respecto a la mediana:            conjuntos de datos expresados en
        Rango intercuartil                    unidades distintas o de magnitud
        Desviación cuartil                               muy distinta.


                              www.auladeeconomia.com
Resumen medidas de variabilidad

                                                        Rango o recorrido
                                  Con respecto
                                                        Varianza
                                  a la media
                                                        Desviación estándar
               Absolutas
               Se expresan
               en unidades
               (metros,          Con respecto
                                                        Rango intercuartílico
               gramos, etc.)     a la mediana
                                                        Desviación cuartil
Medidas de
variabilidad

               Relativas
               No se expresan       Coeficiente de variación
               en unidades




                               www.auladeeconomia.com
Ejercicio:

Dado el siguiente conjunto de datos sobre el tiempo (en minutos) que una
muestra de personas seleccionadas al azar dura en completar una prueba:

         55, 81, 92, 74, 58, 62, 84, 60, 90, 57, 82, 66,
         90, 57, 74, 73, 67, 74, 88, 65, 68, 70, 98, 82
1. Calcule e interprete cada una de las siguientes medidas descriptivas:
    moda                                  mediana
    media aritmética                      1er cuartil
    3er cuartil                           percentil 45
    decil 3                               quintil 3
    desviación estándar                   varianza
    coeficiente de variación              rango intercuartil
    desviación cuartil
2. ¿Qué se puede concluir sobre la simetría o asimetría de los
   datos?
                               www.auladeeconomia.com
Ejercicio - respuesta:

Dado el siguiente conjunto de datos sobre el tiempo (en minutos) que una
muestra de personas seleccionadas al azar dura en completar una prueba:

             55, 57, 57, 58, 60, 62, 65, 66, 67, 68 , 70, 73,
             74, 74, 74, 81 , 82 , 82, 84, 88, 90, 90, 92, 98

1. Calcule e interprete cada una de las siguientes medidas descriptivas:
    Moda = 74

    El tiempo más frecuente en que estas personas completaron
    la prueba es de 74 minutos.




                               www.auladeeconomia.com
Ejercicio - solución:

Dado el siguiente conjunto de datos sobre el tiempo (en minutos) que una
muestra de personas seleccionadas al azar dura en completar una prueba:

              55, 57, 57, 58, 60, 62, 65, 66, 67, 68 , 70, 73,
              74, 74, 74, 81, 82, 82, 84, 88, 90, 90, 92, 98

1. Calcule e interprete cada una de las siguientes medidas descriptivas:
    Mediana =
    n = 24
    Pmed = (n + 1) / 2 = (24 + 1) / 2 = 12,5 =>
    Med = (73 + 74) / 2 = 73,5

    La mitad de las personas terminaron la prueba en 73,5 minutos o
    menos, y la otra mitad la terminaron en más de 73,5 minutos.



                               www.auladeeconomia.com
Ejercicio - solución:

Dado el siguiente conjunto de datos sobre el tiempo (en minutos) que una
muestra de personas seleccionadas al azar dura en completar una prueba:

              55, 57, 57, 58, 60, 62, 65, 66, 67, 68 , 70, 73,
              74, 74, 74, 81, 82, 82, 84, 88, 90, 90, 92, 98

1. Calcule e interprete cada una de las siguientes medidas descriptivas:
    Media aritmética o promedio =
    Media = (55 + 57 + 57 + … + 98) / 24 = 73,63

    El tiempo promedio de terminación de esta prueba es de 73,63
    minutos.




                               www.auladeeconomia.com
Ejercicio - solución:

Dado el siguiente conjunto de datos sobre el tiempo (en minutos) que una
muestra de personas seleccionadas al azar dura en completar una prueba:

              55, 57, 57, 58, 60, 62, 65, 66, 67, 68 , 70, 73,
              74, 74, 74, 81, 82, 82, 84, 88, 90, 90, 92, 98

1. Calcule e interprete cada una de las siguientes medidas descriptivas:
    1er cuartil =
    n = 24
    Q1 = P25 => m = 25
    P25 = m(n + 1) / 100 = 25(24 + 1) / 100 = 6,25 =>
    P25 = 62 + 0,25 * 3 = 62,75

    El 25% de las personas terminaron la prueba en 62,75 minutos o
    menos, y el 75% la terminaron en más de 62,75 minutos.


                               www.auladeeconomia.com
Ejercicio - solución:

Dado el siguiente conjunto de datos sobre el tiempo (en minutos) que una
muestra de personas seleccionadas al azar dura en completar una prueba:

              55, 57, 57, 58, 60, 62, 65, 66, 67, 68 , 70, 73,
              74, 74, 74, 81, 82, 82, 84, 88, 90, 90, 92, 98

1. Calcule e interprete cada una de las siguientes medidas descriptivas:
    3er cuartil =
    n = 24
    Q3 = P75 => m = 75
    P75 = m(n + 1) / 100 = 75(24 + 1) / 100 = 18,75 =>
    P75 = 82 + 0,75 * 2 = 83,5

    El 75% de las personas terminaron la prueba en 83,5 minutos o
    menos, y el 25% la terminaron en más de 83,5 minutos.


                               www.auladeeconomia.com
Ejercicio - solución:

Dado el siguiente conjunto de datos sobre el tiempo (en minutos) que una
muestra de personas seleccionadas al azar dura en completar una prueba:

              55, 57, 57, 58, 60, 62, 65, 66, 67, 68 , 70, 73,
              74, 74, 74, 81, 82, 82, 84, 88, 90, 90, 92, 98

1. Calcule e interprete cada una de las siguientes medidas descriptivas:
    Percentil 45 =
    n = 24
    P45 => m = 45
    P45 = m(n + 1) / 100 = 45(24 + 1) / 100 = 11,25 =>
    P45 = 70 + 0,25 * 3 = 70,75

    El 45% de las personas terminaron la prueba en 70,75 minutos o
    menos, y el 55% la terminaron en más de 70,75 minutos.


                               www.auladeeconomia.com
Ejercicio - solución:

Dado el siguiente conjunto de datos sobre el tiempo (en minutos) que una
muestra de personas seleccionadas al azar dura en completar una prueba:

              55, 57, 57, 58, 60, 62, 65, 66, 67, 68 , 70, 73,
              74, 74, 74, 81, 82, 82, 84, 88, 90, 90, 92, 98

1. Calcule e interprete cada una de las siguientes medidas descriptivas:
    Decil 3 =
    n = 24
    D3 = P30 => m = 30
    P30 = m(n + 1) / 100 = 30(24 + 1) / 100 = 7,5 =>
    P30 = 65 + 0,5 * 1 = 65,5

    El 30% de las personas terminaron la prueba en 65,5 minutos o
    menos, y el 70% la terminaron en más de 65,5 minutos.


                               www.auladeeconomia.com
Ejercicio - solución:

Dado el siguiente conjunto de datos sobre el tiempo (en minutos) que una
muestra de personas seleccionadas al azar dura en completar una prueba:

              55, 57, 57, 58, 60, 62, 65, 66, 67, 68 , 70, 73,
              74, 74, 74, 81, 82, 82, 84, 88, 90, 90, 92, 98

1. Calcule e interprete cada una de las siguientes medidas descriptivas:
    Quintil 3 =
    n = 24
    K3 = P60 => m = 60
    P60 = m(n + 1) / 100 = 60(24 + 1) / 100 = 15 =>
    P60 = 74

    El 60% de las personas terminaron la prueba en 74 minutos o
    menos, y el 40% la terminaron en más de 74 minutos.


                               www.auladeeconomia.com
Ejercicio - solución:

Dado el siguiente conjunto de datos sobre el tiempo (en minutos) que una
muestra de personas seleccionadas al azar dura en completar una prueba:

              55, 57, 57, 58, 60, 62, 65, 66, 67, 68 , 70, 73,
              74, 74, 74, 81, 82, 82, 84, 88, 90, 90, 92, 98

1. Calcule e interprete cada una de las siguientes medidas descriptivas:
    Desviación estándar =
    s = raiz((55 – 73,63)2 + (57 – 73,63)2 + … + (98 – 73,63)2) / (24 – 1))=
    s = 12,62

    Los tiempos en que las personas terminaron la prueba tienen una
    variabilidad de 12,62 minutos con respecto a su media.




                               www.auladeeconomia.com
Ejercicio - solución:

Dado el siguiente conjunto de datos sobre el tiempo (en minutos) que una
muestra de personas seleccionadas al azar dura en completar una prueba:

              55, 57, 57, 58, 60, 62, 65, 66, 67, 68 , 70, 73,
              74, 74, 74, 81, 82, 82, 84, 88, 90, 90, 92, 98

1. Calcule e interprete cada una de las siguientes medidas descriptivas:
    Varianza =
    s2 = (desviación estándar) 2 =
    s2 = (12,62) 2 = 159,26

    Los tiempos en que las personas terminaron la prueba tienen una
    variabilidad de 159,26 minutos2 con respecto a su media.




                               www.auladeeconomia.com
Ejercicio - solución:

Dado el siguiente conjunto de datos sobre el tiempo (en minutos) que una
muestra de personas seleccionadas al azar dura en completar una prueba:

              55, 57, 57, 58, 60, 62, 65, 66, 67, 68 , 70, 73,
              74, 74, 74, 81, 82, 82, 84, 88, 90, 90, 92, 98

1. Calcule e interprete cada una de las siguientes medidas descriptivas:
    Coeficiente de variación =
    CV = desviación estándar / promedio * 100 =
    CV = 12,62 / 73,63 * 100 = 17,14%

    Los tiempos en que las personas terminaron la prueba tienen una
    variabilidad relativa del 17,14% con respecto a su media.




                               www.auladeeconomia.com
Ejercicio - solución:

Dado el siguiente conjunto de datos sobre el tiempo (en minutos) que una
muestra de personas seleccionadas al azar dura en completar una prueba:

              55, 57, 57, 58, 60, 62, 65, 66, 67, 68 , 70, 73,
              74, 74, 74, 81, 82, 82, 84, 88, 90, 90, 92, 98

1. Calcule e interprete cada una de las siguientes medidas descriptivas:
    Rango intercuartil =
    RIC = Q3 – Q1 =
    RIC = 83,5 – 62,75 = 20,75

    El 50% de los tiempos de terminación de la prueba se ubican en
    un rango de 20,75 minutos con respecto a su mediana.




                               www.auladeeconomia.com
Ejercicio - solución:

Dado el siguiente conjunto de datos sobre el tiempo (en minutos) que una
muestra de personas seleccionadas al azar dura en completar una prueba:

              55, 57, 57, 58, 60, 62, 65, 66, 67, 68 , 70, 73,
              74, 74, 74, 81, 82, 82, 84, 88, 90, 90, 92, 98

1. Calcule e interprete cada una de las siguientes medidas descriptivas:
    Desviación cuartil =
    Q = RIC / 2 =
    Q = 20,75 / 2 = 10,38

    Los tiempos de terminación de la prueba se ubican en
    un rango de 10,38 minutos con respecto a su mediana.
    O bien, la mediana tiene una variabilidad de 10,38 minutos.



                               www.auladeeconomia.com
Ejercicio - solución:

Dado el siguiente conjunto de datos sobre el tiempo (en minutos) que una
muestra de personas seleccionadas al azar dura en completar una prueba:

              55, 57, 57, 58, 60, 62, 65, 66, 67, 68 , 70, 73,
              74, 74, 74, 81, 82, 82, 84, 88, 90, 90, 92, 98

2. ¿Qué se puede concluir sobre la simetría o asimetría de los
   datos?
    Moda = 74
    Mediana = 73,5
    Media = 73,63

    La distribución de los tiempos de terminación de la prueba es
    casi simétrica (porque la media, la mediana y la moda son casi
    iguales).


                               www.auladeeconomia.com
Gráfica de caja


       Un diagrama de caja                      Suministra información sobre los
es un gráfico, basado en cuartiles,              valores mínimo y máximo, los
 mediante el cual se visualiza un              cuartiles Q1, Q2 o mediana y Q3, la
        conjunto de datos.                        existencia de valores atípicos
                                                 y la simetría de la distribución.
      Está compuesto por:
                                                   Se puede construir horizontal
      un rectángulo o "caja“                                o vertical.
     y dos brazos o "bigotes"




                                www.auladeeconomia.com
Gráfica de caja


 Suponga que sobre un conjunto
 de datos se conoce lo siguiente:
                                                 Mín     Q1   Med Q3 Máx
                                                  8      20    30 36 42
        Primer cuartil: 20
        Tercer cuartil: 36
          Mediana: 30
           Mínimo: 8
           Máximo: 42
                                           0        10   20   30    40     50
El diagrama de caja es el siguiente.




                                www.auladeeconomia.com
Ejercicio:

 Sea la siguiente muestra de datos:
                   45, 56, 60, 60, 43, 62, 55, 69, 49,
                     52, 60, 75, 66, 72, 58, 50, 88
 Construya el diagrama de caja.

Respuesta:
Mínimo = 43
Cuartil 1 = 51
Mediana = 60
Cuartil 3 = 67,5
Máximo = 88

                               40       50       60    70   80   90




                              www.auladeeconomia.com
Ejercicio:

 Sea la siguiente muestra de datos:
                 50, 70, 75, 68, 43, 62, 55, 69, 49,
                   52, 60, 75, 66, 72, 58, 50, 85
 Construya el diagrama de caja.

Respuesta:
Mínimo = 43
Cuartil 1 = 51
Mediana = 62
Cuartil 3 = 71
Máximo = 85

                             40       50       60    70   80   90




                            www.auladeeconomia.com
Ejercicio:

 Analice y compare las siguientes dos diagramas de dispersión.




                          40       50      60        70       80   90
Respuesta:
En la caja superior se observa que los bigotes son iguales o casi iguales y la mediana
está en la mitad de la caja, lo cual indica que la distribución de los datos es simétrica.
En la segunda caja, el bigote derecho es más largo que el izquierdo y la mediana está
hacia la izquierda de la caja, lo cual indica que la distribución de los datos es asimétrica
positiva.
La caja superior muestra un RIC menor que la segunda caja, lo cual es indicador de que
en el primer conjunto de datos hay una menor dispersión que en el segundo.
Lo mismo indica el rango de cada una (diferencia entre el máximo y el mínimo).

                                     www.auladeeconomia.com
Aplicaciones de la desviación estándar

               www.auladeeconomia.com
Suponga un proceso de llenado de botellas de agua de 250 ml.
Se espera que todas las botellas queden a un mismo nivel.
Pero, unas quedan muy vacías.
Y otras quedan muy llenas.
Sin embargo, la mayoría contienen cantidades cercanas a 250 ml.




Suponga que se reúnen datos sobre las cantidades de agua por envase.
Se ha logrado determinar que el promedio por botella es de 249 ml
con una desviación estándar de 3 ml y se traza un histograma.

                         www.auladeeconomia.com
Frecuncia              Histograma
      porcentual
           35%
           30%
           25%
           20%                                                Media: 249 ml
           15%                                                Desv. Est.: 3 ml
           10%
            5%
              0
                   242 244 246 248 250 252 254 256        X
Observe que en este caso la distribución de los datos es simétrica.
La mayoría de los datos se encuentran en un rango cercano al promedio.
Ese rango se puede definir empleando la desviación estándar:
         Promedio – desviación estándar = 249 – 3 = 246
         Promedio + desviación estándar = 249 + 3 = 252
En una distribución simétrica el porcentaje de datos en ese rango se puede
aproximar porcentajela regla datos se encuentran entre 246 y 252 ml?
     ¿Qué mediante de los empírica y es de 68,3%.
O sea, que se espera que un 68,3% de las botellas tenga entre 246 y 252 ml.

                                 www.auladeeconomia.com
Frecuncia              Histograma
      porcentual
           35%
           30%
           25%
           20%                                                Media: 249 ml
           15%                                                Desv. Est.: 3 ml
           10%
            5%
              0
                   242 244 246 248 250 252 254 256        X
Si se define un rango más amplio, va a contener más observaciones.
Si el rango se define empleando dos veces la desviación estándar:
          Promedio – 2 x desviación estándar = 249 – 2 x 3 = 243
          Promedio + 2 x desviación estándar = 249 + 2 x 3 = 255
En una distribución simétrica el porcentaje de datos en ese rango se puede
aproximar porcentajela regla datos se encuentran entre 243 y 255 ml?
      ¿Qué mediante de los empírica y es de 95,4%.
O sea, que se espera que un 95,4% de las botellas tenga entre 243 y 255 ml.


                                 www.auladeeconomia.com
Frecuncia              Histograma
      porcentual
           35%
           30%
           25%
           20%                                                Media: 249 ml
           15%                                                Desv. Est.: 3 ml
           10%
            5%
              0
                   242 244 246 248 250 252 254 256        X
Si se define un rango aún más amplio, va a contener más observaciones.
Si el rango se define empleando tres veces la desviación estándar:
          Promedio – 3 x desviación estándar = 249 – 3 x 3 = 240
          Promedio + 3 x desviación estándar = 249 + 3 x 3 = 258
En una distribución simétrica el porcentaje de datos en ese rango se puede
aproximar porcentajela regla datos se encuentran entre 240 y 258 ml?
      ¿Qué mediante de los empírica y es de 99,7%.
O sea, que se espera que un 99,7% de las botellas tenga entre 240 y 258 ml.


                                 www.auladeeconomia.com
Frecuncia              Histograma
       porcentual
            35%
            30%
            25%
            20%                                                Media: 249 ml
            15%                                                Desv. Est.: 3 ml
            10%
    ¿Qué 5%
         pasaría si la distribución no fuera simétrica?
               0
                    242 244 246 248 250 252 254 256        X
Si la distribución no es simétrica, los porcentajes anteriores disminuyen
un poco y ya no aplicaríamos la regla empírica, sino el teorema de Chebychev.
El rango se puede definir empleando dos veces la desviación estándar:
           Promedio – 2 x desviación estándar = 249 – 2 x 3 = 243
           Promedio + 2 x desviación estándar = 249 + 2 x 3 = 255
En una distribución asimétrica el porcentaje de datos en ese rango se puede
aproximar mediante el teorema de Chebychev y es de aproximadamente 75%.
O sea, que se espera que un 75% de las botellas tenga entre 243 y 255 ml.

                                  www.auladeeconomia.com
Aplicaciones de la desviación estándar


   La probabilidad de que cualquier            Cuando la distribución es simétrica,
variable aleatoria tome un valor dentro          se puede aplicar la distribución
 de la k desviaciones estándar (k > 1)         normal, y las probabilidades que se
 con respecto a la media es al menos                      obtienen son:
                 1 – 1 / k2
    Si k = 2, la probabilidad es 75%.            Si k = 1, la probabilidad es 68,3%
    Si k = 3, la probabilidad es 89%.            Si k = 2, la probabilidad es 95,4%
                                                 Si k = 3, la probabilidad es 99,7%
   A este planteamiento se le llama
     Teorema de Chebychev
  Esto lo aplicaremos principalmente                     Esta regla se conoce como
     en distribuciones asimétricas.                         Regla empírica

                                www.auladeeconomia.com
Ejercicio:

 Sea la siguiente muestra de datos:
                 45, 56, 60, 60, 43, 62, 55, 69, 49,
                   52, 60, 75, 66, 72, 58, 50, 88
 Calcule el rango de variación de estos datos.

Respuesta:
Media = 60, Mediana = 60, Moda = 60
El conjunto de datos es simétrico.

Desviación estándar = 11,51

Rango de variación del 68% = 60 – 11,51 = 48,49
                           = 60 + 11,51 = 71,51

El 68,3% de los datos se encuentra en un rango entre 48,49 y 71,51.



                                  www.auladeeconomia.com
Ejercicio:

 Sea la siguiente muestra de datos:
                 45, 56, 60, 60, 43, 62, 55, 69, 49,
                   52, 60, 75, 66, 72, 58, 50, 88
 Calcule el rango en el que se encuentra el 95,4% de los datos.

Respuesta:
Media = 60, Mediana = 60, Moda = 60
El conjunto de datos es simétrico.

Desviación estándar = 11,51

Rango de variación del 95% = 60 – 2 * 11,51 = 36,98
                           = 60 + 2 * 11,51 = 83,02

El 95,4% de los datos se encuentra en un rango entre 36,98 y 83,02.



                                  www.auladeeconomia.com
Ejercicio:

 Sea la siguiente muestra de datos:
                 45, 56, 60, 60, 43, 62, 55, 69, 49,
                   52, 60, 75, 66, 72, 58, 50, 88
 Calcule el rango en el que se encuentra el 99,7% de los datos.

Respuesta:
Media = 60, Mediana = 60, Moda = 60
El conjunto de datos es simétrico.

Desviación estándar = 11,51

Rango de variación del 99,7% = 60 – 3 * 11,51 = 25,47
                             = 60 + 3 * 11,51 = 94,53

El 99,7% de los datos se encuentra en un rango entre 25,47 y 94,53.



                                  www.auladeeconomia.com
Ejercicio:

 La distribución de las notas de un examen tuvieron
 promedio de 7,85 y desviación estándar 0,83.
 a. Si la distribución de las notas es aproximadamente
    normal, ¿qué proporción de los estudiantes tuvo
    notas entre 7,02 y 8,68? ¿qué proporción de los
    estudiantes tuvo notas mayores a 9,51?
 b. Si la distribución hubiera sido asimétrica, ¿qué
    proporción de los estudiantes tendría nota entre
    6,19 y 9,51?




                      www.auladeeconomia.com
Ejercicio:

 La distribución de las notas de un examen tuvieron promedio
 de 7,85 y desviación estándar 0,83.
 a. Si la distribución de las notas es aproximadamente normal,
     ¿qué proporción de los estudiantes tuvo notas entre 7,02 y
     8,68?
Respuesta:
Media = 7,85
Desviación estándar = 0,83

Intervalo: Media – Desviación estándar = 7,85 – 0,83 = 7,02
           Media + Desviación estándar = 7,85 + 0,83 = 8,68

En el intervalo de 7,02 a 8,68 se encuentra el 68,3% de las notas de los
estudiantes.



                                www.auladeeconomia.com
Ejercicio:

 La distribución de las notas de un examen tuvieron promedio
 de 7,85 y desviación estándar 0,83.
 a. Si la distribución de las notas es aproximadamente
     normal, ¿qué proporción de los estudiantes tuvo notas
     mayores a 9,51?
Respuesta:
Media = 7,85
Desviación estándar = 0,83

Intervalo: Media – 2 * Desviación estándar = 7,85 – 2 * 0,83 = 6,19
           Media + 2 * Desviación estándar = 7,85 + 2 * 0,83 = 9,51

En el intervalo de 6,19 a 9,51 se encuentra el 95,4% de las notas de los
estudiantes.
Lo quiere decir que un 4,6% está fuera de ese intervalo, dado que la
distribución es simétrica, un 2,3% tendrá nota mayor que 9,51.
                                www.auladeeconomia.com
Ejercicio:

 La distribución de las notas de un examen tuvieron promedio
 de 7,85 y desviación estándar 0,83.
 b. Si la distribución hubiera sido asimétrica, ¿qué proporción
 de los estudiantes tendría nota entre 6,19 y 9,51?

Respuesta:
Media = 7,85
Desviación estándar = 0,83

Intervalo: Media – 2 * Desviación estándar = 7,85 – 2 * 0,83 = 6,19
           Media + 2 * Desviación estándar = 7,85 + 2 * 0,83 = 9,51

En el intervalo de 6,19 a 9,51 se encuentra el 75% de las notas de los
estudiantes (según el teorema de Chebychev).



                                www.auladeeconomia.com
Raquel tiene 15 años y tiene una
                                      estatura de 1,59 metros.
                                      Las adolescentes de su edad tiene una
                                      talla media de 1,61 metros, con
                                      desviación estándar de 0,08 metros.

                                      Marco tiene 15 años y tiene una
                                      estatura de 1,61 metros.
                                      Los adolescentes de su edad tiene una
                                      talla media de 1,64 metros, con
                                      desviación estándar de 0,11 metros.

   ¿Cuál de los dos es relativamente más alto?
Para comparar se necesita un parámetro estándar, ya que cada uno proviene
     de un conjunto con distinta media y diferente desviación estándar.

         En estos casos se emplean los puntajes estandarizados.

                               www.auladeeconomia.com
Aplicaciones de la desviación estándar


  A veces puede ser conveniente                 Estos puntajes estandarizados se
 transformar los datos para poder                   representan con la letra z
     efectuar comparaciones.                  y se pueden obtener con la fórmula:

Si a un valor se le resta el promedio                          x
     del conjunto de datos al que                         z
     pertenece y luego se divide                                
     entre la desviación estándar,
    se obtiene lo que llamaremos                 Los puntajes estandarizados no
  puntajes estandarizados                         tienen unidades de medida.




                                www.auladeeconomia.com
Raquel:
                              X = 1,59 metros
                              Media = 1,61 metros
                              Desviación estándar = 0,08 metros
                              Z = (1,59 – 1,61) / 0,08 = -0,25

                              Marco:
                              X =1,61 metros
                              Media = 1,64 metros
                              Desviación estándar = 0,11 metros
                              Z = (1,61 – 1,64) / 0,11 = -0,27

¿Cuál de los dos es relativamente más alto?
       Dado que -0,25 es mayor que -0,27, entonces
       Raquel es relativamente más alta que Marco.




                       www.auladeeconomia.com
Ejercicio:

 La distribución de las notas del primer examen parcial
 de economía tuvo promedio de 7,33 y desviación
 estándar 1,37. El segundo examen parcial tuvo
 promedio de 7,00 con desviación estándar de 1,91.
 a. Compare la variabilidad absoluta y relativa de las
    notas de los dos exámenes.
 b. Si un estudiante obtuvo en el primer examen un
    7,5 y en el segundo un 8,1, ¿en cuál de los dos
    exámenes su rendimiento relativo fue mayor?




                      www.auladeeconomia.com
Ejercicio:

 La distribución de las notas del primer examen parcial de
 economía tuvo promedio de 7,33 y desviación estándar 1,37.
 El segundo examen parcial tuvo promedio de 7,00 con
 desviación estándar de 1,91.
 a. Compare la variabilidad absoluta y relativa de las notas de
     los dos exámenes

Respuesta:
El segundo examen tiene mayor variabilidad absoluta, porque su desviación
estándar es mayor.

CV1 = 1,37 / 7,33 * 100 = 18,69%
CV2 = 1,91 / 7,00 * 100 = 27,28%

El segundo examen también presenta mayor variabilidad relativa, dado que el
coeficiente de variación da más alto.
                              www.auladeeconomia.com
Ejercicio:

 La distribución de las notas del primer examen parcial de
 economía tuvo promedio de 7,33 y desviación estándar 1,37.
 El segundo examen parcial tuvo promedio de 7,00 con
 desviación estándar de 1,91.
 b. Si un estudiante obtuvo en el primer examen un 7,5 y en el
 segundo un 8,1, ¿en cuál de los dos exámenes su rendimiento
 relativo fue mayor?
Respuesta:
Hay que calcular los puntajes estandarizados:

Examen 1: z1 = (7,5 – 7,33) / 1,37 = 0,12
Examen 2: z2 = (8,1 – 7,00) / 1,91 = 0,57

En términos relativos, la nota del segundo es mejor que la del primero.


                                www.auladeeconomia.com
www.auladeeconomia.com
Ejercicios




www.auladeeconomia.com
Ejercicio:

 La media aritmética del siguiente conjunto de datos

 7, 8, 20, 20, 13, 14, 12, 6, 9, 10, 6 es:

 ( a ) 20
 ( b ) 10
 ( c ) 13
 ( d ) 11,36




Respuesta:
La respuesta correcta es:
( d ) 11,36




                                       www.auladeeconomia.com
Ejercicio:

 La mediana del siguiente conjunto de datos

 7, 8, 20, 20, 13, 14, 12, 6, 9, 10, 6 es:

 ( a ) 20
 ( b ) 10
 ( c ) 13
 ( d ) 11,36




Respuesta:
La respuesta correcta es:
( b ) 10




                                       www.auladeeconomia.com
Ejercicio:

 La moda del siguiente conjunto de datos

 7, 8, 20, 20, 13, 14, 12, 6, 9, 10, 6 es:

 ( a ) 20
 ( b ) 10
 ( c ) 13
 ( d ) 11,36




Respuesta:
La respuesta correcta es:
( a ) 20




                                       www.auladeeconomia.com
Ejercicio:
Dado el siguiente conjunto de datos sobre el número de turistas que se hospedan en
un hotel por semana en una muestra de 22 semanas seleccionadas al azar:

          25, 81, 92, 44, 58, 62, 34, 40, 90, 57, 42,
          40, 57, 57, 57, 57, 62, 40, 65, 58, 50, 18
1. Calcule e interprete cada una de las siguientes medidas descriptivas:
    moda                                  mediana
    media aritmética                      1er cuartil
    3er cuartil                           percentil 45
    decil 3                               quintil 3
    desviación estándar                   varianza
    coeficiente de variación              rango intercuartil
    desviación cuartil

2. ¿Qué se puede concluir sobre la simetría o asimetría de los datos?
3. ¿Qué % de los datos se encuentra en un rango de 2 veces la desviación estándar?
4. Construya el diagrama de caja e interprételo.

                                   www.auladeeconomia.com
Ejercicio - solución:
Media = 53,91
Moda = 57
Mediana = 57,00

Desv. Est. = 18,49
Varianza = 341,90
CoefVar = 34,30

Mínimo = 18,00
Máximo = 92,00
Rango = 74,00

Q1 = 40,00
Q3 = 62,00
IQR = 22,00
Percentil 45 = 57
Decil 3 = 41,8
Quintil 3 = 57


                        www.auladeeconomia.com
Ejercicio:
Según un estudio de una agencia de publicidad sobre el número de horas de televisión
por semana que ven los jóvenes entre 12 y 18 años de una zona del país, poseen los
siguientes datos (todos en horas por semana):

     Moda: 13                   Mediana: 14,34                   Media: 16,67
     Cuartil 1: 11,04           Cuartil 3: 18,92                 Decil 2: 10,87
     Percentil 95: 25,88        Desviación estándar: 4,5         Mínimo: 6

Con base en los datos anteriores:
1. Interprete cada una de las medidas anteriores.
2. Calcule e interprete el coeficiente de variación.
3. ¿Cuáles de las siguientes afirmaciones son falsas y cuáles verdaderas?
    • “Yo veo muy poca TV, pues por semana estoy frente al televisor solo 20 horas”
    • “Yo creo que la mayoría de los muchachos ven menos TV que mi hijo. Es increíble
      que gaste 11 horas semanales frente al televisor”
    • “El 95% de los jóvenes miran entre 7,67 y 23,67 horas de TV por mes”
    • “La distribución del número de horas de televisión por semana que ven los
      jóvenes entre 12 y 18 años de una zona del país es asimétrica negativa”


                                  www.auladeeconomia.com
Moda = 13                    Mediana = 14,34                Media = 16,67
 Ejercicio - solución:
La cantidad de horas por     La mitad de los jóvenes        En promedio los jóvenes
semana más frecuente         de esa zona ven 14,34          de esa zona del país ven
que los jóvenes de esa       horas semanales de TV o        16,67 horas semanales
zona ven TV es de 13         menos, y otra mitad ve         de TV.
horas.                       14,34 horas de TV
                             semanales o más.               Decil 2 = 10,87
Cuartil 1 = 11,04                                           Un 20% de los jóvenes de
Una cuarta parte (25%)       Cuartil 3 = 18,92              la zona ven menos de
de los jóvenes de esa        Tres cuartas partes (o el      10,87 horas semanales
zona ven menos de 11,04      75%) de los jóvenes de         de TV, y el restante 80%
horas semanales de TV. Y     esa zona ven menos de          ve más de 10,87 horas
el restante 75% ve más       18,92 horas semanales          semanales de TV.
de 11,04 horas               de TV. Y el restante 25%
semanales de TV.             ve más de 18,92 horas          Mínimo = 6
                             semanales de TV.               La cantidad más baja de
Percentil 95 = 25,88                                        horas semanales de TV
Un 95% de los jóvenes de     Desv. estándar = 4,5           que ven los jóvenes de la
la zona ven menos de         La cantidad de horas           zona es de 6 horas
25,88 horas semanales        semanales de TV que ven        semanales. Ninguno ve
de TV, y el restante 5% ve   los jóvenes de la zona         menos de 6 horas
más de 25,88 horas           varía en promedio 4,5          semanales.
semanales de TV.             horas con respecto a su
                             media.www.auladeeconomia.com
Ejercicio:

2. Calcule e interprete el coeficiente de variación.

CV = 4,5 / 16,67 * 100 = 26,99%

La cantidad de horas de TV que ven los jóvenes de la zona tiene
una variabilidad relativa de 26,99%.




                           www.auladeeconomia.com
Ejercicio:

3. ¿Cuáles de las siguientes afirmaciones son falsas y cuáles verdaderas?
• “Yo veo muy poca TV, pues por semana estoy frente al televisor solo 20
  horas”.
• FALSO. La cantidad de 20 horas está por arriba del promedio e incluso por
  arriba del tercer cuartil, lo cual quiere decir que ve más TV que el 75% de los
  jóvenes.
• “Yo creo que la mayoría de los muchachos ven menos TV que mi hijo. Es
  increíble que gaste 11 horas semanales frente al televisor”
• FALSO. La cantidad de 11 horas está por debajo del primer cuartil, lo cual
  quiere decir que este joven está en el 25% que ve menos TV.
• “El 95% de los jóvenes miran entre 7,67 y 23,67 horas de TV por mes”
• FALSO. Se calculan los intervalos del 95,4% (media – 2 * desviación estándar
  = 16,67 – 2 * 4,5 = 7,67 y media + 2 * desviación estándar = 16,67 + 2 * 4,5 =
  25,67) y los intervalos no coinciden, además la distribución no es simétrica.
• “La distribución del número de horas de televisión por semana que ven los
  jóvenes entre 12 y 18 de una zona del país es asimétrica negativa”
• FALSO. La relación entre media > mediana > moda, indica que la asimetría es
  positiva.
                                www.auladeeconomia.com
Ejercicio:
Suponga que se realizó un estudio en el que se comparó la efectividad de dos métodos
de enseñanza A y B en una escuela rural. Luego de aplicar exámenes a los estudiantes
se obtuvieron los siguientes resultados:

                                                  Método de enseñanza
                                             A                           B
    Media aritmética                       74.5                         74.9
    Desviación estándar                    11.3                         24.6
    Mediana                                  72                         68
    Moda                                     71                         65

Determine la validez de las siguientes afirmaciones (justifique su respuesta):

•   Los resultados de ambos métodos son prácticamente iguales.
•   Con el método B casi todos los estudiantes obtuvieron la misma nota.
•   La distribución de las notas del método B presenta una asimetría hacia la izquierda.
•   El método A presenta una dispersión de las notas mayor que el método B.

                                    www.auladeeconomia.com
Ejercicio:

El Hospital “La Cruz” dedicado a la atención exclusiva de problemas
mentales, realizó un estudio en enero pasado, y para ello
elaboraron un cuestionario que incluía las siguientes preguntas (que
fueron respondidas por los familiares encargados de los pacientes
al momento de la entrevista del egreso:
   1. Sexo:    [1] Masculino    [2] Femenino
   2. Tiempo semanal que dedica a ver televisión:_____________
   3. Rendimiento en el examen de aptitud mental:
   [1]Muy malo [2]Malo [3]Regular [4]Bueno [5]Muy bueno
   4. ¿Al menos uno de los padres de familia o encargado supervisa
   la cantidad de tiempo dedicada a ver televisión? [0] No [1] Sí
   5. Con cuántos familiares convive él /la paciente en el hogar? ___
La siguiente base de datos se obtiene luego de la información
recogida y corresponde a la totalidad de los pacientes que
permanecen en el hospital.
                           www.auladeeconomia.com
Sexo   Tiempo que   Rendimiento en la      Peso del paciente en   Número de familiares
          ve T.V.   prueba de aptitud             kilos.
 1        5.5              1                          55                   2
 2        0.6              2                          63                   0
 2        1.2              1                          49                   1
 2        1.5              5                          58                   4
 2        8.0              2                          65                   0
 1        6.4              1                          70                   2
 1        2.3              4                          71                   1
 1        3.5              2                          48                   0
 2        4.8              5                          47                   2
 2        5.2              1                          70                   1
 2        6.7              2                          71                   0
 1        4.5              3                          69                   2
 1        7.3              2                          68                   5
 2        4.2              3                          55                   0
 1        3.2              2                          55                   2
 2        5.2              1                          47                   0
 1        6.3              4                          47                   3
 2        8.5              2                          69                   0
 1        8.8              3   www.auladeeconomia.com 69                   3
Ejercicio:
• Calcule la media, la mediana y la moda para la variable peso. Interprete las
  medidas.
• Determine e interprete las medidas de tendencia o posición central para la
  variable tiempo que ven televisión los pacientes. ¿Qué forma tiene la
  distribución de las edades?
• Considera usted que la distribución de los datos presenta algún tipo de
  valores extremos? Si es así, de qué tipo son?
• ¿Cuál es el peso que deja por encima de el al 45 % de los vecinos?
• Determine la variabilidad asociada a la mediana en cuanto al tiempo que
  ven televisión los pacientes. Interprete el promedio y la variabilidad.
• ¿Cuál de las dos variables, peso o número de familiares es menos variable?
  ¿Por qué?
• Determine e interprete el valor del quintil tres de los pesos.
• Calcule el tiempo que ven televisión los pacientes y que deja por debajo de
  él, al 40 % de los pacientes.
• Explique qué significa la variabilidad absoluta de un conjunto de
  observaciones.

                               www.auladeeconomia.com
Ejercicio 1
• Una gran empresa de equipos deportivos está probando el
  efecto de uno de sus planes publicitarios sobre las ventas de
  su producto principal en los últimos 6 meses.
Considerando las ventas que se resumen en la siguiente tabla:
Mes        Enero Febrero Marzo Abril          Mayo Junio
Ventas     400     500       600      600     750       850
   1.   ¿Cuál es el promedio mensual de ventas?
   2.   ¿Son simétricos los datos o presentan algún tipo de asimetría
        (positiva o negativa)?
   3.   ¿Cuál es el nivel de ventas máximo que representa el 75% de las
        ventas mensuales más bajas?
   4.   Prepare la caja de dispersión asociada con las ventas de esta
        empresa.
Pregunta 1.
   ¿Cuál es el promedio mensual de ventas?

Solución:
 Promedio = Suma de datos / número de datos

             Ventas promedio =
   (400 + 500 + 600 + 600 + 750 + 850) / 6 =
                   616.67
Pregunta 2.
  ¿Son simétricos los datos o presentan algún tipo de
           asimetría (positiva o negativa)?

Solución:
  Promedio = 616.67
  Mediana = 600
  Moda = 600

  Dado que el promedio es un poco mayor que la
  mediana y que la moda, indica una ligera asimetría
  positiva.
Pregunta 3.
 ¿Cuál es el nivel de ventas máximo que representa el
      75% de las ventas mensuales más bajas?

Solución:
  Se debe calcular el percentil 75:
  P75 = 75/100 * (6 + 1) = 5.25

  El percentil es el dato en la posición 5.25:
  P75 = 750 + 0.25 * (850 – 750) = 775
Pregunta 4.
  Prepare la caja de dispersión asociada con las ventas
                    de esta empresa

Solución:
Se debe calcular Q1, Med y Q3:
Q1 = P25 = 25/100 * (6 + 1)
  = 1.75  Q1 = 475

Q3 = P75 = 75/100 * (6 + 1)
  = 5.25  Q3 = 775

Med = 600
Ejercicio 2
• Los estadísticos del programa Meals in Wheels (Comida sobre
  ruedas), el cual lleva comidas calientes a enfermos confinados
  en casa, desean evaluar sus servicios.
• El número de comidas diarias que entregaron en la última
  semana fue:
      30       45       60      50       50       75
Con base en la información suministrada, determine:
   1.   ¿Cuál es la cantidad promedio de comidas que se entregan por día?
   2.   Establezca el rango en que se espera que varíe el número promedio
        de entregas diarias.
   3.   Calcule e interprete los cuartiles 1 y 3.
   4.   Establezca el rango en que se espera que varíe la mediana del
        número de entregas promedio diarias.
Pregunta 1.
  ¿Cuál es la cantidad promedio de comidas que se
                 entregan por día?

Solución:
 Promedio = Suma de datos / número de datos

             Entregas promedio =
       (30 + 45 + 60 + 50 + 50 + 75) / 6 =
                     51.67
Pregunta 2.
    Establezca el rango en que se espera que varíe el
          número promedio de entregas diarias
Solución:
   Rango de variación para la media = Media ± Desviación estándar

                           Promedio = 51.67
 Varianza = (30 – 51.67)2 + (45 – 51.67)2 + … + (75 – 51.67)2 = 226.67
                   Desv. est. = raiz(226.67) = 15.06

                 Rango de variación para la media =
                       51.67 – 15.06 = 36.61
                       51.67 + 15.06 = 66.73
Pregunta 3.
        Calcule e interprete los cuartiles 1 y 3

Solución:
Ordenar datos: 30, 45, 50, 50, 60, 75

Q1 = P25 = 25/100 * (6 + 1) = 1.75 
   Q1 = 30 + 0.75 * (45 – 30) = 41.25
El 25% de los días se reparten 41.25 comidas o menos.

Q3 = P75 = 75/100 * (6 + 1) = 5.25 
   Q3 = 60 + 0.25 * (75 – 60) = 63.75
El 75% de los días se reparten 63.75 comidas o menos.
Pregunta 4.
    Establezca el rango en que se espera que varíe la
    mediana del número de entregas promedio diarias
Solución:
Se conoce que:
    Med = 50
    Q1 = 41.25
    Q3 = 63.75

Entonces:
    Rango intercuartil = 63.75 – 41.25 = 22.5
    Desviación cuartil = (63.75 – 41.25) / 2 = 11.25
    Se espera que la mediana varíe en el rango:
                           50 – 11.25 = 38.75
                           50 + 11.25 = 61.25
Pregunta 3
En una muestra seleccionada al azar de 8 estudiantes del curso de estadística,
el grupo 1 de la mañana y el grupo 2 de la noche, se obtuvieron las siguientes
edades:
Grupo 1             18      20    21      23    24       21 21         17
Grupo 2             20      25    25      30    30       30 40         35
1.   Con la información suministrada determine e interprete para cada grupo:
     –   Edad promedio
     –   Edad que representa la mediana
     –   ¿En cuánto se espera que varíe la edad promedio de los estudiantes?
2.   Si un estudiante del grupo 1 tiene 22 años y un estudiante del grupo 2
     tiene 28 años, ¿cuál de los dos estudiantes tiene una edad relativa
     mayor?
3.   Para el grupo que presenta mayor variación determine cada uno de los
     rangos en que se espera que varíen los pesos de los estudiantes según
     Gauss.
Pregunta 1.
   Con la información suministrada determine e interprete para cada
  grupo edad promedio, edad mediana y rango en que varíe la edad
                              promedio
Solución:
                               Grupo 1         Grupo 2
   Promedio                    20.63           29.38
   Mediana                     21.00           30.00
   Desviación estándar         2.33             6.23
Interpretación:
La edad promedio de los estudiantes del grupo 1 es de 20.63 años y
de 29.38 años en el grupo 2.
La mitad de los estudiantes del grupo 1 tiene 21 años o
menos, mientras que la mitad de los estudiantes del grupo 2 tiene 30
años o más.
Las edades del grupo 1 se espera que varíen en 2.33 años alrededor de
su promedio, mientras que en el grupo 2 se espera que varíen en 6.23
años alrededor de su promedio.
Pregunta 2.
      Si un estudiante del grupo 1 tiene 22 años y un estudiante del
    grupo 2 tiene 28 años, ¿cuál de los dos estudiantes tiene una edad
                              relativa mayor?
Solución:
Hay que calcular los puntajes estandarizados z:
Estudiante grupo 1:
                  z = (22 – 20.63) / 2.33 = 0.59

Estudiante grupo 2:
                 z = (28 – 29.38) / 6.23 = -0.22

El estudiante del grupo 1 es relativamente mayor.
Pregunta 3.
     Para el grupo que presenta mayor variación determine cada uno
       de los rangos en que se espera que varíen los pesos de los
                        estudiantes según Gauss
Solución:
Rango  – ,  +  (incluye el 68.3% de los datos):
   20.63 – 2.33 = 18.30
   20.63 + 2.33 = 22.95
Rango  – 2,  + 2 (incluye el 95.4% de los datos):
   20.63 – 2 * 2.33 = 15.97
   20.63 + 2 * 2.33 = 25.28
Rango  – 3,  + 3 (incluye el 99.7% de los datos):
   20.63 – 3 * 2.33 = 13.65
   20.63 + 3 * 2.33 = 27.60

Más contenido relacionado

La actualidad más candente

Trabajo de prueba de hipótesis
Trabajo de prueba de hipótesisTrabajo de prueba de hipótesis
Trabajo de prueba de hipótesisIris Márquez
 
Mapa conceptual
Mapa conceptualMapa conceptual
Mapa conceptualcannia
 
Ejercicio practico 1 10 2018
Ejercicio practico 1 10 2018Ejercicio practico 1 10 2018
Ejercicio practico 1 10 2018edidson fuentes
 
Distribución de poisso ejercicios
Distribución de poisso ejerciciosDistribución de poisso ejercicios
Distribución de poisso ejerciciosAurora Sanchez Caro
 
Guia intervalos de confianza
Guia intervalos de confianzaGuia intervalos de confianza
Guia intervalos de confianzaAndres Oyarzun
 
Metodos de muestreo, ejercicios y su procedimiento (1)
Metodos de muestreo, ejercicios y su procedimiento (1)Metodos de muestreo, ejercicios y su procedimiento (1)
Metodos de muestreo, ejercicios y su procedimiento (1)Luz Hernández
 
Medidas de la_forma_de_distribuciã³n
Medidas de la_forma_de_distribuciã³nMedidas de la_forma_de_distribuciã³n
Medidas de la_forma_de_distribuciã³nSanty D
 
Medidas estadísticas
Medidas estadísticasMedidas estadísticas
Medidas estadísticasMarco Yacila
 
Matemáticas.financiera
Matemáticas.financieraMatemáticas.financiera
Matemáticas.financieraDigna Ortiz
 
media, mediana,_moda_y_otras_medidas
media, mediana,_moda_y_otras_medidasmedia, mediana,_moda_y_otras_medidas
media, mediana,_moda_y_otras_medidasAnderson Marrugo
 
Coeficiente de Asimetría y Curtosis.pptx
Coeficiente de Asimetría y Curtosis.pptxCoeficiente de Asimetría y Curtosis.pptx
Coeficiente de Asimetría y Curtosis.pptxAlexisLedesma12
 
Ejercicios y problemas resueltos de estadística ii
Ejercicios y problemas resueltos de estadística iiEjercicios y problemas resueltos de estadística ii
Ejercicios y problemas resueltos de estadística iiEliza Yanayaco Paucar
 
Diapositiva de interes compuesto
Diapositiva de interes compuestoDiapositiva de interes compuesto
Diapositiva de interes compuestoEfernandez1
 

La actualidad más candente (20)

Trabajo de prueba de hipótesis
Trabajo de prueba de hipótesisTrabajo de prueba de hipótesis
Trabajo de prueba de hipótesis
 
Mapa conceptual
Mapa conceptualMapa conceptual
Mapa conceptual
 
Ejercicio practico 1 10 2018
Ejercicio practico 1 10 2018Ejercicio practico 1 10 2018
Ejercicio practico 1 10 2018
 
Medidas de forma
Medidas de formaMedidas de forma
Medidas de forma
 
Teorema de chebyshev
Teorema de chebyshevTeorema de chebyshev
Teorema de chebyshev
 
ejercicios resuelto de estadística l
ejercicios resuelto de estadística lejercicios resuelto de estadística l
ejercicios resuelto de estadística l
 
Medidas descriptivas sesion 6
Medidas descriptivas sesion 6Medidas descriptivas sesion 6
Medidas descriptivas sesion 6
 
Medidas de tendencia central
Medidas de tendencia centralMedidas de tendencia central
Medidas de tendencia central
 
Medidas de tendencia central
Medidas de tendencia centralMedidas de tendencia central
Medidas de tendencia central
 
Distribución de poisso ejercicios
Distribución de poisso ejerciciosDistribución de poisso ejercicios
Distribución de poisso ejercicios
 
Guia intervalos de confianza
Guia intervalos de confianzaGuia intervalos de confianza
Guia intervalos de confianza
 
Guiapractica estadistica
Guiapractica estadisticaGuiapractica estadistica
Guiapractica estadistica
 
Metodos de muestreo, ejercicios y su procedimiento (1)
Metodos de muestreo, ejercicios y su procedimiento (1)Metodos de muestreo, ejercicios y su procedimiento (1)
Metodos de muestreo, ejercicios y su procedimiento (1)
 
Medidas de la_forma_de_distribuciã³n
Medidas de la_forma_de_distribuciã³nMedidas de la_forma_de_distribuciã³n
Medidas de la_forma_de_distribuciã³n
 
Medidas estadísticas
Medidas estadísticasMedidas estadísticas
Medidas estadísticas
 
Matemáticas.financiera
Matemáticas.financieraMatemáticas.financiera
Matemáticas.financiera
 
media, mediana,_moda_y_otras_medidas
media, mediana,_moda_y_otras_medidasmedia, mediana,_moda_y_otras_medidas
media, mediana,_moda_y_otras_medidas
 
Coeficiente de Asimetría y Curtosis.pptx
Coeficiente de Asimetría y Curtosis.pptxCoeficiente de Asimetría y Curtosis.pptx
Coeficiente de Asimetría y Curtosis.pptx
 
Ejercicios y problemas resueltos de estadística ii
Ejercicios y problemas resueltos de estadística iiEjercicios y problemas resueltos de estadística ii
Ejercicios y problemas resueltos de estadística ii
 
Diapositiva de interes compuesto
Diapositiva de interes compuestoDiapositiva de interes compuesto
Diapositiva de interes compuesto
 

Destacado (8)

Ppt1
Ppt1Ppt1
Ppt1
 
Ppt4
Ppt4Ppt4
Ppt4
 
Ppt2
Ppt2Ppt2
Ppt2
 
Tipos De Raices Y Hojas
Tipos De Raices Y HojasTipos De Raices Y Hojas
Tipos De Raices Y Hojas
 
Ejercicios Resueltos de Estadística:
Ejercicios Resueltos de Estadística:Ejercicios Resueltos de Estadística:
Ejercicios Resueltos de Estadística:
 
Modulo Estadística 2011
Modulo Estadística 2011Modulo Estadística 2011
Modulo Estadística 2011
 
Problemas de razonamiento lógico libro de preguntas
Problemas de razonamiento lógico libro de preguntasProblemas de razonamiento lógico libro de preguntas
Problemas de razonamiento lógico libro de preguntas
 
Ejercicios resueltos-de-estadistica
Ejercicios resueltos-de-estadisticaEjercicios resueltos-de-estadistica
Ejercicios resueltos-de-estadistica
 

Similar a Ppt3

Medidas de tendencia central posicion y dispercion gabriel
Medidas de tendencia central posicion y dispercion gabrielMedidas de tendencia central posicion y dispercion gabriel
Medidas de tendencia central posicion y dispercion gabrielgabrielliendo2222222
 
TamañO De La Muestra
TamañO De La MuestraTamañO De La Muestra
TamañO De La MuestraAna kristell
 
Clase 03 medidas de tendencia central
Clase 03 medidas de tendencia centralClase 03 medidas de tendencia central
Clase 03 medidas de tendencia centralNilsonVallecillo
 
Clase 03 medidas de tendencia central
Clase 03 medidas de tendencia centralClase 03 medidas de tendencia central
Clase 03 medidas de tendencia centralNilsonVallecillo
 
Clase 03 medidas de tendencia central
Clase 03 medidas de tendencia centralClase 03 medidas de tendencia central
Clase 03 medidas de tendencia centralNilsonVallecillo
 
Clases bioestadistica1
Clases bioestadistica1Clases bioestadistica1
Clases bioestadistica1Henry Andrade
 
Bioestadística. Lic. Henry Andrade
Bioestadística. Lic. Henry AndradeBioestadística. Lic. Henry Andrade
Bioestadística. Lic. Henry AndradeHenry Andrade
 
SEMANA 04- MEDIDAS DE TENDENCIA CENTRAL.pdf
SEMANA 04- MEDIDAS DE TENDENCIA CENTRAL.pdfSEMANA 04- MEDIDAS DE TENDENCIA CENTRAL.pdf
SEMANA 04- MEDIDAS DE TENDENCIA CENTRAL.pdfIvanBautistaQuispe
 
Laboratorio 01
Laboratorio 01Laboratorio 01
Laboratorio 01Alex Vt
 
Clase v medidas_de_tendencia_central
Clase v medidas_de_tendencia_centralClase v medidas_de_tendencia_central
Clase v medidas_de_tendencia_centralJuan Diaz
 
Tamaño de la muestra (física)
Tamaño de la muestra (física)Tamaño de la muestra (física)
Tamaño de la muestra (física)Angie Hernandez
 
Estadistica tercero b copia
Estadistica tercero b copiaEstadistica tercero b copia
Estadistica tercero b copiaHilda578
 

Similar a Ppt3 (20)

Medidas de tendencia central posicion y dispercion gabriel
Medidas de tendencia central posicion y dispercion gabrielMedidas de tendencia central posicion y dispercion gabriel
Medidas de tendencia central posicion y dispercion gabriel
 
Ejercicios media aritmetica
Ejercicios media aritmeticaEjercicios media aritmetica
Ejercicios media aritmetica
 
Ejercicios media aritmetica
Ejercicios media aritmeticaEjercicios media aritmetica
Ejercicios media aritmetica
 
Presentación
Presentación Presentación
Presentación
 
TamañO De La Muestra
TamañO De La MuestraTamañO De La Muestra
TamañO De La Muestra
 
Clase 03 medidas de tendencia central
Clase 03 medidas de tendencia centralClase 03 medidas de tendencia central
Clase 03 medidas de tendencia central
 
Clase 03 medidas de tendencia central
Clase 03 medidas de tendencia centralClase 03 medidas de tendencia central
Clase 03 medidas de tendencia central
 
Clase 03 medidas de tendencia central
Clase 03 medidas de tendencia centralClase 03 medidas de tendencia central
Clase 03 medidas de tendencia central
 
Clases bioestadistica1
Clases bioestadistica1Clases bioestadistica1
Clases bioestadistica1
 
Bioestadística. Lic. Henry Andrade
Bioestadística. Lic. Henry AndradeBioestadística. Lic. Henry Andrade
Bioestadística. Lic. Henry Andrade
 
SEMANA 04- MEDIDAS DE TENDENCIA CENTRAL.pdf
SEMANA 04- MEDIDAS DE TENDENCIA CENTRAL.pdfSEMANA 04- MEDIDAS DE TENDENCIA CENTRAL.pdf
SEMANA 04- MEDIDAS DE TENDENCIA CENTRAL.pdf
 
Laboratorio 01
Laboratorio 01Laboratorio 01
Laboratorio 01
 
Clase v medidas_de_tendencia_central
Clase v medidas_de_tendencia_centralClase v medidas_de_tendencia_central
Clase v medidas_de_tendencia_central
 
Estadística. Medidas de tendencia central.
Estadística. Medidas de tendencia central.Estadística. Medidas de tendencia central.
Estadística. Medidas de tendencia central.
 
Matematicas
MatematicasMatematicas
Matematicas
 
Medidas de tendencias central
Medidas de tendencias centralMedidas de tendencias central
Medidas de tendencias central
 
Capitulo3
Capitulo3Capitulo3
Capitulo3
 
Tamaño de la muestra (física)
Tamaño de la muestra (física)Tamaño de la muestra (física)
Tamaño de la muestra (física)
 
Estadística descriptiva
Estadística descriptivaEstadística descriptiva
Estadística descriptiva
 
Estadistica tercero b copia
Estadistica tercero b copiaEstadistica tercero b copia
Estadistica tercero b copia
 

Último

MAYO 1 PROYECTO día de la madre el amor más grande
MAYO 1 PROYECTO día de la madre el amor más grandeMAYO 1 PROYECTO día de la madre el amor más grande
MAYO 1 PROYECTO día de la madre el amor más grandeMarjorie Burga
 
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptxACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptxzulyvero07
 
Qué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativaQué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativaDecaunlz
 
Ejercicios de PROBLEMAS PAEV 6 GRADO 2024.pdf
Ejercicios de PROBLEMAS PAEV 6 GRADO 2024.pdfEjercicios de PROBLEMAS PAEV 6 GRADO 2024.pdf
Ejercicios de PROBLEMAS PAEV 6 GRADO 2024.pdfMaritzaRetamozoVera
 
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURAFORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURAEl Fortí
 
ORGANIZACIÓN SOCIAL INCA EN EL TAHUANTINSUYO.pptx
ORGANIZACIÓN SOCIAL INCA EN EL TAHUANTINSUYO.pptxORGANIZACIÓN SOCIAL INCA EN EL TAHUANTINSUYO.pptx
ORGANIZACIÓN SOCIAL INCA EN EL TAHUANTINSUYO.pptxnandoapperscabanilla
 
actividades comprensión lectora para 3° grado
actividades comprensión lectora para 3° gradoactividades comprensión lectora para 3° grado
actividades comprensión lectora para 3° gradoJosDanielEstradaHern
 
La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...JonathanCovena1
 
proyecto de mayo inicial 5 añitos aprender es bueno para tu niño
proyecto de mayo inicial 5 añitos aprender es bueno para tu niñoproyecto de mayo inicial 5 añitos aprender es bueno para tu niño
proyecto de mayo inicial 5 añitos aprender es bueno para tu niñotapirjackluis
 
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.Alejandrino Halire Ccahuana
 
origen y desarrollo del ensayo literario
origen y desarrollo del ensayo literarioorigen y desarrollo del ensayo literario
origen y desarrollo del ensayo literarioELIASAURELIOCHAVEZCA1
 
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdfSELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdfAngélica Soledad Vega Ramírez
 
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICABIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICAÁngel Encinas
 
Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...Lourdes Feria
 
CALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDADCALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDADauxsoporte
 
plande accion dl aula de innovación pedagogica 2024.pdf
plande accion dl aula de innovación pedagogica 2024.pdfplande accion dl aula de innovación pedagogica 2024.pdf
plande accion dl aula de innovación pedagogica 2024.pdfenelcielosiempre
 

Último (20)

Unidad 3 | Metodología de la Investigación
Unidad 3 | Metodología de la InvestigaciónUnidad 3 | Metodología de la Investigación
Unidad 3 | Metodología de la Investigación
 
MAYO 1 PROYECTO día de la madre el amor más grande
MAYO 1 PROYECTO día de la madre el amor más grandeMAYO 1 PROYECTO día de la madre el amor más grande
MAYO 1 PROYECTO día de la madre el amor más grande
 
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptxACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
 
Qué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativaQué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativa
 
Ejercicios de PROBLEMAS PAEV 6 GRADO 2024.pdf
Ejercicios de PROBLEMAS PAEV 6 GRADO 2024.pdfEjercicios de PROBLEMAS PAEV 6 GRADO 2024.pdf
Ejercicios de PROBLEMAS PAEV 6 GRADO 2024.pdf
 
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURAFORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
 
ORGANIZACIÓN SOCIAL INCA EN EL TAHUANTINSUYO.pptx
ORGANIZACIÓN SOCIAL INCA EN EL TAHUANTINSUYO.pptxORGANIZACIÓN SOCIAL INCA EN EL TAHUANTINSUYO.pptx
ORGANIZACIÓN SOCIAL INCA EN EL TAHUANTINSUYO.pptx
 
actividades comprensión lectora para 3° grado
actividades comprensión lectora para 3° gradoactividades comprensión lectora para 3° grado
actividades comprensión lectora para 3° grado
 
La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...
 
proyecto de mayo inicial 5 añitos aprender es bueno para tu niño
proyecto de mayo inicial 5 añitos aprender es bueno para tu niñoproyecto de mayo inicial 5 añitos aprender es bueno para tu niño
proyecto de mayo inicial 5 añitos aprender es bueno para tu niño
 
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
 
origen y desarrollo del ensayo literario
origen y desarrollo del ensayo literarioorigen y desarrollo del ensayo literario
origen y desarrollo del ensayo literario
 
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdfSELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
 
Presentacion Metodología de Enseñanza Multigrado
Presentacion Metodología de Enseñanza MultigradoPresentacion Metodología de Enseñanza Multigrado
Presentacion Metodología de Enseñanza Multigrado
 
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICABIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
 
Sesión de clase: Fe contra todo pronóstico
Sesión de clase: Fe contra todo pronósticoSesión de clase: Fe contra todo pronóstico
Sesión de clase: Fe contra todo pronóstico
 
Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...
 
Medición del Movimiento Online 2024.pptx
Medición del Movimiento Online 2024.pptxMedición del Movimiento Online 2024.pptx
Medición del Movimiento Online 2024.pptx
 
CALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDADCALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDAD
 
plande accion dl aula de innovación pedagogica 2024.pdf
plande accion dl aula de innovación pedagogica 2024.pdfplande accion dl aula de innovación pedagogica 2024.pdf
plande accion dl aula de innovación pedagogica 2024.pdf
 

Ppt3

  • 1. 5 Análisis de los datos Vamos a ampliar en qué consiste la fase de analizar los datos empleando medidas descriptivas www.auladeeconomia.com
  • 2. ¿Cómo se puede analizar la información? Haga una lista de diferentes formas en las cuales se podría analizar la información estadística con el fin de describir el conjunto de datos. Indique tipos de datos que podrían calcularse. Anote aquí los pasos que usted cree que se deben hacer. www.auladeeconomia.com
  • 3. Estatura de jugadores de futbol Kaká Tévez Villa Messi Zlatan Cristiano Ronaldinho Crouch 1,83 1,73 1,75 1,69 1,94 1,83 1,81 2,01
  • 4. Estatura de jugadores de basketbol Bryant Gasol James Ming Paul O´Neal 2,01 2,15 1,90 2,28 1,83 2,15
  • 5. 1,83 1,73 1,75 1,69 1,94 1,83 Conjuntos de datos 1,81 2,01 2,01 2,15 1,90 2,28 1,83 2,15 ¿Cómo describimos estos conjuntos de datos? Medidas de posición Medidas de variabilidad
  • 6. Medidas de posición Medidas de posición central Kaká Tévez Villa Messi Zlatan Cristiano Ronaldinho Crouch 1,83 1,73 1,75 1,69 1,94 1,83 1,81 2,01 Moda: Dato más frecuente: 1,83
  • 7. Medidas de posición Medidas de posición central Bryant Gasol James Ming Paul O´Neal 2,01 2,15 1,90 2,28 1,83 2,15 Moda: Dato más frecuente: 2,15
  • 8. Medidas de posición Medidas de posición central Kaká Tévez Villa Messi Zlatan Cristiano Ronaldinho Crouch 1,83 1,73 1,75 1,69 1,94 1,83 1,81 2,01 Mediana: La mitad de los datos son menores y la mitad de los datos son mayores: 1,82
  • 9. Medidas de posición Medidas de posición central Bryant Gasol James Ming Paul O´Neal 2,01 2,15 1,90 2,28 1,83 2,15 Mediana: La mitad de los datos son menores y la mitad de los datos son mayores: 2,08
  • 10. Medidas de posición Medidas de posición central Kaká Tévez Villa Messi Zlatan Cristiano Ronaldinho Crouch 1,83 1,73 1,75 1,69 1,94 1,83 1,81 2,01 Media: Promedio: Suma de datos dividido entre número de datos: 1,83 + 1,73 + 1,75 + 1,69 + 1,94 + 1,83 + 1,81 + 2,01 = 14,59 / 8 = 1,82
  • 11. Medidas de posición Medidas de posición central Bryant Gasol James Ming Paul O´Neal 2,01 2,15 1,90 2,28 1,83 2,15 Media: Promedio: Suma de datos dividido entre número de datos: 2,01 + 2,15 + 1,90 + 2,28 + 1,83 + 2,15 = 12,32 / 6 = 2,05
  • 12. Medidas de posición Medidas de posición no central Kaká Tévez Villa Messi Zlatan Cristiano Ronaldinho Crouch 1,83 1,73 1,75 1,69 1,94 1,83 1,81 2,01 Cuartiles: Dividen el conjunto de datos en cuatro partes.
  • 13. Medidas de posición Medidas de posición no central Kaká Tévez Villa Messi Zlatan Cristiano Ronaldinho Crouch 1,83 1,73 1,75 1,69 1,94 1,83 1,81 2,01 Cuartil 1: La cuarta parte de los datos son menores y tres cuartas partes de los datos son mayores: 1,74
  • 14. Medidas de posición Medidas de posición no central Kaká Tévez Villa Messi Zlatan Cristiano Ronaldinho Crouch 1,83 1,73 1,75 1,69 1,94 1,83 1,81 2,01 Cuartil 3: Tres cuartas partes de los datos son menores y una cuarta parte de los datos son mayores: 1,89
  • 15. 1,83 1,73 1,75 1,69 1,94 1,83 Conjuntos de datos 1,81 2,01 2,01 2,15 1,90 2,28 1,83 2,15 ¿Cómo describimos estos conjuntos de datos? Medidas de posición
  • 16. Medidas de posición Moda 1,83 2,15 Mediana 1,82 2,08 Media 1,82 2,05 Primer cuartil 1,74 1,93 Tercer cuartil 1,89 2,15
  • 17. 1,83 1,73 1,75 1,69 1,94 1,83 Conjuntos de datos 1,81 2,01 2,01 2,15 1,90 2,28 1,83 2,15 ¿Cómo describimos estos conjuntos de datos? Medidas de posición Medidas de variabilidad
  • 18. Medidas de variabilidad Kaká Tévez Villa Messi Zlatan Cristiano Ronaldinho Crouch 1,83 1,73 1,75 1,69 1,94 1,83 1,81 2,01 Rango: Dato mayor menos dato menor: 2,01 - 1,69 = 0,32
  • 19. Medidas de variabilidad Bryant Gasol James Ming Paul O´Neal 2,01 2,15 1,90 2,28 1,83 2,15 Rango: Dato mayor menos dato menor: 2,28 - 1,83 = 0,55
  • 20. Medidas de variabilidad Desviación media, Varianza y Desviación estándar Kaká Tévez Villa Messi Zlatan Cristiano Ronaldinho Crouch 1,83 1,73 1,75 1,69 1,94 1,83 1,81 2,01 Promedio: 1,82 Desviación: Diferencia entre un valor de una serie y su media 1,83 - 1,82 = 0,01 1,73 - 1,82 = -0,09
  • 21. Desviación media: Desviación absoluta promedio = Suma de los valores absolutos de las desviaciones dividido entre el número de datos 1,83 - 1,82 = 0,01 => 0,01 1,73 - 1,82 = -0,09 => 0,09 1,75 - 1,82 = -0,07 => 0,07 1,69 - 1,82 = -0,13 => 0,13 1,94 - 1,82 = 0,12 => 0,12 Suma = 0,63 1,83 - 1,82 = 0,01 => 0,01 8 1,81 - 1,82 = -0,01 => 0,01 = 0,0788 2,01 - 1,82 = 0,19 => 0,19
  • 22. Varianza = Suma de los cuadrados de las desviaciones dividido entre el número de datos 1,83 - 1,82 = 0,01 => 0,0001 1,73 - 1,82 = -0,09 => 0,0081 1,75 - 1,82 = -0,07 => 0,0049 1,69 - 1,82 = -0,13 => 0,0169 1,94 - 1,82 = 0,12 => 0,0144 Suma = 0,0807 1,83 - 1,82 = 0,01 => 0,0001 8 1,81 - 1,82 = -0,01 => 0,0001 = 0,0101 2,01 - 1,82 = 0,19 => 0,0361
  • 23. Desviación estándar = Raíz cuadrada de la varianza Varianza = 0,0101 Raíz cuadrada de 0,0101 = 0,1004
  • 24. Medidas de posición www.auladeeconomia.com
  • 25. Medidas de posición Hay medidas que se ubican Otras medidas de posición no alrededor del centro del conjunto tienden a ubicarse en el centro de datos. del conjunto ordenado de datos. A estas medidas se les llama Estas medidas se conocen como medidas de posición central cuantilos Estas medidas son: Los cuantilos son: Cuartiles Media o promedio Percentiles Mediana Deciles Moda Quintiles. www.auladeeconomia.com
  • 26. Media aritmética Es la suma de los datos entre el La fórmula para calcular la media es: número de datos. Población: N Se denota por , si corresponde a X i una población.  i 1 N Se denota por cuando se refiere a Muestra: n una muestra. x i x i 1 n www.auladeeconomia.com
  • 27. En calculadora Casio fx-570 ES Pasos para calcular la media: 1. Presionar: Mode 3 2. Presionar AC 3. Presionar: Shift 1 2 4. Introducir datos en la columna: • Usar tecla = para introducir cada dato 5. Presionar AC 6. Presionar: Shift 1 5 2 = www.auladeeconomia.com
  • 28. En calculadora Casio fx-95 MS o fx-82 MS: Pasos para calcular la media: 1. Presionar: Mode 2 2. Introducir datos: • dato M+ • Etc. 3. Presionar: Shift 2 1 = www.auladeeconomia.com
  • 29. Ejercicio: Suponga que se tienen los siguientes datos correspondientes a las ventas mensuales que ha realizado un vendedor durante los últimos siete meses (en millones de dólares): 20, 33, 42, 40, 19, 23, 28 Calcule la media aritmética. Respuesta: El cálculo de la media sería: 20  33  42  40  19  23  28 x  29.29 7 Según ese resultado, sus ventas mensuales promedio son de 29.29 millones de dólares. www.auladeeconomia.com
  • 30. Ejercicio: Suponga que se tienen los siguientes datos correspondientes a las ventas mensuales que ha realizado un vendedor durante los últimos siete meses (en millones de dólares): 20, 33, 42, 40, 19, 23, 2800 Calcule la media aritmética. ¿Representa adecuadamente la media al conjunto de datos? Respuesta: El cálculo de la media sería: 20  33  42  40  19  23  2800 x  425,29 7 Según ese resultado, sus ventas mensuales promedio son de 425,29 millones de dólares. El valor extremo de 2800 “distorsiona” el valor de la media, ocasionando que no represente bien al conjunto de datos. www.auladeeconomia.com
  • 31. Media aritmética Las principales características de la Otras características son: media aritmética son: Es única para cada caso. Depende de cada una de las medidas que forman la serie de datos Permite representar mediante un solo valor de la serie de valores. Se halla afectada excesivamente por los valores extremos del conjunto de Se calcula con todos los datos de la datos (principal desventaja). serie de valores. Se calcula con facilidad. Es susceptible de operaciones algebraicas. www.auladeeconomia.com
  • 32. Media aritmética ponderada Se emplea cuando hay datos que se La fórmula para calcular la media es: repiten varias veces. Caso de valores repetidos: k También cuando hay datos con x i fi diferente importancia o diferente x i 1 n peso. Caso de valores con diferente peso: k x w i i x i 1 k w i 1 i www.auladeeconomia.com
  • 33. Ejercicio: Suponga que una empresa posee quince vendedores de un determinado producto. Cuatro de los vendedores lograron vender 50 unidades, 6 vendieron 40 unidades, tres vendieron 35 unidades y 2 vendieron 20 unidades. ¿Cuál es el número de unidades promedio de cada vendedor? Respuesta: Dado que existen valores repetidos, entonces se aplica la fórmula: Unidades (X) Frecuencia k 50 4 x i fi 4  50  6  40  3  35  2  20 40 6 x i 1   39 n 15 35 3 Es decir, el número de unidades promedio 20 2 vendidas por cada vendedor es de 39 Total 15 unidades. www.auladeeconomia.com
  • 34. Ejercicio: Una empresa obtiene distintos márgenes de utilidad según los diferentes productos que vende. Suponiendo que vende 3 productos diferentes A, B y C, con rentabilidades de 20%, 30% y 40% respectivamente, de acuerdo con los siguientes datos: las ventas de A son de $200 millones, las de B de $100 millones y las de C de $60 millones. ¿Cuál es el margen de utilidad promedio? Respuesta: Para responder a esta pregunta es necesario calcular la media ponderada, ya que el volumen de ventas de cada producto es distinto, y eso afecta al promedio. El cálculo debe ser el siguiente: Utilidad Ventas k 20% 200 x w i i 20%  200  30%  100  40%  60 x i 1   26.11% 30% 100 k w 360 i 40% 60 i 1 Total 360 El margen de utilidad promedio es de 26.11%. www.auladeeconomia.com
  • 35. Mediana Es una medida de posición que divide Si el número N es el número de a la serie de valores en dos partes datos de la serie, entonces la iguales: posición de la mediana será: un cincuenta por ciento que es mayor N 1 PMed  o igual a la mediana 2 y otro cincuenta por ciento que es Cuando el número N de datos es una menor o igual que ella. cantidad par, se requerirá obtener el punto medio para poder obtener la Se denota Med. mediana. www.auladeeconomia.com
  • 36. Ejercicio: Sean los siguientes datos: 5, 12, 7, 8, 10, 6, y 9 los años de servicios de un grupo de trabajadores. ¿Cuál es la mediana? Respuesta: Lo primero que se hace es ordenar los datos en forma creciente o decreciente: 5, 6, 7, 8, 9, 10, 12 Dado que se tienen 7 datos, una cantidad impar de datos, se aplica la formula: N 1 7 1 PMed   4 2 2 Ese resultado indica que la mediana será el cuarto dato de la serie, es decir, la mediana será 8, Med = 8. www.auladeeconomia.com
  • 37. Ejercicio: Sean los siguientes datos: 5, 12, 7, 8, 11, 10, 6, y 9 los años de servicios de un grupo de trabajadores. ¿Cuál es la mediana? Respuesta: Lo primero que se hace es ordenar los datos en forma creciente o decreciente: 5, 6, 7, 8, 9, 10, 11, 12 Dado que se tienen 8 datos, una cantidad par de datos, se aplica la formula: N 1 8 1 PMed    4,5 2 2 Ese resultado indica que la mediana estará entre el cuarto y el quinto dato de la serie, y por tanto será necesario calcular el punto medio entre 8 y 9, es decir, la mediana será (8+9)/2, Med = 8,5. www.auladeeconomia.com
  • 38. Moda Es el valor de la variable que más se Sus principales características son: repite en el conjunto de datos. No se afecta por valores extremos Se designa como Mo o Mod. Se puede obtener en una forma Es posible que un conjunto de datos aproximada con facilidad. posea dos o más modas. Tiene poca utilidad si hay pocos En estos casa se habla de serie de datos y si no hay tendencia central. datos bimodales o multimodales. Se utiliza principalmente con escalas nominales . www.auladeeconomia.com
  • 39. Ejercicio: Con base en los siguientes conjuntos de datos, obtenga la moda: Conjunto 1: 12, 14, 14, 15, 18, 18, 18, 22, 25 Conjunto 2: 12, 14, 14, 14, 15, 18, 18, 18, 22, 25 Conjunto 3: 12, 14, 15, 18, 22, 25 Conjunto 4: 12, 14, 14, 15, 18, 18, 18, 22, 2500 Respuesta: 1. El dato que más veces aparece es el 18, por tanto la moda es 18. 2. El dato que más veces aparece es el 14 y el 18, por tanto la moda es 14 y 18. 3. No tiene moda. 4. El dato que más veces aparece es el 18, por tanto la moda es 18. www.auladeeconomia.com
  • 41. Ejercicio: La media aritmética del siguiente conjunto de datos 7, 20, 13, 14, 6, 9, 1 es: ( a ) 70 ( b ) 20 ( c ) 14 ( d ) 10 Respuesta: La respuesta correcta es: ( d ) 10 www.auladeeconomia.com
  • 42. Ejercicio: En el conjunto de valores 3, 4, 5, 5, 4, 7, 8, 4, 6, 9, 10, la mediana es: (a)4 (b)7 ( c ) 5,5 (d)5 (e)6 Respuesta: La respuesta correcta es: Se ordena: 3, 4, 4, 4, 5, 5, 6, 7, 8, 9, 10 N = 11, PMed = (N + 1) / 2 = (11 + 1) / 2 = 6 => Med = 5 (d)5 www.auladeeconomia.com
  • 43. Ejercicio: La moda del siguiente conjunto de datos 7, 7, 20, 20, 13, 14, 13, 6, 9, 13, 6 es: (a)7 ( b ) 20 ( c ) 13 (d)6 Respuesta: La respuesta correcta es: ( c ) 13 www.auladeeconomia.com
  • 44. Ejercicio: A continuación se presentan tres conjuntos de datos. En cada caso, calcule la media aritmética, la mediana y la moda del siguiente conjunto de datos: Conjunto 1: 12, 13, 14, 14, 15, 15, 15, 16, 16, 16, 16, 16, 17, 17, 17, 18, 18, 19, 20 Conjunto 2: 12, 13, 14, 15, 15, 16, 16, 17, 17, 17, 18, 18, 18, 19, 19, 19, 19, 19, 20, 20, 20 Conjunto 3: 12, 12, 12, 13, 13, 13, 13, 13, 14, 14, 14, 15, 15, 16, 16, 17, 17, 18, 19, 20 Además en cada caso: Construya una gráfica (histograma) para representar a este conjunto de datos. Observe la gráfica. Si dividiera la gráfica por la “mitad”, ¿es igual la parte derecha a la parte izquierda? Observe la relación entre la media, la mediana y la moda. ¿Cuál de las tres es mayor? www.auladeeconomia.com
  • 45. Ejercicio: Calcule la media aritmética, la mediana y la moda del siguiente conjunto de datos: 12, 13, 14, 14, 15, 15, 15, 16, 16, 16, 16, 16, 17, 17, 17, 18, 18, 19, 20 Construya una gráfica (histograma) para representar a este conjunto de datos. Observe la gráfica. Si dividiera la gráfica por la “mitad”, ¿es igual la parte derecha a la parte izquierda? Observe la relación entre la media, la mediana y la moda. ¿Cuál de las tres es mayor? Respuesta: F La respuesta correcta es: Media = 16 5 Mediana = 16 4 Moda = 16 3 Esta es una distribución simétrica. 2 La media, la mediana y la moda son 1 iguales. 12 13 14 15 16 17 18 19 20 X www.auladeeconomia.com
  • 46. Ejercicio: Calcule la media aritmética, la mediana y la moda del siguiente conjunto de datos: 12, 13, 14, 15, 15, 16, 16, 17, 17, 17, 18, 18, 18, 19, 19, 19, 19, 19, 20, 20, 20 Construya una gráfica (histograma) para representar a este conjunto de datos. Observe la gráfica. Si dividiera la gráfica por la “mitad”, ¿es igual la parte derecha a la parte izquierda? Observe la relación entre la media, la mediana y la moda. ¿Cuál de las tres es mayor? Respuesta: F La respuesta correcta es: Media = 17,19 5 Mediana = 18 4 Moda = 19 3 Esta es una distribución asimétrica 2 negativa: 1 media < mediana < moda 12 13 14 15 16 17 18 19 20 X www.auladeeconomia.com
  • 47. Ejercicio: Calcule la media aritmética, la mediana y la moda del siguiente conjunto de datos: 12, 12, 12, 13, 13, 13, 13, 13, 14, 14, 14, 15, 15, 16, 16, 17, 17, 18, 19, 20 Construya una gráfica (histograma) para representar a este conjunto de datos. Observe la gráfica. Si dividiera la gráfica por la “mitad”, ¿es igual la parte derecha a la parte izquierda? Observe la relación entre la media, la mediana y la moda. ¿Cuál de las tres es mayor? Respuesta: F La respuesta correcta es: Media = 14,8 5 Mediana = 14 4 Moda = 13 3 Esta es una distribución asimétrica 2 positiva: 1 media > mediana > moda 12 13 14 15 16 17 18 19 20 X www.auladeeconomia.com
  • 48. Simetría y asimetría Hay medidas para determinar el grado y tipo de la asimetría de un conjunto de datos. En este curso no se estudian esas medidas, por lo que la simetría o asimetría se determinará por la relación entre moda, mediana y media Entonces: Si Media = Med = Mo, simetría Si Media > Med > Mo, asimetría positiva Si Media < Med < Mo, asimetría negativa www.auladeeconomia.com
  • 49. Ejercicio: Los siguientes son los ingresos de siete personas (en $/mes): 300, 450, 500, 250, 600, 550, 3000 Calcule e interprete la media, moda y mediana. ¿Cuál de las tres medidas describe mejor al conjunto de datos? Respuesta: La respuesta correcta es: Media = 807.14 ->El ingreso promedio mensual es de $807,14. Mediana = 500 ->La mitad de estas personas tiene un ingreso mensual inferior a $500. Moda = No hay.. Dada la presencia de un valor extremo, entonces la mediana describe al conjunto mejor que la media. www.auladeeconomia.com
  • 50. Ejercicio: Los siguientes son los pesos, en gramos, de una muestra de frascos de mermelada que se envasan en una empresa: 252, 260, 266, 248, 240, 246, 255, 260, 270, 258, 259, 260, 264, 254, 256, 262 Calcule e interprete la media, moda y mediana. ¿Qué se puede concluir sobre la simetría o asimetría de los pesos? Si cada frasco debe contener 250 gramos, ¿qué indican los datos calculados y el tipo de simetría o asimetría que se presenta? Respuesta: La respuesta correcta es: Media = 256,9 -> El peso promedio de los frascos es de 256,9 grs. Mediana = 258,5 -> El 50% de los frascos contiene más de 258,5 grs., y el resto menos. Moda = 260 -> El peso más frecuente es 260 grs. Esta es una distribución asimétrica negativa (media < mediana < moda). La empresa está “regalando” producto, pues la mayoría de los frascos contienen más de lo especificado. La asimetría negativa indica que son pocos los pesos bajos y muchos los pesos altos. www.auladeeconomia.com
  • 51. Cuantiles Son medidas de posición tales que Cuartiles: tres valores que dividen al superan a no más de cierta conjunto ordenado de datos en proporción de las observaciones y a 4 partes iguales. la vez quedan superados por no más Percentiles: 99 valores que dividen de la proporción complementaria, al conjunto ordenado de datos en cuando las observaciones han sido 100 partes iguales. ordenadas. Deciles: nueve valores que dividen al Las principales de estas medidas son: conjunto ordenado de datos en Cuartiles 10 partes iguales. Percentiles Quintiles: cuatro valores que dividen Deciles al conjunto ordenado de datos en Quintiles 5 partes iguales. www.auladeeconomia.com
  • 52. Cuantiles Conjunto ordenado de datos P5 P10 P16 P25 P40 P50 P63 P75 P90 P95 D1 D2 D3 D4 D5 D6 D7 D8 D9 Q1 Med Q3 Q2 www.auladeeconomia.com
  • 53. Relaciones entre cuantilos Cuartil Percentil Decil Percentil Quintil Percentil Q1 P25 D1 P10 K1 P20 Q3 P75 D2 P20 K2 P40 D3 P30 K3 P60 Cuartil x 25 = Percentil D4 P40 K4 P80 D5 P50 Quintil x 20 = Percentil D6 P60 D7 P70 D8 P80 D9 P90 Decil x 10 = Percentil Recuerde que para calcular mediana, cuartiles, percentiles, quintiles y deciles, los datos deben ordenarse ascendentemente. www.auladeeconomia.com
  • 54. Ejercicio: Sean los siguientes datos: 20, 40, 70, 80, 90, 100, 100, 100, 120, 120, 140, 150 Determine el percentil 80. Respuesta: Lo primero que se hace es verificar que los datos estén ordenados en forma creciente: 1 2 3 4 5 6 7 8 9 10 11 12 20, 40, 70, 80, 90, 100, 100, 100, 120, 120, 140, 150 Se aplica la formula con n = 12 y m = 80: Pm  100 n  1 m P  100 12  1  0,8(13)  10,4 80 80 Posición del percentil décimo dato 120 + 0,4 * 20 = 128 www.auladeeconomia.com
  • 55. Ejercicio: Sean los siguientes datos: 20, 40, 70, 80, 90, 100, 100, 100, 120, 120, 140, 150 Determine el cuartil 1. Respuesta: Lo primero que se hace es verificar que los datos estén ordenados en forma creciente: 1 2 3 4 5 6 7 8 9 10 11 12 20, 40, 70, 80, 90, 100, 100, 100, 120, 120, 140, 150 Se sabe que Q1 = P25 y se aplica la formula con n = 12 y m = 25: Pm  100 n  1 m P25  100 12  1  0,25(13)  3,25 25 tercer dato 70 + 0,25 *10 = 72,5 www.auladeeconomia.com
  • 56. Ejercicio: Sean los siguientes datos: 20, 40, 70, 80, 90, 100, 100, 100, 120, 120, 140, 150 Determine el cuartil 3. Respuesta: Lo primero que se hace es verificar que los datos estén ordenados en forma creciente: 1 2 3 4 5 6 7 8 9 10 11 12 20, 40, 70, 80, 90, 100, 100, 100, 120, 120, 140, 150 Se sabe que Q3 = P75 y se aplica la formula con n = 12 y m = 75: Pm  100 n  1 m P75  100 12  1  0,75(13)  9,75 75 noveno dato 120 + 0,75 * 0 = 120 www.auladeeconomia.com
  • 57. Ejercicio: Sean los siguientes datos: 20, 40, 70, 80, 90, 100, 100, 100, 120, 120, 140, 150 Determine el decil 4. Respuesta: Lo primero que se hace es verificar que los datos estén ordenados en forma creciente: 1 2 3 4 5 6 7 8 9 10 11 12 20, 40, 70, 80, 90, 100, 100, 100, 120, 120, 140, 150 Se sabe que D4 = P40 y se aplica la formula con n = 12 y m = 40: Pm  100 n  1 m P40  100 12  1  0,40(13)  5,2 40 quinto dato 90 + 0,2 * 10 = 92 www.auladeeconomia.com
  • 58. Ejercicio: Sean los siguientes datos: 45, 56, 72, 81, 43, 62, 55, 90, 49, 52, 60, 75, 66, 72, 58, 50, 88 Calcule e interprete: • Cuartil 1 • Cuartil 3 • Decil 7 • Percentil 42 • Percentil 93 • Quintil 3 www.auladeeconomia.com
  • 59. Ejercicio: Sean los siguientes datos: 45, 56, 72, 81, 43, 62, 55, 90, 49, 52, 60, 75, 66, 72, 58, 50, 88 Calcule e interprete el cuartil 1. Respuesta: Lo primero que se hace es verificar que los datos estén ordenados en forma creciente: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 43, 45, 49, 50, 52, 55, 56, 58, 60, 62, 66, 72, 72, 75, 81, 88, 90 Se sabe que Q1 = P25 y se aplica la formula con n = 17 y m = 25: Pm  100 n  1 m P25  100 17  1  0,25(18)  4,5 25 cuarto dato 50 + 0,5 * 2 = 51 www.auladeeconomia.com
  • 60. Ejercicio: Sean los siguientes datos: 45, 56, 72, 81, 43, 62, 55, 90, 49, 52, 60, 75, 66, 72, 58, 50, 88 Calcule e interprete el cuartil 3. Respuesta: Lo primero que se hace es verificar que los datos estén ordenados en forma creciente: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 43, 45, 49, 50, 52, 55, 56, 58, 60, 62, 66, 72, 72, 75, 81, 88, 90 Se sabe que Q3 = P75 y se aplica la formula con n = 17 y m = 75: Pm  100 n  1 m P75  100 17  1  0,75(18)  13,5 75 13er dato 72 + 0,5 * 3 = 73,5 www.auladeeconomia.com
  • 61. Ejercicio: Sean los siguientes datos: 45, 56, 72, 81, 43, 62, 55, 90, 49, 52, 60, 75, 66, 72, 58, 50, 88 Calcule e interprete el decil 7. Respuesta: Lo primero que se hace es verificar que los datos estén ordenados en forma creciente: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 43, 45, 49, 50, 52, 55, 56, 58, 60, 62, 66, 72, 72, 75, 81, 88, 90 Se sabe que D7 = P70 y se aplica la formula con n = 17 y m = 70: Pm  100 n  1 m P70  100 17  1  0,70(18)  12,6 70 12º. dato 72 + 0,6 * 0 = 72 www.auladeeconomia.com
  • 62. Ejercicio: Sean los siguientes datos: 45, 56, 72, 81, 43, 62, 55, 90, 49, 52, 60, 75, 66, 72, 58, 50, 88 Calcule e interprete el percentil 42. Respuesta: Lo primero que se hace es verificar que los datos estén ordenados en forma creciente: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 43, 45, 49, 50, 52, 55, 56, 58, 60, 62, 66, 72, 72, 75, 81, 88, 90 Se sabe que P42 y se aplica la formula con n = 17 y m = 42: Pm  100 n  1 m P42  100 17  1  0,42(18)  7,56 42 sétimo dato 56 + 0,56 * 2 = 57,12 www.auladeeconomia.com
  • 63. Ejercicio: Sean los siguientes datos: 45, 56, 72, 81, 43, 62, 55, 90, 49, 52, 60, 75, 66, 72, 58, 50, 88 Calcule e interprete el percentil 93. Respuesta: Lo primero que se hace es verificar que los datos estén ordenados en forma creciente: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 43, 45, 49, 50, 52, 55, 56, 58, 60, 62, 66, 72, 72, 75, 81, 88, 90 Se sabe que P93 y se aplica la formula con n = 17 y m = 93: Pm  100 n  1 m P  100 17  1 0,93(18)  16,74 93 93 16º. dato 88 + 0,74 * 2 = 89,48 www.auladeeconomia.com
  • 64. Ejercicio: Sean los siguientes datos: 45, 56, 72, 81, 43, 62, 55, 90, 49, 52, 60, 75, 66, 72, 58, 50, 88 Calcule e interprete el quintil 3. Respuesta: Lo primero que se hace es verificar que los datos estén ordenados en forma creciente: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 43, 45, 49, 50, 52, 55, 56, 58, 60, 62, 66, 72, 72, 75, 81, 88, 90 Se sabe que K3 = P60 y se aplica la formula con n = 17 y m = 60: Pm  100 n  1 m P60  100 17  1  0,60(18)  10,8 60 décimo dato 62 + 0,8 * 4 = 65,2 www.auladeeconomia.com
  • 65. Ejercicio: Un instituto de idiomas ha contratado un estudio de salarios de profesores (salarios mensuales). En dicho estudio se obtuvieron los siguientes resultados: Percentil 12 = $600 Cuartil 1 = $650 Mediana = $725 Cuartil 3 = $800 Quintil 4 = $1000 Decil 9 = $1200 ¿Qué significan estos resultados? www.auladeeconomia.com
  • 66. Ejercicio – Respuesta: • Percentil 12 = $600 => Un 12% de los profesores tiene un salario mensual inferior a $600, y un 88% de los profesores gana más de $600 al mes. • Cuartil 1 = $650 => Un 25% (una cuarta parte) de los profesores tiene un salario mensual inferior a $650, y el 75% de los profesores gana más de $650 al mes. • Mediana = $725 => Un 50% (la mitad) de los profesores tiene un salario menor que $725 al mes, y la otra mitad tiene un salario mayor que $725 al mes. • Cuartil 3 = $800 => Un 75% (tres cuartas partes) de los profesores tiene un salario menor que $800 al mes, y el 25% gana más de $800 al mes. • Quintil 4 = $1000 => Un 80% (cuatro quintas partes) de los profesores tiene un salario menor de $1000 al mes, y el 20% gana más de $1000 al mes. • Decil 9 = $1200 => Un 90% (nueve décimas) de los profesores tiene un salario mensual inferior a $1200, y un 10% de los profesores gana más de $1200 al mes. www.auladeeconomia.com
  • 67. Medidas de variabilidad o dispersión www.auladeeconomia.com
  • 68. Medidas de variabilidad “Donde yo vivo el clima es muy “Yo vivo cerca de una playa en un agradable, las temperaturas se país del norte de Europa. ¿Sería indiferente paraLa temperaturaen ubican entre los 18º y 22º, con un usted vivir también tiene un promedio de 20º. estos dos lugares, promedio de 20º. cualquiera de dado que la A veces llega hasta 35º. temperatura promedioPero la misma? -5º o menos. es otras veces es Observe que no solo el promedio es importante, sino también la variabilidad. www.auladeeconomia.com
  • 69. Medidas de variabilidad La variabilidad, o dispersión de los Las medidas de dispersión pueden datos, es el grado en que los valores ser clasificadas en: de una distribución o serie numérica tienden a acercarse o alejarse - Medidas de dispersión absolutas alrededor de un promedio. - Medidas de dispersión relativas Cuando la dispersión es baja indica Las medidas absolutas se expresan que la serie de valores es en las mismas unidades de los datos. relativamente homogénea. Como el recorrido, la desviación Una variabilidad alta indica una serie cuartil, la desviación estándar y la de valores heterogénea. varianza. www.auladeeconomia.com
  • 70. Medidas de variabilidad La varianza consiste en el promedio La desviación estándar es una del cuadrado de las desviaciones de medida de variabilidad que consiste un conjunto de datos con respecto a en la raíz cuadrada de la varianza. su media. Se calcula como: Se calcula como: Varianza poblacional: Desviación estándar poblacional: N (X i   )2   2   2 i 1 N Varianza muestral: Desviación estándar muestral: n  (x i  x )2 s s2 s  2 i 1 n 1 www.auladeeconomia.com
  • 71. Ejercicio: Suponga que se tiene el siguiente conjunto de cinco datos: 1, 1, 3, 10, 10 y se desea calcular la varianza y la desviación estándar de dicha población. n Respuesta: Primero calcular la media aritmética: X 1  1  3  10  10 25 i  i 1   5 N 5 5 Se calcula la diferencia entre cada dato y la media, y luego se elevan al cuadrado: Dato Dato menos media Se eleva al cuadrado 1 1 – 5 = -4 (-4)² = 16 1 1 – 5 = -4 (-4)² = 16 3 3 – 5 = -2 (-2)² = 4 10 10 – 5 = 5 (5)² = 25 10 10 – 5 = 5 (5)² = 25 Suma: = 86 La suma se divide entre n : Varianza = 86 / 5 = 17,2 Desviación estándar = raíz(17,2) = 4,15 www.auladeeconomia.com
  • 72. Ejercicio: Suponga que se tiene el siguiente conjunto de cinco datos: 1, 1, 3, 10, 10 y se desea calcular la varianza y la desviación estándar de dicha muestra. n Respuesta: Primero calcular la media aritmética: x 1  1  3  10  10 25 i x i 1   5 n 5 5 Se calcula la diferencia entre cada dato y la media, y luego se elevan al cuadrado: Dato Dato menos media Se eleva al cuadrado 1 1 – 5 = -4 (-4)² = 16 1 1 – 5 = -4 (-4)² = 16 3 3 – 5 = -2 (-2)² = 4 10 10 – 5 = 5 (5)² = 25 10 10 – 5 = 5 (5)² = 25 Suma: = 86 La suma se divide entre n -1: Varianza = 86 / 4 = 21,5 Desviación estándar = raíz(21,5) = 4,64 www.auladeeconomia.com
  • 73. En calculadora Casio fx-570 ES Pasos para calcular la desviación estándar: 1. Presionar: Mode 3 2. Presionar AC 3. Presionar: Shift 1 2 4. Introducir datos en la columna: • Usar tecla = para introducir cada dato 5. Presionar AC 6. Presionar: Shift 1 5 3 = desviación estándar poblacional Shift 1 5 4 = desviación estándar muestral Para obtener la variancia, eleve al cuadrado el resultado anterior. www.auladeeconomia.com
  • 74. En calculadora Casio fx-95 MS o fx-82 MS Pasos para calcular la desviación estándar: 1. Presionar: Mode 2 2. Introducir datos: • dato M+ • Etc. 3. Presionar: Shift 2 2 = desviación estándar poblacional Shift 2 3 = desviación estándar muestral Para obtener la variancia, eleve al cuadrado el resultado anterior. www.auladeeconomia.com
  • 75. Ejercicio: Sea la siguiente muestra de datos: 45, 56, 72, 81, 43, 62, 55, 90, 49, 52, 60, 75, 66, 72, 58, 50, 88 Calcule la varianza y la desviación estándar. Respuesta: Promedio = (45 + 56 + … + 88)/17 = 63,17 Varianza = ((45 – 63,17)2 + (56 – 63,17)2 + … + (88 – 63,17)2) / (17 – 1) = 209,40 Desviación estándar = raiz(209,40) = 14,47 www.auladeeconomia.com
  • 76. Variabilidad relativa Considere los dos siguientes conjuntos: ¿En cuál de los dos conjuntos se presenta mayor variabilidad? Observe que una hormiga puede ser hasta más de 4 veces más larga que otra, pero una persona no es 4 veces ¿Por qué en el conjunto de menor variabilidad se obtuvo un que otra. más alta valor mayor? Para milímetros devalores mayores, poren centímetros de presidentes: Es7porque son 5 hormigas: Estatura Longitud ensaberlo, calcule la desviación estándar en cada caso. tanto la desviación 165 9 2 6 185 180 163 165 estándar de un valor más alto. Para compararmm necesita una medida de variacióncm Media = 5,8 se Media = 171,6 relativa, Desviación estándar = 2,59 mm Desviación estándar = 10,14 cm como el coeficiente de variación. www.auladeeconomia.com
  • 77. Variabilidad relativa Permiten comparar grupos de series La medida de variabilidad relativa distintas en cuanto a su variación. más usada es el coeficiente de variación. Son independientes de las unidades en que se midan las variables. Se designa con las letras CV. Generalmente se expresan en Consiste en el cociente de la porcentajes, facilitando así el estudio desviación estándar entre la media: con medidas procedentes de otras series de valores. CV = Desviación estándar / Media www.auladeeconomia.com
  • 78. Variabilidad relativa Considere los dos siguientes conjuntos: Longitud en milímetros de hormigas: Estatura en centímetros de presidentes: 9 7 2 5 6 185 180 163 165 165 Media = 5,8 mm Media = 171,6 cm Desviación estándar = 2,59 mm Desviación estándar = 10,14 cm CV = 44,7% CV = 5,9% www.auladeeconomia.com
  • 79. Ejercicio: Sean las siguientes muestras de datos: Muestra 1: 45, 56, 72, 81, 43, 62, 55, 90, 49 Muestra 2: 67, 52, 60, 70, 66, 72, 58, 50, 58 ¿Cuál posee mayor variabilidad relativa? Respuesta: Promedio muestra 1 = 61,44 Promedio muestra 2 = 61,44 Desviación estándar muestra 1 = 16,38 Desviación estándar muestra 2= 7,76 Coeficiente de variación muestra 1 = 26,7% Coeficiente de variación muestra 2 = 12,6% La muestra 1 tiene mayor variabilidad relativa. www.auladeeconomia.com
  • 80. Otras medidas de variabilidad Se puede calcular medidas de El rango intercuartílico es la variabilidad relacionadas con la diferencia entre el tercer cuartil mediana. menos el primer cuartil: RIC = Q3 – Q1 Estas pueden ser: La desviación cuartil consiste en Rango intercuartílico dividir el rango intercuartil entre dos: Desviación cuartil Q = RIC / 2 www.auladeeconomia.com
  • 81. Ejercicio: Sea la siguiente muestra de datos: 45, 56, 72, 81, 43, 62, 55, 90, 49, 52, 60, 75, 66, 72, 58, 50, 88 Calcule el rango intercuartil y la desviación cuartil. Respuesta: Cuartil 1 = 51 Cuartil 3 = 73,5 Rango intercuartil = 73,5 – 51 = 22,5 El 50% de los datos se encuentran en un rango de 22,5 unidades alrededor de su mediana. Desviación cuartil = 22,5 / 2 = 11,25 La mediana tiene un rango de variación de 11,25 unidades. www.auladeeconomia.com
  • 82. Medidas de variabilidad Medidas de variabilidad absoluta: Medidas de variabilidad relativa: se expresan en unidades de medida, no se expresan en unidades de como metros, gramos, etc. medida, sino que por lo general se expresan como porcentajes. Pueden ser con respecto a la media: Rango o recorrido La principal es el coeficiente de Desviación estándar variación (CV). Varianza El CV se emplea para comparar También con respecto a la mediana: conjuntos de datos expresados en Rango intercuartil unidades distintas o de magnitud Desviación cuartil muy distinta. www.auladeeconomia.com
  • 83. Resumen medidas de variabilidad Rango o recorrido Con respecto Varianza a la media Desviación estándar Absolutas Se expresan en unidades (metros, Con respecto Rango intercuartílico gramos, etc.) a la mediana Desviación cuartil Medidas de variabilidad Relativas No se expresan Coeficiente de variación en unidades www.auladeeconomia.com
  • 84. Ejercicio: Dado el siguiente conjunto de datos sobre el tiempo (en minutos) que una muestra de personas seleccionadas al azar dura en completar una prueba: 55, 81, 92, 74, 58, 62, 84, 60, 90, 57, 82, 66, 90, 57, 74, 73, 67, 74, 88, 65, 68, 70, 98, 82 1. Calcule e interprete cada una de las siguientes medidas descriptivas: moda mediana media aritmética 1er cuartil 3er cuartil percentil 45 decil 3 quintil 3 desviación estándar varianza coeficiente de variación rango intercuartil desviación cuartil 2. ¿Qué se puede concluir sobre la simetría o asimetría de los datos? www.auladeeconomia.com
  • 85. Ejercicio - respuesta: Dado el siguiente conjunto de datos sobre el tiempo (en minutos) que una muestra de personas seleccionadas al azar dura en completar una prueba: 55, 57, 57, 58, 60, 62, 65, 66, 67, 68 , 70, 73, 74, 74, 74, 81 , 82 , 82, 84, 88, 90, 90, 92, 98 1. Calcule e interprete cada una de las siguientes medidas descriptivas: Moda = 74 El tiempo más frecuente en que estas personas completaron la prueba es de 74 minutos. www.auladeeconomia.com
  • 86. Ejercicio - solución: Dado el siguiente conjunto de datos sobre el tiempo (en minutos) que una muestra de personas seleccionadas al azar dura en completar una prueba: 55, 57, 57, 58, 60, 62, 65, 66, 67, 68 , 70, 73, 74, 74, 74, 81, 82, 82, 84, 88, 90, 90, 92, 98 1. Calcule e interprete cada una de las siguientes medidas descriptivas: Mediana = n = 24 Pmed = (n + 1) / 2 = (24 + 1) / 2 = 12,5 => Med = (73 + 74) / 2 = 73,5 La mitad de las personas terminaron la prueba en 73,5 minutos o menos, y la otra mitad la terminaron en más de 73,5 minutos. www.auladeeconomia.com
  • 87. Ejercicio - solución: Dado el siguiente conjunto de datos sobre el tiempo (en minutos) que una muestra de personas seleccionadas al azar dura en completar una prueba: 55, 57, 57, 58, 60, 62, 65, 66, 67, 68 , 70, 73, 74, 74, 74, 81, 82, 82, 84, 88, 90, 90, 92, 98 1. Calcule e interprete cada una de las siguientes medidas descriptivas: Media aritmética o promedio = Media = (55 + 57 + 57 + … + 98) / 24 = 73,63 El tiempo promedio de terminación de esta prueba es de 73,63 minutos. www.auladeeconomia.com
  • 88. Ejercicio - solución: Dado el siguiente conjunto de datos sobre el tiempo (en minutos) que una muestra de personas seleccionadas al azar dura en completar una prueba: 55, 57, 57, 58, 60, 62, 65, 66, 67, 68 , 70, 73, 74, 74, 74, 81, 82, 82, 84, 88, 90, 90, 92, 98 1. Calcule e interprete cada una de las siguientes medidas descriptivas: 1er cuartil = n = 24 Q1 = P25 => m = 25 P25 = m(n + 1) / 100 = 25(24 + 1) / 100 = 6,25 => P25 = 62 + 0,25 * 3 = 62,75 El 25% de las personas terminaron la prueba en 62,75 minutos o menos, y el 75% la terminaron en más de 62,75 minutos. www.auladeeconomia.com
  • 89. Ejercicio - solución: Dado el siguiente conjunto de datos sobre el tiempo (en minutos) que una muestra de personas seleccionadas al azar dura en completar una prueba: 55, 57, 57, 58, 60, 62, 65, 66, 67, 68 , 70, 73, 74, 74, 74, 81, 82, 82, 84, 88, 90, 90, 92, 98 1. Calcule e interprete cada una de las siguientes medidas descriptivas: 3er cuartil = n = 24 Q3 = P75 => m = 75 P75 = m(n + 1) / 100 = 75(24 + 1) / 100 = 18,75 => P75 = 82 + 0,75 * 2 = 83,5 El 75% de las personas terminaron la prueba en 83,5 minutos o menos, y el 25% la terminaron en más de 83,5 minutos. www.auladeeconomia.com
  • 90. Ejercicio - solución: Dado el siguiente conjunto de datos sobre el tiempo (en minutos) que una muestra de personas seleccionadas al azar dura en completar una prueba: 55, 57, 57, 58, 60, 62, 65, 66, 67, 68 , 70, 73, 74, 74, 74, 81, 82, 82, 84, 88, 90, 90, 92, 98 1. Calcule e interprete cada una de las siguientes medidas descriptivas: Percentil 45 = n = 24 P45 => m = 45 P45 = m(n + 1) / 100 = 45(24 + 1) / 100 = 11,25 => P45 = 70 + 0,25 * 3 = 70,75 El 45% de las personas terminaron la prueba en 70,75 minutos o menos, y el 55% la terminaron en más de 70,75 minutos. www.auladeeconomia.com
  • 91. Ejercicio - solución: Dado el siguiente conjunto de datos sobre el tiempo (en minutos) que una muestra de personas seleccionadas al azar dura en completar una prueba: 55, 57, 57, 58, 60, 62, 65, 66, 67, 68 , 70, 73, 74, 74, 74, 81, 82, 82, 84, 88, 90, 90, 92, 98 1. Calcule e interprete cada una de las siguientes medidas descriptivas: Decil 3 = n = 24 D3 = P30 => m = 30 P30 = m(n + 1) / 100 = 30(24 + 1) / 100 = 7,5 => P30 = 65 + 0,5 * 1 = 65,5 El 30% de las personas terminaron la prueba en 65,5 minutos o menos, y el 70% la terminaron en más de 65,5 minutos. www.auladeeconomia.com
  • 92. Ejercicio - solución: Dado el siguiente conjunto de datos sobre el tiempo (en minutos) que una muestra de personas seleccionadas al azar dura en completar una prueba: 55, 57, 57, 58, 60, 62, 65, 66, 67, 68 , 70, 73, 74, 74, 74, 81, 82, 82, 84, 88, 90, 90, 92, 98 1. Calcule e interprete cada una de las siguientes medidas descriptivas: Quintil 3 = n = 24 K3 = P60 => m = 60 P60 = m(n + 1) / 100 = 60(24 + 1) / 100 = 15 => P60 = 74 El 60% de las personas terminaron la prueba en 74 minutos o menos, y el 40% la terminaron en más de 74 minutos. www.auladeeconomia.com
  • 93. Ejercicio - solución: Dado el siguiente conjunto de datos sobre el tiempo (en minutos) que una muestra de personas seleccionadas al azar dura en completar una prueba: 55, 57, 57, 58, 60, 62, 65, 66, 67, 68 , 70, 73, 74, 74, 74, 81, 82, 82, 84, 88, 90, 90, 92, 98 1. Calcule e interprete cada una de las siguientes medidas descriptivas: Desviación estándar = s = raiz((55 – 73,63)2 + (57 – 73,63)2 + … + (98 – 73,63)2) / (24 – 1))= s = 12,62 Los tiempos en que las personas terminaron la prueba tienen una variabilidad de 12,62 minutos con respecto a su media. www.auladeeconomia.com
  • 94. Ejercicio - solución: Dado el siguiente conjunto de datos sobre el tiempo (en minutos) que una muestra de personas seleccionadas al azar dura en completar una prueba: 55, 57, 57, 58, 60, 62, 65, 66, 67, 68 , 70, 73, 74, 74, 74, 81, 82, 82, 84, 88, 90, 90, 92, 98 1. Calcule e interprete cada una de las siguientes medidas descriptivas: Varianza = s2 = (desviación estándar) 2 = s2 = (12,62) 2 = 159,26 Los tiempos en que las personas terminaron la prueba tienen una variabilidad de 159,26 minutos2 con respecto a su media. www.auladeeconomia.com
  • 95. Ejercicio - solución: Dado el siguiente conjunto de datos sobre el tiempo (en minutos) que una muestra de personas seleccionadas al azar dura en completar una prueba: 55, 57, 57, 58, 60, 62, 65, 66, 67, 68 , 70, 73, 74, 74, 74, 81, 82, 82, 84, 88, 90, 90, 92, 98 1. Calcule e interprete cada una de las siguientes medidas descriptivas: Coeficiente de variación = CV = desviación estándar / promedio * 100 = CV = 12,62 / 73,63 * 100 = 17,14% Los tiempos en que las personas terminaron la prueba tienen una variabilidad relativa del 17,14% con respecto a su media. www.auladeeconomia.com
  • 96. Ejercicio - solución: Dado el siguiente conjunto de datos sobre el tiempo (en minutos) que una muestra de personas seleccionadas al azar dura en completar una prueba: 55, 57, 57, 58, 60, 62, 65, 66, 67, 68 , 70, 73, 74, 74, 74, 81, 82, 82, 84, 88, 90, 90, 92, 98 1. Calcule e interprete cada una de las siguientes medidas descriptivas: Rango intercuartil = RIC = Q3 – Q1 = RIC = 83,5 – 62,75 = 20,75 El 50% de los tiempos de terminación de la prueba se ubican en un rango de 20,75 minutos con respecto a su mediana. www.auladeeconomia.com
  • 97. Ejercicio - solución: Dado el siguiente conjunto de datos sobre el tiempo (en minutos) que una muestra de personas seleccionadas al azar dura en completar una prueba: 55, 57, 57, 58, 60, 62, 65, 66, 67, 68 , 70, 73, 74, 74, 74, 81, 82, 82, 84, 88, 90, 90, 92, 98 1. Calcule e interprete cada una de las siguientes medidas descriptivas: Desviación cuartil = Q = RIC / 2 = Q = 20,75 / 2 = 10,38 Los tiempos de terminación de la prueba se ubican en un rango de 10,38 minutos con respecto a su mediana. O bien, la mediana tiene una variabilidad de 10,38 minutos. www.auladeeconomia.com
  • 98. Ejercicio - solución: Dado el siguiente conjunto de datos sobre el tiempo (en minutos) que una muestra de personas seleccionadas al azar dura en completar una prueba: 55, 57, 57, 58, 60, 62, 65, 66, 67, 68 , 70, 73, 74, 74, 74, 81, 82, 82, 84, 88, 90, 90, 92, 98 2. ¿Qué se puede concluir sobre la simetría o asimetría de los datos? Moda = 74 Mediana = 73,5 Media = 73,63 La distribución de los tiempos de terminación de la prueba es casi simétrica (porque la media, la mediana y la moda son casi iguales). www.auladeeconomia.com
  • 99. Gráfica de caja Un diagrama de caja Suministra información sobre los es un gráfico, basado en cuartiles, valores mínimo y máximo, los mediante el cual se visualiza un cuartiles Q1, Q2 o mediana y Q3, la conjunto de datos. existencia de valores atípicos y la simetría de la distribución. Está compuesto por: Se puede construir horizontal un rectángulo o "caja“ o vertical. y dos brazos o "bigotes" www.auladeeconomia.com
  • 100. Gráfica de caja Suponga que sobre un conjunto de datos se conoce lo siguiente: Mín Q1 Med Q3 Máx 8 20 30 36 42 Primer cuartil: 20 Tercer cuartil: 36 Mediana: 30 Mínimo: 8 Máximo: 42 0 10 20 30 40 50 El diagrama de caja es el siguiente. www.auladeeconomia.com
  • 101. Ejercicio: Sea la siguiente muestra de datos: 45, 56, 60, 60, 43, 62, 55, 69, 49, 52, 60, 75, 66, 72, 58, 50, 88 Construya el diagrama de caja. Respuesta: Mínimo = 43 Cuartil 1 = 51 Mediana = 60 Cuartil 3 = 67,5 Máximo = 88 40 50 60 70 80 90 www.auladeeconomia.com
  • 102. Ejercicio: Sea la siguiente muestra de datos: 50, 70, 75, 68, 43, 62, 55, 69, 49, 52, 60, 75, 66, 72, 58, 50, 85 Construya el diagrama de caja. Respuesta: Mínimo = 43 Cuartil 1 = 51 Mediana = 62 Cuartil 3 = 71 Máximo = 85 40 50 60 70 80 90 www.auladeeconomia.com
  • 103. Ejercicio: Analice y compare las siguientes dos diagramas de dispersión. 40 50 60 70 80 90 Respuesta: En la caja superior se observa que los bigotes son iguales o casi iguales y la mediana está en la mitad de la caja, lo cual indica que la distribución de los datos es simétrica. En la segunda caja, el bigote derecho es más largo que el izquierdo y la mediana está hacia la izquierda de la caja, lo cual indica que la distribución de los datos es asimétrica positiva. La caja superior muestra un RIC menor que la segunda caja, lo cual es indicador de que en el primer conjunto de datos hay una menor dispersión que en el segundo. Lo mismo indica el rango de cada una (diferencia entre el máximo y el mínimo). www.auladeeconomia.com
  • 104. Aplicaciones de la desviación estándar www.auladeeconomia.com
  • 105. Suponga un proceso de llenado de botellas de agua de 250 ml. Se espera que todas las botellas queden a un mismo nivel. Pero, unas quedan muy vacías. Y otras quedan muy llenas. Sin embargo, la mayoría contienen cantidades cercanas a 250 ml. Suponga que se reúnen datos sobre las cantidades de agua por envase. Se ha logrado determinar que el promedio por botella es de 249 ml con una desviación estándar de 3 ml y se traza un histograma. www.auladeeconomia.com
  • 106. Frecuncia Histograma porcentual 35% 30% 25% 20% Media: 249 ml 15% Desv. Est.: 3 ml 10% 5% 0 242 244 246 248 250 252 254 256 X Observe que en este caso la distribución de los datos es simétrica. La mayoría de los datos se encuentran en un rango cercano al promedio. Ese rango se puede definir empleando la desviación estándar: Promedio – desviación estándar = 249 – 3 = 246 Promedio + desviación estándar = 249 + 3 = 252 En una distribución simétrica el porcentaje de datos en ese rango se puede aproximar porcentajela regla datos se encuentran entre 246 y 252 ml? ¿Qué mediante de los empírica y es de 68,3%. O sea, que se espera que un 68,3% de las botellas tenga entre 246 y 252 ml. www.auladeeconomia.com
  • 107. Frecuncia Histograma porcentual 35% 30% 25% 20% Media: 249 ml 15% Desv. Est.: 3 ml 10% 5% 0 242 244 246 248 250 252 254 256 X Si se define un rango más amplio, va a contener más observaciones. Si el rango se define empleando dos veces la desviación estándar: Promedio – 2 x desviación estándar = 249 – 2 x 3 = 243 Promedio + 2 x desviación estándar = 249 + 2 x 3 = 255 En una distribución simétrica el porcentaje de datos en ese rango se puede aproximar porcentajela regla datos se encuentran entre 243 y 255 ml? ¿Qué mediante de los empírica y es de 95,4%. O sea, que se espera que un 95,4% de las botellas tenga entre 243 y 255 ml. www.auladeeconomia.com
  • 108. Frecuncia Histograma porcentual 35% 30% 25% 20% Media: 249 ml 15% Desv. Est.: 3 ml 10% 5% 0 242 244 246 248 250 252 254 256 X Si se define un rango aún más amplio, va a contener más observaciones. Si el rango se define empleando tres veces la desviación estándar: Promedio – 3 x desviación estándar = 249 – 3 x 3 = 240 Promedio + 3 x desviación estándar = 249 + 3 x 3 = 258 En una distribución simétrica el porcentaje de datos en ese rango se puede aproximar porcentajela regla datos se encuentran entre 240 y 258 ml? ¿Qué mediante de los empírica y es de 99,7%. O sea, que se espera que un 99,7% de las botellas tenga entre 240 y 258 ml. www.auladeeconomia.com
  • 109. Frecuncia Histograma porcentual 35% 30% 25% 20% Media: 249 ml 15% Desv. Est.: 3 ml 10% ¿Qué 5% pasaría si la distribución no fuera simétrica? 0 242 244 246 248 250 252 254 256 X Si la distribución no es simétrica, los porcentajes anteriores disminuyen un poco y ya no aplicaríamos la regla empírica, sino el teorema de Chebychev. El rango se puede definir empleando dos veces la desviación estándar: Promedio – 2 x desviación estándar = 249 – 2 x 3 = 243 Promedio + 2 x desviación estándar = 249 + 2 x 3 = 255 En una distribución asimétrica el porcentaje de datos en ese rango se puede aproximar mediante el teorema de Chebychev y es de aproximadamente 75%. O sea, que se espera que un 75% de las botellas tenga entre 243 y 255 ml. www.auladeeconomia.com
  • 110. Aplicaciones de la desviación estándar La probabilidad de que cualquier Cuando la distribución es simétrica, variable aleatoria tome un valor dentro se puede aplicar la distribución de la k desviaciones estándar (k > 1) normal, y las probabilidades que se con respecto a la media es al menos obtienen son: 1 – 1 / k2 Si k = 2, la probabilidad es 75%. Si k = 1, la probabilidad es 68,3% Si k = 3, la probabilidad es 89%. Si k = 2, la probabilidad es 95,4% Si k = 3, la probabilidad es 99,7% A este planteamiento se le llama Teorema de Chebychev Esto lo aplicaremos principalmente Esta regla se conoce como en distribuciones asimétricas. Regla empírica www.auladeeconomia.com
  • 111. Ejercicio: Sea la siguiente muestra de datos: 45, 56, 60, 60, 43, 62, 55, 69, 49, 52, 60, 75, 66, 72, 58, 50, 88 Calcule el rango de variación de estos datos. Respuesta: Media = 60, Mediana = 60, Moda = 60 El conjunto de datos es simétrico. Desviación estándar = 11,51 Rango de variación del 68% = 60 – 11,51 = 48,49 = 60 + 11,51 = 71,51 El 68,3% de los datos se encuentra en un rango entre 48,49 y 71,51. www.auladeeconomia.com
  • 112. Ejercicio: Sea la siguiente muestra de datos: 45, 56, 60, 60, 43, 62, 55, 69, 49, 52, 60, 75, 66, 72, 58, 50, 88 Calcule el rango en el que se encuentra el 95,4% de los datos. Respuesta: Media = 60, Mediana = 60, Moda = 60 El conjunto de datos es simétrico. Desviación estándar = 11,51 Rango de variación del 95% = 60 – 2 * 11,51 = 36,98 = 60 + 2 * 11,51 = 83,02 El 95,4% de los datos se encuentra en un rango entre 36,98 y 83,02. www.auladeeconomia.com
  • 113. Ejercicio: Sea la siguiente muestra de datos: 45, 56, 60, 60, 43, 62, 55, 69, 49, 52, 60, 75, 66, 72, 58, 50, 88 Calcule el rango en el que se encuentra el 99,7% de los datos. Respuesta: Media = 60, Mediana = 60, Moda = 60 El conjunto de datos es simétrico. Desviación estándar = 11,51 Rango de variación del 99,7% = 60 – 3 * 11,51 = 25,47 = 60 + 3 * 11,51 = 94,53 El 99,7% de los datos se encuentra en un rango entre 25,47 y 94,53. www.auladeeconomia.com
  • 114. Ejercicio: La distribución de las notas de un examen tuvieron promedio de 7,85 y desviación estándar 0,83. a. Si la distribución de las notas es aproximadamente normal, ¿qué proporción de los estudiantes tuvo notas entre 7,02 y 8,68? ¿qué proporción de los estudiantes tuvo notas mayores a 9,51? b. Si la distribución hubiera sido asimétrica, ¿qué proporción de los estudiantes tendría nota entre 6,19 y 9,51? www.auladeeconomia.com
  • 115. Ejercicio: La distribución de las notas de un examen tuvieron promedio de 7,85 y desviación estándar 0,83. a. Si la distribución de las notas es aproximadamente normal, ¿qué proporción de los estudiantes tuvo notas entre 7,02 y 8,68? Respuesta: Media = 7,85 Desviación estándar = 0,83 Intervalo: Media – Desviación estándar = 7,85 – 0,83 = 7,02 Media + Desviación estándar = 7,85 + 0,83 = 8,68 En el intervalo de 7,02 a 8,68 se encuentra el 68,3% de las notas de los estudiantes. www.auladeeconomia.com
  • 116. Ejercicio: La distribución de las notas de un examen tuvieron promedio de 7,85 y desviación estándar 0,83. a. Si la distribución de las notas es aproximadamente normal, ¿qué proporción de los estudiantes tuvo notas mayores a 9,51? Respuesta: Media = 7,85 Desviación estándar = 0,83 Intervalo: Media – 2 * Desviación estándar = 7,85 – 2 * 0,83 = 6,19 Media + 2 * Desviación estándar = 7,85 + 2 * 0,83 = 9,51 En el intervalo de 6,19 a 9,51 se encuentra el 95,4% de las notas de los estudiantes. Lo quiere decir que un 4,6% está fuera de ese intervalo, dado que la distribución es simétrica, un 2,3% tendrá nota mayor que 9,51. www.auladeeconomia.com
  • 117. Ejercicio: La distribución de las notas de un examen tuvieron promedio de 7,85 y desviación estándar 0,83. b. Si la distribución hubiera sido asimétrica, ¿qué proporción de los estudiantes tendría nota entre 6,19 y 9,51? Respuesta: Media = 7,85 Desviación estándar = 0,83 Intervalo: Media – 2 * Desviación estándar = 7,85 – 2 * 0,83 = 6,19 Media + 2 * Desviación estándar = 7,85 + 2 * 0,83 = 9,51 En el intervalo de 6,19 a 9,51 se encuentra el 75% de las notas de los estudiantes (según el teorema de Chebychev). www.auladeeconomia.com
  • 118. Raquel tiene 15 años y tiene una estatura de 1,59 metros. Las adolescentes de su edad tiene una talla media de 1,61 metros, con desviación estándar de 0,08 metros. Marco tiene 15 años y tiene una estatura de 1,61 metros. Los adolescentes de su edad tiene una talla media de 1,64 metros, con desviación estándar de 0,11 metros. ¿Cuál de los dos es relativamente más alto? Para comparar se necesita un parámetro estándar, ya que cada uno proviene de un conjunto con distinta media y diferente desviación estándar. En estos casos se emplean los puntajes estandarizados. www.auladeeconomia.com
  • 119. Aplicaciones de la desviación estándar A veces puede ser conveniente Estos puntajes estandarizados se transformar los datos para poder representan con la letra z efectuar comparaciones. y se pueden obtener con la fórmula: Si a un valor se le resta el promedio x del conjunto de datos al que z pertenece y luego se divide  entre la desviación estándar, se obtiene lo que llamaremos Los puntajes estandarizados no puntajes estandarizados tienen unidades de medida. www.auladeeconomia.com
  • 120. Raquel: X = 1,59 metros Media = 1,61 metros Desviación estándar = 0,08 metros Z = (1,59 – 1,61) / 0,08 = -0,25 Marco: X =1,61 metros Media = 1,64 metros Desviación estándar = 0,11 metros Z = (1,61 – 1,64) / 0,11 = -0,27 ¿Cuál de los dos es relativamente más alto? Dado que -0,25 es mayor que -0,27, entonces Raquel es relativamente más alta que Marco. www.auladeeconomia.com
  • 121. Ejercicio: La distribución de las notas del primer examen parcial de economía tuvo promedio de 7,33 y desviación estándar 1,37. El segundo examen parcial tuvo promedio de 7,00 con desviación estándar de 1,91. a. Compare la variabilidad absoluta y relativa de las notas de los dos exámenes. b. Si un estudiante obtuvo en el primer examen un 7,5 y en el segundo un 8,1, ¿en cuál de los dos exámenes su rendimiento relativo fue mayor? www.auladeeconomia.com
  • 122. Ejercicio: La distribución de las notas del primer examen parcial de economía tuvo promedio de 7,33 y desviación estándar 1,37. El segundo examen parcial tuvo promedio de 7,00 con desviación estándar de 1,91. a. Compare la variabilidad absoluta y relativa de las notas de los dos exámenes Respuesta: El segundo examen tiene mayor variabilidad absoluta, porque su desviación estándar es mayor. CV1 = 1,37 / 7,33 * 100 = 18,69% CV2 = 1,91 / 7,00 * 100 = 27,28% El segundo examen también presenta mayor variabilidad relativa, dado que el coeficiente de variación da más alto. www.auladeeconomia.com
  • 123. Ejercicio: La distribución de las notas del primer examen parcial de economía tuvo promedio de 7,33 y desviación estándar 1,37. El segundo examen parcial tuvo promedio de 7,00 con desviación estándar de 1,91. b. Si un estudiante obtuvo en el primer examen un 7,5 y en el segundo un 8,1, ¿en cuál de los dos exámenes su rendimiento relativo fue mayor? Respuesta: Hay que calcular los puntajes estandarizados: Examen 1: z1 = (7,5 – 7,33) / 1,37 = 0,12 Examen 2: z2 = (8,1 – 7,00) / 1,91 = 0,57 En términos relativos, la nota del segundo es mejor que la del primero. www.auladeeconomia.com
  • 126. Ejercicio: La media aritmética del siguiente conjunto de datos 7, 8, 20, 20, 13, 14, 12, 6, 9, 10, 6 es: ( a ) 20 ( b ) 10 ( c ) 13 ( d ) 11,36 Respuesta: La respuesta correcta es: ( d ) 11,36 www.auladeeconomia.com
  • 127. Ejercicio: La mediana del siguiente conjunto de datos 7, 8, 20, 20, 13, 14, 12, 6, 9, 10, 6 es: ( a ) 20 ( b ) 10 ( c ) 13 ( d ) 11,36 Respuesta: La respuesta correcta es: ( b ) 10 www.auladeeconomia.com
  • 128. Ejercicio: La moda del siguiente conjunto de datos 7, 8, 20, 20, 13, 14, 12, 6, 9, 10, 6 es: ( a ) 20 ( b ) 10 ( c ) 13 ( d ) 11,36 Respuesta: La respuesta correcta es: ( a ) 20 www.auladeeconomia.com
  • 129. Ejercicio: Dado el siguiente conjunto de datos sobre el número de turistas que se hospedan en un hotel por semana en una muestra de 22 semanas seleccionadas al azar: 25, 81, 92, 44, 58, 62, 34, 40, 90, 57, 42, 40, 57, 57, 57, 57, 62, 40, 65, 58, 50, 18 1. Calcule e interprete cada una de las siguientes medidas descriptivas: moda mediana media aritmética 1er cuartil 3er cuartil percentil 45 decil 3 quintil 3 desviación estándar varianza coeficiente de variación rango intercuartil desviación cuartil 2. ¿Qué se puede concluir sobre la simetría o asimetría de los datos? 3. ¿Qué % de los datos se encuentra en un rango de 2 veces la desviación estándar? 4. Construya el diagrama de caja e interprételo. www.auladeeconomia.com
  • 130. Ejercicio - solución: Media = 53,91 Moda = 57 Mediana = 57,00 Desv. Est. = 18,49 Varianza = 341,90 CoefVar = 34,30 Mínimo = 18,00 Máximo = 92,00 Rango = 74,00 Q1 = 40,00 Q3 = 62,00 IQR = 22,00 Percentil 45 = 57 Decil 3 = 41,8 Quintil 3 = 57 www.auladeeconomia.com
  • 131. Ejercicio: Según un estudio de una agencia de publicidad sobre el número de horas de televisión por semana que ven los jóvenes entre 12 y 18 años de una zona del país, poseen los siguientes datos (todos en horas por semana): Moda: 13 Mediana: 14,34 Media: 16,67 Cuartil 1: 11,04 Cuartil 3: 18,92 Decil 2: 10,87 Percentil 95: 25,88 Desviación estándar: 4,5 Mínimo: 6 Con base en los datos anteriores: 1. Interprete cada una de las medidas anteriores. 2. Calcule e interprete el coeficiente de variación. 3. ¿Cuáles de las siguientes afirmaciones son falsas y cuáles verdaderas? • “Yo veo muy poca TV, pues por semana estoy frente al televisor solo 20 horas” • “Yo creo que la mayoría de los muchachos ven menos TV que mi hijo. Es increíble que gaste 11 horas semanales frente al televisor” • “El 95% de los jóvenes miran entre 7,67 y 23,67 horas de TV por mes” • “La distribución del número de horas de televisión por semana que ven los jóvenes entre 12 y 18 años de una zona del país es asimétrica negativa” www.auladeeconomia.com
  • 132. Moda = 13 Mediana = 14,34 Media = 16,67 Ejercicio - solución: La cantidad de horas por La mitad de los jóvenes En promedio los jóvenes semana más frecuente de esa zona ven 14,34 de esa zona del país ven que los jóvenes de esa horas semanales de TV o 16,67 horas semanales zona ven TV es de 13 menos, y otra mitad ve de TV. horas. 14,34 horas de TV semanales o más. Decil 2 = 10,87 Cuartil 1 = 11,04 Un 20% de los jóvenes de Una cuarta parte (25%) Cuartil 3 = 18,92 la zona ven menos de de los jóvenes de esa Tres cuartas partes (o el 10,87 horas semanales zona ven menos de 11,04 75%) de los jóvenes de de TV, y el restante 80% horas semanales de TV. Y esa zona ven menos de ve más de 10,87 horas el restante 75% ve más 18,92 horas semanales semanales de TV. de 11,04 horas de TV. Y el restante 25% semanales de TV. ve más de 18,92 horas Mínimo = 6 semanales de TV. La cantidad más baja de Percentil 95 = 25,88 horas semanales de TV Un 95% de los jóvenes de Desv. estándar = 4,5 que ven los jóvenes de la la zona ven menos de La cantidad de horas zona es de 6 horas 25,88 horas semanales semanales de TV que ven semanales. Ninguno ve de TV, y el restante 5% ve los jóvenes de la zona menos de 6 horas más de 25,88 horas varía en promedio 4,5 semanales. semanales de TV. horas con respecto a su media.www.auladeeconomia.com
  • 133. Ejercicio: 2. Calcule e interprete el coeficiente de variación. CV = 4,5 / 16,67 * 100 = 26,99% La cantidad de horas de TV que ven los jóvenes de la zona tiene una variabilidad relativa de 26,99%. www.auladeeconomia.com
  • 134. Ejercicio: 3. ¿Cuáles de las siguientes afirmaciones son falsas y cuáles verdaderas? • “Yo veo muy poca TV, pues por semana estoy frente al televisor solo 20 horas”. • FALSO. La cantidad de 20 horas está por arriba del promedio e incluso por arriba del tercer cuartil, lo cual quiere decir que ve más TV que el 75% de los jóvenes. • “Yo creo que la mayoría de los muchachos ven menos TV que mi hijo. Es increíble que gaste 11 horas semanales frente al televisor” • FALSO. La cantidad de 11 horas está por debajo del primer cuartil, lo cual quiere decir que este joven está en el 25% que ve menos TV. • “El 95% de los jóvenes miran entre 7,67 y 23,67 horas de TV por mes” • FALSO. Se calculan los intervalos del 95,4% (media – 2 * desviación estándar = 16,67 – 2 * 4,5 = 7,67 y media + 2 * desviación estándar = 16,67 + 2 * 4,5 = 25,67) y los intervalos no coinciden, además la distribución no es simétrica. • “La distribución del número de horas de televisión por semana que ven los jóvenes entre 12 y 18 de una zona del país es asimétrica negativa” • FALSO. La relación entre media > mediana > moda, indica que la asimetría es positiva. www.auladeeconomia.com
  • 135. Ejercicio: Suponga que se realizó un estudio en el que se comparó la efectividad de dos métodos de enseñanza A y B en una escuela rural. Luego de aplicar exámenes a los estudiantes se obtuvieron los siguientes resultados: Método de enseñanza A B Media aritmética 74.5 74.9 Desviación estándar 11.3 24.6 Mediana 72 68 Moda 71 65 Determine la validez de las siguientes afirmaciones (justifique su respuesta): • Los resultados de ambos métodos son prácticamente iguales. • Con el método B casi todos los estudiantes obtuvieron la misma nota. • La distribución de las notas del método B presenta una asimetría hacia la izquierda. • El método A presenta una dispersión de las notas mayor que el método B. www.auladeeconomia.com
  • 136. Ejercicio: El Hospital “La Cruz” dedicado a la atención exclusiva de problemas mentales, realizó un estudio en enero pasado, y para ello elaboraron un cuestionario que incluía las siguientes preguntas (que fueron respondidas por los familiares encargados de los pacientes al momento de la entrevista del egreso: 1. Sexo: [1] Masculino [2] Femenino 2. Tiempo semanal que dedica a ver televisión:_____________ 3. Rendimiento en el examen de aptitud mental: [1]Muy malo [2]Malo [3]Regular [4]Bueno [5]Muy bueno 4. ¿Al menos uno de los padres de familia o encargado supervisa la cantidad de tiempo dedicada a ver televisión? [0] No [1] Sí 5. Con cuántos familiares convive él /la paciente en el hogar? ___ La siguiente base de datos se obtiene luego de la información recogida y corresponde a la totalidad de los pacientes que permanecen en el hospital. www.auladeeconomia.com
  • 137. Sexo Tiempo que Rendimiento en la Peso del paciente en Número de familiares ve T.V. prueba de aptitud kilos. 1 5.5 1 55 2 2 0.6 2 63 0 2 1.2 1 49 1 2 1.5 5 58 4 2 8.0 2 65 0 1 6.4 1 70 2 1 2.3 4 71 1 1 3.5 2 48 0 2 4.8 5 47 2 2 5.2 1 70 1 2 6.7 2 71 0 1 4.5 3 69 2 1 7.3 2 68 5 2 4.2 3 55 0 1 3.2 2 55 2 2 5.2 1 47 0 1 6.3 4 47 3 2 8.5 2 69 0 1 8.8 3 www.auladeeconomia.com 69 3
  • 138. Ejercicio: • Calcule la media, la mediana y la moda para la variable peso. Interprete las medidas. • Determine e interprete las medidas de tendencia o posición central para la variable tiempo que ven televisión los pacientes. ¿Qué forma tiene la distribución de las edades? • Considera usted que la distribución de los datos presenta algún tipo de valores extremos? Si es así, de qué tipo son? • ¿Cuál es el peso que deja por encima de el al 45 % de los vecinos? • Determine la variabilidad asociada a la mediana en cuanto al tiempo que ven televisión los pacientes. Interprete el promedio y la variabilidad. • ¿Cuál de las dos variables, peso o número de familiares es menos variable? ¿Por qué? • Determine e interprete el valor del quintil tres de los pesos. • Calcule el tiempo que ven televisión los pacientes y que deja por debajo de él, al 40 % de los pacientes. • Explique qué significa la variabilidad absoluta de un conjunto de observaciones. www.auladeeconomia.com
  • 139. Ejercicio 1 • Una gran empresa de equipos deportivos está probando el efecto de uno de sus planes publicitarios sobre las ventas de su producto principal en los últimos 6 meses. Considerando las ventas que se resumen en la siguiente tabla: Mes Enero Febrero Marzo Abril Mayo Junio Ventas 400 500 600 600 750 850 1. ¿Cuál es el promedio mensual de ventas? 2. ¿Son simétricos los datos o presentan algún tipo de asimetría (positiva o negativa)? 3. ¿Cuál es el nivel de ventas máximo que representa el 75% de las ventas mensuales más bajas? 4. Prepare la caja de dispersión asociada con las ventas de esta empresa.
  • 140. Pregunta 1. ¿Cuál es el promedio mensual de ventas? Solución: Promedio = Suma de datos / número de datos Ventas promedio = (400 + 500 + 600 + 600 + 750 + 850) / 6 = 616.67
  • 141. Pregunta 2. ¿Son simétricos los datos o presentan algún tipo de asimetría (positiva o negativa)? Solución: Promedio = 616.67 Mediana = 600 Moda = 600 Dado que el promedio es un poco mayor que la mediana y que la moda, indica una ligera asimetría positiva.
  • 142. Pregunta 3. ¿Cuál es el nivel de ventas máximo que representa el 75% de las ventas mensuales más bajas? Solución: Se debe calcular el percentil 75: P75 = 75/100 * (6 + 1) = 5.25 El percentil es el dato en la posición 5.25: P75 = 750 + 0.25 * (850 – 750) = 775
  • 143. Pregunta 4. Prepare la caja de dispersión asociada con las ventas de esta empresa Solución: Se debe calcular Q1, Med y Q3: Q1 = P25 = 25/100 * (6 + 1) = 1.75  Q1 = 475 Q3 = P75 = 75/100 * (6 + 1) = 5.25  Q3 = 775 Med = 600
  • 144. Ejercicio 2 • Los estadísticos del programa Meals in Wheels (Comida sobre ruedas), el cual lleva comidas calientes a enfermos confinados en casa, desean evaluar sus servicios. • El número de comidas diarias que entregaron en la última semana fue: 30 45 60 50 50 75 Con base en la información suministrada, determine: 1. ¿Cuál es la cantidad promedio de comidas que se entregan por día? 2. Establezca el rango en que se espera que varíe el número promedio de entregas diarias. 3. Calcule e interprete los cuartiles 1 y 3. 4. Establezca el rango en que se espera que varíe la mediana del número de entregas promedio diarias.
  • 145. Pregunta 1. ¿Cuál es la cantidad promedio de comidas que se entregan por día? Solución: Promedio = Suma de datos / número de datos Entregas promedio = (30 + 45 + 60 + 50 + 50 + 75) / 6 = 51.67
  • 146. Pregunta 2. Establezca el rango en que se espera que varíe el número promedio de entregas diarias Solución: Rango de variación para la media = Media ± Desviación estándar Promedio = 51.67 Varianza = (30 – 51.67)2 + (45 – 51.67)2 + … + (75 – 51.67)2 = 226.67 Desv. est. = raiz(226.67) = 15.06 Rango de variación para la media = 51.67 – 15.06 = 36.61 51.67 + 15.06 = 66.73
  • 147. Pregunta 3. Calcule e interprete los cuartiles 1 y 3 Solución: Ordenar datos: 30, 45, 50, 50, 60, 75 Q1 = P25 = 25/100 * (6 + 1) = 1.75  Q1 = 30 + 0.75 * (45 – 30) = 41.25 El 25% de los días se reparten 41.25 comidas o menos. Q3 = P75 = 75/100 * (6 + 1) = 5.25  Q3 = 60 + 0.25 * (75 – 60) = 63.75 El 75% de los días se reparten 63.75 comidas o menos.
  • 148. Pregunta 4. Establezca el rango en que se espera que varíe la mediana del número de entregas promedio diarias Solución: Se conoce que: Med = 50 Q1 = 41.25 Q3 = 63.75 Entonces: Rango intercuartil = 63.75 – 41.25 = 22.5 Desviación cuartil = (63.75 – 41.25) / 2 = 11.25 Se espera que la mediana varíe en el rango: 50 – 11.25 = 38.75 50 + 11.25 = 61.25
  • 149. Pregunta 3 En una muestra seleccionada al azar de 8 estudiantes del curso de estadística, el grupo 1 de la mañana y el grupo 2 de la noche, se obtuvieron las siguientes edades: Grupo 1 18 20 21 23 24 21 21 17 Grupo 2 20 25 25 30 30 30 40 35 1. Con la información suministrada determine e interprete para cada grupo: – Edad promedio – Edad que representa la mediana – ¿En cuánto se espera que varíe la edad promedio de los estudiantes? 2. Si un estudiante del grupo 1 tiene 22 años y un estudiante del grupo 2 tiene 28 años, ¿cuál de los dos estudiantes tiene una edad relativa mayor? 3. Para el grupo que presenta mayor variación determine cada uno de los rangos en que se espera que varíen los pesos de los estudiantes según Gauss.
  • 150. Pregunta 1. Con la información suministrada determine e interprete para cada grupo edad promedio, edad mediana y rango en que varíe la edad promedio Solución: Grupo 1 Grupo 2 Promedio 20.63 29.38 Mediana 21.00 30.00 Desviación estándar 2.33 6.23 Interpretación: La edad promedio de los estudiantes del grupo 1 es de 20.63 años y de 29.38 años en el grupo 2. La mitad de los estudiantes del grupo 1 tiene 21 años o menos, mientras que la mitad de los estudiantes del grupo 2 tiene 30 años o más. Las edades del grupo 1 se espera que varíen en 2.33 años alrededor de su promedio, mientras que en el grupo 2 se espera que varíen en 6.23 años alrededor de su promedio.
  • 151. Pregunta 2. Si un estudiante del grupo 1 tiene 22 años y un estudiante del grupo 2 tiene 28 años, ¿cuál de los dos estudiantes tiene una edad relativa mayor? Solución: Hay que calcular los puntajes estandarizados z: Estudiante grupo 1: z = (22 – 20.63) / 2.33 = 0.59 Estudiante grupo 2: z = (28 – 29.38) / 6.23 = -0.22 El estudiante del grupo 1 es relativamente mayor.
  • 152. Pregunta 3. Para el grupo que presenta mayor variación determine cada uno de los rangos en que se espera que varíen los pesos de los estudiantes según Gauss Solución: Rango  – ,  +  (incluye el 68.3% de los datos): 20.63 – 2.33 = 18.30 20.63 + 2.33 = 22.95 Rango  – 2,  + 2 (incluye el 95.4% de los datos): 20.63 – 2 * 2.33 = 15.97 20.63 + 2 * 2.33 = 25.28 Rango  – 3,  + 3 (incluye el 99.7% de los datos): 20.63 – 3 * 2.33 = 13.65 20.63 + 3 * 2.33 = 27.60