SlideShare una empresa de Scribd logo
1 de 38
ESTADÍSTICA MATEMÁTICA




                   Juan Carlos Ballabriga
           Departamento de Matemáticas
                 IES Benjamín de Tudela
Estadística para qué

  • Un sondeo de opinión
  • El control de calidad de un artículo
  • Un estudio para conocer la efectividad de un
    medicamento
  • Calcular la composición futura de una
    población…

                               .... esto es estadística
Tipos de Estadística

• La Estadística descriptiva:
   – Trata del recuento, ordenación y clasificación de los
      datos obtenidos de las observaciones:
      • Construcción de tablas, gráficos y cálculo de parámetros.
• La Estadística inferencial:
   – Utiliza los resultados de la estadística descriptiva y se
      apoya en el cálculo de probabilidades para la obtención
      de conclusiones sobre una población a partir de los
      resultados obtenidos de una muestra.
Centralización
                            Parámetros
                                           Dispersión
              Estadística
              descriptiva   Gráficos

Estadística



              Inferencia
              estadística          Investigación
Nociones básicas
Población: Conjunto de elementos que se quiere estudiar.
        • Votantes de una ciudad, comunidad, país
        • Televisores fabricados en una fábrica.
        •Alumnos de primero de bachillerato…

Muestra: Cualquier subconjunto de una población. El número de
elementos de una muestra se llama tamaño.
Población                    No representativa




               muestra


                                 Con sesgo




            Representativa       Sin sesgo
Tipos de muestreo
  Probabilístico: sabemos la probabilidad de que un
   individuo sea elegido en la muestra

     Muestreo aleatorio simple (m.a.s.): Todos tienen las mismas
      posibilidades de ser elegidos
     Muestreo aleatorio estratificado: Se divide la población en
      estratos y se hace un m.a.s. en cada uno
     Muestreo sistemático: Se selecciona el primer individuo al azar
      y los siguientes estableciendo una pauta


  Muestreo no probabilístico: no se sabe la probabilidad
   de que un individuo sea elegido
Variable estadística: Cada uno de los rasgos o características que
se quiere estudiar de los elementos de la población, susceptible o no
de medida.

      Ejemplos:

        • Color del pelo: negro, castaño, rubio o pelirrojo

        • Sexo: hombre o mujer

        • Miembros asalariados de una familia: 0, 1 , 2 , 3 ,4 , 5

        • Alturas de alumnos:178, 169, 172, 183, …

        •Nº de suspensos en determinada asignatura: 0, 1, 2, 3,…

        •Gastos en vacaciones de una familia: 1000€,1500€,..
Variables cualitativas y cuantitativas
 Población: Alumnos de bachillerato de una localidad determinada
                           •Sexo
         Cualitativas     •Modelo de zapatillas deportivas
                          •Barrio de la localidad en que vive
          (modalidad)     •Deporte preferido
         
                                            •Número de hermanos
                                            •Núm.de suspensos en la 1ª evaluación
Variables                 Discretas        •Núm de libros leídos trimestralmente
                          (Recuentos)      •Num. de llamadas telefónicas diarias
         Cuantitativas   
                          
                         
          (números)                         •Tiempo diario delante del televisor
         
                                            •Tiempo de estudio
                          Continuas
                                             •Altura
                            (Cualquier        •Peso
                            cantidad en       •Tiempo empleado en llamadas
                            un intervalo)
Frecuencias
 Frecuencia absoluta: Nº de veces que aparece un
 determinado valor de la variable                 fi
 Si sumamos todas las frecuencias obtenemos el º de datos
                       N  f1  f 2  f 3    f r
 Frecuencia relativa:                     fi
                                    ni 
                                           N
 Frecuencia absoluta acumulada: Acumula las
  frecuencias absolutas hasta determinado valor de la
  variable,        Fi
 Frecuencia relativa acumulada: Acumula las
  frecuencias relativas hasta determinado valor de la
  variable         Ni
Tabla de frecuencias
    Población : Alumnos de
    Bachillerato
    Variable: Preferencias musicales            Tipo: Cualitativa
    Tamaño de la muestra 120

                     fi         Fi            ni             Ni
    Clásica                 1          1   0,00833333    0,00833333
    Rock                   36         37           0,3   0,30833333
    Pop                    49         86   0,40833333    0,71666667
    Jazz                    4         90   0,03333333           0,75
    Flamenco                2         92   0,01666667    0,76666667
    Techno                 28        120   0,23333333              1
               N          120
Variables cualitativas: Representación gráfica

 50
 45                                                                  1
 40
 35                                                                           Clásica
 30                                                     2      28        36   Rock
 25                                                                           Pop
 20                                                     4                     Jazz
 15                                                                           Flamenco
 10                                                                 49        Techno
  5
 0
      Clásica   Rock   Pop   Jazz   Flamenco   Techno




           Diagrama de Barras                               Diagrama de Sectores
Variable discreta
  Ejemplo: Un profesor tiene anotadas en su cuaderno las
  notas de 30 alumnos de un clase:

         5      3      4       1      2      8      9
         8      7      6       6      7      9      8
         7      7      1       0      1      5      9
         9      8      0       8      8      8      9
         5      7

  Lo primero que tenemos que hacer es contar los datos
Tabla de frecuencias

        Notas   Frec. Abs.   Frec. Abs.   Frec. Relat.   Frec. Relat.
                             Acumuladas                  Acumuladas
         xi         fi           Fi           ni             Ni
          0         2            2            0,07           0,07
          1         3            5            0,10           0,17
          2         1            6            0,03           0,20
          3         1            7            0,03           0,23
          4         1            8            0,03           0,27
          5         3            11           0,10           0,37
          6         2            13           0,07           0,43
          7         5            18           0,17           0,60
          8         7            25           0,23           0,83
          9         5            30           0,17           1,00
        Suma       30                          1
Algunos diagramas
   8

   7

   6

   5

   4

   3

   2

   1

   0
       1   2   3   4   5   6   7   8   9   10



            Frecuencias absolutas
  Diagrama de barras y polígono de frecuencias
Con frecuencias acumuladas
    35

    30

    25

    20

    15

    10

     5

    0
         1   2   3   4   5   6   7   8   9   10



         Frecuencias absolutas acumuladas
    Diagrama de barras y polígono de frecuencias
Cuidado al interpretar datos
    120

    100

    80

    60

     40

     20

     0
          E   F   M   A   My   J   Jl   A   S   O   N   D



          Evolución de las ventas de coches en un
                determinado concesionario
…la cruda realidad
     16
     14
     12
     10
     8
     6
     4
     2
     0
          E   F   M   A   My   J   Jl   A   S   O   N   D
Parámetros estadísticos
 Centralización:
    Media aritmética: La suma de todos los valores dividido por el
     número de datos
                                 X
    Moda: Valor que más se repite. Si hay más de una, se llama
     bimodal, trimodal,…
                                Mo
    Mediana: La mediana de una colección de datos ordenados de
     menor a mayor es el valor que está en medio, es decir que la mitad
     de los datos son mayores que él y la otra mitad son menores que
     él, si hay un número impar de datos; si el número de datos es par, la
     mediana es la media aritmética entre los dos valores centrales.

                                 Me
Cálculo de parámetros
 La media aritmética cuando tenemos la tabla de frecuencias
 se calcula así
  x  x  x3    xN x1  f1  x2  f 2    xr  f r
X 1 2                                                 
                                                            x  f
                                                               i       i

          N                   f1  f 2    xr             f     i

                       xi      fi    x i* f i    Fi
                        0      2             0         2
                        1      3             3         5
                        2      1             2         6
                        3      1             3         7
                        4      1             4         8
                        5      3            15        11
                        6      2            12        13
                        7      5            35        18
                        8      7            56        25
                        9      5            45        30
                              30           175

                      Media   5,83
La moda y mediana
La moda por simple observación: Mo = 8
xi    fi    x i* f i    Fi
0     2             0         2
1
2
      3
      1
                    3
                    2
                              5
                              6
                                     La mediana: Es el valor que
3     1             3         7
4     1             4         8   ocupa el sitio “central”. Se puede
5     3            15        11
6     2            12        13   plantear de la siguiente manera
7     5            35        18
8     7            56        25
9     5            45        30     Si N impar Me  x N 1
      30          175
                                   
                                                       2
                                                xN  xN
                                                           1
                                   Si N par Me  2      2
                                   
                                                    2
                       N
     N  30 como es par   15 buscamoslos valores que ocupen
                       2
                   N        N
     las posiciones  15 y     16, es decir Me  7
                   2        2
Dispersión
 Rango: Diferencia entre el mayor y el menor valor de la
 variable
                  Rango: V max V min

 Desviación Media D.M.                   D.M . 
                                                  x X  f
                                                    i         i

                                                   f
                              x  X 
                                         2              i
                                              fi
 Varianza:           2
                                i

                                 f  i


 Desviación típica:       
Dispersión
 Coeficiente de variación:                     
                                        C.V . 
    Sin unidades                               X
    No depende de la variable
    Permite comparar poblaciones y variables distintas


Ejemplo 1                           Ejemplo 2
                                                                    Desv.        Coeficiente
                                                        Media       Típica        variación
              Clase A Clase B
                                    Variable Notas              7            2     0,28571429
 Nota media       7,4         6,5
 Desv. Típica     2,8         2,5   Variable Ingresos     1500         145        0,09666667
Cálculo de parámetros
                   Variable:        Notas asignatura
                    Tipo:           Discreta
                  Población:        Alumnos Bachillerato



                                    TABLA PARA UNA VARIABLE ESTADÍSTICA DISCRETA


   Datos (xi)    Frecuencias (fi)     Fr. Relativas (hi)   xi*fi       xi-X    (xi-X)2       (xi-X)2 * fi   Fr. Acumuladas
       0                2                0,0667              0        -5,83   33,9889       67,9778               2
       1                3                  0,1               3        -4,83   23,3289       69,9867               5
       2                1                0,0333              2        -3,83   14,6689       14,6689               6
       3                1                0,0333              3        -2,83    8,0089        8,0089               7
       4                1                0,0333              4        -1,83    3,3489        3,3489               8
       5                3                  0,1              15        -0,83    0,6889        2,0667              11
       6                2                0,0667             12         0,17    0,0289        0,0578              13
       7                5                0,1667             35         1,17    1,3689        6,8445              18
       8                7                0,2333             56         2,17    4,7089       32,9623              25
       9                5                0,1667             45         3,17   10,0489       50,2445              30
                       30                   1              175                              256,167

                 MEDIA (X)            5,83
                 MODA (Mo)            8
                MEDIANA (Me)          7

                 VARIANZA       8,5389
                    DESVIACIÓN TÍPICA                              2,9221
                 COEFICIENTE DE VARIACIÓN                          0,5012                50,12%
                          RANGO                                       9
Los gráficos
         DIAGRAMA DE BARRAS Y
        POLÍGONO DE FRECUENCIAS                                DIAGRAMA Y POLÍGONO DE FRECUENCIAS
8                                                                          ACUMULADO
                                                      35
7
                                                      30
6
                                                      25
5
                                                      20
4
                                                      15
3
                                                      10
2
                                                       5
1
                                                       0
0                                                          0     1    2   3      4       5         6   7   8   9
    0    1   2     3    4     5    6      7   8   9
                                                                          Valores de la variable
                 Valores de la variable
Variable continua: Agrupación de datos
 Si la variable es continua, o discreta con un número de datos muy grande, es aconsejable
  agrupar los datos en CLASES.
 ¿Cuál es el número idóneo de clases?
       El número clases debe ser aproximadamente igual a la raíz cuadrada positiva del número de
        datos.
 ¿Cómo escoger las clases?
       Es aconsejable que los límites de clase (tanto el superior como el inferior) sean números
        “redondos”, como múltiplos de 5, 10, …
       Se debe procurar que todas las clases tengan la misma amplitud o tamaño.
       Los intervalos se deben construir de modo que el límite superior de una clase coincida con el
        límite inferior de la siguiente.
       Adoptaremos el criterio de que los intervalos sean cerrados por la izquierda y abiertos por la
        derecha.
Variable continua
 Ejemplo
Se ha aplicado un test sobre satisfacción en el trabajo a 88 empleados de una
fábrica, obteniéndose las resultados:


                 Puntuaciones     Núm. de trabajadores

                   [38-44)                 7
                   [44-50)                 8
                   [50-56)                15
                   [56-62)                25
                   [62-68)                18
                   [68-74)                 9
                   [74-80)                 6
Variable: Satisfacción empleados
                        Tipo:    Continua
                      Población: Empleados de una fábrica



                          TABLA PARA UNA VARIABLE ESTADÍSTICA CONTINUA

     Intervalo        Marca (xi) Frecuencias (fi) Fr. Relativas (hi)    xi*fi     xi-X    (xi-X)2   (xi-X)2 * fi   Fr. Acumuladas
38               44      41             7              0,0795           287     -18,14    329,06    2303,4172              7
44               50      47             8              0,0909           376     -12,14    147,38    1179,0368             15
50               56      53            15              0,1705           795      -6,14   37,6996      565,494             30
56               62      59            25              0,2841          1475      -0,14    0,0196        0,49              55
62               68      65            18              0,2045          1170       5,86   34,3396     618,1128             73
68               74      71             9              0,1023           639      11,86    140,66    1265,9364             82
74               80      77             6              0,0682           462      17,86    318,98    1913,8776             88
                                                                                                                          88
                                                                                                                          88
                                                                                                                          88
                                        88                 1           5204                         7846,3648

               MEDIA (X)                        59,14
           INTERVALO MODAL                     [56,62)                  MODA (Mo)                             59
         INTERVALO MEDIANA                     [56,62)                 MEDIANA (Me)                           59

                                   VARIANZA        89,1632
                                      DESVIACIÓN TÍPICA                     9,4426
                                   COEFICIENTE DE VARIACIÓN                 0,1597             15,97%
                                            RANGO                             42
 Gráficos: Histograma
                             HISTOGRAMA Y POLÍGONO DE FRECUENCIAS

    30


    25


    20


    15


    10


     5


     0
         [38,44)   [44,50)     [50,56)   [56,62)      [62,68)   [68,74)     [74,80)
                                                   Valores de la variable
HISTOGRAMA Y POLÍGONO DE FRECUENCIAS ACUMULADO

100

 90

 80

 70

 60

 50

 40

 30

 20

 10

 0

      [38,44) [44,50) [50,56) [56,62) [62,68) [68,74) [74,80)
                                    Valores de la variable
Parámetros en variable continua
 Cuando estamos trabajando con variable continua algunas de las fórmulas
  utilizadas se deben “ajustar” para que sean más fiables
                                               f i  f i 1
                    Mo  Li 1                                        ai
 Moda                              f i  f i 1    f i  f i 1 
                                 N
                                    Fi 1
 Mediana           Me  Li 1  2         ai
                                    fi

                                rN
                                      Fi 1
 Percentiles      Pr  Li 1  100          ai
                                    fi
Del anterior test sobre satisfacción en el trabajo a 88 empleados de una fábrica,
cuyos resultados son:

                  Puntuaciones     Núm. de trabajadores

                    [38-44)                 7
                    [44-50)                 8
                    [50-56)                15
                    [56-62)                25
                    [62-68)                18
                    [68-74)                 9
                    [74-80)                 6


       Calcular:          a) El cuartil primero.
                          b) Los percentiles de orden 40 y 90
Q1 deja la cuarta parte de la distribución a su izquierda :N/4=22
 Clases           fi             Fi
 [38-44)           7             7
 [44-50)           8             15 <22
 [50-56)          15             30 >22         Clase del primer
 [56-62)          25             55             cuartil: [50-56)
 [62-68)          18             73
 [68-74)           9             82
 [74-80)           6             88
 Aplicando la fórmula:
 Li-1 = 50
 ai = 6                               22  15
 N/4 = 22
                    Q1      50  6           52.8
                                        15
 Fi-1 = 15
 fi = 15
P40 deja el 40% de los datos a su izquierda :88.40/100=35.2
  Clases            fi                Fi
  [38-44)           7                 7
  [44-50)           8                 15
  [50-56)           15                30 < 35.2
  [56-62)           25                55 > 35.2         Clase de P40:
  [62-68)           18                73                  [56-62)
  [68-74)           9                 82
  [74-80)           6                 88
   Aplicando la fórmula:
Li-1 = 56
ai = 6                                   35.2  30
40.N/100 = 35.2       P40      56  6             57.25
Fi-1 = 30                                   25
fi = 25
P90 deja el 90% de los datos a su izquierda :88.90/100=79.2
  Clases            fi                Fi               Clase de P90:
  [38-44)           7                 7                  [68-74)
  [44-50)           8                 15
                                                          9 6.2
  [50-56)           15                30                    
                                                          6   x
  [56-62)           25                55
  [62-68)           18                73 < 79.2                 9
  [68-74)           9                 82 > 79.2              6.2
  [74-80)           6                 88
                                                              x
   Aplicando la fórmula:
                                                68 6 74
Li-1 = 68
ai = 6
                                     79.2  73
90.N/100 = 79.2       P90  68  6             72.13
Fi-1 = 73                                9
fi = 9
Estadistica
Estadistica

Más contenido relacionado

Similar a Estadistica

Unidad 1 Estadistica Basica
Unidad 1 Estadistica BasicaUnidad 1 Estadistica Basica
Unidad 1 Estadistica Basicabrian paz
 
Unidad 1 Estadistica Basica
Unidad 1 Estadistica BasicaUnidad 1 Estadistica Basica
Unidad 1 Estadistica Basicabrian paz
 
Estadistica por Giselle Guilcaso
Estadistica por Giselle GuilcasoEstadistica por Giselle Guilcaso
Estadistica por Giselle GuilcasoGiselle_Guilcaso
 
Trabajo de Estadistica, grupo Hi.gu-e
Trabajo de Estadistica, grupo Hi.gu-eTrabajo de Estadistica, grupo Hi.gu-e
Trabajo de Estadistica, grupo Hi.gu-eJorge Guevara
 
Problemas de Frecuencia Absoluta Ccesa007.pdf
Problemas de Frecuencia Absoluta  Ccesa007.pdfProblemas de Frecuencia Absoluta  Ccesa007.pdf
Problemas de Frecuencia Absoluta Ccesa007.pdfDemetrio Ccesa Rayme
 
Estadística
EstadísticaEstadística
Estadísticajcremiro
 
Estadidtica descriptiva graficos
Estadidtica descriptiva graficos Estadidtica descriptiva graficos
Estadidtica descriptiva graficos Paula Diaz
 
métodos gréficos
métodos gréficosmétodos gréficos
métodos gréficosMarco Rojas
 
probabilidades parte 2
probabilidades parte 2probabilidades parte 2
probabilidades parte 2Jaime Lastra
 
Estadidtica descriptiva graficos_exploratorios
Estadidtica descriptiva graficos_exploratoriosEstadidtica descriptiva graficos_exploratorios
Estadidtica descriptiva graficos_exploratoriosClaudia Reyes Cano
 
Estadistica graficas
Estadistica graficasEstadistica graficas
Estadistica graficasAxel Gärciä
 
Examen soluciones
Examen solucionesExamen soluciones
Examen solucionesjdsg2001
 
Módulo 2 Introducción a la Estadística
Módulo 2 Introducción a la EstadísticaMódulo 2 Introducción a la Estadística
Módulo 2 Introducción a la Estadísticawplata
 

Similar a Estadistica (20)

Clase de estadistica 1ºparcial
Clase de estadistica 1ºparcialClase de estadistica 1ºparcial
Clase de estadistica 1ºparcial
 
Unidad 1 Estadistica Basica
Unidad 1 Estadistica BasicaUnidad 1 Estadistica Basica
Unidad 1 Estadistica Basica
 
Unidad 1 Estadistica Basica
Unidad 1 Estadistica BasicaUnidad 1 Estadistica Basica
Unidad 1 Estadistica Basica
 
Estadistica por Giselle Guilcaso
Estadistica por Giselle GuilcasoEstadistica por Giselle Guilcaso
Estadistica por Giselle Guilcaso
 
Trabajo de Estadistica, grupo Hi.gu-e
Trabajo de Estadistica, grupo Hi.gu-eTrabajo de Estadistica, grupo Hi.gu-e
Trabajo de Estadistica, grupo Hi.gu-e
 
Hi.gu e
Hi.gu eHi.gu e
Hi.gu e
 
Problemas de Frecuencia Absoluta Ccesa007.pdf
Problemas de Frecuencia Absoluta  Ccesa007.pdfProblemas de Frecuencia Absoluta  Ccesa007.pdf
Problemas de Frecuencia Absoluta Ccesa007.pdf
 
Unidad1
Unidad1Unidad1
Unidad1
 
Unidad1
Unidad1Unidad1
Unidad1
 
01 presentacion de datos u ap
01 presentacion de datos u ap01 presentacion de datos u ap
01 presentacion de datos u ap
 
Variables
VariablesVariables
Variables
 
Estadística
EstadísticaEstadística
Estadística
 
Estadidtica descriptiva graficos
Estadidtica descriptiva graficos Estadidtica descriptiva graficos
Estadidtica descriptiva graficos
 
métodos gréficos
métodos gréficosmétodos gréficos
métodos gréficos
 
probabilidades parte 2
probabilidades parte 2probabilidades parte 2
probabilidades parte 2
 
Estadidtica descriptiva graficos_exploratorios
Estadidtica descriptiva graficos_exploratoriosEstadidtica descriptiva graficos_exploratorios
Estadidtica descriptiva graficos_exploratorios
 
Estadistica.pptx
Estadistica.pptxEstadistica.pptx
Estadistica.pptx
 
Estadistica graficas
Estadistica graficasEstadistica graficas
Estadistica graficas
 
Examen soluciones
Examen solucionesExamen soluciones
Examen soluciones
 
Módulo 2 Introducción a la Estadística
Módulo 2 Introducción a la EstadísticaMódulo 2 Introducción a la Estadística
Módulo 2 Introducción a la Estadística
 

Más de carlosprofesor2001 (7)

Estadística bidimensional
Estadística bidimensionalEstadística bidimensional
Estadística bidimensional
 
Derivación
DerivaciónDerivación
Derivación
 
Conicas eso
Conicas esoConicas eso
Conicas eso
 
Conicas bt
Conicas btConicas bt
Conicas bt
 
Aritmética mercantil
Aritmética mercantilAritmética mercantil
Aritmética mercantil
 
Limites
LimitesLimites
Limites
 
Prueba
PruebaPrueba
Prueba
 

Estadistica

  • 1. ESTADÍSTICA MATEMÁTICA Juan Carlos Ballabriga Departamento de Matemáticas IES Benjamín de Tudela
  • 2. Estadística para qué • Un sondeo de opinión • El control de calidad de un artículo • Un estudio para conocer la efectividad de un medicamento • Calcular la composición futura de una población… .... esto es estadística
  • 3. Tipos de Estadística • La Estadística descriptiva: – Trata del recuento, ordenación y clasificación de los datos obtenidos de las observaciones: • Construcción de tablas, gráficos y cálculo de parámetros. • La Estadística inferencial: – Utiliza los resultados de la estadística descriptiva y se apoya en el cálculo de probabilidades para la obtención de conclusiones sobre una población a partir de los resultados obtenidos de una muestra.
  • 4. Centralización Parámetros Dispersión Estadística descriptiva Gráficos Estadística Inferencia estadística Investigación
  • 5. Nociones básicas Población: Conjunto de elementos que se quiere estudiar. • Votantes de una ciudad, comunidad, país • Televisores fabricados en una fábrica. •Alumnos de primero de bachillerato… Muestra: Cualquier subconjunto de una población. El número de elementos de una muestra se llama tamaño.
  • 6. Población No representativa muestra Con sesgo Representativa Sin sesgo
  • 7. Tipos de muestreo  Probabilístico: sabemos la probabilidad de que un individuo sea elegido en la muestra  Muestreo aleatorio simple (m.a.s.): Todos tienen las mismas posibilidades de ser elegidos  Muestreo aleatorio estratificado: Se divide la población en estratos y se hace un m.a.s. en cada uno  Muestreo sistemático: Se selecciona el primer individuo al azar y los siguientes estableciendo una pauta  Muestreo no probabilístico: no se sabe la probabilidad de que un individuo sea elegido
  • 8. Variable estadística: Cada uno de los rasgos o características que se quiere estudiar de los elementos de la población, susceptible o no de medida. Ejemplos: • Color del pelo: negro, castaño, rubio o pelirrojo • Sexo: hombre o mujer • Miembros asalariados de una familia: 0, 1 , 2 , 3 ,4 , 5 • Alturas de alumnos:178, 169, 172, 183, … •Nº de suspensos en determinada asignatura: 0, 1, 2, 3,… •Gastos en vacaciones de una familia: 1000€,1500€,..
  • 9. Variables cualitativas y cuantitativas Población: Alumnos de bachillerato de una localidad determinada •Sexo Cualitativas •Modelo de zapatillas deportivas  •Barrio de la localidad en que vive  (modalidad) •Deporte preferido   •Número de hermanos  •Núm.de suspensos en la 1ª evaluación Variables  Discretas •Núm de libros leídos trimestralmente   (Recuentos) •Num. de llamadas telefónicas diarias Cuantitativas      (números)  •Tiempo diario delante del televisor    •Tiempo de estudio Continuas  •Altura (Cualquier •Peso cantidad en •Tiempo empleado en llamadas un intervalo)
  • 10. Frecuencias  Frecuencia absoluta: Nº de veces que aparece un determinado valor de la variable fi Si sumamos todas las frecuencias obtenemos el º de datos N  f1  f 2  f 3    f r  Frecuencia relativa: fi ni  N  Frecuencia absoluta acumulada: Acumula las frecuencias absolutas hasta determinado valor de la variable, Fi  Frecuencia relativa acumulada: Acumula las frecuencias relativas hasta determinado valor de la variable Ni
  • 11. Tabla de frecuencias Población : Alumnos de Bachillerato Variable: Preferencias musicales Tipo: Cualitativa Tamaño de la muestra 120 fi Fi ni Ni Clásica 1 1 0,00833333 0,00833333 Rock 36 37 0,3 0,30833333 Pop 49 86 0,40833333 0,71666667 Jazz 4 90 0,03333333 0,75 Flamenco 2 92 0,01666667 0,76666667 Techno 28 120 0,23333333 1 N 120
  • 12. Variables cualitativas: Representación gráfica 50 45 1 40 35 Clásica 30 2 28 36 Rock 25 Pop 20 4 Jazz 15 Flamenco 10 49 Techno 5 0 Clásica Rock Pop Jazz Flamenco Techno Diagrama de Barras Diagrama de Sectores
  • 13. Variable discreta Ejemplo: Un profesor tiene anotadas en su cuaderno las notas de 30 alumnos de un clase: 5 3 4 1 2 8 9 8 7 6 6 7 9 8 7 7 1 0 1 5 9 9 8 0 8 8 8 9 5 7 Lo primero que tenemos que hacer es contar los datos
  • 14. Tabla de frecuencias Notas Frec. Abs. Frec. Abs. Frec. Relat. Frec. Relat. Acumuladas Acumuladas xi fi Fi ni Ni 0 2 2 0,07 0,07 1 3 5 0,10 0,17 2 1 6 0,03 0,20 3 1 7 0,03 0,23 4 1 8 0,03 0,27 5 3 11 0,10 0,37 6 2 13 0,07 0,43 7 5 18 0,17 0,60 8 7 25 0,23 0,83 9 5 30 0,17 1,00 Suma 30 1
  • 15. Algunos diagramas 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10 Frecuencias absolutas Diagrama de barras y polígono de frecuencias
  • 16. Con frecuencias acumuladas 35 30 25 20 15 10 5 0 1 2 3 4 5 6 7 8 9 10 Frecuencias absolutas acumuladas Diagrama de barras y polígono de frecuencias
  • 17. Cuidado al interpretar datos 120 100 80 60 40 20 0 E F M A My J Jl A S O N D Evolución de las ventas de coches en un determinado concesionario
  • 18. …la cruda realidad 16 14 12 10 8 6 4 2 0 E F M A My J Jl A S O N D
  • 19. Parámetros estadísticos  Centralización:  Media aritmética: La suma de todos los valores dividido por el número de datos X  Moda: Valor que más se repite. Si hay más de una, se llama bimodal, trimodal,… Mo  Mediana: La mediana de una colección de datos ordenados de menor a mayor es el valor que está en medio, es decir que la mitad de los datos son mayores que él y la otra mitad son menores que él, si hay un número impar de datos; si el número de datos es par, la mediana es la media aritmética entre los dos valores centrales. Me
  • 20. Cálculo de parámetros La media aritmética cuando tenemos la tabla de frecuencias se calcula así x  x  x3    xN x1  f1  x2  f 2    xr  f r X 1 2   x  f i i N f1  f 2    xr f i xi fi x i* f i Fi 0 2 0 2 1 3 3 5 2 1 2 6 3 1 3 7 4 1 4 8 5 3 15 11 6 2 12 13 7 5 35 18 8 7 56 25 9 5 45 30 30 175 Media 5,83
  • 21. La moda y mediana La moda por simple observación: Mo = 8 xi fi x i* f i Fi 0 2 0 2 1 2 3 1 3 2 5 6 La mediana: Es el valor que 3 1 3 7 4 1 4 8 ocupa el sitio “central”. Se puede 5 3 15 11 6 2 12 13 plantear de la siguiente manera 7 5 35 18 8 7 56 25 9 5 45 30  Si N impar Me  x N 1 30 175   2  xN  xN 1 Si N par Me  2 2   2 N N  30 como es par  15 buscamoslos valores que ocupen 2 N N las posiciones  15 y  16, es decir Me  7 2 2
  • 22. Dispersión  Rango: Diferencia entre el mayor y el menor valor de la variable Rango: V max V min  Desviación Media D.M. D.M .  x X  f i i f  x  X  2 i  fi  Varianza:  2  i f i  Desviación típica: 
  • 23. Dispersión  Coeficiente de variación:  C.V .   Sin unidades X  No depende de la variable  Permite comparar poblaciones y variables distintas Ejemplo 1 Ejemplo 2 Desv. Coeficiente Media Típica variación Clase A Clase B Variable Notas 7 2 0,28571429 Nota media 7,4 6,5 Desv. Típica 2,8 2,5 Variable Ingresos 1500 145 0,09666667
  • 24. Cálculo de parámetros Variable: Notas asignatura Tipo: Discreta Población: Alumnos Bachillerato TABLA PARA UNA VARIABLE ESTADÍSTICA DISCRETA Datos (xi) Frecuencias (fi) Fr. Relativas (hi) xi*fi xi-X (xi-X)2 (xi-X)2 * fi Fr. Acumuladas 0 2 0,0667 0 -5,83 33,9889 67,9778 2 1 3 0,1 3 -4,83 23,3289 69,9867 5 2 1 0,0333 2 -3,83 14,6689 14,6689 6 3 1 0,0333 3 -2,83 8,0089 8,0089 7 4 1 0,0333 4 -1,83 3,3489 3,3489 8 5 3 0,1 15 -0,83 0,6889 2,0667 11 6 2 0,0667 12 0,17 0,0289 0,0578 13 7 5 0,1667 35 1,17 1,3689 6,8445 18 8 7 0,2333 56 2,17 4,7089 32,9623 25 9 5 0,1667 45 3,17 10,0489 50,2445 30 30 1 175 256,167 MEDIA (X) 5,83 MODA (Mo) 8 MEDIANA (Me) 7 VARIANZA 8,5389 DESVIACIÓN TÍPICA 2,9221 COEFICIENTE DE VARIACIÓN 0,5012 50,12% RANGO 9
  • 25. Los gráficos DIAGRAMA DE BARRAS Y POLÍGONO DE FRECUENCIAS DIAGRAMA Y POLÍGONO DE FRECUENCIAS 8 ACUMULADO 35 7 30 6 25 5 20 4 15 3 10 2 5 1 0 0 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 Valores de la variable Valores de la variable
  • 26. Variable continua: Agrupación de datos  Si la variable es continua, o discreta con un número de datos muy grande, es aconsejable agrupar los datos en CLASES.  ¿Cuál es el número idóneo de clases?  El número clases debe ser aproximadamente igual a la raíz cuadrada positiva del número de datos.  ¿Cómo escoger las clases?  Es aconsejable que los límites de clase (tanto el superior como el inferior) sean números “redondos”, como múltiplos de 5, 10, …  Se debe procurar que todas las clases tengan la misma amplitud o tamaño.  Los intervalos se deben construir de modo que el límite superior de una clase coincida con el límite inferior de la siguiente.  Adoptaremos el criterio de que los intervalos sean cerrados por la izquierda y abiertos por la derecha.
  • 27. Variable continua  Ejemplo Se ha aplicado un test sobre satisfacción en el trabajo a 88 empleados de una fábrica, obteniéndose las resultados: Puntuaciones Núm. de trabajadores [38-44) 7 [44-50) 8 [50-56) 15 [56-62) 25 [62-68) 18 [68-74) 9 [74-80) 6
  • 28. Variable: Satisfacción empleados Tipo: Continua Población: Empleados de una fábrica TABLA PARA UNA VARIABLE ESTADÍSTICA CONTINUA Intervalo Marca (xi) Frecuencias (fi) Fr. Relativas (hi) xi*fi xi-X (xi-X)2 (xi-X)2 * fi Fr. Acumuladas 38 44 41 7 0,0795 287 -18,14 329,06 2303,4172 7 44 50 47 8 0,0909 376 -12,14 147,38 1179,0368 15 50 56 53 15 0,1705 795 -6,14 37,6996 565,494 30 56 62 59 25 0,2841 1475 -0,14 0,0196 0,49 55 62 68 65 18 0,2045 1170 5,86 34,3396 618,1128 73 68 74 71 9 0,1023 639 11,86 140,66 1265,9364 82 74 80 77 6 0,0682 462 17,86 318,98 1913,8776 88 88 88 88 88 1 5204 7846,3648 MEDIA (X) 59,14 INTERVALO MODAL [56,62) MODA (Mo) 59 INTERVALO MEDIANA [56,62) MEDIANA (Me) 59 VARIANZA 89,1632 DESVIACIÓN TÍPICA 9,4426 COEFICIENTE DE VARIACIÓN 0,1597 15,97% RANGO 42
  • 29.  Gráficos: Histograma HISTOGRAMA Y POLÍGONO DE FRECUENCIAS 30 25 20 15 10 5 0 [38,44) [44,50) [50,56) [56,62) [62,68) [68,74) [74,80) Valores de la variable
  • 30. HISTOGRAMA Y POLÍGONO DE FRECUENCIAS ACUMULADO 100 90 80 70 60 50 40 30 20 10 0 [38,44) [44,50) [50,56) [56,62) [62,68) [68,74) [74,80) Valores de la variable
  • 31. Parámetros en variable continua  Cuando estamos trabajando con variable continua algunas de las fórmulas utilizadas se deben “ajustar” para que sean más fiables f i  f i 1 Mo  Li 1  ai  Moda  f i  f i 1    f i  f i 1  N  Fi 1  Mediana Me  Li 1  2 ai fi rN  Fi 1  Percentiles Pr  Li 1  100 ai fi
  • 32.
  • 33. Del anterior test sobre satisfacción en el trabajo a 88 empleados de una fábrica, cuyos resultados son: Puntuaciones Núm. de trabajadores [38-44) 7 [44-50) 8 [50-56) 15 [56-62) 25 [62-68) 18 [68-74) 9 [74-80) 6 Calcular: a) El cuartil primero. b) Los percentiles de orden 40 y 90
  • 34. Q1 deja la cuarta parte de la distribución a su izquierda :N/4=22 Clases fi Fi [38-44) 7 7 [44-50) 8 15 <22 [50-56) 15 30 >22 Clase del primer [56-62) 25 55 cuartil: [50-56) [62-68) 18 73 [68-74) 9 82 [74-80) 6 88 Aplicando la fórmula: Li-1 = 50 ai = 6 22  15 N/4 = 22 Q1  50  6   52.8 15 Fi-1 = 15 fi = 15
  • 35. P40 deja el 40% de los datos a su izquierda :88.40/100=35.2 Clases fi Fi [38-44) 7 7 [44-50) 8 15 [50-56) 15 30 < 35.2 [56-62) 25 55 > 35.2 Clase de P40: [62-68) 18 73 [56-62) [68-74) 9 82 [74-80) 6 88 Aplicando la fórmula: Li-1 = 56 ai = 6 35.2  30 40.N/100 = 35.2 P40  56  6   57.25 Fi-1 = 30 25 fi = 25
  • 36. P90 deja el 90% de los datos a su izquierda :88.90/100=79.2 Clases fi Fi Clase de P90: [38-44) 7 7 [68-74) [44-50) 8 15 9 6.2 [50-56) 15 30  6 x [56-62) 25 55 [62-68) 18 73 < 79.2 9 [68-74) 9 82 > 79.2 6.2 [74-80) 6 88 x Aplicando la fórmula: 68 6 74 Li-1 = 68 ai = 6 79.2  73 90.N/100 = 79.2 P90  68  6   72.13 Fi-1 = 73 9 fi = 9