SlideShare una empresa de Scribd logo
1 de 69
Descargar para leer sin conexión
INFRAESTRUCTURA ESTADÍSTICA

 ESTADÍSTICAS POR ISLAS
 Estimación en áreas pequeñas




ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
INFRAESTRUCTURA ESTADÍSTICA

 ESTADÍSTICAS POR ISLAS
 Estimación en áreas pequeñas

 Alberto González Yanes
 jgonyanp@gobiernodecanarias.org




ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
ESTADÍSTICAS POR ISLAS
 Estrategia de producción de
 información en áreas pequeñas




ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
Necesidades de información insular, comarcal y local


                                  INSULAR
                                COMARCAL
                                    LOCAL




 ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
Estrategia de producción de datos: El empleo a modo de ejemplo


           AREAS                                REGISTROS
         PEQUEÑAS                             ADMINISTRATIVOS
   Encuesta de                               Estadística de Afiliación
   Población Activa                          a la Seguridad Social

                                             Estadística de
                                             Accidentes de Trabajo

                                             Estadística de
                                             Empresas Inscritas en
                                             la Seguridad Social

                                             (…)
 ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
ESTIMACIÓN EN ÁREAS
 PEQUEÑAS PARA LA EPA
 Reseña histórica del trabajo
 realizado




ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
ESTIMACIÓN EN ÁREAS PEQUEÑAS: Reseña histórica del trabajo
realizado


        El Instituto Canario de Estadística (ISTAC) se incorpora al grupo de trabajo de
        áreas pequeñas del INE desde sus inicios en abril de 2004.
        Participan otros institutos autonómicos: Cataluña, Madrid y Navarra, y
        posteriormente: Galicia, País Vasco, Baleares, Andalucía y Valencia.
        Se crea un grupo de trabajo de apoyo en el Departamento de Estadística,
        Investigación Operativa y Computación (ULL), firmando el proyecto
        “Estimadores en Áreas Pequeñas aplicados a la Estadística Pública Canaria
        (CANAREA 2005)” y posteriormente CANAREA 2006 y 2007, con la idea de
        cubrir los objetivos de:
            Responder a los requerimientos del grupo de trabajo sobre áreas pequeñas del
            Instituto Nacional de Estadística, e
            Incorporar los desarrollos técnicos y metodológicos a la práctica estadística del
            Instituto Canario de Estadística.


 ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
ESTIMACIÓN EN ÁREAS PEQUEÑAS: Reseña histórica del trabajo
realizado

       El grupo de trabajo propone utilizar la Encuesta de Población Activa (EPA) en
       la evaluación de los estimadores de áreas pequeñas.

       Se construye un simulador de realizaciones de EPA partiendo de la población
       suministrada por el Censo de Población y Viviendas del 2001.

       Esto permite conocer los valores reales que se desean estimar y evaluar el
       rendimiento de los estimadores planteados.

       CANAREA 2005 evalúa también la posibilidad de utilización de muestra
       suplementaria (muestreo aleatorio simple de viviendas en las áreas pequeñas
       tras afijación uniforme).




 ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
ESTIMACIÓN EN ÁREAS PEQUEÑAS: Reseña histórica del trabajo
realizado


                                               Una breve reseña de los trabajos
                                               realizados y la metodología final para la
                                               estimación en pequeñas áreas de
                                               Canarias se puede encontrar en la
                                               publicación del ISTAC.
                                               En esa misma publicación se pueden
                                               encontrar, a modo de ejemplo,
                                               resultados anuales por islas para los
                                               años 2005, 2006 y 2007.
                                               Los resultados detallados, con carácter
                                               provisional, son publicados por el ISTAC
                                               en formato pc-axis y difundidos en la
                                               web y en CD.



 ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
ENCUESTA DE POBLACIÓN
 ACTIVA (EPA)
 Descripción de la encuesta




ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
LA ENCUESTA DE POBLACIÓN ACTIVA: Descripción de la encuesta


       Ofrece información del mercado laboral a nivel de comunidad autónoma y
       provincia.
       Periodicidad trimestral.
       Muestreo bietápico con estratificación en primera etapa (secciones censales y
       viviendas).
       104 y 91 secciones en Las Palmas y S/C de Tenerife. 18 viviendas por
       sección.
       Se renueva la sexta parte cada trimestre (paneles).
       Utiliza estimadores directos de razón con pesos calibrados, wj , según:
           población de 16 y más años por grupo de edad y sexo (22 grupos) a nivel de CA,
           población de 16 y más años por provincia

       Las variables de interés en áreas pequeñas son:
           Totales de ocupados, parados e inactivos
           Tasas de ocupación, actividad y paro
 ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
ENCUESTA DE POBLACIÓN
 ACTIVA
 Estimaciones de interés para
 Canarias




ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
ENCUESTA DE POBLACIÓN ACTIVA: Estimaciones de interés para
Canarias

       Pequeñas Áreas de interés para Canarias y requerimiento de información
       El nivel NUT 3 (Reglamento Nº 105/2007) considera las islas en lugar de las
       provincias.
       Para la Comunidad Autónoma es además de interés suministrar información a
       nivel de comarcas por sexo. 12 y 15 en Las Palmas y S/C de Tenerife
       respectivamente.
       Eurostat solicita información a nivel de isla por sexo y dos grupos de edades
       (<25 y ≥25).

       Los métodos planteados y evaluados van en la línea de proporcionar buenas
       estimaciones por comarcas y, posteriormente comprobar si la agregación
       proporciona buenas estimaciones a nivel de islas.
       Los inactivos son calculados por diferencia del tamaño poblacional con
       respecto a las estimaciones de activos.

 ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
EVALUACIÓN DE ESTIMADORES
 Simulador de EPA
 Estimadores
 Indicadores de rendimiento




ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
SIMULADOR DE LA ENCUESTA DE POBLACIÓN ACTIVA
 Un simulador
       Se construye un programa que simula la extracción de realizaciones de EPA (igual
       diseño) a partir del Censo 2001. Se generan 1000 simulaciones.
       Con el simulador evaluamos diferentes estimadores a través de indicadores de
       rendimiento.

 Notación para estimadores e indicadores de rendimiento
        wj : peso del diseño al individuo j en la EPA.
        d: dominio a estimar (área pequeña*sexo).
        g: niveles de variable de estratificación (grupo de edad, <25; 25-54; >54).
        r: región formada por unión de dominios “homogéneos”.
        y: variable objetivo (p.e., 1 sí parado, 0 no parado).
       Nd: tamaño poblacional del dominio d.
       ˆ                                                    ˆ    (
       Nd : estimación HT de la población en el dominio d . Nd = ∑ j∈EPA w j .
                                                                           d
                                                                               )
 ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
ESTIMADORES:

                               Estimadores basados en el diseño


           Estimación Directa                                                        Estimación Indirecta
    Información sólo del área pequeña                                    Se incorpora Información de otras áreas
        (Directo, Pos-estratificado)                                         (Sintético básico, sintético región)


                                       ˆ Compuesto = λd ydpost + (1 − λd ) yd
                                       yd               ˆ                  ˆ sint


                               Estimadores basados en modelos


          Modelos de individuos                                                       Modelos de áreas
 Se utiliza información a nivel de individuo                             Se utiliza información a nivel de área de
            de variables auxiliares                                                  variables auxiliares
      (EBLUP-A, Sintético-regresión)                                           (EBLUP-B, Sintético-regresión)


                                   YdEBLUP = γ d yd
                                   ˆ              directo
                                                          + ( 1 − γ d )Ydsint-regr
                                                                       ˆ

 ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
ESTIMADORES EVALUADOS: Estimadores basados en el diseño

       Directo
                              ∑wy       j       j
                                                                                      ˆ direct
             ˆ
             y   direct
                          =
                              j∈EPAd
                                                    Nd   y su media        ˆ direct = y d
                                                                           yd
                              ∑w
                 d
                                            j                                          Nd
                               j∈EPAd



       Posestratificado: suma ponderada de los estimadores directos de la media en los
       grupos de estratificación.
              y dpost = ∑ y dg Ndg
              ˆ           ˆ direct
                              g

       Sintético: suma ponderada de los estimadores directos de la media en los grupos de
       estratificación en una región r.
           Si r es la provincia: sintético-básico.
                                                                                                 ∑       w jy j
                                                               y d = ∑ y rdirect Ndg = ∑
                                                                       ˆ,                    j∈EPAr ,g
                                                               ˆ sint                                             Ndg
           Si r es el dominio: posestratificado.
                                                                                                  ∑
                                                                           g
                                                                      g                  g                   wj
           Otro caso: sintético-región.                                                          j∈EPAr ,g




 ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
ESTIMADORES EVALUADOS: Estimadores basados en el diseño


       Compuesto dependiente del diseño: combinación convexa del estimador
       posestratificado y del sintético.
                                                               λd = 1          ˆ
                                                                            si Nd ≥ α Nd
              ˆ
              y   dep
                        = λd y
                             ˆ   post
                                        + (1 − λd ) y
                                                    ˆ   sint
                  d              d                      d
                                                                    ˆ
                                                               λd = Nd /(α Nd ) otro caso
       Los valores de α se fijan a 2/3, 1, 1.5 y 2, constituyendo lo que denominaremos como
       compuesto 1, 2, 3 y 4, respectivamente.

       Propiedades
       Los estimadores directos y posestratificados son insesgados, aunque generalmente
       con altísimas varianzas (poca muestra).
       El estimador sintético suele presentar grandes sesgo (utilización de muestra indirecta) y
       pequeñas variabilidades (muestras grandes).
       Los estimadores compuestos intentan aprovechar las cualidades buenas de los
       directos y sintéticos. La determinación del parámetro λ es crucial.


 ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
ESTIMADORES EVALUADOS: Estimadores basados en modelo



     Nivel de área: modelos lineales generales mixtos, en el proyecto EURAREA se denota
     como modelo B o modelo de Fay-Herriots.
                θˆd = x d β + υd + ed
                        ′

           ˆ
     con θd una función del estimador directo, x d = ( x1d ,K, x pd )′ los valores para el dominio d
     de las p variables auxiliares consideradas, υd efectos aleatorios del dominio d ( N (0,σ υ ) )
                                                                                                 2

     y ed los errores muestrales ( N (0,σ e2 / Nd ) ).

     Estimadores: EBLUP y sintético-regresión.
                    ˆ              ′ ˆ
                   Ydsint-regr = x d β                 ˆ            ˆ                     ˆ
                                                      YdEBLUP = γ dYddirecto + (1 − γ d )Ydsint-regr

     con γ d = σ υ (σ υ + σ e2 Nd ) .
                ˆ2 ˆ2 ˆ




 ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
ESTIMADORES: Error en la estimación




                VARIANZA                                 SESGO




 ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
INDICADORES DE RENDIMIENTO


       Sesgo relativo (SR):
                                           1 Sim y d (k ) − Yd
                                                   ˆ
                              SRd ( y ) =
                                    ˆ         ∑ Y 100
                                          Sim k =1       d

       Media del sesgo relativo absoluto (SRAM):
                                             1
                              SRAM ( y ) =
                                     ˆ         ∑ SRd ( yˆ )
                                             D d

       Error cuadrático medio relativo (REMC):
                                                                  12
                                            ⎛ 1 Sim ⎛ y (k ) − Y ⎞2 ⎞
                                                         ˆd
                                       ˆ) = ⎜
                               REMCd ( y          ∑ ⎜ Y d ⎟ ⎟ 100
                                            ⎜ Sim k =1 ⎝
                                            ⎝               d    ⎠ ⎟⎠
       Media del error cuadrático medio relativo (REMCM):
                                               1
                               REMCM ( y ) =
                                       ˆ         ∑ REMCd ( yˆ )
                                               D d

 ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
ESTIMADORES E INDICADORES DE RENDIMIENTO



    ECM

                    varianza

                                           varianza


                                                                    varianza
                      sesgo2


                                            sesgo2


                                                                     sesgo2


                 Sintético                                         Posestratificado

                             Compuesto4               Compuesto1




 ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
INDICADORES DE RENDIMIENTO: Selección del mejor estimador

               Criterio más usual de elección de un estimador es el de tomar
                        aquel con menor error cuadrático e insesgado.


                  EMC
                            varianza
                                            varianza

                                                          varianza
                             sesgo2

                                            sesgo2

                                                           sesgo2




¿Problema temporal
con la variabilidad?
                          Sugerencia:
                          Elegir estimadores con variabilidades próximas a las de la
                          estimación a nivel de provincia.


  ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
CANAREA 2005
 Influencia de muestra
 suplementaria




ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
CANARERA 2005: Simulación de muestra suplementaria



     Se simula la utilización de muestra suplementaria, aumentando el número
     de viviendas en una fracción r sobre el número total de viviendas de la
     EPA, 3042 viviendas, seleccionadas por muestreo aleatorio simple dentro
     de cada área pequeña tras un reparto uniforme entre ellas. (r igual al 0%,
     50%,75%,80% y 100%).


                              Estimador directo con muestra suplementada:




                                          ∑wy
                                         j∈EPA
                                                    j   j   +    ∑ vy
                                                                i∈SUP
                                                                         i       i

                              yd =
                              ˆ direct                                               Nd
                                          ∑ w
                                           j∈EPAd
                                                        j   +    ∑v
                                                                i∈SUPd
                                                                             i




 ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
CANAREA 2005: Influencia muestra suplementaria



                                                r=0                                                                       r=0

             25                                                                          9
                                                                                         6
             20
                                                                                         3
             15
      REMC




                                                                                         0




                                                                                   SR
             10                                                                          -3
                                                                                         -6
             5
                                                                                         -9
             0                                                                          -12
                    EH         LG         FV          LP      LZ      TF      GC               EH        LG         FV          LP      LZ      TF      GC

              Directo    Posestr    Sintético   Comp1      Comp2   Comp3   Comp4         Directo   Posestr    Sintético   Comp1      Comp2   Comp3   Comp4



                  Error Cuadrático Medio Relativo (REMC) y Sesgo Relativo (SR) para hombres ocupados con la EPA original (r =0).
                                                         Se utilizan 1000 simulaciones.



•     Sin muestra suplementaria: el sintético y el compuesto 4 son los mejores, si bien ambos con
      los peores sesgos. Con sesgos más pequeños y con errores cuadráticos próximos a estos dos,
      se sitúan los dos primeros compuestos así como el posestratificado



     ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
CANAREA 2005: Influencia muestra suplementaria


                                                                                     9
        16
                                                                                     8
        14
                                                                                     7
        12
                                                                                     6
REMCM




        10




                                                                              SRAM
                                                                                     5
            8                                                                        4
            6                                                                        3
            4                                                                        2
            2                                                                        1
            0                                                                        0
                      0           0.5         0.75           0.8        1                      0          0.5          0.75           0.8        1

            Directo   Posestr   Sintético   Comp1    Comp2    Comp3   Comp4          Directo   Posestr   Sintético   Comp1    Comp2    Comp3   Comp4


             Media del Error Cuadrático Medio Relativo (REMCM) y Sesgo Relativo Absoluto (SRAM) para hombres
             ocupados con la EPA original (r = 0) y suplementada (r =0’5, 0’75, 0’80 y 1). Se utilizan 1000 simulaciones.


        •        Con muestra suplementaria El aumento por encima del 50% de fracción de muestreo no
                 produce cambios significativos.

                LA SUPLEMENTACIÓN DE MUESTRA REDUCE LA VARIABILIDAD, PERO NO EL SESGO

        ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
CANAREA 2005: Influencia muestra suplementaria
                                               r=0                                                                            r=0

            25                                                                          9
                                                                                        6
            20
                                                                                        3
            15
     REMC



                                                                                        0




                                                                                  SR
            10                                                                          -3
                                                                                        -6
             5
                                                                                        -9
             0                                                                         -12
                   EH         LG         FV          LP      LZ      TF      GC               EH         LG            FV           LP      LZ       TF       GC

             Directo    Posestr    Sintético   Comp1      Comp2   Comp3   Comp4         Directo    Posestr    Sintético       Comp1      Comp2    Comp3    Comp4

                                               r=1                                                                            r=1

            25                                                                           9
                                                                                         6
            20
                                                                                         3
            15                                                                           0
     REMC




                                                                                  SR
                                                                                         -3
            10
                                                                                         -6
             5                                                                           -9

             0                                                                         -12
                   EH         LG         FV          LP      LZ      TF      GC                   EH         LG         FV          LP       LZ       TF       GC


             Directo    Posestr    Sintético   Comp1      Comp2   Comp3   Comp4          Directo   Posestr        Sintético    Comp1     Comp2    Comp3    Comp4




 •          Con muestra suplementaria se reducen todos los errores cuadráticos con la excepción del
            sintético básico, pero este sigue manteniendo los mejores errores cuadráticos

 ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
CANAREA 2005: Conclusiones

       El estimador sintético básico
       Menores variabilidades.
       Mayores sesgos (agravándose en comarcas e islas con peculiaridades en la
       actividad económica –por ejemplo las turísticas-).
       El sesgo se reduce con la utilización de estimadores compuestos, a costa de
       aumentar variabilidad.
       En la mayoría de las comarcas, el error cuadrático medio relativo sigue siendo
       de los más pequeños, incluso después de la utilización de muestra
       suplementaria.
       La realización de encuesta suplementaria es caro y estratégicamente difícil.

      ¿Podremos aprovechar las buenas propiedades
      que tiene este estimador tomando información de
      otras áreas distintas a la provincia?
 ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
ESTIMADOR SINTÉTICO
 REGIÓN
 Estático y dinámico




ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
ESTIMADOR SINTÉTICO-REGIÓN: Construcción de regiones

       Se propone (Rao 2003, pag. 46) construcción de regiones, uniones de
       comarcas, que presenten comportamiento homogéneo en cuanto a las
       variables objetivo a estudiar. Se ha distinguido entre hombre ocupado, mujer
       ocupada, hombre parado o mujer parada.

       Las variables auxiliares utilizadas en la construcción de las regiones fueron:
           Información censal (Censo de Población y Viviendas de 2001). Utilización de
           variables homónimas del Censo.
           Registros administrativos (empleo registrado, para registrado,…).

       La construcción utilizó técnicas de análisis cluster (K-medias o jerárquicos)
       sobre los dominios.
           Regiones estáticas: los dominios pertenecientes a un mismo cluster comparten
           su información (entre 2 y 5 clusters parece ser adecuado). Denotamos por C2, C3,
           C4, …
           Valoración a posteriori del error cuadrático y sesgo (simulación).

 ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
ESTIMADOR SINTÉTICO-REGIÓN: Construcción de regiones

Construcción de regiones a partir del Censo 2001

 Para cada variable                                      Hombres
                                                         Ocupados
 objetivo por sexo se han
 considerado las
 correspondientes del
 Censo 2001
 desagregada por grupo
 de edad y relativizadas
 por el total comarcal de
 dicho sexo.                                              Mujeres
                                                         Ocupadas




 ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
ESTIMADOR SINTÉTICO-REGIÓN: Construcción de regiones

Construcción de regiones a partir de registros administrativos

         Partiendo de las variables auxiliares:
              Empleo Total (agrario, industria, construcción y servicio),
              Empleo por Cuenta Ajena (agrario, industria, construcción y servicio),
              Empleo por Cuenta Propia (agrario, industria, construcción y servicio),
              Paro total (hombre, mujer, mayor 25 años, agrario, industria, construcción y
              servicio) y
              Contratos (hombres, mujeres, indefinidos, temporal, agrario, industria, construcción
              y servicio).


          Se han relativizado a los tamaños comarcales.


         Se han seleccionado distintos modelos (utilizando la información del año 2001
         para buscar relaciones con variables objetivo del Censo 2001).

 ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
ESTIMADOR SINTÉTICO-REGIÓN: Construcción de regiones

Censo 2001 vs Registros administrativos
 Variables homónimas:
        Ventajas
            Variables automáticamente definidas.
            Estabilidad temporal.
        Inconvenientes:
            Revisión sólo cada 10 años.
            Diferencia de definición de conceptos EPA y Censo.
 Registros administrativos:
        Ventajas
            Posibilidad de reflejar cambios bruscos si el periodo de vigencia de las regiones es
            relativamente corto.
        Inconvenientes:
            Elección del modelo (variables).
            Periodo de vigencia de regiones.
            Falta de estabilidad temporal.

 ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
ESTIMADOR SINTÉTICO-REGIÓN: Construcción de regiones
Censo 2001 vs Registros administrativos                                 Ocupados
                                                      Hombres                                       Mujeres
Se ha comprobado la                   Censal   2001   2002   2003   2004   2005 Censal   2001   2002      2003   2004   2005

evolución de las regiones a   LZ-E
                              LZ-N
                                         1
                                         1
                                                1
                                                1
                                                      1
                                                      1
                                                             1
                                                             1
                                                                    1
                                                                    1
                                                                           1
                                                                           1
                                                                                   1
                                                                                   1
                                                                                          1
                                                                                          1
                                                                                                1
                                                                                                1
                                                                                                          1
                                                                                                          1
                                                                                                                 1
                                                                                                                 1
                                                                                                                        1
                                                                                                                        1

través de las variables de    LZ-SO      1      1     1      1      1      1       1      1     1         1      1      1
                              FV-C       1      1     1      1      1      1       1      1     1         1      1      1
registros administrativos     FV-N       1      1     1      1      1      1       1      1     1         1      1      1

para los años disponibles     FV-S
                              GC-Me
                                         1
                                         2
                                                1
                                                2
                                                      1
                                                      2
                                                             1
                                                             2
                                                                    1
                                                                    2
                                                                           1
                                                                           2
                                                                                   1
                                                                                   2
                                                                                          1
                                                                                          2
                                                                                                1
                                                                                                2
                                                                                                          1
                                                                                                          2
                                                                                                                 1
                                                                                                                 2
                                                                                                                        1
                                                                                                                        2
(2001-2005)                   GC-CN      2      2     2      2      2      2       2      2     2         2      2      2

comparándolas con las
                              GC-NO      2      2     2      2      2      2       2      2     2         2      2      2
                              GC-O       2      2     2      2      2      2       2      2     2         2      2      2

obtenidas con las variables   GC-S
                              GC-SE
                                         1
                                         1
                                                1
                                                2
                                                      1
                                                      1
                                                             1
                                                             1
                                                                    1
                                                                    1
                                                                           1
                                                                           1
                                                                                   1
                                                                                   1
                                                                                          1
                                                                                          2
                                                                                                1
                                                                                                2
                                                                                                          1
                                                                                                          2
                                                                                                                 1
                                                                                                                 1
                                                                                                                        1
                                                                                                                        1
homónimas del Censo.          TF-Ab      1      1     1      1      1      1       1      2     2         2      1      1
                              TF-Ac      2      2     2      2      2      2       2      2     2         2      2      2
                              TF-Me      2      2     2      2      1      2       2      2     2         2      1      1
                              TF-D       2      2     2      2      2      2       2      2     2         2      2      2

En general, cuando el
                              TF-I       2      2     2      2      2      2       2      2     2         2      2      2
                              TF-SO      1      1     1      1      1      1       1      1     1         1      1      1

número de regiones a          TF-VG
                              TF-VO
                                         2
                                         2
                                                2
                                                2
                                                      2
                                                      2
                                                             2
                                                             2
                                                                    2
                                                                    2
                                                                           2
                                                                           2
                                                                                   2
                                                                                   2
                                                                                          2
                                                                                          2
                                                                                                2
                                                                                                2
                                                                                                          2
                                                                                                          2
                                                                                                                 2
                                                                                                                 2
                                                                                                                        2
                                                                                                                        2
constituir es relativamente   LG-N       2      2     2      2      2      2       2      2     2         2      2      2

pequeño suele producir        LG-S
                              LP-Ca
                                         2
                                         2
                                                2
                                                2
                                                      1
                                                      2
                                                             1
                                                             2
                                                                    1
                                                                    2
                                                                           2
                                                                           2
                                                                                   2
                                                                                   2
                                                                                          2
                                                                                          2
                                                                                                2
                                                                                                2
                                                                                                          2
                                                                                                          2
                                                                                                                 2
                                                                                                                 2
                                                                                                                        2
                                                                                                                        2
resultados muy similares.     LP-NE      2      2     2      2      2      2       2      2     2         2      2      2
                              LP-NO      2      2     2      2      2      2       2      2     2         2      2      2
                              LP-VA      2      2     2      2      2      2       2      2     2         2      2      2
                              EH         2      2     2      2      2      2       2      2     2         2      2      2



  ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
ESTIMADOR SINTÉTICO-REGIÓN: Construcción de regiones
¿Cuántas regiones construimos?

                          Ocupados                          Parados
                    REMCM             SRAM           REMCM           SRAM          Datos provinciales
                  H      M         H       M       H      M       H       M
    Directo       11,76  19,90      1,47    2,83   43,40  47,02    3,51    2,23     con variabilidades
    Posestrat.    10,50  18,29      1,40    2,39   44,42  46,84    3,85    2,14
    Sintético      6,76  13,77      6,07   13,03   21,96  20,08   19,15   17,71   para ocupados entre
                                                                                     un 2 y 3% y para
    Sint_C2        4,82   8,96      3,79    7,39   16,54  14,08   12,66    8,31
    Sint_C3        4,98   8,37      3,19    6,18   17,97  14,76    9,95    8,31

                                                                                   parados en torno al
    Sint_C4        4,95   8,01      2,80    5,24   15,35  15,88    6,98    7,24
    Sint_C5        5,67   9,70      2,87    5,51   15,51  18,19    5,53    7,23

                                                                                            7%.
    Sint_C6        5,47   9,13      2,43    4,70   19,08  17,34    5,62    6,92
    Sint_C7        5,75   8,67      2,47    5,34   20,46  20,78    5,44    6,31


                                                                                      Se ha constatado
                                                                                      sobre EPA reales
                                 El sesgo se reduce con el                        (2001-2005) y tasa de
                                   aumento de regiones                            paro que C4, produce
                                                                                        una excesiva
                                                                                      variabilidad entre
                 El error cuadrático medio se
                                                                                   trimestre ( >8% entre
                  reduce con el aumento de
                                                                                     REMCM y SRAM).
                            regiones

  ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
ESTIMADOR       SINTÉTICO-REGIÓN:                        Resultados            con       sintético-región
estático
                            14

                            12

                            10




                    REMCM
                            8

                            6

                            4

                            2

                            0

                                 Directo   Posestrat.    Sintético   Sint_C2   Sint_C3
                                 Sint_C4   Sint_C5       Sint_C6     Sint_C7


                            14

                            12

                            10
                    SRAM




                            8

                            6

                            4

                            2

                            0

                                 Directo   Poses trat.   Sintético   Sint_C2   Sint_C3
                                 Sint_C4   Sint_C5       Sint_C6     Sint_C7




 ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
ESTIMADOR                     SINTÉTICO-REGIÓN:                                   Resultados                 con          sintético-región
estático
                                Hombres Ocupados
                                                                                                             Hombres Ocupados
           25
                                                                                        10
           20
                                                                                         5

           15
    REMC



                                                                                         0




                                                                                   SR
           10                                                                            -5

            5                                                                           -10

            0                                                                           -15
                 LZ      FV        GC         TF         LG        LP        EH               LZ      FV        GC        TF          LG         LP         EH

                      Directo    Posestrat   Sintético   2-2-2-2   3-3-4-2                         Directo    Posestrat   Sintético   2-2-2-2    3-3-4-2




                                Hombres Parados
                                                                                                              Hombres Parados
           70   Bajan los errores cuadráticos respecto del
           65                                            45
           60
           55
                             postestratificado           40
                                                         35                                                          Bajan los sesgos respecto del
           50                                                                            30
           45                                                                            25
                                                                                         20
                                                                                                                             sintético básico
   REMC




           40
                                                                                         15




                                                                                   SR
           35
           30                                                                            10
           25                                                                             5
           20                                                                             0
           15                                                                            -5
           10                                                                           -10
            5                                                                           -15
            0                                                                           -20
                 LZ      FV        GC        TF          LG        LP        EH               LZ      FV         GC        TF         LG         LP         EH

                      Directo    Posestrat   Sintético   2-2-2-2   3-3-4-2                         Directo    Posestrat   Sintético    2-2-2-2    3-3-4-2




 ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
ESTIMADOR SINTÉTICO-REGIÓN: Dinámico

        En las regiones estáticas todas las comarcas de una misma región prestan y toman
        prestada la información que poseen.
        Si bien los resultados son aceptables, parece más lógico proponer regiones “borrosas”
        (fuzzy), donde una comarcas A pueda compartir su información con una comarca B y
        no necesariamente al revés. (Ej. GC-Me pueda prestar y no necesariamente tomar
        prestada información de otras comarcas).


                         Se proponen regiones dinámicas

        La idea es similar a la que subyace en los estimadores compuestos.

           Aprovechar la información directa y cuando no es suficiente pedir
                 prestada (“Borrowing strengh”) información auxiliar.

           Se intenta conseguir un equilibrio entre la variabilidad y el sesgo
                         intentando mantener un ECM bajo.


 ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
ESTIMADOR SINTÉTICO-REGIÓN: Dinámico


       Utilizando distancias, por ejemplo la euclídea, se definen matrices de órdenes
       de cercanía entre las distintas comarcas.
       En la estimación de una comarca, si se precisa muestra adicional se tomará de
       las comarcas más próximas.
       El método de parada en la utilización de información de las comarcas vecinas,
       emplea una versión simplificada del cálculo del tamaño muestral necesario que
       debería tener una comarca con una determinada precisión,

                                                          Se ha fijado:
                                  zα 2P (1 − P )N
                                    2
                                                                 • zα 2 a 1.96.
                        n=
                             ε (N − 1) + zα 2P (1 − P )
                              2            2
                                                                 • P a 0.20
                                                                 • ε entre el 1 y 4%.




 ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
ESTIMADOR SINTÉTICO-REGIÓN: Dinámico



       La interpretación de ε puede variar con respecto a su interpretación estándar.
            Valores pequeños de ε, muestras grandes, posibilita la utilización de información
            de comarcas más alejadas, y
            Valores grandes, muestras pequeñas, que tiene pocos vecinos relativamente
            próximos o no precisa más muestra. En el límite sólo muestra directa, el estimador
            posestratificado.


       Una comarca utilizará información de las comarcas más próximas hasta que
       alcance el tamaño muestral obtenido con dicha precisión.




 ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
ESTIMADOR SINTÉTICO-REGIÓN: Dinámico

                                          LZ-E   LZ-N    LZ-SO   FV-C   FV-N   …
                             LZ-E           1     5        3       4      3
 Las comarcas utilizarán     LZ-N           8     1        8       9      8

 información de aquellas     LZ-SO
                             FV-C
                                            5
                                            7
                                                  9
                                                  13
                                                           1
                                                           4
                                                                   3
                                                                   1
                                                                          2
                                                                          4
 comarcas con número de      FV-N           3     8        2       2      1

 cercanía más bajo.          FV-S
                             GC-Me
                                           10
                                           17
                                                  21
                                                  16
                                                           9
                                                           17
                                                                   5
                                                                  16
                                                                          9
                                                                         17
                             GC-CN         11     6        11     11     11
                             GC-NO         18     17       18     18     18
                             GC-O          20     20       20     20     20
                             GC-S           6     2        7       8      7
                             GC-SE          2     4        6       6      5
 Ej.: LZ-E inicialmente      TF-Ab
                             TF-Ac
                                            9
                                           12
                                                  7
                                                  10
                                                           10
                                                           12
                                                                  10
                                                                  12
                                                                         10
                                                                         12
 utilizará LZ-E (1) y        TF-Me         16     15       16     17     16

 posteriormente si precisa   TF-D
                             TF-I
                                           22
                                           19
                                                  22
                                                  19
                                                           22
                                                           19
                                                                  22
                                                                  19
                                                                         22
                                                                         19
 GC-SE (2), FV-N (3), TF-    TF-SO          4     3        5       7      6

 SO (4), …, LP-NO (27).      TF-VG
                             TF-VO
                                           14
                                           15
                                                  12
                                                  14
                                                           14
                                                           15
                                                                  14
                                                                  15
                                                                         14
                                                                         15
                             LG-N          26     26       26     26     26
                             LG-S          13     11       13     13     13
                             LP-Ca         21     18       21     21     21
                             LP-NE         24     24       24     24     24
                             LP-NO         27     27       27     27     27
                             LP-VA         25     25       25     25     25
                             EH            23     23       23     23     23


 ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
ESTIMADOR SINTÉTICO-REGIÓN: Dinámico


 Se distinguen entre dos posibilidades según la fijación de la precisión (ε ).

 Precisión constante
        La precisión, ε, se fija independientemente de la comarca, variable objetivo y
        sexo (entre el 1 y 4%).

 Precisión variable

        La precisión puede variar entre comarcas, variable objetivo y sexo.
        Se aplica inicialmente una rejilla de precisiones constantes entre el 1 y 4%,
        eligiendo para cada comarca, variable objetivo y sexo la que minimiza los
        errores cuadráticos medios de cada estimación. Finalmente se aplica el
        estimador con tales precisiones.



 ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
VALORACIÓN DE ESTIMADORES SOBRE SIMULACIONES: Resultados
sobre estimadores evaluados




 ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
VALORACIÓN DE ESTIMADORES SOBRE SIMULACIONES: Resultados
sobre estimadores evaluados

                                                      Hombres Ocupados

        13
        12
        11
        10
         9
         8
         7                                                                                              REMCM
         6                                                                                              SRAM
         5
         4
         3
         2
         1
         0
              Directo




                                   Sint_básico




                                                                                          Dinámico PV
                        Posestr.




                                                 1%


                                                        1,50%


                                                                1,75%


                                                                        2%


                                                                             2,50%


                                                                                     3%

                                                                                              Sint.
 ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
VALORACIÓN DE ESTIMADORES SOBRE SIMULACIONES: Resultados
sobre estimadores evaluados

                                                        Hombres Parados

           50
           45

           40
           35

           30
                                                                                                         REMCM
           25
                                                                                                         SRAM
           20

           15
           10
            5
            0
                Directo




                                     Sint_básico




                                                                                           Dinámico PV
                          Posestr.




                                                   1%


                                                         1,50%


                                                                 1,75%


                                                                         2%


                                                                              2,50%


                                                                                      3%

                                                                                               Sint.
 ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
VALORACIÓN DE                 ESTIMADORES:                 Comparación                 con     estimadores
suplementados                            Hombres Ocupados (r=1)

          12
                                             Menores errores
          10
                                              cuadráticos
          8
   REMC



          6
          4
          2
          0
                LZ            FV             GC            TF             LG            LP              EH

                Directo    Posestr.   Sint-bas    Comp1   Comp2   Comp3    Comp4       1%     2%   3%   PV
           12
           10
            8
            6
            4
            2
   SR




            0
           -2
           -4
           -6
           -8                                  Se mejoran los sesgos respecto a los
          -10                              compuestos pero quedan por encima del directo
          -12
                LZ             FV                GC         TF            LG             LP             EH

                 Directo   Posestr.   Sint-bas    Comp1   Comp2   Comp3        Comp4   1%     2%   3%   PV

 ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
VALORACIÓN DE                    ESTIMADORES:                 Comparación         con          estimadores
suplementados                               Hombres Parados (r=1)

           45
           40
           35
           30
    REMC

           25
           20
           15
           10
            5
            0
                 LZ              FV             GC            TF         LG           LP             EH

                      Directo   Posestr.   Sint-bas   Comp1   Comp2   Comp3   Comp4   1    2    3   PV
            45
            40
            35
            30
            25
            20
            15
   SR




            10
             5
             0
            -5
           -10
           -15
           -20
                 LZ              FV             GC            TF         LG           LP             EH

                      Directo   Posestr.   Sint-bas   Comp1   Comp2   Comp3   Comp4   1    2    3   PV


 ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
CALIBRADOS
 Las estimaciones
 Valores poblacionales




ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
CALIBRADO: Las estimaciones


       Las estimaciones comarcales, población ocupada y parada, son calibradas
       para cada sexo y provincia (reparto proporcional).
       La población inactiva comarcal es entonces calculada por diferencia con
       respecto al total poblacional de dicho dominio.
       Las estimaciones por islas son obtenidas por agregación de las comarcas que
       las componen.




       Las estimaciones a nivel de isla por grupo de edad (<25 y ≥25) son
       adicionalmente calibradas (método Calmar) a las estimaciones a nivel de isla y
       a las estimaciones provinciales por grupo de edad (<25 y ≥25).




 ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
CALIBRADO: Valores poblacionales


        La “Estimación de la Población Actual” (ePOBa) proporciona estimaciones de
        totales poblaciones por isla, sexo y grupo de edad (<25, 25-54, >54) a principio
        de cada año.
        Estos datos son ajustados en los diferentes trimestres (CalMar) a:
            Las estimaciones poblacionales por sexo a nivel de provincia suministrado por la
            correspondiente EPA, y a
            Los totales poblacionales por grupo de edad y sexo a nivel de Comunidad
            Autónoma.



        Finalmente los datos comarcales a nivel de grupo de edad por sexo
        proporcionados por el Padrón Municipal de Habitantes a 1 de enero del último
        año publicado, son ajustados (reparto proporcional) a los datos de islas por
        grupo de edad por sexo anteriormente ajustados.


 ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
CALIBRADO: Valores poblacionales

     Trimestre 1           Trimestre 2            Trimestre 3    Trimestre 4
          EPA                   EPA                    EPA            EPA
          C.A.                  C.A.                   C.A.           C.A.
      (sexo*edad)           (sexo*edad)            (sexo*edad)    (sexo*edad)
        Provincia             Provincia              Provincia      Provincia
         (sexo)                (sexo)                 (sexo)         (sexo)



        ePOBa
          isla                  isla                  isla
      (sexo*edad)           (sexo*edad)           (sexo*edad)




       Padrón
      Continuo                Comarca                Comarca
       Comarca              (sexo*edad)            (sexo*edad)
     (sexo*edad)




ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
ESTIMACIÓN DEL ERROR
 CUADRÁTICO MEDIO
 Método Jack-knife
 Método Bootstrap




ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
ESTIMACIÓN DEL ERROR CUADRÁTICO MEDIO: Método Jack-knife



       Se toman tantas submuestras como secciones censales existen. Cada una de
       ellas al dejar una sección fuera.
       Los pesos originales de los individuos de secciones que están en el estrato de
       la sección eliminada son modificados (factor          ).
       Se calculan las estimaciones para cada una de las submuestras exactamente
       igual que con la muestra original.
                                          H
                                             ⎛ nh − 1 nh ˆ sint_rd ˆ sint_rd 2                                            ⎞
              ˆ
             MSEJK (Yˆ
                         d
                          sint_rd
                                    ) = ∑⎜           ∑                                           ˆ
                                                                                                   ( h .)
                                                                                                             ˆ
                                                           (Yd ( hi ) − Yd ( h .) ) + ((nh − 1)(Ydsint_rd − Ydsint_rd ))2 ⎟
                                        h =1 ⎝ nh     i =1                                                                ⎠

       con Yd ( h .) d = ∑ i =1Yd ( hi ) d nh .
            ˆ sint_r            ˆ sint_r
                           nh




 ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
ESTIMACIÓN DEL ERROR CUADRÁTICO MEDIO: Método Bootstrap


       Las submuestras toman en cada estrato con nh secciones, nh-1 secciones
       mediante muestreo aleatorio simple con reemplazamiento.
       Los pesos originales de los individuos son modificados (factor mi nh /(nh-1),
       con mi número de veces que aparece la sección i en el muestreo).
       Este proceso se repite R veces (al menos R = 500).
       Se calculan las estimaciones para cada una de las submuestras exactamente
       igual que con la muestra original.

                    ˆ (Y sint_rd ) = 1
                                           R
                        ˆ
                   MSEB d                ∑ (Yˆdrsint_rd − Yˆdsint_rd )2 .
                                    R − 1 r =1


       Las valoraciones sobre simulaciones nos indican que el método Jack-knife es
       preferible sobre el método Bootstrap implementado (subestima).

 ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
CONCLUSIONES
 EPA insular y comarcal




ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
CONCLUSIONES: Sintético-región dinámico con precisión variable



       Ventajas

       Posee bajas variabilidades (estabilidad de la serie trimestral).
       Áreas con abundante muestra directa utilizan poca o ninguna muestra indirecta.
       Áreas con escasa muestra aprovechan la información indirecta (empezando por las
       áreas más próximas a la que se desea estimar).
       El proceso de asignación de información está separado del de estimación.
       Permite conocer y cambiar la estructura de asignación de información.
       La modificación de la regla de parada (elección de precisión) permite trabajar con un
       amplio abanico de posibilidades (ECM relativamente bajo con alto sesgo hasta ECM
       moderado con bajo sesgo)




 ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
CONCLUSIONES: Sintético-región dinámico con precisión variable


       Desventajas

       Necesidad de definir matrices de órdenes de cercanía entre comarcas para cada
       variable objetivo.
       Indicar periodo de vigencia de las matrices de órdenes (inferiores a cinco no serán
       necesarios, en particular, la intención es que coincidan con publicación del Censo).
       Los estimadores sintéticos no son insesgados. Si bien las pruebas indican que los ECM
       son de los más bajos.




 ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
RESULTADOS
 EPA insular y comarcal




ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
http://www2.gobiernodecanarias.org/istac/operacion.js
                    p?codigo=050.010.010&id=E30308B




ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
Los resultados en los informes del CES




 ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
Los resultados en Eurostat




 ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
RESULTADOS COMPARADOS
 EPA insular y comarcal




ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
RESULTADOS PROVISIONALES: Tasa paro hombre
                                       Paro hombre (CA, Las Palmas y S/C Tenerife)

18,0




16,0




14,0



                                                                                                                 0535000
12,0                                                                                                             0538000
                                                                                                                 0500000



10,0




 8,0




 6,0
       118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143
                                                        ciclo

       ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
RESULTADOS PROVISIONALES: Tasa paro hombre
                                          Paro Hombre (Las Palmas, LZ, FV y GC)

18,0



16,0



14,0



12,0                                                                                                             0535100
                                                                                                                 0535200
                                                                                                                 0535300
10,0                                                                                                             0535000




 8,0



 6,0



 4,0
       118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143
                                                        ciclo

       ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
RESULTADOS PROVISIONALES: Tasa paro hombre

                                        Paro Hombre (S/C Tenerife, Tf, LG, LP y EH)

18,0



16,0



14,0



12,0                                                                                                             0538400
                                                                                                                 0538500
                                                                                                                 0538600
                                                                                                                 0538700
10,0
                                                                                                                 0538000



 8,0



 6,0



 4,0
       118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143
                                                        ciclo
       ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
Resultados comparados: Afiliación versus Ocupados EPA (áreas
pequeñas)
               Afiliados a la Seguridad Social vs Ocupados según EPA en áreas pequeñas. 1T-05

                                                    Total                  Grupos de edad                         Sexo
                                                                        <25            >=25              Hombre           Mujer
               CANARIAS                        715.280 819.968     72.568 85.185 642.712 734.783     425.790 493.757 289.490 326.211
               LZ                               52.217 53.452       5.895 5.871 46.322      47.581    30.889 32.085 21.328 21.367
                 LZ-Este                        37.448 38.116       4.375    -    33.073     -        21.978 22.647 15.470 15.469
                 LZ-Norte                        8.318     8.789      707    -     7.611     -         4.942   5.245   3.376    3.543
                 LZ-Suroeste                     6.451     6.548      813    -     5.638     -         3.969   4.193   2.482    2.355
               FV                               37.759 36.440       4.459 4.037 33.300      32.403    22.571 22.410 15.188 14.030
                 FV-Centro                       3.506     3.620      379    -     3.127     -         2.239   2.266   1.267    1.353
                 FV-Norte                       20.649 19.739       2.372    -    18.277     -        12.297 11.953    8.352    7.786
                 FV-Sur                         13.604 13.082       1.708    -    11.896     -         8.035   8.190   5.569    4.892
               GC                              286.491 335.957     28.354 36.653 258.137 299.304     171.724 199.581 114.767 136.377
                 GC-Metropolitana              179.651 218.566     16.671    -   162.980     -       107.306 129.027 72.345 89.539
                 GC-Centro Norte                14.010 16.088       1.185    -    12.825     -         9.161   9.811   4.849    6.277
                 GC-Noroeste                    17.694 20.526       1.624    -    16.070     -        10.898 12.444    6.796    8.082
                 GC-Oeste                        4.772     4.985      524    -     4.248     -         2.698   3.042   2.074    1.943
                 GC-Sur                         26.426 27.956       3.096    -    23.330     -        15.716 16.898 10.710 11.058
                 GC-Sureste                     43.938 47.836       5.254    -    38.684     -        25.945 28.358 17.993 19.478
               TF                              303.225 347.076     30.867 34.310 272.358 312.765     179.269 210.265 123.956 136.811
                 TF-Abona                       23.020 24.754       2.701    -    20.319     -        13.295 15.230    9.725    9.524
                 TF-Acentejo                    20.807 23.863       2.185    -    18.622     -        13.412 14.822    7.395    9.041
                 TF-Área metropolitana         135.626 159.967     12.055    -   123.571     -        78.485 95.612 57.141 64.355
                 TF-Daute                        6.166     7.445      721    -     5.445     -         3.921   4.698   2.245    2.746
                 TF-Icod                        11.702 13.408       1.382    -    10.320     -         7.417   8.305   4.285    5.104
                 TF-Suroeste                    52.554 57.589       6.293    -    46.261     -        30.088 35.524 22.466 22.066
                 TF-Valle de Güímar             15.864 17.247       1.514    -    14.350     -         9.301 10.424    6.563    6.822
                 TF-Valle de La Orotava         37.486 42.802       4.016    -    33.470     -        23.350 25.650 14.136 17.153
               LG                                7.319     8.921      586    768   6.733     8.153     4.344   5.597   2.975    3.324
                 LG-Norte                        1.900     3.229      185    -     1.715     -         1.178   2.112     722    1.117
                 LG-Sur                          5.419     5.692      401    -     5.018     -         3.166   3.485   2.253    2.207
               LP                               25.009 34.173       2.122 3.190 22.887      30.983    15.051 21.285    9.958 12.888
                 LP-Capitalina                  10.996 13.899         861    -    10.135     -         6.480   8.512   4.516    5.388
                 LP-Noreste                      2.883     3.937      223    -     2.660     -         1.779   2.505   1.104    1.432
                 LP-Noroeste                     1.482     2.474      113    -     1.369     -           922   1.596     560      878
                 LP-Valle de Aridane             9.648 13.863         925    -     8.723     -         5.870   8.673   3.778    5.191
               EH                                3.260     3.949      285    355   2.975     3.594     1.942   2.534   1.318    1.415
               Fuente: Instituto Canario de Estadística (ISTAC)

 ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
Resultados comparados: Paro registrado versus                                                            parados EPA (áreas
pequeñas) Paro registrado vs parados EPA. Primer trimestre de 2006.
                                                Total             Grupos                             Sexo
                                                                    <25           >=25              Hombre             Mujer
               CANARIAS                         135.004 117.479    17.323 26.172 117.681   91.307    56.244   55.864   78.760   61.615
               LZ                                 6.158   6.864       653 1.594    5.504    5.270     2.749    3.727    3.408    3.137
                 LZ-Este                          4.569   5.134       499      -   4.071        -     2.015    2.837    2.555    2.297
                 LZ-Norte                           939     929        99      -     839        -       405      486      533      442
                 LZ-Suroeste                        650     802        55      -     594        -       329      404      320      398
               FV                                 4.950   5.236       589 1.194    4.361    4.043     2.260    2.609    2.690    2.627
                 FV-Centro                          481     501        43      -     438        -       226      266      254      234
                 FV-Norte                         2.834   3.159       368      -   2.466        -     1.220    1.511    1.614    1.648
                 FV-Sur                           1.635   1.577       178      -   1.457        -       814      832      822      745
               GC                                63.466 51.892      8.627 11.033 54.839    40.859    26.038   24.107   37.428   27.785
                 GC-Metropolitana                43.797 34.922      6.010      - 37.787         -    17.955   16.253   25.842   18.669
                 GC-Centro Norte                  2.511   1.832       311      -   2.201        -       985    1.009    1.527      823
                 GC-Noroeste                      4.384   3.059       641      -   3.742        -     1.750    1.393    2.633    1.666
                 GC-Oeste                           636     679        97      -     539        -       349      350      287      329
                 GC-Sur                           3.942   4.323       460      -   3.481        -     1.759    1.904    2.182    2.419
                 GC-Sureste                       8.196   7.077     1.107      -   7.089        -     3.240    3.198    4.956    3.879
               TF                                51.674 46.687      6.464 10.819 45.210    35.868    21.457   21.970   30.217   24.717
                 TF-Abona                         2.904   3.430       298      -   2.606        -     1.143    1.361    1.761    2.069
                 TF-Acentejo                      3.737   3.365       481      -   3.256        -     1.600    1.476    2.137    1.889
                 TF-Área metropolitana           25.224 22.554      3.279      - 21.944         -    10.599   10.708   14.625   11.845
                 TF-Daute                         1.360     927       195      -   1.165        -       601      465      758      462
                 TF-Icod                          2.991   1.665       357      -   2.634        -     1.199      907    1.792      758
                 TF-Suroeste                      5.756   7.048       578      -   5.178        -     2.380    3.413    3.376    3.634
                 TF-Valle de Güímar               2.534   2.134       306      -   2.229        -     1.018    1.087    1.516    1.047
                 TF-Valle de La Orotava           7.169   5.565       971      -   6.198        -     2.917    2.552    4.252    3.012
               LG                                 1.359   1.316       129    276   1.230    1.040       627      684      732      632
                 LG-Norte                           488     341        44      -     444        -       233      186      254      156
                 LG-Sur                             872     975        85      -     786        -       394      499      478      476
               LP                                 6.763   4.919       797 1.110    5.965    3.808     2.815    2.450    3.947    2.469
                 LP-Capitalina                    2.690   1.907       325      -   2.365        -     1.112      922    1.578      985
                 LP-Noreste                         630     501        65      -     565        -       245      260      386      241
                 LP-Noroeste                        601     350        56      -     546        -       308      197      293      152
                 LP-Valle de Aridane              2.841   2.161       352      -   2.490        -     1.151    1.070    1.691    1.091
               EH                                   634     564        63    145     570      419       297      316      337      248
               Fuente: Instituto Canario de Estadística

  ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
GRACIAS POR SU
 ATENCIÓN
 Más información:
 http:// www.gobiernodecanarias.org/istac
 http://www.slideshare.net/istac
 http://twitter.com/istac_es




ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS

Más contenido relacionado

Más de Instituto Canario de Estadística (ISTAC)

Análisis regional e insular de las predicciones de entradas de pasajeros en C...
Análisis regional e insular de las predicciones de entradas de pasajeros en C...Análisis regional e insular de las predicciones de entradas de pasajeros en C...
Análisis regional e insular de las predicciones de entradas de pasajeros en C...Instituto Canario de Estadística (ISTAC)
 
La estadística pública en la evaluación de políticas publicas. 2ª parte
La estadística pública en la evaluación de políticas publicas. 2ª parteLa estadística pública en la evaluación de políticas publicas. 2ª parte
La estadística pública en la evaluación de políticas publicas. 2ª parteInstituto Canario de Estadística (ISTAC)
 
La estadística pública en la evaluación de políticas: Introducción a la esta...
La estadística pública en la evaluación  de políticas: Introducción a la esta...La estadística pública en la evaluación  de políticas: Introducción a la esta...
La estadística pública en la evaluación de políticas: Introducción a la esta...Instituto Canario de Estadística (ISTAC)
 
Apuntes metodológicos de la Encuesta de Seguimiento de la Marca Turística de ...
Apuntes metodológicos de la Encuesta de Seguimiento de la Marca Turística de ...Apuntes metodológicos de la Encuesta de Seguimiento de la Marca Turística de ...
Apuntes metodológicos de la Encuesta de Seguimiento de la Marca Turística de ...Instituto Canario de Estadística (ISTAC)
 
Casos de uso de fuentes big data en las estadísticas económicas de Canarias
Casos de uso de fuentes big data en las estadísticas económicas de CanariasCasos de uso de fuentes big data en las estadísticas económicas de Canarias
Casos de uso de fuentes big data en las estadísticas económicas de CanariasInstituto Canario de Estadística (ISTAC)
 
REGIONAL TOURISM INFORMATION SYSTEM (R-TIS) OF THE CANARY ISLANDS . A strateg...
REGIONAL TOURISM INFORMATION SYSTEM (R-TIS) OF THE CANARY ISLANDS. A strateg...REGIONAL TOURISM INFORMATION SYSTEM (R-TIS) OF THE CANARY ISLANDS. A strateg...
REGIONAL TOURISM INFORMATION SYSTEM (R-TIS) OF THE CANARY ISLANDS . A strateg...Instituto Canario de Estadística (ISTAC)
 
SISTEMA REGIONAL DE ESTADÍSTICAS DE TURISMO. Una aproximación estratégica
SISTEMA REGIONAL DE ESTADÍSTICAS DE TURISMO. Una aproximación estratégicaSISTEMA REGIONAL DE ESTADÍSTICAS DE TURISMO. Una aproximación estratégica
SISTEMA REGIONAL DE ESTADÍSTICAS DE TURISMO. Una aproximación estratégicaInstituto Canario de Estadística (ISTAC)
 

Más de Instituto Canario de Estadística (ISTAC) (20)

Sistema de Datos Integrados (iDatos) - capacidades analíticas
Sistema de Datos Integrados (iDatos) - capacidades analíticasSistema de Datos Integrados (iDatos) - capacidades analíticas
Sistema de Datos Integrados (iDatos) - capacidades analíticas
 
Turismo Canarias 2018. Islas
Turismo Canarias 2018. IslasTurismo Canarias 2018. Islas
Turismo Canarias 2018. Islas
 
Crecimiento vegetativo
Crecimiento vegetativoCrecimiento vegetativo
Crecimiento vegetativo
 
Indicadores para politicas publicas
Indicadores para politicas publicasIndicadores para politicas publicas
Indicadores para politicas publicas
 
Presentacion chatbot istac
Presentacion chatbot istacPresentacion chatbot istac
Presentacion chatbot istac
 
[Jecas2018] entorno de computo estadistico en e datos
[Jecas2018] entorno de computo estadistico en e datos[Jecas2018] entorno de computo estadistico en e datos
[Jecas2018] entorno de computo estadistico en e datos
 
[Jecas2018] marco de desarrollo del sistema de datos integrados de canarias
[Jecas2018] marco de desarrollo del sistema de datos integrados de canarias[Jecas2018] marco de desarrollo del sistema de datos integrados de canarias
[Jecas2018] marco de desarrollo del sistema de datos integrados de canarias
 
[Jecas2018] marco de estadistica espacial de canarias
[Jecas2018] marco de estadistica espacial de canarias[Jecas2018] marco de estadistica espacial de canarias
[Jecas2018] marco de estadistica espacial de canarias
 
Matrimonios. 2015
Matrimonios. 2015Matrimonios. 2015
Matrimonios. 2015
 
Nombres más comunes entre recién nacidos. 2016
Nombres más comunes entre recién nacidos. 2016Nombres más comunes entre recién nacidos. 2016
Nombres más comunes entre recién nacidos. 2016
 
201807 gobcan jordanas datos abiertos
201807  gobcan   jordanas datos abiertos 201807  gobcan   jordanas datos abiertos
201807 gobcan jordanas datos abiertos
 
Análisis regional e insular de las predicciones de entradas de pasajeros en C...
Análisis regional e insular de las predicciones de entradas de pasajeros en C...Análisis regional e insular de las predicciones de entradas de pasajeros en C...
Análisis regional e insular de las predicciones de entradas de pasajeros en C...
 
La estadística pública en la evaluación de políticas publicas. 2ª parte
La estadística pública en la evaluación de políticas publicas. 2ª parteLa estadística pública en la evaluación de políticas publicas. 2ª parte
La estadística pública en la evaluación de políticas publicas. 2ª parte
 
La estadística pública en la evaluación de políticas: Introducción a la esta...
La estadística pública en la evaluación  de políticas: Introducción a la esta...La estadística pública en la evaluación  de políticas: Introducción a la esta...
La estadística pública en la evaluación de políticas: Introducción a la esta...
 
Apuntes metodológicos de la Encuesta de Seguimiento de la Marca Turística de ...
Apuntes metodológicos de la Encuesta de Seguimiento de la Marca Turística de ...Apuntes metodológicos de la Encuesta de Seguimiento de la Marca Turística de ...
Apuntes metodológicos de la Encuesta de Seguimiento de la Marca Turística de ...
 
Casos de uso de fuentes big data en las estadísticas económicas de Canarias
Casos de uso de fuentes big data en las estadísticas económicas de CanariasCasos de uso de fuentes big data en las estadísticas económicas de Canarias
Casos de uso de fuentes big data en las estadísticas económicas de Canarias
 
REGIONAL TOURISM INFORMATION SYSTEM (R-TIS) OF THE CANARY ISLANDS . A strateg...
REGIONAL TOURISM INFORMATION SYSTEM (R-TIS) OF THE CANARY ISLANDS. A strateg...REGIONAL TOURISM INFORMATION SYSTEM (R-TIS) OF THE CANARY ISLANDS. A strateg...
REGIONAL TOURISM INFORMATION SYSTEM (R-TIS) OF THE CANARY ISLANDS . A strateg...
 
SISTEMA REGIONAL DE ESTADÍSTICAS DE TURISMO. Una aproximación estratégica
SISTEMA REGIONAL DE ESTADÍSTICAS DE TURISMO. Una aproximación estratégicaSISTEMA REGIONAL DE ESTADÍSTICAS DE TURISMO. Una aproximación estratégica
SISTEMA REGIONAL DE ESTADÍSTICAS DE TURISMO. Una aproximación estratégica
 
Entidades y núcleos turísticos. estadísticas asociadas
Entidades y núcleos turísticos. estadísticas asociadasEntidades y núcleos turísticos. estadísticas asociadas
Entidades y núcleos turísticos. estadísticas asociadas
 
Jornada OpenData La Palma: Generando valor y transparencia
Jornada OpenData La Palma: Generando valor y transparenciaJornada OpenData La Palma: Generando valor y transparencia
Jornada OpenData La Palma: Generando valor y transparencia
 

ESTADISTICAS POR ISLAS: Estimacion en areas pequeñas

  • 1. INFRAESTRUCTURA ESTADÍSTICA ESTADÍSTICAS POR ISLAS Estimación en áreas pequeñas ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 2. INFRAESTRUCTURA ESTADÍSTICA ESTADÍSTICAS POR ISLAS Estimación en áreas pequeñas Alberto González Yanes jgonyanp@gobiernodecanarias.org ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 3. ESTADÍSTICAS POR ISLAS Estrategia de producción de información en áreas pequeñas ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 4. Necesidades de información insular, comarcal y local INSULAR COMARCAL LOCAL ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 5. Estrategia de producción de datos: El empleo a modo de ejemplo AREAS REGISTROS PEQUEÑAS ADMINISTRATIVOS Encuesta de Estadística de Afiliación Población Activa a la Seguridad Social Estadística de Accidentes de Trabajo Estadística de Empresas Inscritas en la Seguridad Social (…) ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 6. ESTIMACIÓN EN ÁREAS PEQUEÑAS PARA LA EPA Reseña histórica del trabajo realizado ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 7. ESTIMACIÓN EN ÁREAS PEQUEÑAS: Reseña histórica del trabajo realizado El Instituto Canario de Estadística (ISTAC) se incorpora al grupo de trabajo de áreas pequeñas del INE desde sus inicios en abril de 2004. Participan otros institutos autonómicos: Cataluña, Madrid y Navarra, y posteriormente: Galicia, País Vasco, Baleares, Andalucía y Valencia. Se crea un grupo de trabajo de apoyo en el Departamento de Estadística, Investigación Operativa y Computación (ULL), firmando el proyecto “Estimadores en Áreas Pequeñas aplicados a la Estadística Pública Canaria (CANAREA 2005)” y posteriormente CANAREA 2006 y 2007, con la idea de cubrir los objetivos de: Responder a los requerimientos del grupo de trabajo sobre áreas pequeñas del Instituto Nacional de Estadística, e Incorporar los desarrollos técnicos y metodológicos a la práctica estadística del Instituto Canario de Estadística. ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 8. ESTIMACIÓN EN ÁREAS PEQUEÑAS: Reseña histórica del trabajo realizado El grupo de trabajo propone utilizar la Encuesta de Población Activa (EPA) en la evaluación de los estimadores de áreas pequeñas. Se construye un simulador de realizaciones de EPA partiendo de la población suministrada por el Censo de Población y Viviendas del 2001. Esto permite conocer los valores reales que se desean estimar y evaluar el rendimiento de los estimadores planteados. CANAREA 2005 evalúa también la posibilidad de utilización de muestra suplementaria (muestreo aleatorio simple de viviendas en las áreas pequeñas tras afijación uniforme). ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 9. ESTIMACIÓN EN ÁREAS PEQUEÑAS: Reseña histórica del trabajo realizado Una breve reseña de los trabajos realizados y la metodología final para la estimación en pequeñas áreas de Canarias se puede encontrar en la publicación del ISTAC. En esa misma publicación se pueden encontrar, a modo de ejemplo, resultados anuales por islas para los años 2005, 2006 y 2007. Los resultados detallados, con carácter provisional, son publicados por el ISTAC en formato pc-axis y difundidos en la web y en CD. ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 10. ENCUESTA DE POBLACIÓN ACTIVA (EPA) Descripción de la encuesta ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 11. LA ENCUESTA DE POBLACIÓN ACTIVA: Descripción de la encuesta Ofrece información del mercado laboral a nivel de comunidad autónoma y provincia. Periodicidad trimestral. Muestreo bietápico con estratificación en primera etapa (secciones censales y viviendas). 104 y 91 secciones en Las Palmas y S/C de Tenerife. 18 viviendas por sección. Se renueva la sexta parte cada trimestre (paneles). Utiliza estimadores directos de razón con pesos calibrados, wj , según: población de 16 y más años por grupo de edad y sexo (22 grupos) a nivel de CA, población de 16 y más años por provincia Las variables de interés en áreas pequeñas son: Totales de ocupados, parados e inactivos Tasas de ocupación, actividad y paro ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 12. ENCUESTA DE POBLACIÓN ACTIVA Estimaciones de interés para Canarias ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 13. ENCUESTA DE POBLACIÓN ACTIVA: Estimaciones de interés para Canarias Pequeñas Áreas de interés para Canarias y requerimiento de información El nivel NUT 3 (Reglamento Nº 105/2007) considera las islas en lugar de las provincias. Para la Comunidad Autónoma es además de interés suministrar información a nivel de comarcas por sexo. 12 y 15 en Las Palmas y S/C de Tenerife respectivamente. Eurostat solicita información a nivel de isla por sexo y dos grupos de edades (<25 y ≥25). Los métodos planteados y evaluados van en la línea de proporcionar buenas estimaciones por comarcas y, posteriormente comprobar si la agregación proporciona buenas estimaciones a nivel de islas. Los inactivos son calculados por diferencia del tamaño poblacional con respecto a las estimaciones de activos. ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 14. EVALUACIÓN DE ESTIMADORES Simulador de EPA Estimadores Indicadores de rendimiento ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 15. SIMULADOR DE LA ENCUESTA DE POBLACIÓN ACTIVA Un simulador Se construye un programa que simula la extracción de realizaciones de EPA (igual diseño) a partir del Censo 2001. Se generan 1000 simulaciones. Con el simulador evaluamos diferentes estimadores a través de indicadores de rendimiento. Notación para estimadores e indicadores de rendimiento wj : peso del diseño al individuo j en la EPA. d: dominio a estimar (área pequeña*sexo). g: niveles de variable de estratificación (grupo de edad, <25; 25-54; >54). r: región formada por unión de dominios “homogéneos”. y: variable objetivo (p.e., 1 sí parado, 0 no parado). Nd: tamaño poblacional del dominio d. ˆ ˆ ( Nd : estimación HT de la población en el dominio d . Nd = ∑ j∈EPA w j . d ) ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 16. ESTIMADORES: Estimadores basados en el diseño Estimación Directa Estimación Indirecta Información sólo del área pequeña Se incorpora Información de otras áreas (Directo, Pos-estratificado) (Sintético básico, sintético región) ˆ Compuesto = λd ydpost + (1 − λd ) yd yd ˆ ˆ sint Estimadores basados en modelos Modelos de individuos Modelos de áreas Se utiliza información a nivel de individuo Se utiliza información a nivel de área de de variables auxiliares variables auxiliares (EBLUP-A, Sintético-regresión) (EBLUP-B, Sintético-regresión) YdEBLUP = γ d yd ˆ directo + ( 1 − γ d )Ydsint-regr ˆ ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 17. ESTIMADORES EVALUADOS: Estimadores basados en el diseño Directo ∑wy j j ˆ direct ˆ y direct = j∈EPAd Nd y su media ˆ direct = y d yd ∑w d j Nd j∈EPAd Posestratificado: suma ponderada de los estimadores directos de la media en los grupos de estratificación. y dpost = ∑ y dg Ndg ˆ ˆ direct g Sintético: suma ponderada de los estimadores directos de la media en los grupos de estratificación en una región r. Si r es la provincia: sintético-básico. ∑ w jy j y d = ∑ y rdirect Ndg = ∑ ˆ, j∈EPAr ,g ˆ sint Ndg Si r es el dominio: posestratificado. ∑ g g g wj Otro caso: sintético-región. j∈EPAr ,g ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 18. ESTIMADORES EVALUADOS: Estimadores basados en el diseño Compuesto dependiente del diseño: combinación convexa del estimador posestratificado y del sintético. λd = 1 ˆ si Nd ≥ α Nd ˆ y dep = λd y ˆ post + (1 − λd ) y ˆ sint d d d ˆ λd = Nd /(α Nd ) otro caso Los valores de α se fijan a 2/3, 1, 1.5 y 2, constituyendo lo que denominaremos como compuesto 1, 2, 3 y 4, respectivamente. Propiedades Los estimadores directos y posestratificados son insesgados, aunque generalmente con altísimas varianzas (poca muestra). El estimador sintético suele presentar grandes sesgo (utilización de muestra indirecta) y pequeñas variabilidades (muestras grandes). Los estimadores compuestos intentan aprovechar las cualidades buenas de los directos y sintéticos. La determinación del parámetro λ es crucial. ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 19. ESTIMADORES EVALUADOS: Estimadores basados en modelo Nivel de área: modelos lineales generales mixtos, en el proyecto EURAREA se denota como modelo B o modelo de Fay-Herriots. θˆd = x d β + υd + ed ′ ˆ con θd una función del estimador directo, x d = ( x1d ,K, x pd )′ los valores para el dominio d de las p variables auxiliares consideradas, υd efectos aleatorios del dominio d ( N (0,σ υ ) ) 2 y ed los errores muestrales ( N (0,σ e2 / Nd ) ). Estimadores: EBLUP y sintético-regresión. ˆ ′ ˆ Ydsint-regr = x d β ˆ ˆ ˆ YdEBLUP = γ dYddirecto + (1 − γ d )Ydsint-regr con γ d = σ υ (σ υ + σ e2 Nd ) . ˆ2 ˆ2 ˆ ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 20. ESTIMADORES: Error en la estimación VARIANZA SESGO ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 21. INDICADORES DE RENDIMIENTO Sesgo relativo (SR): 1 Sim y d (k ) − Yd ˆ SRd ( y ) = ˆ ∑ Y 100 Sim k =1 d Media del sesgo relativo absoluto (SRAM): 1 SRAM ( y ) = ˆ ∑ SRd ( yˆ ) D d Error cuadrático medio relativo (REMC): 12 ⎛ 1 Sim ⎛ y (k ) − Y ⎞2 ⎞ ˆd ˆ) = ⎜ REMCd ( y ∑ ⎜ Y d ⎟ ⎟ 100 ⎜ Sim k =1 ⎝ ⎝ d ⎠ ⎟⎠ Media del error cuadrático medio relativo (REMCM): 1 REMCM ( y ) = ˆ ∑ REMCd ( yˆ ) D d ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 22. ESTIMADORES E INDICADORES DE RENDIMIENTO ECM varianza varianza varianza sesgo2 sesgo2 sesgo2 Sintético Posestratificado Compuesto4 Compuesto1 ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 23. INDICADORES DE RENDIMIENTO: Selección del mejor estimador Criterio más usual de elección de un estimador es el de tomar aquel con menor error cuadrático e insesgado. EMC varianza varianza varianza sesgo2 sesgo2 sesgo2 ¿Problema temporal con la variabilidad? Sugerencia: Elegir estimadores con variabilidades próximas a las de la estimación a nivel de provincia. ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 24. CANAREA 2005 Influencia de muestra suplementaria ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 25. CANARERA 2005: Simulación de muestra suplementaria Se simula la utilización de muestra suplementaria, aumentando el número de viviendas en una fracción r sobre el número total de viviendas de la EPA, 3042 viviendas, seleccionadas por muestreo aleatorio simple dentro de cada área pequeña tras un reparto uniforme entre ellas. (r igual al 0%, 50%,75%,80% y 100%). Estimador directo con muestra suplementada: ∑wy j∈EPA j j + ∑ vy i∈SUP i i yd = ˆ direct Nd ∑ w j∈EPAd j + ∑v i∈SUPd i ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 26. CANAREA 2005: Influencia muestra suplementaria r=0 r=0 25 9 6 20 3 15 REMC 0 SR 10 -3 -6 5 -9 0 -12 EH LG FV LP LZ TF GC EH LG FV LP LZ TF GC Directo Posestr Sintético Comp1 Comp2 Comp3 Comp4 Directo Posestr Sintético Comp1 Comp2 Comp3 Comp4 Error Cuadrático Medio Relativo (REMC) y Sesgo Relativo (SR) para hombres ocupados con la EPA original (r =0). Se utilizan 1000 simulaciones. • Sin muestra suplementaria: el sintético y el compuesto 4 son los mejores, si bien ambos con los peores sesgos. Con sesgos más pequeños y con errores cuadráticos próximos a estos dos, se sitúan los dos primeros compuestos así como el posestratificado ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 27. CANAREA 2005: Influencia muestra suplementaria 9 16 8 14 7 12 6 REMCM 10 SRAM 5 8 4 6 3 4 2 2 1 0 0 0 0.5 0.75 0.8 1 0 0.5 0.75 0.8 1 Directo Posestr Sintético Comp1 Comp2 Comp3 Comp4 Directo Posestr Sintético Comp1 Comp2 Comp3 Comp4 Media del Error Cuadrático Medio Relativo (REMCM) y Sesgo Relativo Absoluto (SRAM) para hombres ocupados con la EPA original (r = 0) y suplementada (r =0’5, 0’75, 0’80 y 1). Se utilizan 1000 simulaciones. • Con muestra suplementaria El aumento por encima del 50% de fracción de muestreo no produce cambios significativos. LA SUPLEMENTACIÓN DE MUESTRA REDUCE LA VARIABILIDAD, PERO NO EL SESGO ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 28. CANAREA 2005: Influencia muestra suplementaria r=0 r=0 25 9 6 20 3 15 REMC 0 SR 10 -3 -6 5 -9 0 -12 EH LG FV LP LZ TF GC EH LG FV LP LZ TF GC Directo Posestr Sintético Comp1 Comp2 Comp3 Comp4 Directo Posestr Sintético Comp1 Comp2 Comp3 Comp4 r=1 r=1 25 9 6 20 3 15 0 REMC SR -3 10 -6 5 -9 0 -12 EH LG FV LP LZ TF GC EH LG FV LP LZ TF GC Directo Posestr Sintético Comp1 Comp2 Comp3 Comp4 Directo Posestr Sintético Comp1 Comp2 Comp3 Comp4 • Con muestra suplementaria se reducen todos los errores cuadráticos con la excepción del sintético básico, pero este sigue manteniendo los mejores errores cuadráticos ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 29. CANAREA 2005: Conclusiones El estimador sintético básico Menores variabilidades. Mayores sesgos (agravándose en comarcas e islas con peculiaridades en la actividad económica –por ejemplo las turísticas-). El sesgo se reduce con la utilización de estimadores compuestos, a costa de aumentar variabilidad. En la mayoría de las comarcas, el error cuadrático medio relativo sigue siendo de los más pequeños, incluso después de la utilización de muestra suplementaria. La realización de encuesta suplementaria es caro y estratégicamente difícil. ¿Podremos aprovechar las buenas propiedades que tiene este estimador tomando información de otras áreas distintas a la provincia? ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 30. ESTIMADOR SINTÉTICO REGIÓN Estático y dinámico ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 31. ESTIMADOR SINTÉTICO-REGIÓN: Construcción de regiones Se propone (Rao 2003, pag. 46) construcción de regiones, uniones de comarcas, que presenten comportamiento homogéneo en cuanto a las variables objetivo a estudiar. Se ha distinguido entre hombre ocupado, mujer ocupada, hombre parado o mujer parada. Las variables auxiliares utilizadas en la construcción de las regiones fueron: Información censal (Censo de Población y Viviendas de 2001). Utilización de variables homónimas del Censo. Registros administrativos (empleo registrado, para registrado,…). La construcción utilizó técnicas de análisis cluster (K-medias o jerárquicos) sobre los dominios. Regiones estáticas: los dominios pertenecientes a un mismo cluster comparten su información (entre 2 y 5 clusters parece ser adecuado). Denotamos por C2, C3, C4, … Valoración a posteriori del error cuadrático y sesgo (simulación). ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 32. ESTIMADOR SINTÉTICO-REGIÓN: Construcción de regiones Construcción de regiones a partir del Censo 2001 Para cada variable Hombres Ocupados objetivo por sexo se han considerado las correspondientes del Censo 2001 desagregada por grupo de edad y relativizadas por el total comarcal de dicho sexo. Mujeres Ocupadas ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 33. ESTIMADOR SINTÉTICO-REGIÓN: Construcción de regiones Construcción de regiones a partir de registros administrativos Partiendo de las variables auxiliares: Empleo Total (agrario, industria, construcción y servicio), Empleo por Cuenta Ajena (agrario, industria, construcción y servicio), Empleo por Cuenta Propia (agrario, industria, construcción y servicio), Paro total (hombre, mujer, mayor 25 años, agrario, industria, construcción y servicio) y Contratos (hombres, mujeres, indefinidos, temporal, agrario, industria, construcción y servicio). Se han relativizado a los tamaños comarcales. Se han seleccionado distintos modelos (utilizando la información del año 2001 para buscar relaciones con variables objetivo del Censo 2001). ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 34. ESTIMADOR SINTÉTICO-REGIÓN: Construcción de regiones Censo 2001 vs Registros administrativos Variables homónimas: Ventajas Variables automáticamente definidas. Estabilidad temporal. Inconvenientes: Revisión sólo cada 10 años. Diferencia de definición de conceptos EPA y Censo. Registros administrativos: Ventajas Posibilidad de reflejar cambios bruscos si el periodo de vigencia de las regiones es relativamente corto. Inconvenientes: Elección del modelo (variables). Periodo de vigencia de regiones. Falta de estabilidad temporal. ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 35. ESTIMADOR SINTÉTICO-REGIÓN: Construcción de regiones Censo 2001 vs Registros administrativos Ocupados Hombres Mujeres Se ha comprobado la Censal 2001 2002 2003 2004 2005 Censal 2001 2002 2003 2004 2005 evolución de las regiones a LZ-E LZ-N 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 través de las variables de LZ-SO 1 1 1 1 1 1 1 1 1 1 1 1 FV-C 1 1 1 1 1 1 1 1 1 1 1 1 registros administrativos FV-N 1 1 1 1 1 1 1 1 1 1 1 1 para los años disponibles FV-S GC-Me 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 (2001-2005) GC-CN 2 2 2 2 2 2 2 2 2 2 2 2 comparándolas con las GC-NO 2 2 2 2 2 2 2 2 2 2 2 2 GC-O 2 2 2 2 2 2 2 2 2 2 2 2 obtenidas con las variables GC-S GC-SE 1 1 1 2 1 1 1 1 1 1 1 1 1 1 1 2 1 2 1 2 1 1 1 1 homónimas del Censo. TF-Ab 1 1 1 1 1 1 1 2 2 2 1 1 TF-Ac 2 2 2 2 2 2 2 2 2 2 2 2 TF-Me 2 2 2 2 1 2 2 2 2 2 1 1 TF-D 2 2 2 2 2 2 2 2 2 2 2 2 En general, cuando el TF-I 2 2 2 2 2 2 2 2 2 2 2 2 TF-SO 1 1 1 1 1 1 1 1 1 1 1 1 número de regiones a TF-VG TF-VO 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 constituir es relativamente LG-N 2 2 2 2 2 2 2 2 2 2 2 2 pequeño suele producir LG-S LP-Ca 2 2 2 2 1 2 1 2 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 resultados muy similares. LP-NE 2 2 2 2 2 2 2 2 2 2 2 2 LP-NO 2 2 2 2 2 2 2 2 2 2 2 2 LP-VA 2 2 2 2 2 2 2 2 2 2 2 2 EH 2 2 2 2 2 2 2 2 2 2 2 2 ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 36. ESTIMADOR SINTÉTICO-REGIÓN: Construcción de regiones ¿Cuántas regiones construimos? Ocupados Parados REMCM SRAM REMCM SRAM Datos provinciales H M H M H M H M Directo 11,76 19,90 1,47 2,83 43,40 47,02 3,51 2,23 con variabilidades Posestrat. 10,50 18,29 1,40 2,39 44,42 46,84 3,85 2,14 Sintético 6,76 13,77 6,07 13,03 21,96 20,08 19,15 17,71 para ocupados entre un 2 y 3% y para Sint_C2 4,82 8,96 3,79 7,39 16,54 14,08 12,66 8,31 Sint_C3 4,98 8,37 3,19 6,18 17,97 14,76 9,95 8,31 parados en torno al Sint_C4 4,95 8,01 2,80 5,24 15,35 15,88 6,98 7,24 Sint_C5 5,67 9,70 2,87 5,51 15,51 18,19 5,53 7,23 7%. Sint_C6 5,47 9,13 2,43 4,70 19,08 17,34 5,62 6,92 Sint_C7 5,75 8,67 2,47 5,34 20,46 20,78 5,44 6,31 Se ha constatado sobre EPA reales El sesgo se reduce con el (2001-2005) y tasa de aumento de regiones paro que C4, produce una excesiva variabilidad entre El error cuadrático medio se trimestre ( >8% entre reduce con el aumento de REMCM y SRAM). regiones ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 37. ESTIMADOR SINTÉTICO-REGIÓN: Resultados con sintético-región estático 14 12 10 REMCM 8 6 4 2 0 Directo Posestrat. Sintético Sint_C2 Sint_C3 Sint_C4 Sint_C5 Sint_C6 Sint_C7 14 12 10 SRAM 8 6 4 2 0 Directo Poses trat. Sintético Sint_C2 Sint_C3 Sint_C4 Sint_C5 Sint_C6 Sint_C7 ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 38. ESTIMADOR SINTÉTICO-REGIÓN: Resultados con sintético-región estático Hombres Ocupados Hombres Ocupados 25 10 20 5 15 REMC 0 SR 10 -5 5 -10 0 -15 LZ FV GC TF LG LP EH LZ FV GC TF LG LP EH Directo Posestrat Sintético 2-2-2-2 3-3-4-2 Directo Posestrat Sintético 2-2-2-2 3-3-4-2 Hombres Parados Hombres Parados 70 Bajan los errores cuadráticos respecto del 65 45 60 55 postestratificado 40 35 Bajan los sesgos respecto del 50 30 45 25 20 sintético básico REMC 40 15 SR 35 30 10 25 5 20 0 15 -5 10 -10 5 -15 0 -20 LZ FV GC TF LG LP EH LZ FV GC TF LG LP EH Directo Posestrat Sintético 2-2-2-2 3-3-4-2 Directo Posestrat Sintético 2-2-2-2 3-3-4-2 ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 39. ESTIMADOR SINTÉTICO-REGIÓN: Dinámico En las regiones estáticas todas las comarcas de una misma región prestan y toman prestada la información que poseen. Si bien los resultados son aceptables, parece más lógico proponer regiones “borrosas” (fuzzy), donde una comarcas A pueda compartir su información con una comarca B y no necesariamente al revés. (Ej. GC-Me pueda prestar y no necesariamente tomar prestada información de otras comarcas). Se proponen regiones dinámicas La idea es similar a la que subyace en los estimadores compuestos. Aprovechar la información directa y cuando no es suficiente pedir prestada (“Borrowing strengh”) información auxiliar. Se intenta conseguir un equilibrio entre la variabilidad y el sesgo intentando mantener un ECM bajo. ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 40. ESTIMADOR SINTÉTICO-REGIÓN: Dinámico Utilizando distancias, por ejemplo la euclídea, se definen matrices de órdenes de cercanía entre las distintas comarcas. En la estimación de una comarca, si se precisa muestra adicional se tomará de las comarcas más próximas. El método de parada en la utilización de información de las comarcas vecinas, emplea una versión simplificada del cálculo del tamaño muestral necesario que debería tener una comarca con una determinada precisión, Se ha fijado: zα 2P (1 − P )N 2 • zα 2 a 1.96. n= ε (N − 1) + zα 2P (1 − P ) 2 2 • P a 0.20 • ε entre el 1 y 4%. ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 41. ESTIMADOR SINTÉTICO-REGIÓN: Dinámico La interpretación de ε puede variar con respecto a su interpretación estándar. Valores pequeños de ε, muestras grandes, posibilita la utilización de información de comarcas más alejadas, y Valores grandes, muestras pequeñas, que tiene pocos vecinos relativamente próximos o no precisa más muestra. En el límite sólo muestra directa, el estimador posestratificado. Una comarca utilizará información de las comarcas más próximas hasta que alcance el tamaño muestral obtenido con dicha precisión. ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 42. ESTIMADOR SINTÉTICO-REGIÓN: Dinámico LZ-E LZ-N LZ-SO FV-C FV-N … LZ-E 1 5 3 4 3 Las comarcas utilizarán LZ-N 8 1 8 9 8 información de aquellas LZ-SO FV-C 5 7 9 13 1 4 3 1 2 4 comarcas con número de FV-N 3 8 2 2 1 cercanía más bajo. FV-S GC-Me 10 17 21 16 9 17 5 16 9 17 GC-CN 11 6 11 11 11 GC-NO 18 17 18 18 18 GC-O 20 20 20 20 20 GC-S 6 2 7 8 7 GC-SE 2 4 6 6 5 Ej.: LZ-E inicialmente TF-Ab TF-Ac 9 12 7 10 10 12 10 12 10 12 utilizará LZ-E (1) y TF-Me 16 15 16 17 16 posteriormente si precisa TF-D TF-I 22 19 22 19 22 19 22 19 22 19 GC-SE (2), FV-N (3), TF- TF-SO 4 3 5 7 6 SO (4), …, LP-NO (27). TF-VG TF-VO 14 15 12 14 14 15 14 15 14 15 LG-N 26 26 26 26 26 LG-S 13 11 13 13 13 LP-Ca 21 18 21 21 21 LP-NE 24 24 24 24 24 LP-NO 27 27 27 27 27 LP-VA 25 25 25 25 25 EH 23 23 23 23 23 ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 43. ESTIMADOR SINTÉTICO-REGIÓN: Dinámico Se distinguen entre dos posibilidades según la fijación de la precisión (ε ). Precisión constante La precisión, ε, se fija independientemente de la comarca, variable objetivo y sexo (entre el 1 y 4%). Precisión variable La precisión puede variar entre comarcas, variable objetivo y sexo. Se aplica inicialmente una rejilla de precisiones constantes entre el 1 y 4%, eligiendo para cada comarca, variable objetivo y sexo la que minimiza los errores cuadráticos medios de cada estimación. Finalmente se aplica el estimador con tales precisiones. ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 44. VALORACIÓN DE ESTIMADORES SOBRE SIMULACIONES: Resultados sobre estimadores evaluados ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 45. VALORACIÓN DE ESTIMADORES SOBRE SIMULACIONES: Resultados sobre estimadores evaluados Hombres Ocupados 13 12 11 10 9 8 7 REMCM 6 SRAM 5 4 3 2 1 0 Directo Sint_básico Dinámico PV Posestr. 1% 1,50% 1,75% 2% 2,50% 3% Sint. ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 46. VALORACIÓN DE ESTIMADORES SOBRE SIMULACIONES: Resultados sobre estimadores evaluados Hombres Parados 50 45 40 35 30 REMCM 25 SRAM 20 15 10 5 0 Directo Sint_básico Dinámico PV Posestr. 1% 1,50% 1,75% 2% 2,50% 3% Sint. ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 47. VALORACIÓN DE ESTIMADORES: Comparación con estimadores suplementados Hombres Ocupados (r=1) 12 Menores errores 10 cuadráticos 8 REMC 6 4 2 0 LZ FV GC TF LG LP EH Directo Posestr. Sint-bas Comp1 Comp2 Comp3 Comp4 1% 2% 3% PV 12 10 8 6 4 2 SR 0 -2 -4 -6 -8 Se mejoran los sesgos respecto a los -10 compuestos pero quedan por encima del directo -12 LZ FV GC TF LG LP EH Directo Posestr. Sint-bas Comp1 Comp2 Comp3 Comp4 1% 2% 3% PV ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 48. VALORACIÓN DE ESTIMADORES: Comparación con estimadores suplementados Hombres Parados (r=1) 45 40 35 30 REMC 25 20 15 10 5 0 LZ FV GC TF LG LP EH Directo Posestr. Sint-bas Comp1 Comp2 Comp3 Comp4 1 2 3 PV 45 40 35 30 25 20 15 SR 10 5 0 -5 -10 -15 -20 LZ FV GC TF LG LP EH Directo Posestr. Sint-bas Comp1 Comp2 Comp3 Comp4 1 2 3 PV ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 49. CALIBRADOS Las estimaciones Valores poblacionales ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 50. CALIBRADO: Las estimaciones Las estimaciones comarcales, población ocupada y parada, son calibradas para cada sexo y provincia (reparto proporcional). La población inactiva comarcal es entonces calculada por diferencia con respecto al total poblacional de dicho dominio. Las estimaciones por islas son obtenidas por agregación de las comarcas que las componen. Las estimaciones a nivel de isla por grupo de edad (<25 y ≥25) son adicionalmente calibradas (método Calmar) a las estimaciones a nivel de isla y a las estimaciones provinciales por grupo de edad (<25 y ≥25). ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 51. CALIBRADO: Valores poblacionales La “Estimación de la Población Actual” (ePOBa) proporciona estimaciones de totales poblaciones por isla, sexo y grupo de edad (<25, 25-54, >54) a principio de cada año. Estos datos son ajustados en los diferentes trimestres (CalMar) a: Las estimaciones poblacionales por sexo a nivel de provincia suministrado por la correspondiente EPA, y a Los totales poblacionales por grupo de edad y sexo a nivel de Comunidad Autónoma. Finalmente los datos comarcales a nivel de grupo de edad por sexo proporcionados por el Padrón Municipal de Habitantes a 1 de enero del último año publicado, son ajustados (reparto proporcional) a los datos de islas por grupo de edad por sexo anteriormente ajustados. ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 52. CALIBRADO: Valores poblacionales Trimestre 1 Trimestre 2 Trimestre 3 Trimestre 4 EPA EPA EPA EPA C.A. C.A. C.A. C.A. (sexo*edad) (sexo*edad) (sexo*edad) (sexo*edad) Provincia Provincia Provincia Provincia (sexo) (sexo) (sexo) (sexo) ePOBa isla isla isla (sexo*edad) (sexo*edad) (sexo*edad) Padrón Continuo Comarca Comarca Comarca (sexo*edad) (sexo*edad) (sexo*edad) ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 53. ESTIMACIÓN DEL ERROR CUADRÁTICO MEDIO Método Jack-knife Método Bootstrap ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 54. ESTIMACIÓN DEL ERROR CUADRÁTICO MEDIO: Método Jack-knife Se toman tantas submuestras como secciones censales existen. Cada una de ellas al dejar una sección fuera. Los pesos originales de los individuos de secciones que están en el estrato de la sección eliminada son modificados (factor ). Se calculan las estimaciones para cada una de las submuestras exactamente igual que con la muestra original. H ⎛ nh − 1 nh ˆ sint_rd ˆ sint_rd 2 ⎞ ˆ MSEJK (Yˆ d sint_rd ) = ∑⎜ ∑ ˆ ( h .) ˆ (Yd ( hi ) − Yd ( h .) ) + ((nh − 1)(Ydsint_rd − Ydsint_rd ))2 ⎟ h =1 ⎝ nh i =1 ⎠ con Yd ( h .) d = ∑ i =1Yd ( hi ) d nh . ˆ sint_r ˆ sint_r nh ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 55. ESTIMACIÓN DEL ERROR CUADRÁTICO MEDIO: Método Bootstrap Las submuestras toman en cada estrato con nh secciones, nh-1 secciones mediante muestreo aleatorio simple con reemplazamiento. Los pesos originales de los individuos son modificados (factor mi nh /(nh-1), con mi número de veces que aparece la sección i en el muestreo). Este proceso se repite R veces (al menos R = 500). Se calculan las estimaciones para cada una de las submuestras exactamente igual que con la muestra original. ˆ (Y sint_rd ) = 1 R ˆ MSEB d ∑ (Yˆdrsint_rd − Yˆdsint_rd )2 . R − 1 r =1 Las valoraciones sobre simulaciones nos indican que el método Jack-knife es preferible sobre el método Bootstrap implementado (subestima). ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 56. CONCLUSIONES EPA insular y comarcal ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 57. CONCLUSIONES: Sintético-región dinámico con precisión variable Ventajas Posee bajas variabilidades (estabilidad de la serie trimestral). Áreas con abundante muestra directa utilizan poca o ninguna muestra indirecta. Áreas con escasa muestra aprovechan la información indirecta (empezando por las áreas más próximas a la que se desea estimar). El proceso de asignación de información está separado del de estimación. Permite conocer y cambiar la estructura de asignación de información. La modificación de la regla de parada (elección de precisión) permite trabajar con un amplio abanico de posibilidades (ECM relativamente bajo con alto sesgo hasta ECM moderado con bajo sesgo) ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 58. CONCLUSIONES: Sintético-región dinámico con precisión variable Desventajas Necesidad de definir matrices de órdenes de cercanía entre comarcas para cada variable objetivo. Indicar periodo de vigencia de las matrices de órdenes (inferiores a cinco no serán necesarios, en particular, la intención es que coincidan con publicación del Censo). Los estimadores sintéticos no son insesgados. Si bien las pruebas indican que los ECM son de los más bajos. ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 59. RESULTADOS EPA insular y comarcal ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 60. http://www2.gobiernodecanarias.org/istac/operacion.js p?codigo=050.010.010&id=E30308B ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 61. Los resultados en los informes del CES ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 62. Los resultados en Eurostat ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 63. RESULTADOS COMPARADOS EPA insular y comarcal ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 64. RESULTADOS PROVISIONALES: Tasa paro hombre Paro hombre (CA, Las Palmas y S/C Tenerife) 18,0 16,0 14,0 0535000 12,0 0538000 0500000 10,0 8,0 6,0 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 ciclo ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 65. RESULTADOS PROVISIONALES: Tasa paro hombre Paro Hombre (Las Palmas, LZ, FV y GC) 18,0 16,0 14,0 12,0 0535100 0535200 0535300 10,0 0535000 8,0 6,0 4,0 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 ciclo ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 66. RESULTADOS PROVISIONALES: Tasa paro hombre Paro Hombre (S/C Tenerife, Tf, LG, LP y EH) 18,0 16,0 14,0 12,0 0538400 0538500 0538600 0538700 10,0 0538000 8,0 6,0 4,0 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 ciclo ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 67. Resultados comparados: Afiliación versus Ocupados EPA (áreas pequeñas) Afiliados a la Seguridad Social vs Ocupados según EPA en áreas pequeñas. 1T-05 Total Grupos de edad Sexo <25 >=25 Hombre Mujer CANARIAS 715.280 819.968 72.568 85.185 642.712 734.783 425.790 493.757 289.490 326.211 LZ 52.217 53.452 5.895 5.871 46.322 47.581 30.889 32.085 21.328 21.367 LZ-Este 37.448 38.116 4.375 - 33.073 - 21.978 22.647 15.470 15.469 LZ-Norte 8.318 8.789 707 - 7.611 - 4.942 5.245 3.376 3.543 LZ-Suroeste 6.451 6.548 813 - 5.638 - 3.969 4.193 2.482 2.355 FV 37.759 36.440 4.459 4.037 33.300 32.403 22.571 22.410 15.188 14.030 FV-Centro 3.506 3.620 379 - 3.127 - 2.239 2.266 1.267 1.353 FV-Norte 20.649 19.739 2.372 - 18.277 - 12.297 11.953 8.352 7.786 FV-Sur 13.604 13.082 1.708 - 11.896 - 8.035 8.190 5.569 4.892 GC 286.491 335.957 28.354 36.653 258.137 299.304 171.724 199.581 114.767 136.377 GC-Metropolitana 179.651 218.566 16.671 - 162.980 - 107.306 129.027 72.345 89.539 GC-Centro Norte 14.010 16.088 1.185 - 12.825 - 9.161 9.811 4.849 6.277 GC-Noroeste 17.694 20.526 1.624 - 16.070 - 10.898 12.444 6.796 8.082 GC-Oeste 4.772 4.985 524 - 4.248 - 2.698 3.042 2.074 1.943 GC-Sur 26.426 27.956 3.096 - 23.330 - 15.716 16.898 10.710 11.058 GC-Sureste 43.938 47.836 5.254 - 38.684 - 25.945 28.358 17.993 19.478 TF 303.225 347.076 30.867 34.310 272.358 312.765 179.269 210.265 123.956 136.811 TF-Abona 23.020 24.754 2.701 - 20.319 - 13.295 15.230 9.725 9.524 TF-Acentejo 20.807 23.863 2.185 - 18.622 - 13.412 14.822 7.395 9.041 TF-Área metropolitana 135.626 159.967 12.055 - 123.571 - 78.485 95.612 57.141 64.355 TF-Daute 6.166 7.445 721 - 5.445 - 3.921 4.698 2.245 2.746 TF-Icod 11.702 13.408 1.382 - 10.320 - 7.417 8.305 4.285 5.104 TF-Suroeste 52.554 57.589 6.293 - 46.261 - 30.088 35.524 22.466 22.066 TF-Valle de Güímar 15.864 17.247 1.514 - 14.350 - 9.301 10.424 6.563 6.822 TF-Valle de La Orotava 37.486 42.802 4.016 - 33.470 - 23.350 25.650 14.136 17.153 LG 7.319 8.921 586 768 6.733 8.153 4.344 5.597 2.975 3.324 LG-Norte 1.900 3.229 185 - 1.715 - 1.178 2.112 722 1.117 LG-Sur 5.419 5.692 401 - 5.018 - 3.166 3.485 2.253 2.207 LP 25.009 34.173 2.122 3.190 22.887 30.983 15.051 21.285 9.958 12.888 LP-Capitalina 10.996 13.899 861 - 10.135 - 6.480 8.512 4.516 5.388 LP-Noreste 2.883 3.937 223 - 2.660 - 1.779 2.505 1.104 1.432 LP-Noroeste 1.482 2.474 113 - 1.369 - 922 1.596 560 878 LP-Valle de Aridane 9.648 13.863 925 - 8.723 - 5.870 8.673 3.778 5.191 EH 3.260 3.949 285 355 2.975 3.594 1.942 2.534 1.318 1.415 Fuente: Instituto Canario de Estadística (ISTAC) ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 68. Resultados comparados: Paro registrado versus parados EPA (áreas pequeñas) Paro registrado vs parados EPA. Primer trimestre de 2006. Total Grupos Sexo <25 >=25 Hombre Mujer CANARIAS 135.004 117.479 17.323 26.172 117.681 91.307 56.244 55.864 78.760 61.615 LZ 6.158 6.864 653 1.594 5.504 5.270 2.749 3.727 3.408 3.137 LZ-Este 4.569 5.134 499 - 4.071 - 2.015 2.837 2.555 2.297 LZ-Norte 939 929 99 - 839 - 405 486 533 442 LZ-Suroeste 650 802 55 - 594 - 329 404 320 398 FV 4.950 5.236 589 1.194 4.361 4.043 2.260 2.609 2.690 2.627 FV-Centro 481 501 43 - 438 - 226 266 254 234 FV-Norte 2.834 3.159 368 - 2.466 - 1.220 1.511 1.614 1.648 FV-Sur 1.635 1.577 178 - 1.457 - 814 832 822 745 GC 63.466 51.892 8.627 11.033 54.839 40.859 26.038 24.107 37.428 27.785 GC-Metropolitana 43.797 34.922 6.010 - 37.787 - 17.955 16.253 25.842 18.669 GC-Centro Norte 2.511 1.832 311 - 2.201 - 985 1.009 1.527 823 GC-Noroeste 4.384 3.059 641 - 3.742 - 1.750 1.393 2.633 1.666 GC-Oeste 636 679 97 - 539 - 349 350 287 329 GC-Sur 3.942 4.323 460 - 3.481 - 1.759 1.904 2.182 2.419 GC-Sureste 8.196 7.077 1.107 - 7.089 - 3.240 3.198 4.956 3.879 TF 51.674 46.687 6.464 10.819 45.210 35.868 21.457 21.970 30.217 24.717 TF-Abona 2.904 3.430 298 - 2.606 - 1.143 1.361 1.761 2.069 TF-Acentejo 3.737 3.365 481 - 3.256 - 1.600 1.476 2.137 1.889 TF-Área metropolitana 25.224 22.554 3.279 - 21.944 - 10.599 10.708 14.625 11.845 TF-Daute 1.360 927 195 - 1.165 - 601 465 758 462 TF-Icod 2.991 1.665 357 - 2.634 - 1.199 907 1.792 758 TF-Suroeste 5.756 7.048 578 - 5.178 - 2.380 3.413 3.376 3.634 TF-Valle de Güímar 2.534 2.134 306 - 2.229 - 1.018 1.087 1.516 1.047 TF-Valle de La Orotava 7.169 5.565 971 - 6.198 - 2.917 2.552 4.252 3.012 LG 1.359 1.316 129 276 1.230 1.040 627 684 732 632 LG-Norte 488 341 44 - 444 - 233 186 254 156 LG-Sur 872 975 85 - 786 - 394 499 478 476 LP 6.763 4.919 797 1.110 5.965 3.808 2.815 2.450 3.947 2.469 LP-Capitalina 2.690 1.907 325 - 2.365 - 1.112 922 1.578 985 LP-Noreste 630 501 65 - 565 - 245 260 386 241 LP-Noroeste 601 350 56 - 546 - 308 197 293 152 LP-Valle de Aridane 2.841 2.161 352 - 2.490 - 1.151 1.070 1.691 1.091 EH 634 564 63 145 570 419 297 316 337 248 Fuente: Instituto Canario de Estadística ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS
  • 69. GRACIAS POR SU ATENCIÓN Más información: http:// www.gobiernodecanarias.org/istac http://www.slideshare.net/istac http://twitter.com/istac_es ESTADÍSTICAS POR ISLAS Y ESTIMACIÓN EN ÁREAS PEQUEÑAS