Este documento describe la metodología dual-frame para estimar variables de interés sobre equipamiento y uso de tecnologías de la información en hogares canarios. Se analizan dos encuestas existentes y se evalúa si es posible usar solo una de ellas o si se requiere una encuesta auxiliar. Los resultados sugieren que la encuesta principal no proporciona estimaciones lo suficientemente precisas a nivel de islas, por lo que una encuesta auxiliar puede ser necesaria. Además, se examina cómo afecta el uso de entrevistas telefónicas en dicha
TALLER -SISTEMA CODIGOS DE LUZ - ACCTIVACION DE CODIGOS LEMURIANOS Y ATLANTES
Metodología para la estimación en áreas pequeñas de la Encuesta TIC-Hogares, usando encuesta auxiliar con estimadores dual-frame
1. ENCUESTAS sobre EQUIPAMIENTO y
USO de TECNOLOGÍAS de INFORMACIÓN
y COMUNICACIÓN en HOGARES
CANARIOS
Metodología para la estimación Dual-Frame
EVALUACIÓN DE ESTIMADORES DUAL-FRAME
2. Ponencia
TIC-HC: Metodología para la estimación Dual-Frame
Alberto González-Yanes
Jefe de Servicio de Estadística Económicas
Instituto Canario de Estadística (ISTAC)
EVALUACIÓN DE ESTIMADORES DUAL-FRAME
3. ANTECEDENTES:
• El Instituto Canario de Estadística (ISTAC) así como las Administraciones
Públicas de Canarias tienen entre sus objetivos poder suministrar
información de los indicadores que actualmente se producen a nivel de
Comunidad Autónoma y/o Provincia a nivel de Islas y/o Comarcas.
• Las islas han sido consideradas unidades de nivel III (NUT III) por lo que
EUROSTAT también solicita datos a esos niveles.
• La mayoría de las encuestas llevadas a cabo por el Instituto Nacional de
Estadística (INE) proporcionan información a nivel de Comunidad Autónoma.
• La imposibilidad de realizar encuestas específicas para tal fin ha motivado el
interés en la metodología y herramientas relacionadas con estimación en
áreas pequeñas.
• Desde finales de 2004 se ha participado activamente en el grupo de trabajo
de áreas pequeñas del INE, así como la constitución de un grupo de apoyo de
investigación en la Universidad de La Laguna, firmando diversos proyectos
identificados con las siglas CANAREA y TICAREA.
EVALUACIÓN DE ESTIMADORES DUAL-FRAME
4. ANTECEDENTES:
• Los primeros trabajos realizados se
enfocaron en la evaluación del uso de
estimaciones en pequeña área en la
Encuesta de Población Activa (EPA).
• Se propusieron estimadores
adaptativos basados en el diseño con
características similares a los
estimadores compuestos, donde
toda la información utilizada
proviene de la propia encuesta
(encuesta con 3.510 viviendas con
aproximadamente 8.000 personas).
• Una descripción del trabajo realizado
y metodología final para la
estimación en pequeñas áreas de
Canarias puede encontrarse en la
web del ISTAC (ISTAC, 2008).
EVALUACIÓN DE ESTIMADORES DUAL-FRAME
5. ANTECEDENTES:
• Otros trabajos de investigación han sido realizados sobre diversos aspectos
de la estimación en áreas pequeñas:
– Métodos jack-knife de estimación de errores cuadráticos cuando existe
estimadores sesgados.
– Estimaciones EPA a nivel de municipios (>50.000 habitantes).
• A partir de mitad de 2009 se ha intentado aplicar la metodología usada en la
EPA a una nueva encuesta: Encuesta sobre Equipamiento y Uso de
Tecnologías de Información y Comunicación en los Hogares (TIC-H-INE) .
• TIC-H-INE es llevada a cabo por el INE cada año, proporcionando información
a nivel de la Comunidad Autónoma.
• Adicionalmente, el ISTAC ha desarrollado una encuesta similar en el 2006 y
2010 con la intención de proporcionar información a nivel de islas (TIC-HC-
ISTAC).
EVALUACIÓN DE ESTIMADORES DUAL-FRAME
6. ANTECEDENTES:
Encuestas sobre Equipamiento y Uso de Tecnologías de Información y
Comunicación en Hogares Canarios
• La aplicación de estimadores de áreas pequeñas así como el análisis de la
encuesta TIC-HC-ISTAC nos introdujo en el estudio de estimadores DUAL-
FRAME.
• Existen dos encuestas que proporcionan información del equipamiento y uso
de las TIC en los Hogares Canarios:
– ENCUESTA SOBRE EQUIPAMIENTO Y USO DE TECNOLOGÍAS DE INFORMACIÓN Y
COMUNICACIÓN EN LOS HOGARES (TIC-H-INE).
– ENCUESTA SOBRE LA IMPLANTACIÓN DE LAS TECNOLOGÍAS DE LA INFORMACIÓN Y LA
COMUNICACIÓN EN LOS HOGARES DE CANARIAS (TIC-HC-ISTAC).
EVALUACIÓN DE ESTIMADORES DUAL-FRAME
7. ANTECEDENTES:
Encuesta TIC-H-INE: descripción
• Proporciona información de equipamiento y uso de las nuevas tecnologías en
hogares a nivel de Comunidad Autónoma.
• Sigue un diseño muestral estratificado en tres etapas en cada provincia, con
unidades primarias las secciones censales, las secundarias las viviendas
dentro de las secciones censales seleccionadas, y las terciarias las personas
de las viviendas seleccionadas.
• Para Canarias: se seleccionan 120 secciones (8 viviendas por sección,
aproximadamente 808 viviendas).
• Cada año se renueva la cuarta parte de viviendas (paneles rotantes desde
2004).
• Usa estimadores directos de razón con pesos calibrados, wj, según tamaño de
las viviendas (5 tamaños) a nivel de comunidad autónoma.
EVALUACIÓN DE ESTIMADORES DUAL-FRAME
8. ANTECEDENTES:
Encuesta TIC-H-INE: descripción
• Todas las viviendas en la primera visita son encuestadas con entrevista
personal (CAPI), y aquellas que poseen teléfono fijo, en las visitas posteriores
pasan a entrevista telefónica (CATI).
• Las variables de interés entre otras son: disponibilidad de teléfono fijo,
teléfono móvil, sólo teléfono fijo, ordenador de sobremesa, ordenador portátil,
internet, etc.
• También incluye resultados a nivel de personas de 16 años y más, midiendo
el uso de ordenador, internet y de comercio electrónico, entre otras variables,
e información a nivel de personas de 10 a 15 años.
EVALUACIÓN DE ESTIMADORES DUAL-FRAME
9. ANTECEDENTES:
Encuesta TIC-HC-ISTAC: descripción
• Encuesta similar a la encuesta TIC-H-INE, algo más ligera en el cuestionario,
proporcionando información a nivel de isla.
• Realizada el año 2006 y el 2010.
• Sigue un diseño muestral estratificado en tres etapas dentro de cada una de
las islas.
• Se seleccionan un total de 180 secciones (20 viviendas por sección,
aproximadamente 3.500 viviendas).
• Usa estimadores directos de razón con pesos calibrados.
• El 70% de la encuesta es llevada a cabo a través de entrevista telefónica
(CATI) y el 30% con entrevista personal (CAPI).
EVALUACIÓN DE ESTIMADORES DUAL-FRAME
10. ANTECEDENTES: preguntas
1. ¿Podremos usar la información de la encuesta TIC-H-INE para dar
estimaciones a nivel de isla?
2. ¿Será necesario realizar una encuesta auxiliar a nivel de Canarias?
3. Si se utiliza una encuesta auxiliar similar a la realizada por el ISTAC,
¿Cómo afecta el uso de entrevista telefónica en la estimación directa de las
variables objetivo de la encuesta?
4. Asumiendo que las estimaciones directas pueden estar sesgadas, ¿es
posible mantener un alto porcentaje de entrevista telefónica, bajo coste,
evitando o corrigiendo ese sesgo? La respuesta a esta pregunta nos
introdujo en los estimadores Dual-Frame.
EVALUACIÓN DE ESTIMADORES DUAL-FRAME
11. ANTECEDENTES: preguntas
5. ¿Cómo afecta la entrevista telefónica a las estimaciones Dual-Frame de las
variables objetivo? Las cuales pueden coincidir, o tener diferentes grados
de asociación, o ser independientes de la disponibilidad de teléfono fijo.
6. ¿Cómo se implementa esta metodología Dual-Frame sobre la encuesta
TIC-HC-ISTAC?
7. ¿Cómo puede fusionarse la información de ambas encuestas?
EVALUACIÓN DE ESTIMADORES DUAL-FRAME
12. Pregunta 1 y 2
¿Podremos usar TIC-H-INE para dar estimaciones
a nivel de Isla?
¿Será necesario realizar una encuesta auxiliar?
EVALUACIÓN DE ESTIMADORES DUAL-FRAME
13. PREGUNTA 1 y 2: Información a nivel de isla sólo con encuesta TIC-H-INE
• Para realizar estas evaluaciones se procedió de dos formas distintas:
1. Computar las estimaciones a nivel de islas a partir de la encuesta TIC-H-
INE 2006 usando estimadores basados en el diseño: estimadores directo,
sintéticos y estimadores compuestos, para posteriormente comparar los
resultados con los proporcionados por la encuesta TIC-HC-ISTAC 2006.
2. Calcular los coeficientes de variación estimados según el método Jack-
knife.
• Todas las pruebas fueron realizadas sobre diferentes variables, aunque nos
centramos en las variables: disponibilidad de ordenador de sobremesa y de
sólo ordenador portátil, pues refleja el comportamiento de una variable con
relativamente alto grado de disponibilidad y otra con disponibilidad baja.
• Los estimadores sintéticos empleados están basados tanto a nivel de la
Comunidad Autónoma, como a nivel de Provincia, así como a nivel de las
regiones de homogeneidad de comarcas usadas en la EPA.
EVALUACIÓN DE ESTIMADORES DUAL-FRAME
14. PREGUNTA 1 y 2: Información a nivel de isla sólo con encuesta TIC-H-INE
Ordenador Directo Compuesto4 Compuesto 4 Compuesto 4 ISTAC
Sobremesa (C.A.) (Provincia) (regiones EPA)
CANARIAS (C.A.) 38,43 37,80
Lanzarote 43,06 39,83 43,71 40,90 41,10
Fuerteventura 27,27 33,17 36,24 40,90 25,60
Gran Canaria 43,85 41,20 41,69 39,26 38,10
Tenerife 35,64 37,01 35,78 38,27 39,20
La Gomera 38,31(*) 38,43 35,50 33,79 32,30
La Palma 35,29 32,92 32,42 28,67 35,60
El Hierro 32,49 34,88 34,68 21,76 27,90
Sólo Ordenador Portátil Directo Compuesto 4 Compuesto 4 Compuesto 4 ISTAC
(C.A.) (Provincia) (regiones EPA)
CANARIAS (C.A.) 3,69 4,80
Lanzarote 2,28 3,23 3,17 3,52 3,50
Fuerteventura 3,16 3,40 3,35 3,59 7,50
Gran Canaria 4,02 3,74 3,71 3,66 5,40
Tenerife 3,12 3,37 3,42 3,42 4,00
La Gomera 3,59 (*) 3,68 3,75 3,26 8,00
La Palma 10,59 8,15 8,16 7,77 3,90
El Hierro 0,00 1,44 1,47 1,28 4,80
Estimaciones a partir de TIC-H-INE. (*) No visitada, se utiliza sintético C.A.
EVALUACIÓN DE ESTIMADORES DUAL-FRAME
15. PREGUNTA 1 y 2: Información a nivel de isla sólo con encuesta TIC-H-INE
C.V. Ordenador Sólo Ordenador
Sobremesa Portátil
CANARIAS (C.A.) 5,17 20,93
Lanzarote 18,32 94,36
Fuerteventura 35,87 120,02
Gran Canaria 8,56 31,25
Tenerife 8,36 34,01
La Gomera 6,84(*) 25,50 (*)
La Palma 36,89 122,08
El Hierro 22,77 ‐
Coeficientes de Variación (C.V.) del estimador directo con Jack-Knife a partir de TIC-H-INE.
(*) Estimador Sesgado.
• La isla de la Gomera no es visitada y El Hierro sólo en un única sección.
• Los C.V. son excesivamente altos, principalmente en islas como Fuerteventura
y La Palma. Los errores estándar, C.V.*estimación / N, serán menores que
C.V., más acentuado en variables con disponibilidades bajas.
• Todos estos resultados sugieren la necesidad de obtener información de otras
fuentes de información: registros administrativos, encuestas auxiliares, etc.
• La existencia de TIC-HC-ISTAC nos hizo plantearnos la posibilidad de una
encuesta auxiliar.
EVALUACIÓN DE ESTIMADORES DUAL-FRAME
16. Pregunta 3
¿Cómo afecta la entrevista telefónica en TIC-HC-
ISTAC?
EVALUACIÓN DE ESTIMADORES DUAL-FRAME
17. PREGUNTA 3: ¿Cómo afecta la entrevista telefónica en TIC-HC-ISTAC?
• Realizar una encuesta es muy caro y el uso de entrevista telefónica reduce el
coste.
• En esta encuesta la mayoría de las variables objetivo están relacionadas con
la disponibilidad de teléfono fijo.
• Para evaluar cómo afecta la entrevista telefónica:
– Se construyó una población artificial de viviendas en Canarias, partiendo
del Censo de Viviendas 2001 de esta comunidad, y se generaron las
variables de interés de esta encuesta bajo diferentes condiciones.
– Se simuló la extracción de encuestas con la misma metodología que la
encuesta TIC-HC-ISTAC, pudiendo variar el porcentaje de presencialidad
que utiliza.
– Para 500 simulaciones y el estimador directo se calculó los errores
cuadráticos medios y sesgos relativos (RMSE y RB).
EVALUACIÓN DE ESTIMADORES DUAL-FRAME
18. PREGUNTA 3: ¿Cómo afecta la entrevista telefónica en TIC-HC-ISTAC?
• Las variables objetivo se generaron usando distribución de Bernoulli con
diferentes parámetros.
• p1: probabilidad de disponibilidad de teléfono fijo.
• p2: probabilidad de disponibilidad de ordenador de sobremesa.
Se considera que la disponibilidad de ordenador de sobremesa es independiente
de teléfono fijo. Esto permite evaluar la ejecución de una variable
independiente del tipo de entrevista.
• p3: probabilidad de disponibilidad de sólo teléfono fijo para esas viviendas
que tienen teléfono fijo.
La variable “sólo teléfono fijo” permitirá evaluar el comportamiento de una
variable contenida totalmente en el marco telefónico.
EVALUACIÓN DE ESTIMADORES DUAL-FRAME
19. PREGUNTA 3: ¿Cómo afecta la entrevista telefónica en TIC-HC-ISTAC?
• p4: probabilidad de disponibilidad de conexión a internet para las que tienen
teléfono fijo.
• p5: probabilidad de disponibilidad de conexión a internet para las viviendas
que no tienen teléfono fijo.
La variable “internet” permitirá evaluar el comportamiento de variables que
están relacionadas con la disponibilidad de teléfono fijo, pero no están
totalmente contenidas dentro del marco telefónico.
p1= .50 y p3= .50
P2=.50 y p3=.50 p1= .50, p4=.50 y p5= .10
P2=.50, p4=.50 y p5=.10
Sí Teléfono Fijo tener
Sólo Tel. Fijo Internet no
frente Tel. Fijo (p3)
Sólo Teléfono Fijo (p3) No Teléfono Fijo
teniendo Tel. Fijo
tener Internet (p5)
(p5)
Internet teniendo
Sí Teléfono Fijo
Tel. Fijo (p4)
tener Internet (p4)
No Tel. Fijo Sí Tel. Fijo (p1)
No Teléfono Fijo Sí Teléfono Fijo(p2) No Tel. Fijo
No Teléfono Fijo Sí Teléfono Fijo(p2)
Sí Tel. Fijo (p1)
Ejemplo de la influencia de las diferentes probabilidad consideradas.
EVALUACIÓN DE ESTIMADORES DUAL-FRAME
20. PREGUNTA 3: ¿Cómo afecta la entrevista telefónica en TIC-HC-ISTAC?
p1= 75% (Promedio Islas) p1= 75%, p2=50% (Promedio Islas)
Teléfono Fijo Ordenador Sobremesa
% de entrevista presencial % de entrevista presencial
• En variables totalmente relacionadas, teléfono fijo, con la realización del
tipo de entrevista, el estimador directo está sesgado, aumentando éste
cuanto menor es el porcentaje de entrevista presencial.
• En variables completamente independientes, ordenador sobremesa, el
porcentaje de entrevista presencial no afecta sobre su sesgo.
EVALUACIÓN DE ESTIMADORES DUAL-FRAME
21. PREGUNTA 3: ¿Cómo afecta la entrevista telefónica en TIC-HC-ISTAC?
p1= 75%, p3=10% (Promedio Islas) p1= 75%, p4=70% y p 5=30% (Promedio Islas)
Sólo Teléfono Fijo Internet
% de entrevista presencial % de entrevista presencial
• En variables parcialmente relacionadas con el marco telefónico las
estimaciones directas estarán sesgadas, siendo más grave cuanto mayor
es dicha relación y menor es el porcentaje de presencialidad que se
aplique.
• Esto sugiere que las estimaciones directas en encuestas tipo TIC-H
donde un porcentaje de las viviendas son elegidas de un marco
telefónico puede afectar muy negativamente en el sesgo.
EVALUACIÓN DE ESTIMADORES DUAL-FRAME
22. Pregunta 4
¿Se puede mantener la entrevista telefónica
corrigiendo el sesgo del estimador directo?
Metodología Dual-Frame
EVALUACIÓN DE ESTIMADORES DUAL-FRAME
24. PREGUNTA 4: Estimadores Dual-Frame
• Sea A y B, dos marcos parcialmente superpuestos. Producirán tres dominios
mutuamente excluyentes:
– a: unidades del marco A que sólo están en él.
– ab: unidades que están en ambos marcos a la vez.
– b: unidades del marco B que sólo están en él.
A B
a ab b
EVALUACIÓN DE ESTIMADORES DUAL-FRAME
31. PREGUNTA 4: Adaptación a encuestas tipo TIC-HC-ISTAC
• La combinación de información obtenida de forma presencial (CAPI) y la
obtenida de forma telefónica (CATI) suele llevar aparejada la definición de al
menos dos marcos.
– A: Padrón Continuo
– B: Listín Telefónico
• En TIC-HC-ISTAC, asumiremos que del marco A se extraen las encuestas
presenciales y del marco B las telefónicas. El marco B estará totalmente
contenido en el marco A, lo que elimina el dominio b.
EVALUACIÓN DE ESTIMADORES DUAL-FRAME
33. PREGUNTA 4: Adaptación a encuestas tipo TIC-HC-ISTAC
• Ej.: Disponibilidad de Teléfono Fijo (p1 = 50%).
100% presencial 50% presencial Valor
Real
Media RMSE S.E. RB Media RMSE S.E. RB
Skinner y Rao 275.779 1,41% 0,70% ‐0,51% 276.698 0,18% 0,09% ‐0,10% 277.204
Hartley 275.779 1,41% 0,70% ‐0,51% 276.699 0,18% 0,09% ‐0,18%
Directo 275.779 1,41% 0,70% ‐0,51% 414.976 49,71% 24,84% 49,70%
• En las pruebas realizadas se consideró que el marco B estaba formado
por todas las viviendas con teléfono fijo. En las aplicaciones reales no
necesariamente estarán todas en el Listín Telefónico.
• Los resultados con cualquiera de los tres estimadores usados fue muy
similar. Finalmente se eligió el estimador PML por las referencias ya
comentadas por Lohr y los resultados obtenidos.
EVALUACIÓN DE ESTIMADORES DUAL-FRAME
34. PREGUNTA 4: Adaptación a encuestas tipo TIC-HC-ISTAC
EVALUACIÓN DE ESTIMADORES DUAL-FRAME
35. Pregunta 5
¿Cómo afecta a las estimaciones PML la entrevista
telefónica?
EVALUACIÓN DE ESTIMADORES DUAL-FRAME
36. PREGUNTA 5: ¿Cómo afecta al estimador PML la entrevista telefónica?
• Utilizando el simulador de encuestas introducido sobre la población artificial
construida, se intentó evaluar el efecto de la entrevista telefónica, así como el
marco telefónico, sobre las variables de interés.
• La definición de las probabilidades en la generación de las variables de
interés en la población se realizó intentando que fueran lo más posible a la
realidad.
TIC‐H‐INE 2010 TIC‐HC‐ISTAC 2010
Ordenador de sobremesa 51,0% 55,49%
Acceso Internet 58,4% 70,44%
Teléfono Fijo 74,7%
Teléfono Móvil 94,2% 92,33%
• Una configuración con p1=75%, p2=50%, p3=10%, p4=70% y p5=30%,
proporcionaría aproximadamente para 1000 viviendas: 750 tendrán teléfono
fijo, 75 de ellas sólo con teléfono fijo y 525 de ellas con acceso a internet; 250
sin teléfono fijo, 75 de ellas con acceso a internet. Lo que daría un 60% con
acceso a internet y un 7,5% sólo con teléfono fijo.
EVALUACIÓN DE ESTIMADORES DUAL-FRAME
37. PREGUNTA 5: ¿Cómo afecta al estimador PML la entrevista telefónica?
p1: probabilidad de
Teléfono Fijo (variable coincidente con marco B)
disponibilidad de
teléfono fijo (tamaño
del marco B)
El estimador PML
permanece insesgado
incluso con porcentajes
bajos de entrevista
presencial cuando la
variable a estimar está
altamente correlada con
el marco.
EVALUACIÓN DE ESTIMADORES DUAL-FRAME
38. PREGUNTA 5: ¿Cómo afecta al estimador PML la entrevista telefónica?
Ordenador sobremesa (variable independiente p2: probabilidad de
con marco B) disponibilidad de
ordenador de
sobremesa
EVALUACIÓN DE ESTIMADORES DUAL-FRAME
39. PREGUNTA 5: ¿Cómo afecta al estimador PML la entrevista telefónica?
Sólo Teléfono Fijo (variable relacionada con p3: probabilidad de
marco B totalmente contenida en él) disponibilidad de sólo
teléfono fijo sobre
aquellas viviendas
que tienen teléfono
fijo.
El estimador PML permanece
insesgado y bastante estable.
Cuando aumenta el tamaño
del marco B (mayor p1) el
valor del RMSE en PML se
mantiene.
EVALUACIÓN DE ESTIMADORES DUAL-FRAME
40. PREGUNTA 5: ¿Cómo afecta al estimador PML la entrevista telefónica?
p4: probabillidad de disponibilidad de
Internet (variable relacionada con marco B no conección a internet en viviendas con
totalmente contenida en él) teléfono fijo.
p5: probabillidad de disponibilidad de
conección a internet en viviendas sin
teléfono fijo.
Internet (p1=75%, p4=50%, p5=30%) = 45% global
Internet/ No
Tel. Fijo
(p5=30%)
Internet/Tel. Fijo
Internet/Fixed phone
(p4=50%)
(p4=50%)
No Tel. Fijo
Not fixed phone Tel. Fijo (p1=75%)
Fixed phone (p1=75%)
(25%)
(25%)
EVALUACIÓN DE ESTIMADORES DUAL-FRAME
41. PREGUNTA 5: ¿Cómo afecta al estimador PML la entrevista telefónica?
Internet (variable relacionada con marco B no
totalmente contenida en él)
Para un muestreo con reparto
proporcional al tamaño de las islas.
Muestra
TIC‐HC‐ISTAC Reparto
(2010) Proporcional
LZ 380 210
FV 320 143
GC 1.020 1.469
TF 1.060 1.475
LG 200 43
LP 380 161
EH 160 21
C.A. 3.520 3.522
Tanto el estimador PML como el directo
empeoran su comportamiento, siendo
más acentuado incluso en variables como
“sólo teléfono fijo”. Se mantiene la
insesgadez de PML, aunque aumenta algo
más la variabilidad.
EVALUACIÓN DE ESTIMADORES DUAL-FRAME
42. PREGUNTA 5: ¿Cómo afecta al estimador PML la entrevista telefónica?
Conclusiones:
•El estimador PML evita el sesgo del estimador directo en encuestas que
combinan varios marcos.
•Los marcos pueden asociarse al tipo de encuesta a realizar, marco presencial ó
Padrón con encuesta presencial, y marco Telefónico con encuesta telefónica.
•Aun cuando las variables de interés de la encuesta puedan estar relacionadas
con el marco telefónico, el estimador PML sigue manteniendo su insesgadez.
•Mientras el % de entrevista personal no sea inferior al 20% se puede utilizar la
versión de PML definido sobre los tamaños muestrales de cada dominio.
•Cuando el % de entrevista personal sea inferior al 20% se debe utilizar la
versión de PML definido sobre el cálculo de la varianza de los tamaños
poblacionales estimados.
•Un muestreo tipo al de TIC-HC-ISTAC mejora al muestreo de reparto
proporciona.
EVALUACIÓN DE ESTIMADORES DUAL-FRAME
43. Pregunta 6
¿Cómo se implementa esta metodología Dual-
Frame sobre la encuesta real TIC-HC-ISTAC?
EVALUACIÓN DE ESTIMADORES DUAL-FRAME
44. PREGUNTA 6: ¿Cómo implementar PML a TIC-HC-ISTAC 2010?
• Aun cuando la encuesta TIC-HC-ISTAC 2010 no ha sido estrictamente
realizada asumiendo dos marcos se ha considerado:
– Marco A: Padrón Continuo (todas las viviendas disponibles), de donde se
ha extraído la muestra identificada como presencial (TCUEST=6).
– Marco B: Listín Telefónico (todas las viviendas del listín telefónico de
Infobel), de donde se ha extraído la muestra identificada como telefónica
(TCUEST=2).
• No todas las viviendas con teléfono fijo están en el listín, lo que hace que:
– Dominio a: viviendas que están en el Padrón Continuo que no están en el listín
telefónico. Son las viviendas que no tienen teléfono fijo más aquellas que
teniéndolo no están en el listín telefónico.
– Dominio ab: viviendas que están en el listín telefónico Infobel (TCUEST=2).
• Puesto que en la base de datos no se identifica cuáles de las viviendas que
teniendo teléfono fijo y la entrevista se realiza de forma presencial no
están en el listín se ha generado por simulación con probabilidad igual a
pNoListín.
EVALUACIÓN DE ESTIMADORES DUAL-FRAME
45. PREGUNTA 6: ¿Cómo implementar PML a TIC-HC-ISTAC 2010?
• pNoListín ha variado entre un 10% y un 70% de 10 en 10.
• Parece razonable que esté entre un 10 y un 40%, en torno al 20%. No
necesariamente igual para todas las islas.
• A nivel de la Comunidad Autónoma el 60% de las viviendas está en el listín
telefónico, y se estima según TIC-H-INE 2010 que el 75% de las viviendas
dispone de teléfono fijo.
– 60% con teléfono y en el listín,
– 15% con teléfono que no está en el Listín.
– 25% sin teléfono fijo.
• Respecto a las viviendas en encuesta presencial con teléfono fijo, se tiene que
el 20% (15 sobre 75%) no estará en el listín (pNoListín).
EVALUACIÓN DE ESTIMADORES DUAL-FRAME
46. PREGUNTA 6: ¿Cómo implementar PML a TIC-HC-ISTAC 2010?
Número de viviendas
Totales Infobel
LZ 50.320 24.293
FV 36.298 16.232
GC 268.154 171.070
TF 313.117 183.929
LG 8.192 5.021
LP 29.461 20.976
EH 3.980 2.902
C.A. 709.522 424.423
EVALUACIÓN DE ESTIMADORES DUAL-FRAME
47. PREGUNTA 6: ¿Cómo implementar PML a TIC-HC-ISTAC 2010?
EVALUACIÓN DE ESTIMADORES DUAL-FRAME
48. PREGUNTA 6: ¿Cómo implementar PML a TIC-HC-ISTAC 2010?
Resultados
•Para diferentes valores de pNoListín se obtuvo los resultados:
TIC-H-INE TIC-HC-ISTAC 2010
2010 Directo PML(20%)
Viviendas con algún tipo de ordenador 67,0 76,7 68,6
Ordenador de sobremesa 51,0 55,5 47,0
Ordenador portátil 37,6 44,2 40,2
Viviendas que disponen de acceso a Internet 58,4 70,4 60,0
Viviendas con teléfono fijo 74,7 89,1 70,6
Viviendas con teléfono móvil 94,2 92,3 92,2
•En particular, la estimación INE de teléfono fijo coincide con PML(35%).
Teléfono Fijo
Directo PML(10%) PML(20%) PML(30%) PML(40%) PML(50%) PML(60%) PML(70%)
LZ 84,70 55,29 63,01 63,39 65,26 73,62 74,85 74,28
FV 80,12 52,60 59,18 59,69 70,21 66,78 72,66 73,81
GC 89,29 68,23 70,14 73,59 74,61 76,89 79,72 80,66
TF 90,26 60,73 72,38 71,55 79,72 80,95 81,39 84,46
LG 93,67 70,93 77,10 85,22 87,51 85,03 87,71 88,73
LP 91,77 78,10 78,11 83,45 87,68 85,92 88,59 88,41
EH 94,79 78,81 85,40 87,76 86,77 90,13 90,95 91,64
C.A. 89,10 63,70 70,56 71,88 76,74 78,47 80,27 82,01
EVALUACIÓN DE ESTIMADORES DUAL-FRAME
49. PREGUNTA 6: ¿Cómo implementar PML a TIC-HC-ISTAC 2010?
EVALUACIÓN DE ESTIMADORES DUAL-FRAME
50. PREGUNTA 6: ¿Cómo implementar PML a TIC-HC-ISTAC 2010?
EVALUACIÓN DE ESTIMADORES DUAL-FRAME
51. PREGUNTA 6: ¿Cómo implementar PML a TIC-HC-ISTAC 2010?
Información a nivel de personas: Resultados
Personas que han Personas que han Personas que han
Personas que usan
CANARIAS Total Personas utilizado alguna vez utilizado alguna vez comprado alguna vez
teléfono móvil
el ordenador Internet a través de Internet
Directo (ISTAC) 1.660.863 89,5 74,8 70,6 26,1
INE 1.620.933 92,1 67,1 62,3 20,8
PML(10%) 1.660.863 88,1 68,1 63,4 22,3
PML(20%) 1.660.863 88,0 68,3 63,9 22,9
PML(30%) 1.660.863 87,7 68,8 64,4 23,4
PML(40%) 1.660.863 87,7 68,9 64,5 23,6
Personas que
Personas que
Personas que Personas que han utilizado
han comprado a Personas que
han utilizado el han utilizado Internet al menos
CANARIAS Total Personas través de Internet usan teléfono
ordenador en los Internet en los una vez por
en los últimos 3 móvil
últimos 3 meses últimos 3 meses semana en los
meses
últimos 3 meses
Directo (ISTAC) 1.660.863 69,3 66,5 61,4 14,6 89,5
INE 1.620.933 60,0 57,0 51,5 11,0 92,1
PML(10%) 1.660.863 62,0 59,4 54,7 12,7 88,1
PML(20%) 1.660.863 62,5 60,0 55,1 12,9 88,0
PML(30%) 1.660.863 62,7 60,3 55,6 13,1 87,7
PML(40%) 1.660.863 63,1 60,6 55,8 13,3 87,7
EVALUACIÓN DE ESTIMADORES DUAL-FRAME
52. PREGUNTA 6: ¿Cómo implementar PML a TIC-HC-ISTAC 2010?
Información a nivel de personas: Resultados
Total de Personas
que han utilizado Hace más de 1 mes y Hace más de 3 meses
CANARIAS En el último mes Hace más de 1 año
alguna vez el menos de 3 meses y menos de 1 año
ordenador
Directo (ISTAC) 1.241.951 90,3 2,3 2,5 4,8
INE 1.087.106 86,4 3,0 5,3 5,3
PML(10%) 1.130.464 88,6 2,5 2,1 6,9
PML(20%) 1.133.871 89,1 2,4 2,2 6,3
PML(30%) 1.141.924 88,9 2,4 2,3 6,4
PML(40%) 1.144.298 89,3 2,3 2,1 6,3
Total de Personas
Al menos una vez al
que han utilizado el Diariamente, al menos Todas las semanas,
CANARIAS mes, pero no todas No todos los meses
ordenador en los 5 días por semana pero no diariamente
las semanas
últimos 3 meses
Directo (ISTAC) 1.150.505 68,4 23,5 6,8 1,3
INE 972.172 65,2 24,8 6,7 3,3
PML(10%) 1.029.306 70,2 22,1 6,5 1,2
PML(20%) 1.038.259 70,2 22,1 6,5 1,2
PML(30%) 1.042.126 70,5 21,8 6,5 1,2
PML(40%) 1.047.918 70,5 21,8 6,6 1,2
EVALUACIÓN DE ESTIMADORES DUAL-FRAME
53. PREGUNTA 6: ¿Cómo implementar PML a TIC-HC-ISTAC 2010?
Información a nivel de personas: Resultados
Personas que han
Personas que han Personas que han
Personas que han utilizado Internet al
utilizado el ordenador comprado a través de Personas que usan
Total Personas utilizado Internet en menos una vez por
en los últimos 3 Internet en los últimos teléfono móvil
los últimos 3 meses semana en los
meses 3 meses
últimos 3 meses
Directo
LZ 112.597 66,4 64,1 59,6 21,4 92,2
FV 82.291 74,4 72,6 65,8 15,3 93,5
GC 658.111 67,3 64,3 58,6 13,4 87,9
TF 714.724 71,7 68,6 64,3 14,7 90,0
LG 17.821 63,4 59,1 52,5 14,6 85,4
LP 67.076 63,9 63,8 57,1 13,7 91,2
EH 8.243 66,4 66,1 62,8 11,8 88,3
Canarias 1.660.863 69,3 66,5 61,4 14,6 89,5
INE 1.620.933 60,0 57,0 51,5 11,0 92,1
PML(10%)
LZ 112.597 59,4 55,6 52,3 19,8 89,9
FV 82.291 72,4 70,3 63,8 14,8 94,0
GC 658.111 58,1 54,9 49,8 10,8 84,7
TF 714.724 64,9 63,0 58,9 13,1 90,0
LG 17.821 63,1 56,1 45,1 7,2 90,0
LP 67.076 60,8 59,8 52,3 14,7 91,5
EH 8.243 59,1 58,6 54,0 7,5 86,4
Canarias 1.660.863 62,0 59,4 54,7 12,7 88,1
PML(20%)
LZ 112.597 60,6 56,9 53,0 20,9 90,5
FV 82.291 72,6 70,8 64,5 15,6 94,6
GC 658.111 57,6 54,4 49,3 10,6 84,5
TF 714.724 66,6 64,8 60,5 13,5 89,9
LG 17.821 64,1 58,4 43,7 7,5 90,4
LP 67.076 58,4 57,3 51,2 15,1 89,8
EH 8.243 58,0 57,5 51,4 7,7 86,3
EVALUACIÓN
Canarias DE ESTIMADORES1.660.863
DUAL-FRAME62,5 60,0 55,1 12,9 88,0
54. PREGUNTA 6: ¿Cómo implementar PML a TIC-HC-ISTAC 2010?
Información a nivel de personas: Resultados
•Las estimaciones PML para diferentes valores de pNoListín no difieren mucho
entre sí.
•En general, las estimaciones PML están más próximas a las proporcionadas por
el INE.
•Para estimaciones sobre una parte de la población (p.ej.: sobre personas que ha
utilizado ordenador en los últimos tres meses, ordenador alguna vez, internet alguna vez,
etc.) los porcentajes estimados según ISTAC y PML son prácticamente
equivalentes.
EVALUACIÓN DE ESTIMADORES DUAL-FRAME
55. Pregunta 7
¿Cómo puede fusionarse la información de
ambas encuestas, TIC-H-INE y TIC-HC-ISTAC?
EVALUACIÓN DE ESTIMADORES DUAL-FRAME
56. PREGUNTA 7: ¿Cómo puede fusionarse TIC-H-INE y TIC-HC-ISTAC?
• Se fusiona la información de TIC-H-INE 2010 con la información de TIC-HC-
ISTAC 2010 (las estimaciones PML).
• Merkouris (2010) realiza una clasificación de posibilidades al combinar
información de dos encuestas. En particular:
– Una encuesta principal y una encuesta suplementaria, con las mismas variables
objetivo o con pocas variables objetivo en la suplementaria, con el fin de que la
encuesta suplementaria mejore la eficiencia de las estimaciones de dominios
pequeños.
• Probamos dos posibilidades:
– DF: introducida en Merkouris (2004). Es similar a la de los estimadores
GREG, donde las estimaciones de dominios comparables de las dos
encuestas son calibrados entre ellos. Además coincide con el estimador
PML cuando se consideran marcos totalmente coincidentes.
– STA: Fue introducida en el grupo de trabajo de áreas pequeñas del INE y
estudiada en CANAREA 2005.
EVALUACIÓN DE ESTIMADORES DUAL-FRAME
57. PREGUNTA 7: ¿Cómo puede fusionarse TIC-H-INE y TIC-HC-ISTAC?
EVALUACIÓN DE ESTIMADORES DUAL-FRAME
58. PREGUNTA 7: ¿Cómo puede fusionarse TIC-H-INE y TIC-HC-ISTAC?
EVALUACIÓN DE ESTIMADORES DUAL-FRAME
59. PREGUNTA 7: ¿Cómo puede fusionarse TIC-H-INE y TIC-HC-ISTAC?
Resultados
•Los estimadores DF y STA fueron implementados sobre TIC-H-INE y TIC-HC-
ISTAC 2010.
•Para las estimaciones PML en TIC-HC-ISTAC fue preciso definir pNoListín,
(probabilidad de no estar en el listín sobre el grupo de viviendas con teléfono fijo
en encuesta presencial) .
TIC-H TIC-HC D.F. ISTAC INE+ISTAC INE+ISTAC
INE ISTAC PML(20%) DF (20%) STA (20%)
Viviendas con algún tipo de ordenador 67,0 76,7 68,6 67,9 67,4
Ordenador de sobremesa 51,0 55,5 47,0 47,5 48,6
Ordenador portátil 37,6 44,2 40,2 39,3 38,5
Viviendas que disponen de acceso a Internet 58,4 70,4 60,0 58,9 58,5
Viviendas con teléfono fijo 74,7 89,1 70,6 70,9 72,1
Viviendas con teléfono móvil 94,2 92,3 92,2 92,7 93,2
•A nivel de C.A. las diferencias entre DF y STA no son demasiado importantes.
EVALUACIÓN DE ESTIMADORES DUAL-FRAME
61. BIBLIOGRAFÍA
• Fuller, W.A. y Burmeister, L.F. (1972). Estimators for samples selected form two
overlapping frames. Proceedings of the Social Statistics Section, American Statistical
Association, pp. 225-249.
• Hartley, H.O. (1962). Multiple frame surveys. Proceedings of the Social Statistics
Section, American Statistical Association, pp. 203-206.
• Hartley, H.O. (1974). Multiple frame methodology and selected applications. Sankhya (C),
36, pp. 99-118.
• Lohr, S. y Rao, J.N.K. (2000). Inference in dual frame surveys. Journal of the American
Statistical Association, 95, pp. 271-280.
• Lohr, S. (2001). Estimation using multiple surveys. Bulletin of the International
Statistical Institute, pp. 1-4.
• Lohr, S. and Rao, J.N.K. (2006). Estimation in multiple-frame surveys. Journal of the
American Statistical Association, 101, pp. 1019-1030.
• Lohr, S. (2007). Recent developments in multiple frame surveys. Proceedings of the
Sruvey reseach Methods Section, American Statistical Association, pp. 3257-3264.
EVALUACIÓN DE ESTIMADORES DUAL-FRAME
62. BIBLIOGRAFÍA
• Merkouris, T. (2004). Combining independent regression estimators form multiple
surveys. Journal of the American Statistical Association, 99, pp. 1131-1139.
• Merkouris, T. (2010). Combining information from multiple surveys by using regression
for efficient small domain estimation. Journal of the Royal Statistical Society, 72, pp.
27-48.
• Skinner, C.J. (1991). On the efficiency of raking ratio estimation for multiple frame
surveys. Journal of the American Statistical Association, 86, pp. 779-784.
• Skinner, C.J. y Rao, J.N.K. (1996). Estimation in dual frame surveys with complex
designs. Journal of the American Statistical Association, 91, pp. 349-356.
• Wu, C. (2004). Combining information from multiple surveys through the empirical
likelihood method. The Canadian Journal of Statistics, 32, pp. 15-26.
EVALUACIÓN DE ESTIMADORES DUAL-FRAME
63. PREGUNTA 7: ¿Cómo puede fusionarse TIC-H-INE y TIC-HC-ISTAC?
Conclusiones
•A nivel de C.A. las diferencias entre DF y STA no son demasiado importantes.
•A nivel de isla, y para islas con poca muestra en alguna de las dos encuestas (El
Hierro y Lanzarote) las diferencias son bastante importante, siendo más estable
el estimador DF.
•La utilización de la combinación de la información de ambas encuestas puede
ser aprovechada para reducir el tamaño muestral de la encuesta TIC-HC-ISTAC.
Esta reducción debería realizarse en las islas capitalinas.
•Pruebas realizadas con una reducción de incluso un 30% en las islas capitalinas
usando sólo TIC-HC-ISTAC con PML muestran un comportamiento bastante
aceptable.
EVALUACIÓN DE ESTIMADORES DUAL-FRAME
64. Ponencia
TIC-HC: Metodología para la estimación Dual-Frame
Alberto González-Yanes
Jefe de Servicio de Estadística Económicas
Instituto Canario de Estadística (ISTAC)
EVALUACIÓN DE ESTIMADORES DUAL-FRAME