Tiedonkeruun keskeiset piirteet
4
Tilastokeskus
17.11.2022
–Paneelitutkimus
–Kesto 15 kuukautta
–Viisi kierrosta
–Uusia otoshenkilöitä 30 000/vuosi (15-74-vuotiaat)
– Kotitalouden kaikki henkilöt mukana yhdellä kierroksella
– 75-89-vuotiaita pienempi otos, vähemmän vastattavaa
– Esityksessä kaikki tiedot koskevat 15-74-vuotiaita ellei muuta mainita
– Kuten yleensä työvoimatutkimuksessa
–Tällä hetkellä vastanneiden kesken ei arvontoja eikä palkkioita,
eikä pullisteita saatekirjeessä
– Tietoinsentiivi
Yhdistelmätiedonkeruun tausta
5
Tilastokeskus
17.11.2022
–Tilastokeskuksen periaate ottaa
verkkovastaamismahdollisuus käyttöön
kaikissa tiedonkeruissa
– Rekisteritieto käytössä työvoimatutkimuksessa silloin kun se on
mahdollista
– Joko tuodaan lomakkeelle esitäyttönä tai suoraan dataan
– Rekisteritiedon/muiden lähteiden ja menetelmien käyttöä nopean
työmarkkinatilanteen kuvaajana kehitetään
– Tämä esitys keskittyy suoraan tiedonkeruuseen
– EU-asetuksen mukaan tietyt työmarkkinatiedot on kerättävä vastaajilta itseltään
–Pitkäaikaiset kokeilut (myös) työvoimatutkimuksessa
Tiedonkeruutavan muuttuessa tilaston
tuotanto muuttuu sen kaikissa osatekijöissä
6
Tilastokeskus
17.11.2022
Työvoima-
tutkimuksen
tilasto
Tilastolliset
metodit
Lomake-
ohjelmointi
Tuotanto-
sovellus
Haastattelu-
työ
Kenttätyön
järjestäminen
Tiedonkeruu-
järjestelmä
Yhdistelmätiedonkeruun käytännöt
7
Tilastokeskus
17.11.2022
–Puhelinkeruusta siirryttiin verkko- ja puhelinkeruuseen
(=yhdistelmätiedonkeruu) vuoden 2021 alussa (1.-4.
kierrokset = ”kertarysäys”)
– Itsetäytettävä lomake ensi kerran sitten vuoden 1983
–Vuoden 2022 alusta lukien verkkomahdollisuus myös 5.
kierrokselle (mukaan lukien kotitalousosa)
–Verkkomahdollisuus tarjotaan aina, mikäli vastaaja ei ole
ilmaissut, että a) haluaa puhelinhaastattelun, tai on b)
kieltäytynyt selvästi
Yhdistelmätiedonkeruun käytännöt
9
Tilastokeskus
17.11.2022
–Verkkovastaaminen avautuu ensin (”web push”, ”verkko edellä”)
– 2021 haastattelija otti yhteyttä t+4 päivää keruujakson
alkamisesta (puhelinkohteet heti)
– 2022 haastattelija saa ottaa yhteyttä heti keruujakson alussa
kaikkiin 1. kierrokselle tuleville (ensisijaisesti nuoret ja
iäkkäämmät)
– Moodit ovat auki rinnakkain
–Mikäli verkkolomaketta ei ole täytetty rajapisteeseen
saakka, haastattelija yrittää ottaa yhteyttä keruujakson
kuluessa
–Mikäli henkilöä ei tavoiteta eikä ole kieltäytynyt, häntä
tavoitellaan edelleen seuraavilla kierroksilla
Yhteydenottotavat vastaajiin
10
Tilastokeskus
17.11.2022
–Saatekirje 1. ja 5. kierroksella
– 1. kierroksella kirjeessä vastaamisosoite
–Vahva tunnistautuminen verkkolomakkeelle
– Mm. koska lomakkeella työpaikkatiedot työssäkäyntitilastosta
–Lomakkeen lopussa kysytään myös meiliosoite
–Jatkokierroksilla verkkovastaajille lähetetään kutsu
vastaamaan tekstiviestillä + meilillä
–Reilu viidennes vastanneista vastaa verkossa kirjeen ja
massaviestien perusteella, ilman haastattelijan yhteydenottoa
Yhdistelmäkeruun vaikutus
11
Tilastokeskus
17.11.2022
1) Vastausasteen lasku kiihtyi siirtymävaiheessa
– Aiemmin kato kasvoi tasaisemmin
– Osa vastaajista sanoo siirtyvänsä verkkoon, mutta ei lopulta
vastaa ollenkaan
– Ei yllätys; kokemukset omista koetutkimuksista ja muualta samansuuntaisia
– Laskun kiihtymiselle useita syitä
– Uusien järjestelmien käyttöönotto
2) Verkkovastaajien osuus korkea
– 15-74-vuotiaista enemmistö vastaa jo verkossa
Kato 2020-2022 kadon syyn mukaan
15-74-vuotiaat, kato-%
15
Tilastokeskus
17.11.2022
15
20
25
30
I
vuosineljännes
II
vuosineljännes
III
vuosineljännes
IV
vuosineljännes
I
vuosineljännes
II
vuosineljännes
III
vuosineljännes
IV
vuosineljännes
I
vuosineljännes
II
vuosineljännes
III
vuosineljännes
2020 2021 2022
Ei tavoitettu
Kieltäytynyt
Kadon kasvun vaikutus estimaatteihin
16
Tilastokeskus
17.11.2022
–Estimointiuudistus 2021 alkaen ottaa aiempaa paremmin
huomioon heikoimmin vastaavat ryhmät
– Uudistus vaikutti työllisyyden estimaatteihin alentavasti
–Kadon kasvaessa
– Painokertoimet kasvavat
– Estimaattien keskivirheet kasvavat
– Työllisten (15-74-vuotiaat) suhteellinen keskivirhe ja luottamusväli (95 %):
9/2022: 0,72 ja ±36 000 >> 9/2019: 0,69 ja ±34 000
– Työllisten (15-24-vuotiaat) suhteellinen keskivirhe ja luottamusväli (95 %):
9/2022: 4,85 ja ±23 000 >> 9/2019: 3,89 ja ±18 000
Kato% EU- ja ETA-maissa 2020
Oranssi osa: kasvu vuodesta 2012
* = osallistuminen pakollista
17
Tilastokeskus
17.11.2022
0
10
20
30
40
50
60
70
Vastaajien määrä vastaustavan mukaan 2021-2022/Q3
18
Tilastokeskus
17.11.2022
0
2000
4000
6000
8000
10000
12000
14000
I
vuosineljännes
II
vuosineljännes
III
vuosineljännes
IV
vuosineljännes
I
vuosineljännes
II
vuosineljännes
III
vuosineljännes
2021 2022
Verkko
Puhelin
Verkkovastaamisen onnistuminen
20
Tilastokeskus
17.11.2022
–Kysymykset ovat yleensä lyhyitä ja helpohkoja vastata
–Verkkovastaajien tunnelmia on kartoitettu vastaajapalautteilla
Haasteitakin on
– Lomake ei välttämättä muodosta vastaajan näkökulmasta loogista
tai mielekästä kokonaisuutta
– Viiteajankohdan vaihtelu: usein yksi viikko, mutta joissakin
kysymyksissä pidempi, kuvaten esimerkiksi ”yleensä” tilannetta
– Vaikka ohjeita on, niitä aina lueta tai ymmärretä
– Kännykällä 50 % verkkolomakkeista, ei välttämättä näy kaikki
–Haastattelija ei ole kuuntelemassa ja ohjaamassa
Verkkovastaamisen onnistuminen
21
Tilastokeskus
17.11.2022
–Varsinkin kotitalouden muiden jäsenien puolesta tietojen
antaminen verkossa saatetaan kokea vaikeaksi ja myös
arveluttavaksi
– Viimeinen kierros sisältää muutenkin enemmän kysymyksiä
– Viimeisen kierroksen kokemukset eivät luonnollisesti vaikuta
vastaamisalttiuteen enää paneelissa
–Vastaajan huomio voi kiinnittyä ”sivuseikkoihin”
– Kaikki kysymykset eivät ole yhtä tärkeitä
– Vastaajaa voi jäädä kaihertamaan mieleen ”sivuseikka”
Oliko vastaamisessa ongelmia;
mitä ongelmia (%)
Voi valita usean vaihtoehdon (siksi yli 100 %) Työvoimatutkimuksen vastaajapalaute 9/2021
22
Tilastokeskus
17.11.2022
0,0
20,0
40,0
60,0
80,0
100,0 Muita ongelmia
Nettiyhteyden toimiminen (hitaus,
yhteyden katkeaminen)
Lomakkeen soveltuvuus näytölle (pieni
teksti, huono sivutus)
Lisätiedon ja ohjeiden löytäminen
Vaikeuksia valita oikea
vastausvaihtoehto
Kysymysten tai vastausvaihtoehtojen
ymmärtäminen
Lomakkeelle kirjautuminen
Ei lainkaan ongelmia
Haastattelun pituus ja verkkolomakkeeseen
käytetty aika, 1. kierros, osuus vastaajista (%)
24
Tilastokeskus
17.11.2022
0
5
10
15
20
25
30
35
40
45
50
1-5 min 6-10 min 11-15 min 16-20 min yli 20 min
Puhelin
Verkko
Haastattelun pituus ja verkkolomakkeeseen
käytetty aika, 3. kierros, osuus vastaajista (%)
25
Tilastokeskus
17.11.2022
0
10
20
30
40
50
60
1-5 min 6-10 min 11-15 min 16-20 min yli 20 min
Puhelin
Verkko
Haastattelun pituus ja verkkolomakkeeseen
käytetty aika, 5. kierros, osuus vastaajista (%)
26
Tilastokeskus
17.11.2022
0
5
10
15
20
25
30
35
1-5 min 6-10 min 11-15 min 16-20 min yli 20 min
Puhelin
Verkko
Keruutapauudistus – osa isompaa muutosta
27
Tilastokeskus
17.11.2022
–Yhdistelmäkeruuseen siirryttäessä toteutettiin myös sisältö-
ja estimointiuudistus vuoden 2021 alusta lukien
–Vuoden 2021 alkupuolella dataa tarkasteltiin huomattavasti
normaalitilannetta enemmän
– Verkkokeruun aiheuttama kadon lisävinouma
– Mahdollinen moodivaikutus
–Lopulliset tulokset vuoden 2021 ensikuukausilta sekä
vuoteen 2009 ulottuva aikasarja korjattuna julkaistiin
4.5.2021, jolloin oli päätetty estimoinnin uudistamisen
metodi
– Poikkeus: aikasarja katkaistu sekä julkaiseminen lopetettu niin
sanotuissa piilotyöttömissä
– Muutosta tuloksissa ei ole voitu selittää
Havaintoja verkkokeruun laadusta
28
Tilastokeskus
17.11.2022
–Vastaamistapojen välillä on eroja tuloksissa, mutta nämä
selittyvät useimmiten erilaisilla vastaajajoukoilla verkossa ja
puhelimessa
–Verkkovastaajat antavat hiukan enemmän eos-vastauksia
sekä, jos vastauksia tarkastellaan yksikkötasolla, niin
sisällöltään ristiriitaisia vastauksia
–Joissain kysymyksissä havaittu virheellisiä tulkintoja
– Esimerkki: viikkotyöajan sijasta on annettu päivittäinen työaika
Yhteenveto:
kato + yhdistelmäkeruu
erityisesti verkkokeruu
29
Tilastokeskus
17.11.2022
Aineiston edustavuuden varmistaminen vastaamishaluttomuudesta
huolimatta (luotettavat estimaatit, datan riittävyys)
+Työvoimatutkimuksen tosiasiapohjaiset kysymykset ja yleensä lyhyt lomake
soveltuvat hyvin verkkovastaamiseen
+Tilaston tuotantoprosessi pystyy käsittelemään sujuvasti eri tiedonkeruu-
tavoista tulevaa dataa
+Tietojen kuukausittainen julkistaminen ei ole viivästynyt
+Parannettu katokorjaus
– Osa vastaajista kokee kysymykset turhiksi tai ei muuten saa tarvitsemaansa
tukea verkossa, ohjeista huolimatta
– Tiedonantajien saaminen verkkoon ilman haastattelijan yhteydenottoa
Tavoite
Onnistumiset
Hankaluuksia