Actualisering van de consumptieprijsindex (CPI) voor het jaar 2020

Consumptieprijzen
Actualisering van de consumptieprijsindex (CPI) voor het jaar 2020

De consumptieprijsindex (CPI) met referentiejaar 2013 = 100, die van start ging in januari 2014, is een kettingindex, die jaarlijks in januari geactualiseerd wordt. Door de jaarlijkse actualiseringen blijft de CPI representatief doorheen de tijd en wordt de gemeten inflatie niet vertekend, naarmate de index veroudert. Dit in tegenstelling met een index met vast basisjaar, die veroudert doorheen de tijd, waardoor mogelijk de inflatie minder nauwkeurig meten wordt na verloop van tijd.

De representativiteit en de kwaliteit van de index worden doorheen de tijd gegarandeerd, onder andere door het actueel houden van de productenkorf, het aanpassen van berekeningsmethoden, het integreren van nieuwe prijzenbronnen en het representatief houden van het winkelstaal.

Het betreft de zesde actualisering op rij. Hier volgt een kort overzicht van de belangrijkste wijzigingen. De Indexcommissie heeft daarover een unaniem positief advies gegeven aan de Minister van Economie. De Minister volgt dit advies en de aanpassingen worden bijgevolg door Statbel geïmplementeerd in de consumptieprijsindex van januari 2020.

Methodologische wijzigingen

Voor de private huur wordt vanaf 2020 een nieuwe methode gebruikt voor de gegevensverzameling en –verwerking. Verder wordt ook de indexberekening verfijnd voor producten die met scannerdata of webscraping gevolgd worden.

Methodologische wijzigingen voor de private huur

De huur is met een gewicht van 7,3% een belangrijke post in de indexkorf. De methode van gegevensinzameling en indexberekening voor de private huur worden grondig gewijzigd. Voorheen werd gebruik gemaakt van een steekproef van ongeveer 2.000 huurwoningen. De adressen werden getrokken uit de databank van de geregistreerde huurcontracten van de AAPD (Algemene Administratie van de Patrimonium Documentatie) van de FOD Financiën. De huurders werden jaarlijks ondervraagd rond de verjaardag van hun contract en op basis van die informatie werd maandelijks een indexcijfer berekend.

Die methode had echter een aantal nadelen, zoals een lage responsgraad, woningen die niet meer kunnen gevolgd worden omdat de huidige huurder vertrekt en de nieuwe huurder niet meewerkt of er niet snel een nieuwe huurder is, …

Vanaf 2020 wordt een nieuwe methode van gegevensinzameling en indexberekening gehanteerd, die een oplossing biedt aan die tekortkomingen. In plaats van aan de hand van een beperkte steekproef de huurprijsevolutie te meten, zal gebruik gemaakt worden van de volledige databank van de AAPD die teruggaat tot 2011. Jaarlijks worden in die databank ruim 200.000 nieuwe huurcontracten geregistreerd. Gezien het een administratieve databron betreft, werd ze in eerste instantie voor statistische doeleinden bruikbaar gemaakt via de nodige data cleaning.

De eigenlijke indexberekening gebeurt net zoals vroeger via een stratificatiemodel tot op provincieniveau. Maar de indexen op het laagste niveau (provincie) worden nu met een regressiemethode (time product dummy methode) met voortschrijdende vensterperiode berekend in plaats van met een Dutot index (index berekend op basis van de verhouding van de gemiddelde prijzen). Eenvoudig gezegd komt het erop neer dat men over een periode (een venster van 8 jaar) dezelfde woningen doorheen de tijd gaat volgen in de databank. Men doet deze oefening voor opeenvolgende perioden (voortschrijdend venster) en koppelt de gemeten prijsevoluties aan elkaar.

Praktisch houdt het in dat met de nieuwe methodologie voor eenzelfde woning de prijsstijging tussen opeenvolgende huurcontracten binnen een periode van 8 jaar gemeten wordt. Die gemeten prijsstijging geeft een compleet beeld van de prijsevolutie, namelijk de jaarlijkse indexeringen én de eventuele prijsverhogingen telkens bij het afsluiten van een nieuw contract voor dezelfde huurwoning.

Methodologische wijzigingen voor scannerdata en webscraping

Eén van de vele voordelen van het gebruik van scannerdata is dat omzetinformatie op productniveau beschikbaar is. Echter wanneer deze informatie rechtstreeks gebruikt wordt in een maandelijkse kettingindex dan ontstaat het risico op chain drift. Het komt erop neer dat de index niet terug naar het aanvangsniveau keert wanneer de prijzen en omzet in de huidige periode opnieuw gelijk worden aan die in de aanvangsperiode.

Om chain drift te vermijden werd tot nu toe gewerkt met ongewogen indices op het laagste niveau. De omzetinformatie werd uiteraard wel gebruikt voor andere doeleinden, bijvoorbeeld om te bepalen welke producten in de steekproef werden opgenomen. Ondertussen zijn er op internationaal niveau methoden ontwikkeld waarbij toch omzetinformatie op productniveau gebruikt kan worden en er geen drift zal optreden. Deze methoden worden multilaterale methoden genoemd omdat meerdere perioden met elkaar vergeleken worden in tegenstelling tot traditionele indexberekeningen waarbij twee perioden met elkaar vergeleken worden. Een gevolg van indexberekeningen met multilaterale methoden is dat, telkens wanneer de tijdreeks wordt uitgebreid, indexcijfers uit het verleden herzien zouden moeten worden. Dat komt omdat oudere periodes ook vergeleken worden met de meest recente toevoeging. Om het herzieningseffect te elimineren, zodat herziening van cijfers uit het verleden niet nodig is, wordt gewerkt met vensterperioden. Die vensterperioden kunnen vervolgens met elkaar gekoppeld worden. Vanaf 2020 wordt voor scannerdata de zogenaamde GEKS-methode gebruikt. Dat is een specifieke multilaterale methode, genaamd naar Gini, Eltetö, Köves & Szulc. Meer achtergrondinformatie is te vinden in de analyse ‘Evaluatie van multilaterale indexmethoden’, die Statbel op 23 oktober 2019 gepubliceerd heeft.

Een soortgelijke verbetering wordt vanaf 2020 ook voor de indexberekening van schoeisel toegepast. Hoewel, in tegenstelling met scannerdata, geen omzetten voorhanden zijn bij webscraping, kan de som van de maandelijkse waarde van alle items binnen een homogeen product worden gebruikt als een gewicht. Dit is gelijkaardig aan een manuele gegevensinzameling waarbij items met een hogere frequentie van beschikbaarheid een grotere kans maken om opgenomen te worden door een enquêteur. Met gewichten op het homogene niveau kan dus een gewogen multilaterale methode worden toegepast, net zoals voor scannerdata.

Productenkorf en gewichten

Bij elke jaarlijkse actualisering kunnen representatieve getuigen aan de korf toegevoegd worden en minder representatieve getuigen geschrapt worden.

Concreet worden in 2020 acht nieuwe getuigen aan de korf toegevoegd, waarvan één getuige zal gevolgd worden via scannerdata (alcoholvrije bieren) en één getuige via webscraping (zonnebril). Er worden twee getuigen geschrapt: zonnebankabonnement en draadloze vaste telefoon. Het gewicht van deze twee getuigen nam jaar na jaar af en is voor 2020 verwaarloosbaar. Twee gelijkaardige getuigen worden gecombineerd in één getuige, namelijk de getuigen “gewone” en combi-microgolfoven worden gecombineerd in de getuige microgolfoven. Het combineren van deze twee getuigen zorgt ervoor dat er geen twee aparte grotere steekproeven meer nodig zijn, maar dat één dekkende steekproef gehanteerd kan worden.

COICOP Benaming
  Nieuwe getuigen
02.1.3.3.01 Alcoholvrije bieren
04.3.1.0.11 Douchekop
05.2.0.3.04 Tafelloper
06.2.2.0.03 Gebitsreiniging
07.2.3.0.07 Vervangen en opslag van zomer- en winterbanden
09.3.5.0.05 Dierenpension
12.3.2.9.01 Paraplu
12.3.2.9.02 Zonnebril
  Definitiewijziging
05.3.1.3.02 Microgolfoven
  Geschrapte getuigen
08.2.0.1.01 Draadloze vaste telefoon
12.1.1.3.01 Zonnebankabonnement

Op getuigenniveau worden geen indices gepubliceerd, maar de introductie van de nieuwe getuigen

  • 02.1.3.3.01 Alcoholvrije bieren
  • 12.3.2.9.01 Paraplu
  • 12.3.2.9.02 Zonnebril

heeft tot gevolg dat vanaf januari 2020 voor 2 bijkomende COICOP-groepen indices gepubliceerd worden (detail op 5e niveau). Het betreft de groepen

  • 02.1.3.3. Alcoholvrije bieren
  • 12.3.2.9. Andere artikelen voor persoonlijk gebruik, niet eerder genoemd (n.e.g.).

Zoals de vorige jaren werd ook het gewichtenschema aangepast. De gewichten zijn nu gebaseerd op het huishoudbudgetonderzoek van 2018, een onderzoek dat om de twee jaar plaats vindt en dat in 2018 liep bij meer dan 6.000 huishoudens. De resultaten werden in november 2019 gepubliceerd. De gewichten hebben in eerste instantie dus betrekking op 2018. Ze werden vervolgens geactualiseerd naar 2019 via een zogenaamde price update, gezien december 2019 de nieuwe referentiemaand is voor de kettingindex in 2020. Uiteraard werden ook de nieuwe getuigen in het gewichtenschema geïntegreerd.

Meting van de prijsevolutie van producten en diensten via scannerdata en webscraping

Statbel blijft verder inzetten op de integratie van ‘big data’ (scannerdata en webscraping) als bron voor de consumptieprijsindex. Door het gebruik van scannerdata en webscraping wordt de nauwkeurigheid van de CPI verbeterd. Hierdoor moet immers het prijsindexcijfer voor een productgroep niet meer gebaseerd worden op een relatief beperkt staal van producten, maar kan men de prijzen verwerken van een veelvoud van verkochte items. Deze nieuwe werkwijze leidt tot een indexcijfer dat nauwer aansluit bij het werkelijke consumptiegedrag.

Scannerdata werden vanaf 2015 gradueel geïntroduceerd in de CPI. Het gewichtsaandeel van de korf, dat gevolgd wordt met scannerdata, zal 23,7% bedragen in 2020. Het betreft kassascangegevens van de grootste supermarkten. Deze scangegevens worden aangevuld met prijsopnames in winkels (voorbeeld: bakker, slager, …).

Verder worden - naast scannerdata, tariefprijzen, catalogusprijzen en klassieke prijsopnames in winkels - prijzen ingezameld via webscraping. Dat is een techniek om automatisch gegevens van webpagina’s af te halen (‘scrapen’). Hierbij worden de data van webpagina’s op een gestructureerde manier verzameld en verwerkt, zodat deze gebruikt kunnen worden voor statistische doeleinden. Gezien het groeiende belang van webwinkels en de online verkoop van ‘klassieke winkels’, is het noodzakelijk om ook deze gegevens mee in rekening te brengen in de berekening van de prijsindices.

Het gebruik van deze data laat bovendien toe om de efficiëntie van de dataverzameling te verbeteren. Daarnaast kan het de representativiteit van de prijsindices verhogen, gezien de prijzen van een veelvoud van producten kunnen gevolgd worden in vergelijking met de klassieke prijsopnames.

Momenteel worden webscraping resultaten verwerkt in de index voor wat betreft de DVD, Blu-ray discs, videogames en internationale treintickets, schoeisel, weekends aan zee en in de Ardennen, hotelkamers, huur van een studentenkamer, tweedehandswagens. In 2020 wordt daar ook de zonnebril aan toegevoegd. In 2020 zal het gewichtsaandeel van gevolgde productgroepen via webscraping 4,3% bedragen.

In 2020 worden voor in totaal 28% van het gewicht van de indexkorf prijzen gevolgd via scannerdata of webscraping.

CIOCOP Big data in de CPI 2020 (‰)
01 Voeding en niet-alcoholische dranken 175.50
02 Alcoholische dranken en tabak 24.66
05.5.2.2 Kleine toebehoren voor het huis en de tuin 3.50
05.6.1 Niet-duurzame huishoudartikelen 9.06
09.3.4.2 Artikelen voor huisdieren 7.44
09.5.4.1 Papierartikelen 0.86
09.5.4.9 Materiaal om te schrijven en te tekenen 1.79
12.1.3 Andere apparaten, artikelen en producten voor lichaamsverzorging 14.66
Totaal scannerdata 237.47
03.2.1.1 Herenschoenen 3.55
03.2.1.2 Damesschoenen 5.36
03.2.1.3 Kinder- en babyschoenen 3.32
04.1.2.1 Huur van een studentenkot 3.45
07.1.1.2 Tweedehands auto's 15.38
07.3.1.1.11 Treinreis naar buitenland 0.41
09.1.4.1.01 Blu-ray disc 0.40
09.1.4.1.02 DVD (muziek of film) 0.40
09.3.1.1.02 Videospel voor console 0.46
09.6.0.1.01 Weekend aan zee / in de Ardennen 2.10
11.2.0.1 Hotelkamer 6.21
12.3.2.9.02 Zonnebril 1.98
Totaal webscraping 43.02
Totaal big data 280.49