Webscraping, gegevens online verzamelen en verwerken voor de consumptieprijsindex

Consumptieprijzen
Webscraping

Webscraping is een techniek waarmee gegevens automatisch uit webpagina's worden opgehaald (‘ to scrape’). Deze analyse geeft uitleg over het gebruik van webscraping voor de consumptieprijsindex. Wat houdt webscraping in? Hoe zien de gegevens eruit? Hoe verwerkt Statbel (AD Statistiek – Statistics Belgium) deze gegevens?

Deze analyse beschrijft de uitgevoerde case studies en de verschillende geteste methoden voor het berekenen van de index op basis van webscraping. Ze bevat ook een aantal algoritmen voor automatisch leren. Automatisch leren is het onderzoek waarin algoritmen worden ontworpen zodat machines/computers/programma's zelf kunnen "leren".

Download de analyse