Le webscraping, la collecte et le traitement de données en ligne pour l'indice des prix à la consommation

Prix à la consommation
Webscraping

Le webscraping est une technique qui permet d'extraire automatiquement des données de pages internet (‘ to scrape’). La présente analyse explique l'utilisation du webscraping dans l’indice des prix à la consommation. En quoi consiste le webscraping? À quoi ressemblent ces données? Et comment Statbel (DG Statistique – Statistics Belgium) traite-t-elle ces données?

Cette analyse décrit les études de cas réalisées et les différentes méthodes de calcul de l'indice sur la base du webscraping qui ont été testées. Elle présente également un certain nombre d'algorithmes pour l'apprentissage automatique. L'apprentissage automatique est l'étude dans le cadre de laquelle des algorithmes sont créés pour que les machines/ordinateurs/programmes puissent "apprendre" eux-mêmes.

Télécharger l’analyse