Platformdata in het verblijfstoerisme

Statbel DataLab: nieuwe statistieken, methoden en gegevensbronnen in beta-versie

DataLab – Platformdata in het verblijfstoerisme

DataLab
DataLab – Platformdata in het verblijfstoerisme

Het voorbije decennium boekten steeds meer Belgen hun vakantie via het internet. Maar ook eigenaars van een accommodatie maakten graag gebruik van een online platform om een appartement of vakantiehuis te huur aan te bieden.

Wegens dit toenemende succes besliste Statbel, het Belgische statistiekbureau, om een nieuwe experimentele statistiek over het gebruik van online platformen bij de verhuur van particuliere vakantieverblijven op te stellen. Hiervoor maakt Statbel gebruik van data die het via Eurostat van vier grote platformbedrijven ontvangt. Deze vier platformbedrijven, Airbnb, Booking.com, de Expedia Group en TripAdvisor, verstrekken gepseudonimiseerde en geaggregeerde data over alle reservaties en overnachtingen die via hun platformen op het Belgische grondgebied plaatsvonden.

Deze experimentele statistiek beperkt zich tot de accommodaties die door particulieren worden aangeboden. Professionele aanbieders van logies, zoals hotels, worden uitgesloten. Voor statistieken over deze professionele aanbieders kan men terecht bij de officiële toerismestatistieken. Meer informatie over deze experimentele statistiek en de gebruikte data is beschikbaar in het tabblad documentatie.

De online platformen waren in 2020 goed voor 4.467.000 overnachtingen bij particulieren

Dat de verhuur van accommodaties aangeboden door particulieren via een online platform, sterk ingeburgerd is, blijkt uit de recentste cijfers. In 2020 werden 437.000 accommodaties gereserveerd via een online platform, waarbij reizigers in totaal 4.467.000 nachten spendeerden. En zonder de uitbraak van het coronavirus en de reisbeperkingen die vanaf maart 2020 ingingen, zou het aantal reservaties en overnachtingen zelfs substantieel hoger liggen.

Het aantal reservaties en overnachtingen geboekt via een online platform, nam tot en met februari 2020 immers op jaarbasis stelselmatig toe. Vanaf maart 2020 stellen we de impact van de coronacrisis vast, waarbij reizen naar het buitenland werd afgeraden. In de zomer van 2020 vond een sterke remonte plaats, maar de tweede golf in het najaar resulteerde uiteindelijk in een sterke afname van het aantal geboekte overnachtingen. Uiteindelijk betekenen de 4.467.000 overnachtingen een afname met 36,1% in vergelijking met 2019 en een daling met 19,5% ten opzichte van 2018.

De meeste overnachtingen vonden plaats in het Vlaamse Gewest

Het Vlaamse Gewest telt het grootste aantal overnachtingen in accommodaties aangeboden door particulieren, die via een online platform werden gereserveerd. In 2020 vonden 45,4% van alle overnachtingen in het Vlaamse Gewest plaats, 35,8% in het Waalse Gewest en ten slotte 18,8% in het Brusselse Hoofdstedelijke Gewest. In vergelijking met 2019 nam vooral het aantal overnachtingen in de hoofdstad substantieel af (-11,4 pp), terwijl het Waalse Gewest aan populariteit won (+11,7 pp). Een vergelijkbare trend treedt op in andere Europese landen, waar door de coronacrisis grote steden aandeel verloren en dit ten voordele van landelijke gebieden met veel natuur.

Brussel-Hoofdstad blijft het populairste arrondissement

Ondanks een sterke daling in 2020, blijft Brussel-Hoofdstad het arrondissement met het grootste aantal overnachtingen die via een online platform bij een particulier werden geboekt. Over het volledige kalenderjaar vonden er 841.000 overnachtingen in de hoofdstad plaats. De arrondissementen Oostende (408.000 overnachtingen) en Brugge (367.000 overnachtingen) vervolledigen de top-3. In Wallonië was het arrondissement Verviers het populairst, met 326.000 overnachtingen, goed voor een landelijke vierde plaats.

Buitenlanders vormen de meerderheid

In 2018 en 2019 werden 77% van de overnachtingen gereserveerd door niet-ingezetenen, dus reizigers wiens hoofdverblijfplaats zich in het buitenland bevindt. Door de reisrestricties verbonden aan de coronacrisis, daalde dit aandeel naar 52% in 2020.

Ten slotte is het eveneens mogelijk om voor de niet-ingezetenen het aantal overnachtingen op te delen naar het herkomstland van de reiziger. Uit deze analyse blijkt dat in 2018 en 2019 de Fransen de grootste groep niet-ingezetenen vormden die via een online platform een accommodatie bij een particulier reserveerden. In 2020 sprongen de Nederlanders over de Fransen, om met 23% van de overnachtingen het belangrijkste herkomstland te worden. Met 17% van de overnachtingen sluiten de Duitsers de top-3 af, op de voet gevolgd door inwoners van het Verenigd Koninkrijk en Spanjaarden.

De voorbije jaren raakten diverse apps in gebruik die mensen met elkaar in contact brengen om goederen en diensten uit te wisselen. Steeds meer consumenten doen een beroep op een online platform om een vakantieverblijf te reserveren of laten een maaltijd aan huis leveren door een fietskoerierbedrijf. Hierdoor neemt het economische belang van de deeleconomie snel toe.

Vandaar dat Statbel, het Belgische statistiekbureau, in nauwe samenwerking met Eurostat en andere nationale statistische instellingen, bestudeert op welke manier de deeleconomie kan geïntegreerd worden in de openbare statistieken. Bij de analyse van de platformbedrijven worden de nationale statistische instellingen echter geconfronteerd met een aanzienlijke moeilijkheid. De grootste platformbedrijven zijn multinationale spelers, die hun activiteiten in België vaak beheren vanuit een buitenlandse zetel. Deze ondernemingen zijn daarom zelden terug te vinden in de reguliere ondernemingsstatistieken of –registers. Om de vereiste data te verkrijgen zouden de nationale statistische instellingen bijgevolg verplicht zijn om alle platformbedrijven op unilaterale basis te contacteren. Dat was een tijdrovende en weinig efficiënte werkwijze, zowel voor de platformbedrijven als voor de statistische instellingen. Vandaar dat de Europese Commissie besloot om deze gesprekken naar zich toe te trekken en via één overeenkomst de data voor alle EU-lidstaten op te vragen. Deze onderhandelingen focusten zich in eerste instantie op de sector van het verblijfstoerisme en resulteerden in akkoorden met de platformbedrijven Airbnb, Booking.com, TripAdvisor en Expedia . Ondertussen hebben deze bedrijven de eerste gegevensbestanden aan Eurostat geleverd. Eurostat deelt de microdata vervolgens op in 27 nationale gepseudonimiseerde en geaggregeerde bestanden, waardoor Statbel informatie ontvangt over alle reservaties en overnachtingen die via deze vier online platformen op het Belgische grondgebied worden gereserveerd.

Met de akkoorden tussen de Europese Commissie en de vier platformbedrijven werd een eerste, belangrijke horde genomen. Maar het methodologisch werk vangt nu pas aan. Op basis van de eerste bestanden moeten de nationale statistische instellingen en Eurostat nog een geharmoniseerde aanpak voor de methodologische uitdagingen uitwerken. Doordat de microdata van de platformbedrijven geen identificatiegegevens bevatten, vormen in het bijzonder de dubbeltellingen een aanzienlijk probleem. Deze dubbeltellingen, waarbij een accommodatie dus minstens in twee verschillende bestanden zit vervat, vormen vooral een uitdaging om de capaciteit te bepalen. Vandaar dat deze informatie niet vervat zit in de experimentele statistiek.

Op dit moment bestuderen de nationale statistische instellingen samen met Eurostat welke technieken het best gebruikt kunnen worden om de methodologische problemen op te lossen. Hierbij wordt vooral gekeken naar innovatieve methoden zoals webscraping. Bij webscraping schraapt men relevante informatie van websites, hetgeen in combinatie met artificiële intelligentie als de beste oplossing wordt gezien. Concreet bestuderen we de volgende twee pistes:

  • tekstherkenning: particulieren die eenzelfde kamer aanbieden op meerdere online platformen, maken in regel gebruik van dezelfde tekst. Door op zoek te gaan naar kernwoorden, zoals de locatie van het logement, de grootte van de kamer, aanwezige faciliteiten, … kunnen identieke accommodaties automatisch opgespoord worden;
  • fotoherkenning: bij deze techniek worden de foto’s die bij een advertentie worden geplaatst automatisch vergeleken, om op die manier eventuele dubbeltellingen te identificeren. Deze techniek vereist echter een groot computergeheugen en wordt hierom eerder als een alternatieve oplossing achter de hand gehouden.

Op termijn is het de bedoeling om de platformdata te integreren in de recurrente statistiek. De timing hiervoor is zowel afhankelijk van het bereiken van een geharmoniseerde aanpak van de methodologische problemen als van een snellere datalevering door de platformbedrijven.