Statbel, big data en privacy

Table of Contents

    De uitdaging

    Big data zoals scannerdata, mobiele-telefoondata of satellietdata bieden Statbel de mogelijkheid om betere en snellere openbare statistieken voor burgers, ondernemingen en het beleid te maken. Big data zijn echter vaak persoonsgegevens, en velen zijn dan ook ongerust over een mogelijke aantasting van de privacy.

    Die vrees moet serieus genomen worden, maar ze kan getemperd worden door een beter begrip van het strikt wettelijk kader waarbinnen Statbel werkt en van de concrete procedures en werkwijzen die garanderen dat de gegevens anoniem zijn en blijven, en uitsluitend gebruikt worden voor  anonieme en gegroepeerde statistieken en - in bepaalde gevallen en mits ‘pseudonimisering’ - voor wetenschappelijk onderzoek.

    Big data zijn nodig

    Beleid kan niet blind gebeuren, bedrijven moeten beslissen met kennis van zaken, en burgers moeten goed geïnformeerd zijn. De traditionele gegevensbronnen van Statbel, enquêtes en exploitatie van administratieve data, kennen hun beperkingen. Big data, uiteraard ook met beperkingen, laten toe op een meer moderne en intelligente manier statistieken te maken die véél sneller en gedetailleerder zijn, tegen een lagere kostprijs, zonder dat men burgers of ondernemingen moet lastigvallen, zelfs over zaken die voorheen onmogelijk in kaart te brengen waren.

    Voorbeeld van mogelijke toekomstige toepassingen.

    Een betere matrix woonplaats-werkplaats

    De woon-werkmatrix toont waar de mensen die ergens wonen gaan werken, wat bijvoorbeeld voor mobiliteit, publieke infrastructuur en arbeidsmarktbeleid van belang is. De huidige statistiek, op gemeenteniveau en op basis van de Bevolkings- en RSZ-registers, zou vervangen kunnen worden door een op mobiele-telefoondata gebaseerde matrix op het niveau van wijken die veel sneller beschikbaar is, met een hogere frequentie. Statbel hoeft daarvoor van de telecomoperatoren geen individuele gegevens te ontvangen, maar alleen het resultaat van een overeengekomen selectie en de berekeningen daarop.

    Er zijn strikte wetten en regels …

    Statbel is voor zowel zijn traditionele dataverzameling als big data onderworpen aan de Belgische en Europese statistische wetgeving die zegt dat gegevens uitsluitend verzameld mogen worden om er anonieme en gegroepeerde statistieken mee te maken en dat de vertrouwelijkheid van de gegevens (persoonlijke én andere) strikt gegarandeerd moet worden.

    Daarbovenop komt de Europese en Belgische privacywetgeving die het gebruik van persoonsgegevens regelt, maar die opslag en verwerking voor statistische doeleinden onder bepaalde voorwaarden toelaat.

    … die ook in de praktijk gebracht worden

    Statbel voert een strikte scheiding door tussen enerzijds de gegevensverzameling, die binnenkomende data onmiddellijk ‘pseudonimiseert’ door het vervangen van elk identificatiegegeven door een code, en anderzijds de statistische verwerking die alleen met dergelijke gepseudonimiseerde gegevens werkt. De statistische resultaten die verspreid worden zijn nooit individueel of persoonlijk maar altijd gegroepeerd, bovendien op een dergelijke manier dat individuele data niet via combinatie afleidbaar zijn.

    Deze verwerkingsprocedures worden aangevuld met een beveiligde databankstructuur, zowel fysiek als qua procedures.

    Een stap verder: privacy by design

    Noch de wetgeving noch de praktijk inzake privacy zijn specifiek voor big data. Maar big data bieden de mogelijkheid om nog verder te gaan in databeveiliging, via zogenaamde ‘privacy by design’; dit is de manier waarop Statbel wil werken, nu en in de toekomst. Privacy by design komt er in dit geval op neer dat individuele data het datawarehouse van de eigenaar (bv. een telecomoperator) niet verlaten, maar dat een afgesproken query en/of berekening op de data losgelaten wordt en dat enkel het resultaat daarvan geleverd wordt. Een dergelijke verwerking kan zo opgesteld worden dat het resultaat volstrekt anoniem en niet-individueel wordt. Dat vermijdt elk mogelijk privacyprobleem, en het heeft als bijkomend groot voordeel dat de omvang van de geleverde dataset sterk gereduceerd en dus makkelijker hanteerbaar wordt.

    Besluit

    Statbel is niet geïnteresseerd in de persoonlijke data op zich maar in relevante, betrouwbare en accurate statistische resultaten die onmisbaar zijn voor burgers, ondernemingen en beleidsmakers om beslissingen te nemen. Persoonlijke en andere individuele data worden beschermd door strikte wettelijke bepalingen die in de praktijk geïmplementeerd worden, omtrent gebruik, opslag, combineren van data, en toegang. Die concrete gegevensbescherming is fysiek, organisatorisch en procedureel vastgelegd en gedocumenteerd, en ze wordt in de praktijk gebracht.

    In het geval van big data is het in veel gevallen bovendien onnodig om individuele data binnen te halen (en dat is vaak zelfs niet mogelijk of praktisch, gezien de enorme volumes), waardoor de bescherming van de privacy verzekerd is .