Grid à mailles variables

Datalab - Grid de population à cellules de taille variable

DataLab
Datalab - Grid de population à cellules de taille variable

Statbel publie depuis déjà près de 10 ans des fichiers vectoriels et de population belge répartie sur une grille composée de carrés de 1km de côté (appelée Grid). Pour certaines utilisations, ces résultats se révélaient encore trop peu détaillés. C’est pourquoi nous avons développé un grid de population reprenant le nombre de personnes par maille carrée de taille variable de 1 km, 500 m, 250 m et 125 m de côté. La taille des mailles dépendant du nombre d’individus présents dans celles-ci : au plus une maille contient de personnes, au plus elle peut être divisée sans en altérer la confidentialité.

Description

Grid de population qui fournit le nombre de personnes par maille carrée de taille variable (1 km, de 500 m, 250 m et 125 m de côté).

Le grid utilisé par Statbel, subdivisant le territoire en carrés d’1 km de côté est utilisé comme base. Les cellules sont ensuite découpées itérativement en 4 si les règles de confidentialité le permettent, les plus petites cellules mesurant 125 m de côté. Une cellule ne peut être divisée qu’en 4 sous-cellules. Les cellules situées aux frontières suivent exactement le même « découpage aux frontières » que dans le grid utilisé par Statbel (et déjà publié sur notre portail open-data). Certaines cellules ne sont plus des carrés, à l’issue de ce traitement. Voici un exemple du découpage au niveau de la frontière :

Datalab - Grid de population à cellules de taille variable

Figure 1 – Découpage à la frontière

Le tracé des frontières suit les limites administratives du pays, sans aucun buffer, telles que définies par le SPF Finances (https://finances.belgium.be/fr/experts-partenaires/donnees-ouvertes-patrimoine/jeux-donnees/unites-administratives).

Données de population

Les données utilisées proviennent du Registre national, pendant une année de référence. Le chiffre officiel de la population belge comprend les Belges et les non-Belges admis ou autorisés à s’établir ou à séjourner sur le territoire mais ne comprend pas les non-Belges séjournant pendant moins de trois mois sur le territoire, les demandeurs d’asile et les non-Belges en situation irrégulière. Un nombre limité d'enregistrements au Registre national sont effectués tardivement ou ne permettent pas d’être positionnés sur une carte (moins de 10.000 personnes ou moins de 0,1% de la population totale). Elles ne sont pas reprises ici.

Règles de confidentialité

Décision a été prise de protéger les km² faiblement peuplés. Pour cela, Statbel a choisi d’appliquer une méthode de « perturbation géographique » sur les données avant agrégation dans le grid. Cette approche peut être utilisée vu le faible pourcentage de cellules concernées. Le critère de confidentialité pour les cellules avant découpage a été fixé à minimum 4 personnes et 2 ménages. Le critère de confidentialité pour le découpage des cellules en 4 sous-cellules est de minimum 10 personnes et 5 ménages.

Le principe est alors le suivant :

  1. Les données de population sont agrégées suivant le grid utilisé par Statbel,
  2. Les cellules qui ne remplissent pas nos critères de confidentialité avant découpage sont listées.
  3. Les ménages qui occupent ces cellules sont virtuellement déplacés vers une zone plus peuplée. Le déplacement se fait, dans la mesure du possible, vers une cellule située dans le même secteur statistique. Si le déplacement ne résout pas le problème de confidentialité, il sera reporté vers une cellule plus éloignée, mais toujours située dans la même commune.
  4. Les données après «perturbation géographiques» sont alors à nouveau agrégées pour obtenir le grid de population de cellule d’1 km de côté.
  5. Chaque cellule d’1 km de côté est ensuite divisée en 4 cellules de 500 m de côté. Cette division est maintenue si les règles de confidentialité pour le découpage sont remplies pour chacune des 4 sous-cellules. Si le découpage viole l’une des règles de confidentialité, il est abandonné. La découpe se poursuit ensuite de manière itérative.

Résultat

Le grid obtenu se présente comme suit :

Datalab - Grid de population à cellules de taille variable

Figure 2 – Grid de population

Sa table attributaire fournit pour chaque cellule :

  • (X, Y): les coordonnées du point en bas à gauche de la cellule
  • MS_POP: la population au sein de la cellule
  • MS_LEN: la longueur du côté de la cellule
  • MS_KM2 : surface de la cellule

Données

Les données sont disponibles aux formats suivants :

  • Sqlite (ETRS89-extended / LAEA Europe)
  • Shapefile (ETRS89-extended / LAEA Europe)
  • GeoJSON (ETRS89-extended / LAEA Europe)