Accueil
Titre : | L’intégration des données administratives dans un processus statistique : Industrialiser une phase essentielle (2023) |
Auteurs : | Franck Cotton ; Olivier Haag |
Type de document : | Article : document Ă©lectronique |
Dans : | Courrier des statistiques (N9, juin 2023) |
Article en page(s) : | pp. 104-1 |
Langues: | Français |
Catégories : |
Thésaurus CEREQ DONNEE STATISTIQUE ; METHODOLOGIE D'ENQUETE ; FRANCE |
Résumé : |
La statistique publique a de plus en plus recours à des sources externes, en particulier à des données administratives, pour produire des statistiques. Ceci nécessite d’industrialiser davantage les processus de production et notamment le processus d’intégration de ces données, afin de sécuriser, d’assurer une meilleure traçabilité et de rendre cette intégration la plus reproductible possible.
L’objectif du statisticien public est de mettre en place un cadre général d’intégration de données permettant une démarche automatisée sur des données structurées, livrées par un producteur externe. Plus précisément, il s’agit d’implémenter un pipeline jalonné de points de contrôle qui permettent de s’assurer que la succession des tâches (renommer, restructurer les données, recoder, pseudonymiser, etc.) se déroule correctement et d’arrêter le processus dès qu’un éventuel problème est rencontré. En outre, l’utilisation de standards et de métadonnées actives le long de ce pipeline permettent au concepteur d’être le plus autonome possible et ainsi de pouvoir l’adapter plus facilement aux évolutions des sources externes. |
Document Céreq : | Non |
En ligne : | https://www.insee.fr/fr/information/7635829?sommaire=7635842 |
Documents numériques (1)
courstat-9.pdf Adobe Acrobat PDF |