La Cnil est née de l’objectif de l’Insee d’interconnexions généralisées des fichiers administratifs
C’est un projet de l’Insee qui est à l’origine de la Commission nationale de l’Informatique et des Libertés et, plus largement, de la Loi Informatique et Libertés. Peu de gens le savent, y compris parmi les statisticiens publics aujourd’hui en poste, mais il suffit de naviguer dans la rubrique « L’histoire de la Cnil en vidéo » du site Internet de la commission pour s’en rappeler. Au début des années 1970, la direction du ministère des finances initie un projet de « système automatisé pour les fichiers administratifs et le répertoire des individus », alias « SAFARI ». Il émerge avec les premiers pas de l’informatisation des fichiers administratifs. Les « experts » de l’Insee voient alors l’intérêt qu’ils auraient à rendre réalisables toutes les interconnexions de fichiers possibles grâce à la systématisation de l’introduction dans ces fichiers du « numéro d’identification au répertoire » (Nir), plus connu sous le nom de « numéro de sécurité sociale ». L’ambition affichée est double : faciliter la production de statistiques et améliorer l’efficacité de l’Etat dans la mise en œuvre de ses politiques publiques.
Avec leur esprit d’ingénieurs d’Etat, qui se considèrent par nature dépositaires du bien-être commun et de toutes les bonnes intentions du monde, ils ne voient là que progrès et rationalité. Aveugle aux leçons de l’Histoire, ils n’y voient aucun risque pour l’avenir. Hors de l’Insee et des administrations concernées, les inquiétudes face aux risques potentiels d’un tel projet n’ont pas non plus été immédiates. Combien se souvenait alors que le NIR avait été créé sous le régime de Vichy par le Service national des Statistiques pour préparer une éventuelle mobilisation militaire des hommes, l’enregistrement des femmes servant alors de leurre sur l’objectif premier du fichier ? Qui savait qu’une fois le NIR créé, les statisticiens s’étaient déjà dit, toujours pendant la guerre, qu’il serait utile de l’utiliser plus largement, notamment à l’occasion d’enquêtes ? Qui savait encore qu’il fut envisagé de l’utiliser pour le recensement des Juifs décidé le cadre de la politique antisémite de l’Etat français ?
Finalement, il faut attendre la publication d’un article du journal Le Monde, intitulé « Safari ou la chasse aux Français », dans l’édition du 21 mars 1974, pour que le débat s’ouvre publiquement. Sous la plume de Philippe Boucher, l’Insee, bien que porteur du projet, est relativement épargné, le journaliste préférant cibler les usages administratifs possibles et, plus encore, les velléités qu’auraient eu le ministère de l’intérieur de jouer un rôle pivot. Les polémiques s’achèvent avec la création de la Cnil et par le vote de la loi Informatique et Libertés du 6 janvier 1978, qui pose un cadre par principe plus suspicieux sur l’informatique d’Etat que sur l’informatique privée.
Avec le déploiement d’Internet et des Gafam, les temps ont évidemment bien changé. L’usage des données individuelles par les entreprises privées est devenu autant porteuse de risques que les usages par les administrations publiques. Cette évolution a provoqué une révolution copernicienne qui permet aujourd’hui à l’Insee de relancer des projets qui ressemblent fort au projet Safari, dans un cadre légal devenu désormais étonnamment permissif pour lui, grâce à la loi pour une République numérique d’octobre 2016 et au règlement général à la protection des données transposé, que la loi du 20 juin 2018 a intégré à la loi Informatique et Libertés.
Les évolutions législatives récentes permettent à l’Insee de relancer son projet d’interconnexions généralisées de données administratives individuelles
Grâce à la loi pour une République numérique, l’Insee a désormais les mains libres pour intégrer le NIR dans ses fichiers d’enquête et tous les fichiers administratifs qu’il traite. Ce NIR est intégré sous une forme cryptée, appelé de façon faussement rassurante « code statistique non signifiant ». Faussement rassurant, car techniquement, l’Insee pourra toujours associer ce code « non signifiant » au NIR et l’état-civil complet des personnes en s’appuyant sur la base des répertoires des personnes physiques, qu’il gère. Il sera aussi possible techniquement d’y associer leurs adresses. C’est d’ailleurs l’objectif du projet de « répertoire statistique individus et locaux d'habitation » (RESIL) que l’Insee développe actuellement : recenser de façon aussi exhaustive que possible, tous les ans, l’ensemble des personnes résidant sur le territoire national, identifié par leur NIR crypté, identifier l’ensemble des adresses qui leur sont associés dans le recensement de population, dans les fichiers fiscaux, dans les fichiers sociaux et définir leur adresse de vie la plus probable dans le cas où plusieurs adresses sont repérées. Tous les services statistiques ministériels peuvent désormais aussi utiliser ce même identifiant « non signifiant » et pourront donc l’associer à toutes les données individuelles administratives qu’ils traitent. Tous pourront ensuite rapprocher les différents fichiers entre eux pour rassembler des informations éparses.
Au passage, rappelons que les dispositions du projet de loi pour une République numérique avait fait l’objet d’une large consultation en ligne. La disposition relative à l’usage du NIR crypté par les services statistiques d’Etat est l’une des rares à avoir fait l’objet d’objections significatives, sans que le texte finalement proposé au parlement n’en tienne compte. A l’initiative de qui et pourquoi ? Aux historiens de demain de nous apporter une réponse ! Curieusement aussi, la loi est beaucoup plus libérale pour les services statistiques d’Etat, institutionnellement insérés dans des ministères et dont les responsables ont des carrières soumises aux nominations du gouvernement, que pour les chercheurs. Ces derniers peuvent désormais aussi s’appuyer sur un NIR crypté non signifiant pour interconnecter des fichiers administratifs à des fins de recherche mais ce NIR doit être crypté de façon différente dans chaque projet, pour éviter que des interconnexions de fichiers non envisagés initialement puissent se faire plus tard. Le même principe aurait pu être mis en œuvre pour l’Insee et les services statistiques ministériels. Mais ce ne fut pas la solution retenue. Eux sont libres d’injecter le même NIR cryptés dans tous les fichiers qu’ils traitent et de le conserver des années durant, leur permettant le moment venu, d’interconnecter entre eux des fichiers en utilisant des informations collectées antérieurement, pour répondre à des besoins d’informations nouvelles, en fonction des nouvelles préoccupations des pouvoir publics du moment. Dit autrement, ils peuvent enrichir d’une information identifiante des fichiers qu’ils conservent durablement « au cas où », de façon séparée, mais interconnectables, pour des usages qu’ils n’ont ni prévu, ni réfléchi au départ. Autant le dire, l’esprit du RGPD semble bien loin, même si on en respecte la lettre.
La mise en œuvre du RGPD a renforcé les dérives potentielles car elle autorise les services statistiques d’Etat à s’exempter d’un certain nombre d’obligations relatives à l’information des personnes, au droit d’accès et au droit de rectification, du fait des exemptions que le RGPD autorise pour les traitements ayant des finalités de recherche ou de « production statistique ». En permettant cela, le législateur européen avait-il en tête le fait que des services statistiques d’Etat pourrait vouloir procéder à des traitements « au cas où », par anticipation, sans idées préconçues sur les usages concrets qui seront faits dans le futur ?
De façon concrète, cette nouvelle architecture va, par exemple, permettre à l’Insee et aux services statistiques ministériels de faire progresser la lecture raciale de la société grâce à l’introduction dans le bulletin du recensement d’une question sur le pays de naissance des parents des personnes recensées. L'Insee l'a décidé l'été 2021 pour satisfaire une demande de la Défenseure des Droits et un lobbying actif de l’Ined. Collectée chaque année auprès de millions de Français, cette information pourra être injectée, grâce à RESIL, dans tous les fichiers administratifs à disposition des services statistiques d’Etat, par exemple, pour racialiser les statistiques de l’emploi, de l’éducation mais aussi celles de la délinquance ou des bénéficiaires des aides sociales. Et si demain, un gouvernement souhaite identifier les adresses de tels groupe de population, les registres nécessaires seront déjà là. Il n’aura qu’à faire voter une loi pour les mobiliser. Fantasme diront certains, en mettant en avant les systèmes de régulation supposés exister (sur lesquels nous reviendront dans un deuxième volet). Risques crédibles à la vue d’une histoire française pas si ancienne que cela et des évolutions politiques observées dans plusieurs pays de l’Union européenne ces dernières années. En cela, la « chasse aux Français » redevient d’actualité.