VAC-SI : un système d’information pour le suivi de la couverture vaccinale des vaccins contre la Covid-19
// VAC-SI: A surveillance system to monitor COVID-19 vaccination coverage
Résumé
Dans un contexte de pandémie, mesurer l’évolution et l’impact de la vaccination contre une maladie est essentiel pour la surveillance épidémiologique. Vaccin Covid est l’outil numérique permettant la traçabilité des vaccinations, et VAC-SI est un système d’information issu de Vaccin Covid, constituant la base de données des vaccinations contre la Covid-19 et des indicateurs de suivi dans le cadre de la pandémie.
Cet article décrit la mise en œuvre du système VAC-SI en pleine crise sanitaire, de la construction de la base de données avec les différents acteurs impliqués jusqu’à la production d’indicateurs, en passant par l’exploitation de la base par Santé publique France et ses évolutions.
Dans l’élaboration de ce nouveau système, de multiples défis techniques sont apparus face aux différents enjeux et besoins, ainsi qu’aux évolutions de la politique vaccinale, qui ont nécessité une capacité d’adaptation constante et une forte réactivité.
Abstract
In the context of a pandemic, measuring the progression and impact of vaccination against a disease is essential for epidemiological surveillance. Vaccin Covid is a vaccination tracking tool and VAC-SI is an information system based on this tool. Together, they constitute France’s COVID-19 vaccination database, which was used to produce indicators for monitoring the pandemic.
This article describes the implementation of the VAC-SI system during the health crisis, from the construction of the database with various stakeholders, to the production of indicators, including how Santé publique France used and adapted the system over time.
In developing this new system, multiple technical challenges arose in relation to different concerns and needs, along with changes in vaccination policy, which required a capacity for constant adjustment and a high level of responsiveness.
Introduction
Le virus SARS-CoV-2 a émergé fin janvier 2020 en France. Les premières injections de vaccin contre la maladie émergente Covid-19 ont été administrées fin décembre 2020, soit un peu moins d’un an après les premiers cas d’infection en France. Les premiers vaccins mis à disposition en France étaient deux vaccins à ARNm : Cominarty®, developpé par Pfizer-BioNTech, et Spikevax®, développé par Moderna. Deux vaccins à vecteur viral ont ensuite été rendus disponibles en France : Vaxzevria® d’AstraZeneca, puis Janssen® de Johnson & Johnson. Les vaccins contre la Covid-19 ont été dans un premier temps recommandés aux personnes les plus à risque de développer des formes graves de Covid-19 telles que les personnes âgées, les personnes résidant en collectivités de personnes âgées, les personnes atteintes d’une maladie chronique ainsi que les personnes à risque d’exposition tels que les professionnels de santé. Au fur et à mesure, la campagne a été étendue aux personnes plus jeunes jusqu’à couvrir l’intégralité de la population française à partir de janvier 2022, avec l’ouverture de la vaccination aux enfants.
Dès son introduction dans les établissements d’hébergement pour personnes âgées dépendantes (Ehpad), la vaccination contre la Covid-19 a eu un impact majeur sur les hospitalisations et sur la mortalité hospitalière 1. En diminuant par ailleurs les formes symptomatiques, elle a contribué à limiter la propagation du virus SARS-CoV-2 1,2,3. L’estimation régulière de la couverture vaccinale (CV) était indispensable pour suivre le déploiement de la campagne de vaccination. Des indicateurs de CV dans les populations pour lesquelles la vaccination était recommandée ont été produits et mis à disposition des autorités et de la population française par Santé publique France à partir du 28 janvier 2021. Ces indicateurs ont dû tenir compte des très nombreuses évolutions des recommandations de vaccination portant notamment sur les populations ciblées, les types de vaccins, l’évolution des schémas vaccinaux, le nombre de doses en lien avec les recommandations de la Haute Autorité de santé (HAS). Les estimations de CV contre la Covid-19 ont permis d’alimenter des modèles de progression de l’épidémie selon différents scénarios et de réaliser des études d’impact 1,2,3.
Afin de tracer les injections de vaccins contre la Covid-19, l’outil Vaccin Covid a été créé par la Caisse nationale d’assurance maladie (Cnam) dans des délais très courts. La base de données VAC-SI issue de Vaccin Covid a ensuite été créée et mise à disposition afin de produire les indicateurs dédiés au suivi de la vaccination. Tous ces composants constituent le système de surveillance VAC-SI. Santé publique France a mis en place une exploitation propre de la base VAC-SI, en collaboration avec ses partenaires, la Cnam et la Direction du numérique (DNUM), visant à répondre à la demande des autorités de disposer d’indicateurs pour la vaccination contre la Covid-19 (nombre de personnes vaccinées et CV) avec une très grande réactivité (données quotidiennes 7j/7), pour les différentes populations et pour différents niveaux géographiques (national, régional, départemental). L’appariement des données du système de suivi des vaccinations (VAC-SI) et des données des tests biologiques effectués pour la recherche du SARS-CoV-2 (SI-DEP : Système d’information de dépistage populationnel) a également permis la réalisation d’estimations des efficacités vaccinales 4,5. À l’image des autres systèmes de surveillance liés au virus, le système VAC-SI devait aussi permettre une forte réactivité face à la propagation du virus et à ses mutations (variants). Le but de cet article est de décrire le processus de construction du système de surveillance, de Vaccin Covid jusqu’à la production d’indicateurs, en passant par la base de données.
La base de données VAC-SI
Le 4 janvier 2021, la Cnam a mis en service Vaccin Covid, outil pour le recueil spécifique des données de vaccination contre la Covid-19 et la traçabilité. Les professionnels vaccinateurs devaient y saisir les informations relatives à chaque injection. Une base de données, la base VAC-SI, a ensuite été créée afin de mettre à disposition les données issues de Vaccin Covid. Cette base contient ainsi l’ensemble des injections de vaccins contre la Covid-19 administrées en France et des informations utiles pour l’exploitation par l’ensemble des organismes destinataires de la base portant sur :
–les injections : date de l’injection, date de saisie dans Vaccin Covid, le rang vaccinal (première, deuxième, troisième dose), le motif de l’injection (primovaccination ou rappel), le nom technique du vaccin, la voie d’administration, le code postal du lieu de vaccination ;
–les patients : âge, sexe, année de naissance, et un pseudonyme ;
–les établissements de santé : catégorie du lieu de vaccination ;
–les professionnels de santé ayant réalisé l’injection : catégorie du professionnel de santé, spécialité ;
–les vaccins : nom commercial du vaccin ;
–des données additionnelles collectées par la Cnam sans être mises à disposition des professionnels de santé. Il peut s’agir de données relatives à la santé de la personne comme les critères médicaux ou non médicaux d’éligibilité à la vaccination. Ces données ont été utiles pour l’organisation de la campagne de vaccination, l’envoi des invitations aux personnes éligibles à la vaccination, la création de cohortes de sous-populations spécifiques.
Plusieurs partenaires sont intervenus dans la constitution et la gestion de la base VAC-SI (figure 1). La Cnam a mis à disposition quotidiennement la base à la DNUM pour une première exploitation de ces données. Afin de répondre aux exigences de la Commission nationale de l’informatique et des libertés (Cnil) et de la protection des données personnelles, les données transmises étaient pseudonymisées par la Cnam. La DNUM procédait à des traitements dédiés à la qualité des données et à des ajouts de variables complémentaires (calcul du code département d’injection à partir des données de localisation de l’injection). Ces traitements et algorithmes de calcul ont été définis lors de réunions pluri-hebdomadaires et hebdomadaires d’un groupe de travail rassemblant notamment des intervenants de la Cnam, de la DNUM, de la Direction de la recherche, des études, de l’évaluation et des statistiques (Drees), des agences régionales de santé (ARS) et de Santé publique France.
L’objectif était de centraliser une partie des traitements sur les données afin d’homogénéiser les indicateurs produits pour les différents partenaires. À l’issue de ces premiers traitements, la DNUM transmettait quotidiennement la base de données aux différents partenaires (Santé publique France, Drees). La Drees exploite les données pseudonymisées issues des trois principales bases de données sur la crise Covid-19 : SI-VIC (hospitalisation), SI-DEP (dépistage) et VAC-SI (vaccination). Elle réalise des croisements entre ces bases, notamment un suivi selon le statut vaccinal des personnes testées positives au Covid-19 et des personnes hospitalisées. Santé publique France exploitait quotidiennement (7j/7) la base ainsi transmise, avec l’ajout de nouveaux tests de qualité et de données complémentaires pour ses propres analyses (données de population de l’Institut national de la statistique et des études économiques – Insee – par exemple). Le département de résidence de la personne vaccinée a ainsi pu être ajouté à compter du 28/10/2021 grâce à une table de correspondance transmise par la Cnam à Santé publique France.
Production des indicateurs de couverture vaccinale
Les enjeux, besoins et résultats
Les indicateurs dédiés au suivi de la vaccination étaient les nombres de personnes vaccinées, ainsi que la CV qui correspond au nombre total de personnes vaccinées, divisé par la population ciblée. La couverture vaccinale était calculée pour plusieurs niveaux géographiques (nationale, régionale, départementale), par classes d’âge (5-9 ans, 10-11, 12-17, 18-24, 25-29, 30-39, 40-49, 50-59, 60-64, 65-69, 70-74, 75-79, et 80 ans et plus), et par sexe. Le nombre de personnes vaccinées par type de vaccin était également produit. Les nombres de personnes vaccinées et les couvertures vaccinales étaient calculés en population générale, ainsi que par type de population cible correspondant aux populations particulièrement à risque, ou particulièrement exposées à la Covid-19 et retenues comme populations prioritaires pour la vaccination par la HAS 6 :
–les résidents en Ehpad ou en unités de soins de longue durée (USLD) ;
–les professionnels exerçant en Ehpad ou USLD ;
–les professionnels de santé.
Ces indicateurs de CV étaient produits en distinguant les personnes :
–vaccinées par au moins une dose ;
–ayant reçu une primovaccination complète correspondant aux personnes : vaccinées par deux doses pour les vaccins nécessitant deux doses (vaccins Pfizer, Moderna ou AstraZeneca) ; vaccinées par une dose par les vaccins nécessitant une seule dose (vaccin Janssen) ; vaccinées par une dose par les vaccins Pfizer, Moderna ou Astra-Zeneca en cas d’antécédent de Covid-19 ; vaccinées par trois doses pour les personnes particulièrement à risque, comme par exemple les personnes immunodéprimées ;
–ayant reçu une première dose de rappel ;
–ayant reçu une deuxième dose de rappel ;
–ayant reçu une troisième dose de rappel ;
–ayant reçu une dose de rappel avec un vaccin adapté au variant Omicron.
La figure 2 présente l’évolution de la vaccination par au moins une dose, primo-vaccination complète et première dose de rappel, pour la France entière, de fin décembre 2020 à juillet 2023.
Au total, environ quatre-vingts indicateurs de couverture vaccinale ont ainsi été produits quotidiennement depuis février 2021 7. L’évolution des recommandations de vaccination a contraint à revoir à plusieurs reprises les populations suivies en termes notamment d’âge, de profil et de schéma vaccinal.
Ces indicateurs étaient mis à disposition pour les bilans quotidiens transmis au ministère de la Santé et publiés dans les points épidémiologiques, en open data sur le site Géodes (1), les plateformes data.gouv (2) et TousAntiCovid (3), ainsi que sur le tableau de bord de Santé publique France (4). Ces indicateurs étaient également transmis à partir de début octobre 2021 au European Centre for Disease Prevention and Control (ECDC), à la fréquence de deux fois par semaine puis une fois par semaine à partir de l’été 2022. Plusieurs pays de l’Union européenne ont pu collecter des données via un système de suivi de la vaccination et construire des indicateurs similaires. La figure 3, issue de l’article de van Kessel et coll. 8, recense les indicateurs calculés pour 10 pays dont la France. Tous ces pays ont construit des indicateurs en fonction d’un premier schéma vaccinal suivi de doses de rappel, stratifiés par classes d’âge et de façon quotidienne. La France est l’un des seuls pays à avoir publié des indicateurs sur des sous-catégories de population comme les personnes vulnérables, comprenant les personnes à très haut risque de forme grave ou de décès, pouvant bénéficier d’affections de longue durée (ALD), les personnes avec transplantation d’organe solide, ou les personnes atteintes de certaines maladies rares (5), de trisomie 21.
Enrichissement et évolution de la base de données
Lieu de résidence
Du fait de l’absence de transmission du lieu de résidence des personnes vaccinées dans la base VAC-SI, et de la pseudonymisation des données transmises, Santé publique France était dans l’impossibilité de produire des données de CV par lieu de résidence. Dans un premier temps, les données de CV ont ainsi, par défaut, tenu compte du département de vaccination comme approximation du département de résidence. L’estimation de la CV s’appuyant sur l’estimation de la population transmise par l’Insee, les estimations de CV départementales pouvaient ainsi être biaisées lorsque des personnes se faisaient vacciner dans un autre département que leur département de résidence. Une correction a pu être apportée grâce à la transmission par la Cnam à Santé publique France à partir du 28 octobre 2021 d’une table de correspondance permettant de lier les personnes vaccinées à leur département de résidence tout en préservant la confidentialité. Une mise à jour des départements de résidence a pu être réalisée en novembre 2022 (figure 4).
Décès
La base de données VAC-SI contient l’ensemble des injections des patients y compris des patients décédés depuis le début de la campagne de vaccination. L’information du décès n’était pas disponible dans VAC-SI. La taille de la population prise en compte pour le dénominateur de la CV (données Insee) prend en revanche bien en compte les décès (et les naissances survenues). La conservation des personnes vaccinées décédées a ainsi pu conduire à surestimer la CV, notamment dans les classes d’âge les plus avancées. La date de décès des personnes vaccinées a pu être ajoutée à la base à partir du 13 octobre 2022 grâce à une autre table de correspondance transmise par la Cnam.
Professionnels de santé
Du fait de la pseudonymisation des données dans la base VAC-SI, Santé publique France n’était pas en mesure d’identifier les personnes dans VAC-SI qui étaient des professionnels de santé. Au lancement de la campagne de vaccination, la Cnam pouvait techniquement repérer certains professionnels de santé, renseignés dans la base VAC-SI, essentiellement des libéraux ainsi que certains professionnels exerçant dans les établissements de santé ou des établissements médico-sociaux identifiés grâce à une saisie manuelle rendue possible dans Vaccin Covid. Cette identification de professionnels était cependant non exhaustive et ne permettait pas d’identifier les professionnels de santé salariés. Des imprécisions pouvaient également survenir en cas d’erreur lors de la saisie manuelle. Avec le temps, la qualité de la cohorte de professionnels ainsi constituée a décru du fait de l’impossibilité de la prise en compte des décès, des embauches ou des licenciements. Ce n’est qu’à partir de novembre 2022, en s’appuyant sur le Répertoire partagé des professionnels de santé (RPPS) et le répertoire Adeli (automatisation des listes) que la Cnam et la Drees ont pu fournir à Santé publique France une nouvelle table de correspondance, résultat de l’appariement entre les répertoires et Vaccin Covid, qui a été intégrée en base à partir du 23 novembre 2022 et a permis d’obtenir des cohortes de professionnels de santé de meilleure qualité.
Résidents en Ehpad
En raison de l’absence d’information dans la base VAC-SI pour identifier les personnes résidentes en Ehpad, population particulièrement à risque pour la Covid-19, nous nous sommes initialement appuyés sur l’âge (à partir de 65 ans) et le lieu de vaccination (Ehpad) pour tenter d’identifier ces résidents. Les couvertures vaccinales ainsi produites ont été cependant surestimées du fait de la vaccination dans ces établissements, notamment en début de campagne, de personnes qui n’étaient pas des résidents et ce pour éviter les pertes de doses (conditionnements multiples). La base Resid-ESMS du Système national des données de santé (SNDS) constitue un référentiel des résidents en Ehpad et USLD (unité de soins de longue durée), ainsi que des bénéficiaires d’ESMS (Établissement social ou médico-social). Grâce à l’exploitation de la base Resid-ESMS, la Cnam a pu fournir à Santé publique France, une table de correspondance permettant d’identifier les résidents en Ehpad et permettant de produire des estimations de meilleure qualité. La non mise à jour régulière de cette cohorte peut cependant conduire à des défauts de qualité des estimations du fait de la non prise en compte des nouvelles admissions ou des décès par exemple. À partir de juin 2023, l’estimation des CV chez les résidents en Ehpad a pu être produite directement par Santé publique France via les données du SNDS, grâce au croisement de la base Resid-ESMS et d’une nouvelle base intégrée au SNDS qui recense les vaccinations contre la Covid-19 issues de Vaccin Covid.
Ressources informatiques et traitements des données
L’ajout des différentes données externes précédemment listées sont venues complexifier l’exploitation de la base VAC-SI au cours du temps. Ces adaptations ont dû être réalisées manuellement et sans automatisation possible lors de la mise à disposition ponctuelle des tables de correspondance. L’acquisition de ces données a également été soumise à un circuit de validation juridique, visant à attester que la transmission et l’utilisation des données s’inscrivaient dans le cadre d’obligations du code de la santé publique et dans le respect du Règlement général sur la protection des données (RGPD). Chacune de ces évolutions a conduit à la mise en place de nouveaux tests d’assurance qualité et au besoin d’accompagnement pour expliquer les possibles modifications de couvertures vaccinales qu’elles induisaient.
La base est devenue très rapidement volumineuse et les traitements de plus en plus coûteux en ressources informatiques et en temps de calcul (jusqu’à 4h de traitement de la réception des données jusqu’à la production des indicateurs pour une base ayant atteint, à partir de début octobre 2021, environ 100 millions d’injections). Afin d’éviter les retards dans les productions quotidiennes d’indicateurs et dans un souci de réactivité du système, une solution a été mise en place fin janvier 2022. Initialement, les données reçues la veille étaient entièrement remplacées par les nouvelles données du jour. La solution a consisté à conserver les données historiques et d’ajouter quotidiennement dans la base uniquement les nouvelles injections et d’apporter les modifications et corrections ou suppressions concernant des injections antérieures. Dans ce nouveau processus, les données de la veille devaient ainsi être appariées avec les données du jour pour procéder aux modifications. Ce nouveau mode de mise à jour de la base a nécessité des évolutions sur toute la chaîne depuis la constitution de la base par la Cnam, faisant intervenir de nouveau l’ensemble des partenaires de la chaîne.
Un maintien des deux modes d’intégration des données a été nécessaire durant quelques mois, afin de s’assurer du bon fonctionnement.
Discussion
Les points forts
La mise en place du système VAC-SI a été très rapide, constituant un nouveau dispositif exhaustif du suivi de la vaccination à grand échelle. Il permettait de disposer d’un système réactif de l’adhésion à une campagne de vaccination, avec une remontée très rapide des données à J-1.
L’exploitation de la base de données par Santé publique France a également permis une mise à jour quotidienne des estimations de CV, ce qui a apporté des informations quotidiennement aux autorités sanitaires, aux décideurs et au grand public pendant la crise par le biais des bilans quotidiens, points épidémiologiques et via l’open data.
Le travail collaboratif entre les différentes entités Cnam, DNUM, Drees, ARS et Santé publique France a été très bénéfique. Les réunions techniques avec ces différents organismes pour fixer les indicateurs, les modes de calcul, les algorithmes et les contrôles qualité, ont permis d’homogénéiser l’exploitation de la base et d’avoir une forte réactivité sur les évolutions survenues dans la base. Grâce à l’implication très forte des différents partenaires, il a été possible de produire pour la première fois et à l’échelle de toute une population, des couvertures vaccinales quasiment en temps réel, c’est-à-dire avec prise en compte des vaccinations ayant été réalisées la veille.
L’exploitation de la base a été conçue dès le départ autour de traitements automatisés et paramétrés permettant de répondre très vite à la fréquence souhaitée de production des indicateurs et aux évolutions. De solides procédures de contrôles qualité ont été mises en place en base de données et sur les résultats des calculs des couvertures vaccinales, limitant les risques d’incohérences sur les indicateurs produits par les différents partenaires.
Les points faibles
Du fait de la pseudonymisation des données et donc de l’absence d’accès au NIR (Numéro de sécurité sociale) par Santé publique France et des défauts de qualité d’harmonisation dans la pseudonymisation des bases, il n’a pas été possible d’apparier dès janvier 2021 la base VAC-SI avec les données historiques issues de SI-DEP (base des cas confirmés de Covid-19). Des appariements entre la base VAC-SI et les bases SI-DEP et SI-VIC ont cependant pu être effectués à compter de juillet 2021 à partir d’un pseudonyme commun pour la réalisation notamment d’études d’efficacité vaccinale 5.
Les données manquantes précédemment décrites, incluant notamment l’absence d’informations initiales sur les départements de résidence des personnes vaccinées, sur leurs activités professionnelles (notamment pour les professionnels de santé) ou le statut de résidents en Ehpad ou plus largement en ESMS et l’absence de visibilité sur la survenue de décès, ont rendu complexe la production d’estimations de couvertures vaccinales de qualité, en particulier dans les populations à risque pour la Covid-19. Par conséquent, des modifications du calcul de l’estimation des CV ont été mises en place, notamment par la prise en compte des nouvelles informations transmises par la Cnam (département de résidence, professionnels de santé…). Du fait de l’imprécision de certaines couvertures vaccinales notamment chez les professionnels de santé et les résidents des établissements médico-sociaux, des études complémentaires ont dû être mises en place 9,10.
De plus, l’exploitation quotidienne de l’entièreté de la base de données VAC-SI a également été un véritable challenge en raison de la volumétrie importante et croissante de la base.
Le système VAC-SI, ses évolutions constantes et ses contraintes techniques, ont été très consommateurs et demandeurs de ressources informatiques et en ressources humaines, qui n’étaient pas faciles à obtenir dans des délais très courts entraînant parfois des évolutions tardives. Les réunions de travail avec l’ensemble des partenaires intervenant dans la constitution et la gestion de la base ont néanmoins permis d’échanger et de trouver des solutions rapides à ces problématiques. Ces réunions ont permis de maîtriser l’uniformité des chiffres de couvertures vaccinales communiqués par les différents partenaires.
Vaccin Covid et la base VAC-SI constituent un système spécifique dit « de crise », donc non pérenne. Ce système qui permet le pilotage des campagnes de vaccination contre la Covid-19 a pris fin le 28 juin 2024, sans alternative immédiate. En effet, Vaccin Covid est un outil construit pour la gestion de crise, non interopérable avec les autres outils des professionnels de santé et pour de la vaccination intensive. La maintenance et l’évolution du système représentent des budgets importants. Un tel système pourrait être adapté dans le cadre d’une nouvelle maladie émergente. En revanche, ce système n’est pas adapté au suivi des campagnes de vaccinations liées à la maladie, hors période de crise, puisque les vaccinations contre la maladie Covid-19 ne sont pas remboursées (car fournies gratuitement par l’État français). Des solutions alternatives pour estimer les CV sont en cours d’étude.
Conclusion
La base VAC-SI, alimentée par les informations saisies par les professionnels vaccinateurs dans l’outil Vaccin Covid, développé par la Cnam, a permis de suivre en temps réel dès janvier 2021, et pendant plus de trois ans, l’ensemble des vaccinations contre la Covid-19 réalisées en France par le biais des indicateurs de surveillance, les couvertures vaccinales produites par Santé publique France.
Cette base a été mise en place dans un environnement attestant la sécurité des données des patients et avec des processus de routine automatisés, robustes et réactifs. Le système de surveillance VAC-SI garantit un suivi de qualité des données de vaccinations et dans un contexte de sortie de crise, l’avenir de ce système repose sur la mise en place d’une solution alternative pérenne permettant le suivi des futures campagnes de vaccination et de prise en compte notamment des vaccinations non remboursées car fournies gratuitement, comme ce fut le cas lors de la crise liée à la Covid-19.
Remerciements
Les équipes de Santé publique France remercient tous les partenaires ayant participé à l’élaboration et l’évolution du système de surveillance VAC-SI : la Caisse nationale de l’assurance maladie (Cnam), la Direction du numérique (DNUM), la Direction générale de la santé (DGS), la Direction de la recherche des études de l’évaluation et des statistiques (Drees), les agences régionales de santé (ARS), l’Institut national de la statistique et des études économiques (Insee), et tous les professionnels de santé impliqués dans la surveillance, l’administration des vaccins et la saisie des données.
Liens d’intérêt
Les auteurs déclarent ne pas avoir de liens d’intérêt au regard du contenu de l’article.
Références
Citer cet article
datasets/donnees-relatives-aux-personnes-vaccinees-contre-la-covid-19-1/