
Supplément. Le Système national des données de santé (SNDS)
// Supplement. The French National Health Data System
Source de données
Les données présentées dans les articles de ce numéro « Épidémiologie des maladies cardiovasculaires en France » (cardiopathie ischémique, insuffisance cardiaque, accident vasculaire cérébral, maladie veineuse thromboembolique, trouble du rythme et de la conduction, valvulopathie, pathologies artérielles périphériques) sont issues du Système national des données de santé (SNDS) de l’Assurance maladie 1.
Le SNDS rassemble, pour l’ensemble des personnes résidant en France depuis plus de trois mois et affiliées à un régime de l’Assurance maladie (plus de 99% de la population) et avec une profondeur variable selon le type de données (jusqu’à 2005), les données suivantes (figure) :
•Les données sociodémographiques :
–âge et sexe ;
–bénéficiaires de la complémentaire santé solidaire (C2S) (regroupant la Couverture maladie universelle complémentaire – CMU-C – et l’Aide au paiement d’une complémentaire santé – ACS – depuis le 19 novembre 2019). En 2022, la C2S concernait 7,4 millions de personnes, dont 2,5 avec une participation selon leur niveau de ressources ;
–bénéficiaires de l’allocation aux adultes handicapés (AAH), minimum social versé aux personnes atteintes d’un handicap ou d’une maladie chronique invalidante avec un taux d’incapacité d’au moins 80% et sous condition de ressources 2. Une personne est éligible à l’AAH si elle a plus de 20 ans et un taux d’incapacité permanente d’au moins 80% (ou entre 50 et 79% si le handicap entraîne une restriction substantielle et durable pour l’accès à l’emploi, mais alors ne participe pas à la complémentation de la retraite). Ainsi, l’AAH est à la fois un marqueur d’incapacité entraînant des difficultés d’accès à l’emploi et un marqueur de pauvreté. Aussi, dans le SNDS, seules les personnes bénéficiaires de l’AAH qui ne travaillent pas en milieu ordinaire ou qui ne bénéficient pas d’une pension d’invalidité sont repérables. Cette population est la plus vulnérable parmi les bénéficiaires de l’AAH, celle pour laquelle il est prioritaire d’avoir une connaissance fine de la morbidité et du recours aux soins ;
–l’indice de désavantage social de la commune de résidence, récupéré pour chaque patient résidant, dans la presque totalité, dans une commune de France métropolitaine. Cet indice écologique (FDep), développé par Rey et coll. 3, est calculé pour chaque commune du territoire métropolitain sur la base des indicateurs suivants : le revenu fiscal médian par unité de consommation, la part des diplômés de niveau baccalauréat (au minimum) dans la population de 15 ans ou plus non scolarisée, la part des ouvriers dans la population active de 15 à 64 ans, la part des chômeurs dans la population active de 15 à 64 ans. Ainsi, la population de France métropolitaine est répartie par quintile de population ayant un indice de désavantage social plus ou moins élevé, le quintile 1 regroupant les communes les moins défavorisées et le quintile 5 les plus défavorisées socio-économiquement. La dernière mise à jour de cet indice a été réalisée à partir des données 2015.
•les remboursements de soins réalisés en ville : délivrances de médicaments (date, nom de spécialité, dose, conditionnement) codés selon la classification Anatomique, thérapeutique et chimique (ATC), les bilans biologiques codés selon la Nomenclature des actes de biologie médicale (NABM) disponible sur ameli.fr, tout comme la Nomenclature générale des actes professionnels (NGAP) pour consultations médicales et paramédicales de ville (date, spécialité), et celle des procédures ou actes diagnostics ou thérapeutiques (Classification commune des actes médicaux – CCAM –, date), et la Liste des produits et prestations (LPP, date) comme le détail et l’origine des dispositifs médicaux (valves, etc.) ;
•les données hospitalières du Programme de médicalisation des systèmes d’information (PMSI) des secteurs de Médecine chirurgie obstétrique (MCO) et des Soins médicaux et de réadaptation (SMR) provenant de l’Agence du traitement de l’information hospitalière (ATIH) et utilisées ici. Tous les séjours hospitaliers des établissements de santé publics et privés sont remontés dans cette base de données, et comprennent entre autres les diagnostics (principal, relié, associé) des pathologies codées selon la 10e révision de la Classification internationale des maladies (CIM-10), les actes codés selon la CCAM et la nature des unités médicales du séjour. Les actes dispensés lors d’une consultation externe sont également repérables. La consommation médicamenteuse à l’hôpital n’est pas enregistrée, sauf dans un fichier nommé liste en sus qui contient et permet la prise en charge par l’Assurance maladie de spécialités pharmaceutiques, pour certaines de leurs indications thérapeutiques, en sus des tarifs d’hospitalisation, lorsque ces indications présentent un caractère innovant ;
•le statut vital et date de décès issus des données de l’Institut national de la statistique et des études économiques (Insee), et aussi le mode de sortie précisé en décès ;
•l’existence de prises en charge à 100% de tous les soins réalisés pour une Affection de longue durée (ALD) codée selon la CIM-10, correspondant à des pathologies sévères nécessitant des soins onéreux et réguliers ;
•les causes médicales de décès codées par le Centre d’épidémiologie sur les causes médicales de décès (CépiDc) selon la codification des causes de décès s’appuyant sur la CIM-10. Ces règles garantissent un certain niveau de qualité et de comparabilité internationale des données de mortalité.
Toutes les personnes résidant en France et affiliées à un des régimes de l’Assurance maladie possèdent un numéro d’identification unique permettant de chaîner l’ensemble des informations leur correspondant.
Les données remontant dans le SNDS n’ont pas la même temporalité suivant leur origine : si les remboursements de soins de villes remontent de façon quasi-instantanée dans la base de données, il faut attendre environ une année pour obtenir les données hospitalières consolidées, et plus de trois ans en moyenne pour le codage des causes de décès.
Caractéristiques des séjours
Les séjours hospitaliers correspondant à chaque pathologie ont été sélectionnés selon l’algorithme propre à la pathologie d’intérêt. Les séjours de moins d’une nuitée et les séances ont été exclus car il apparaît peu probable qu’ils correspondent à un événement cardiovasculaire aigu. Pour chaque patient hospitalisé en 2022, le premier séjour de l’année a été retenu comme étant le séjour index. Après la fin de ce séjour, tous les séjours repérés par l’algorithme de sélection ont été considérés comme faisant partie d’un même épisode de soins s’ils étaient espacés de moins de 8 jours. La date de fin de l’épisode de soin pour l’événement de santé d’intérêt a été recherchée à l’issue de tous ces séjours composants l’épisode de soin. La durée totale de celui-ci a été estimée en additionnant la durée de chacun des séjours composant l’épisode de soin.
Les différentes unités médicales d’intérêt (urgences, unités de soins intensifs de cardiologie, unité neurovasculaire, réanimation…) au cours des différents séjours de l’épisode de soin ont été extraites.
Le mode d’entrée et le mode de sortie lors de l’hospitalisation index ont été identifiés. Ils correspondent à la provenance du patient pour son hospitalisation et sa destination à la fin de l’épisode de soin (domicile, établissement médico-social, soins médicalisés et réadaptation, décès, transfert).
Certains actes thérapeutiques ou d’imagerie caractérisant la prise en charge des patients ont été identifiés grâce à la classification CCAM. La plupart des actes thérapeutiques permettant la cotation du séjour hospitalier sont codés de manière exhaustive dans le SNDS. La liste des actes spécifiques de chaque pathologie d’intérêt est détaillée dans chaque article thématique. Ces actes ont été identifiés qu’ils aient été réalisés au cours du séjour hospitalier index, lors de consultations externes au sein de l’hôpital, ou en ville.
Caractéristiques des patients hospitalisés
Au-delà des caractéristiques sociodémographiques individuelles (âge, sexe, bénéficiaire de prestations sociales…) et du désavantage social de la commune de résidence (Fdep), différentes variables permettant de caractériser l’état de santé initial ou le recours aux soins des patients hospitalisés ont été identifiées.
Facteurs de risque et comorbidités
Plusieurs facteurs de risque cardiovasculaire ont été identifiés dans le SNDS chez les patients hospitalisés. Selon les cas, l’identification des différents facteurs de risque dans le SNDS a été réalisée à partir des diagnostics hospitaliers dans les 5 ans précédant l’hospitalisation index ou à partir des délivrances de traitements pharmacologiques (indiqués) dans l’année précédant l’hospitalisation.
Obésité
L’obésité ou un antécédent d’obésité ont été identifiés à partir des diagnostics hospitaliers (codes CIM-10 « obésité » (E66), à l’exception des codes E66X3 utilisés pour le surpoids) et des actes CCAM de chirurgie bariatrique, durant l’hospitalisation index ou dans les 5 ans précédant l’hospitalisation index. L’indice de masse corporelle n’est pas disponible.
Tabagisme
Le tabagisme a été identifié à partir :
–des diagnostics hospitaliers de l’hospitalisation index ou dans les 5 ans précédant celle-ci
(codes CIM-10 directement associés
au tabac : « Troubles mentaux et du comportement liés à l’utilisation de tabac » (F17) ; « Conseil pour tabagisme » (Z716) ;
« Effet toxique lié au tabac
et à la nicotine » (T652) ; « Usage du tabac » (Z720)) ;
–des délivrances de traitements substitutifs de la nicotine dans les 5 ans précédant l’hospitalisation index ou dans l’année suivant l’hospitalisation dans la mesure où la pathologie à l’origine de l’hospitalisation index pourrait engendrer des délivrances de traitements d’aide à l’arrêt du tabac post-hospitalisation : (« nicotine sous toutes ses formes et varénicline » (N07BA), « bupropion » (N06AX12)) ;
–la combinaison de pathologies avec une part attribuable au tabagisme très élevée (« Bronchite chronique » (J41 et J42), « Emphysème » (J43), et « autres maladies pulmonaires obstructives chroniques » (J44), « thromboangéite oblitérante » (I731)) et leur traitement « olodaterol » (R03AC19), « bromure de tiotropium » (R03BB04), « bromure d’aclidinium » (R03BB05), « bromure de glycopyrronium » (R03BB06), « indacaterol et bromure de glycopyrronium » (R03AL04), « formoterol/ bromure d’aclidinium » (R03AL05), « salbutamol/cromoglicate de sodium » (R03AK04).
Le patient a été considéré comme fumeur ou ancien fumeur si au moins un des codes précédents apparaissait dans les 5 ans précédant l’hospitalisation index.
Hypertension artérielle
L’hypertension artérielle (HTA) a été identifiée par les diagnostics hospitaliers lors de l’hospitalisation index ou dans les 5 ans précédant celle-ci (codes CIM-10 « hypertension essentielle (primitive) » (I10), « cardiopathie hypertensive » (I11), « néphropathie hypertensive » (I12), cardionéphropathie hypertensive (I13), « hypertension secondaire » (I15)) ou par la délivrance, à trois dates différentes (deux délivrances en cas de grand conditionnement) d’un traitement antihypertenseur (classes ATC : C02, C03, C07, C08, C09, C10BX03 (amlodipine), à l’exception de l’indoramine indiquée dans le traitement de la migraine seulement (C02CA02)). L’ALD pour HTA a été supprimée en 2012.
Diabète
Le diabète a été identifié par les diagnostics hospitaliers lors de l’hospitalisation index ou dans les 5 ans précédant celle-ci (codes CIM-10 « diabète sucré de type 1 » (E10), « diabète sucré de type 2 » (E11), « diabète sucré de malnutrition » (E12), « autres diabètes sucrés précisés » (E13), « diabète sucré, sans précision » (E14)) ou par la délivrance, à trois dates différentes (deux délivrances en cas de grand conditionnement) d’un traitement antidiabétique (classes ATC : A10) dans l’année qui précédait l’hospitalisation index, ou si le patient bénéficiait d’une ALD pour un diabète.
Troubles du rythme et de la conduction
Les troubles du rythme et de la conduction ont été identifiés par les diagnostics hospitaliers lors de l’hospitalisation index ou dans les 5 ans précédant celle-ci (code CIM10 : « bloc de branche gauche et auriculoventriculaire » (I44), « autres troubles de la conduction » (I45), « arrêt cardiaque » (I46), « tachycardie paroxystique » (I47), « fibrillation atriale et flutter » (I48), « autres arythmies cardiaque » (I49)), ou par la délivrance, à trois dates différentes (deux délivrances en cas de grand conditionnement) d’un traitement antiarythmique (C01B – antiarythmiques de classe I et III –, C01AA05 – digoxine, antiarythmique classe II) dans l’année qui précédait l’hospitalisation index ou si le patient bénéficiait d’une ALD avec un des codes de trouble du rythme ou de la conduction.
Score de Charlson
Afin d’évaluer le niveau global de comorbidité, le score de Charlson a été calculé pour tous les patients 4. Ce score est le résultat d’une somme pondérée de pathologies sévères. Il est un bon prédicteur de la mortalité. Il regroupe les pathologies ou groupes de pathologies suivants : insuffisance cardiaque congestive, démence, maladies pulmonaires chroniques, maladies rhumatismales, maladies hépatiques, diabète compliqué, hémiplégie ou paraplégie, maladie rénale, tumeur solide métastasique, tous cancers incluant leucémie et lymphome entre autres, et l’infection au virus de l’immunodéficience humaine (VIH) ou sida. Pour chaque patient, nous avons identifié dans le SNDS les pathologies du score en recherchant les diagnostics hospitalier correspondants à chacune des pathologies lors de l’hospitalisation index ou dans un séjour hospitalier dans les 5 ans précédant celle-ci, ou si une ALD pour l’une de ces pathologies était enregistrée jusqu’à 5 ans avant l’hospitalisation index.
Pour chacune des pathologies d’intérêt, les antécédents d’hospitalisation pour cette même pathologie ont été recherchés dans les 5 ans précédents selon le même algorithme d’identification que celui de l’hospitalisation index.
Autres traitements dans l’année précédant l’hospitalisation
En fonction des pathologies d’intérêt, nous avons complété la description des patients hospitalisés par la recherche de délivrances, à trois dates différentes (deux délivrances en cas de grand conditionnement) dans l’année précédant l’hospitalisation index d’un traitement par antiagrégant plaquettaire (ATC : B01AC) ou anticoagulant oral direct (ATC : B01AE07, B01AF01 B01AF02 B01AF03) ou antivitamine-K (ATC : B01AA).
Suivi des patients après l’hospitalisation
Différentes variables permettant de caractériser le suivi des patients ont été identifiées dans le SNDS :
–le statut vital (mortalité toutes causes) a été recherché à 30 jours, 6 mois et 1 an après la date d’entrée de l’hospitalisation index ;
–les consultations chez un médecin spécialiste en fonction de la pathologie (cardiologue, neurologue, médecin vasculaire…), réalisées en ville ou à l’hôpital, et repérables dans les tables regroupant les actes et consultations externes des hôpitaux, l’admission en soins médicaux et de réadaptation (pour les pathologies ayant une indication), en prenant en compte le temps passé dans ces services (demi-journée, journée complète, ou nuitée), et les réhospitalisations en MCO pour récidive de la pathologie d’intérêt ont été recherchées dans les 6 mois suivant la sortie de l’hospitalisation index ;
–la délivrance à trois dates différentes (ou deux si grand conditionnement) d’un traitement de prévention secondaire recommandé dans l’année suivant la sortie de l’hospitalisation index.
Indicateurs épidémiologiques
Nombre annuel de patients hospitalisés
Pour chaque pathologie d’intérêt, les patients adultes âgés de plus de 18 ans, hospitalisés en 2022 avec un diagnostic codant pour la pathologie d’intérêt (voir algorithme de sélection spécifique pour chaque pathologie) ont été sélectionnés. Seul le premier épisode de soin de l’année a été comptabilisé, et le patient a été suivi dans l’année suivant la sortie de l’épisode de soin pour certains indicateurs.
Incidence annuelle des patients hospitalisés
L’incidence annuelle a été calculée en divisant le nombre de patients hospitalisés pour la pathologie d’intérêt en 2022 par la population française recensée dans les statistiques de l’Insee extrapolées pour la même année. L’incidence a été standardisée par une méthode directe en utilisant la structure d’âge de la population européenne de 2010 comme population de référence.
L’incidence annuelle standardisée sur l’âge des patients hospitalisés a été déclinée par quintile de FDep, indice de désavantage social de la commune de résidence de chaque patient et par département de résidence de chaque patient.
Taux de réhospitalisation à 6 mois en MCO
Pour chaque pathologie, le taux de réhospitalisation en MCO a été calculé en divisant le nombre de patients ayant au moins un second séjour hospitalier pour la même cause plus de 7 jours après la sortie de l’hospitalisation index et dans les 6 mois suivants, par le nombre de patients hospitalisés pour la pathologie index et vivants à 6 mois.
Taux d’admission en SMR à 6 mois
Pour chaque pathologie ayant une indication d’admission en SMR le taux de patients admis en SMR a été calculé en divisant le nombre de patients ayant été admis dans un service de SMR dans les 6 mois suivant la sortie de l’hospitalisation index, par le nombre de patients hospitalisés pour la pathologie index et vivants à 6 mois. Le mode de sortie indiquant un transfert vers une unité de SMR a aussi été pris en compte dans le calcul du taux.
Taux de létalité
La létalité hospitalière, à 30 jours, à 6 mois et à 1 an après le début de l’hospitalisation a été calculée en divisant le nombre de patients décédés à chacun des temps de suivi (quelle que soit la cause du décès) par le nombre total de patients hospitalisés pour la pathologie d’intérêt.
Nombre de cas prévalent
Tous les adultes de plus de 18 ans, vivants au 1er janvier 2023 ayant été hospitalisés entre 2017 et 2022 avec un diagnostic principal, relié ou associé codant pour la pathologie d’intérêt ou bénéficiant d’une ALD pour la pathologie d’intérêt sur cette même période ont été considérés comme des cas prévalents pour la pathologie d’intérêt.
Prévalence
La prévalence brute a été estimée en divisant le nombre de cas prévalents par la population française recensée dans les statistiques de l’Insee. La prévalence a été standardisée par une méthode directe en utilisant la structure d’âge de la population européenne de 2010 comme population de référence.
Nombre de décès par cause
Le nombre de décès pour chaque pathologie d’intérêt a été estimé à partir des statistiques sur les causes médicales de décès produites par le CépiDc et leur date. La cause du décès a été identifiée par une mention de la pathologie en cause initiale sur le certificat de décès. La cause initiale de décès est définie, en appliquant les règles de la CIM-10, comme étant la maladie, le traumatisme ou les circonstances en cas de mort violente, à l’origine du processus morbide ayant entraîné le décès.
Taux de mortalité par cause
Les taux de mortalité pour chaque pathologie d’intérêt ont été estimés en divisant le nombre de décès dont la cause initiale était la pathologie d’intérêt par la population française recensée dans les statistiques de l’Insee. Les taux de mortalité ont été standardisés par une méthode directe en utilisant la structure d’âge de la population européenne de 2010 comme population de référence.
Forces et limites de la source de données et des indicateurs
La base de données du SNDS couvre la quasi-totalité de la population française et constitue à ce titre une source de données privilégiée pour la surveillance épidémiologique de nombreuses pathologies, dont les maladies cardiovasculaires. Le volume de cette base de données et la représentativité de la population couverte en font un outil unique au monde. Elle constitue une base de données détaillée sur la consommation remboursée et le parcours de soins des personnes résidant en France sur une longue durée et en vie réelle. Néanmoins, le caractère « médico-administratif » et non médical des données qui y sont portées conduit à certaines limites qui doivent être prises en considération pour l’interprétation des résultats issus de cette base de données.
Si le SNDS comporte des données de nature médicale, peu d’informations cliniques sont disponibles (facteurs de risque, résultats de l’examen du malade par le médecin, de biologie médicale ou d’imagerie médicale…). Ainsi, bien qu’il existe des algorithmes pour l’identification de proxy du tabagisme ou de l’obésité, ces facteurs sont sous-estimés dans la base de données. Les données sociodémographiques sont également limitées, avec notamment l’absence du niveau d’études, du niveau de revenus ou de la catégorie socioprofessionnelle des assurés, des informations familiales.
Le SNDS, par construction, ne contient que des informations concernant les soins effectivement remboursés. Ainsi, la consommation de médicaments prescrits mais non remboursés par l’Assurance maladie, l’automédication ou les ordonnances prescrites mais non délivrées ne sont pas disponibles dans cette base de données. Si l’observance au traitement peut être appréciée par le nombre de remboursements et la forme du traitement associée à sa posologie, le SNDS ne permet pas de s’assurer de l’absorption du traitement par le patient.
Le stade et la sévérité de la maladie ne sont pas renseignés dans le SNDS. Pour certaines pathologies, ils peuvent être approchés à l’aide de proxi construits à partir de données de prise en charge notamment (unité médicale, actes pratiqués, ALD, indications de traitements selon le stade ou autres de la pathologie).
Le motif des consultations, les diagnostics réalisés en médecine de ville ou l’indication des traitements ne sont également pas renseignés dans cette base de données.
Malgré ces limites, l’identification des pathologies faisant l’objet d’une prise en charge hospitalière ou d’un traitement pharmacologiquement spécifique comme les pathologies cardiovasculaires peuvent être identifiées avec une bonne exhaustivité, comme le montrent la plupart des études de validation réalisées (voir les articles spécifiques pour les études de validation de chaque pathologie).
La combinaison de plusieurs sources de données (PMSI, ALD, traitements, bilans biologiques…) permet également une identification plus précise des pathologies, notamment pour l’estimation de la prévalence en population.
L’incidence annuelle des patients hospitalisés, indicateur permettant de mettre en évidence le fardeau épidémiologique pour la population d’une pathologie (avec un dénombrement par patient et non par hospitalisation), n’est pas toujours un reflet de l’incidence vie-entière d’une pathologie. En effet, plusieurs raisons peuvent conduire à une variation entre ces deux indicateurs. La prise en charge de certaines pathologies se fait principalement en ville, avec une prise en charge hospitalière uniquement en cas de complications (insuffisance cardiaque, fibrillation atriale, thrombose veineuse, artériopathie des membres inférieurs, notamment). Dans d’autres cas, la phase aiguë de la maladie peut engendrer une mortalité précoce importante ne permettant pas la prise en charge hospitalière (dissection aortique, mort subite, embolie pulmonaire, infarctus du myocarde). Enfin, l’estimation de l’incidence annuelle inclut dans son calcul les antécédents survenus les années précédentes. Dans ces deux cas, l’incidence annuelle des patients hospitalisés sous-estime l’incidence réelle de la maladie en population. Même si ces deux indicateurs peuvent être très proches pour certaines pathologies, l’indicateur hospitalier doit être interprété en tenant compte de ces éléments.
Éthique et autorisations
Le SNDS est fondé sur quatre principes :
–préserver les intérêts des personnes ;
–le secret professionnel ;
–le respect de la sécurité des données (confidentialité, intégrité et confinement) ;
–la conservation des données pour une durée limitée à 20 ans.
L’accord d’un comité d’éthique spécifique n’a pas été requis pour ces études. En tant qu’agence d’État et gouvernementale, Santé publique France a un accès permanent aux données de remboursement pseudonymisées, en application des dispositions des articles R. 1461-12 et suivants du Code de la santé publique français, avec des règles et critères similaires à la déclaration d’Helsinki. Santé publique France a un accès permanent et complet au SNDS par décret (décret n° 2016−1871 du 26 décembre 2016 relatif au traitement de données à caractère personnel dénommé « système national des données de santé » 5) et dispose d’une autorisation de réalisation d’études basées sur les données du SNDS auprès de la Commission nationale de l’informatique et des libertés (Cnil). Toutes les méthodes ont été réalisées conformément aux directives et réglementations en vigueur. L’accès aux données du SNDS est soumis à une formation et une autorisation préalables, et nécessite l’approbation de la Cnil. Le partage public de ces données est interdit (données individuelles sensibles). Les données sont disponibles auprès du Health Data Hub (1) pour les chercheurs qui répondent aux critères d’accès aux données confidentielles.