Estimations départementales de l’incidence du cancer de la thyroïde à partir des données des registres et du croisement de deux sources de données médico-administratives, France, 2007-2011
// Estimates of thyroid cancer incidence at district level using cancer registries data and linkage of two sources of medico-administrative data, France, 2007-2011
Résumé
Objectifs -
En France, les registres des cancers couvrent 20% de la population. L’objectif de cette étude était d’estimer l’incidence du cancer de la thyroïde sur la période 2007-2011 dans l’ensemble des départements de France métropolitaine à partir des données d’incidence des registres et de données médico-administratives.
Méthode -
Un indicateur médico-administratif « AUP » a été construit à partir du croisement des données du Programme de médicalisation des systèmes d’information (PMSI) et des Affections de longue durée (ALD). Cet indicateur permet de dénombrer les personnes atteintes d’un cancer nouvellement mises en ALD ou hospitalisées. Les estimations d’incidence ont été réalisées en redressant les données départementales AUP par le rapport Incidence/AUP observé dans la zone registre. La qualité des estimations a été évaluée au préalable dans les départements de la zone registre en comparant l’incidence observée et l’incidence estimée.
Résultats -
L’étape préalable d’évaluation a confirmé que le rapport AUP/Incidence pouvait être utilisé pour estimer l’incidence départementale du cancer de la thyroïde. En France, l’incidence ainsi estimée sur la période 2007-2011 présentait d’importants contrastes entre les départements : les percentiles à 5 et 95% de la distribution des taux standardisés d’incidence entre les départements étaient de 2,8 et 7,1 pour 100 000 chez les hommes, de 8,3 et 21,2 pour 100 000 chez les femmes. Des zones de sur-incidence notables étaient visibles dans certains départements du Sud-Est et du littoral sud-ouest par rapport à la moyenne métropolitaine.
Conclusion -
Ce travail confirme l’ampleur des disparités géographiques d’incidence du cancer de la thyroïde entre départements français et illustre l’intérêt du croisement des données issues des bases médico-administratives pour estimer l’incidence départementale des cancers.
Abstract
Objectives –
In France, cancer registries cover 20% of the population. The objective of this study was to provide estimations of thyroid cancer incidence at the administrative district level (“départements”) over the 2007-2011 period in metropolitan France, using registries data and medico-administrative data.
Methods –
A medico-administrative indicator “HUL” [Hospital union LLD] combining Hospital discharge data and health insurance data on Long Duration Diseases (LDD) was constructed. It counts the number of people with a new LDD or hospitalized for thyroid cancer. The principle of the estimation consists in adjusting HUL data at the district level by the Incidence/HUL ratio of the registry area. The accuracy of the estimations was first evaluated in the districts covered by registries by comparing estimated to observed incidence.
Results –
The preliminary phase of the assessment confirmed that the HUL/Incidence ratio were sufficiently accurate to provide district level estimates of thyroid cancer incidence over the whole territory. The district variability of the estimations for the 2007-2011 period was important: the 5th and 95th percentiles of the distribution of standardized incidence rates across districts were 2.8 and 7.1 for 100,000 in men, and 8.3 and 21.2 for 100,000 in women. Areas with significant over-incidence were observed in the South-East, and on the South-West coast of France compared to the national level.
Conclusion –
This study confirms the magnitude of geographical variability of thyroid cancer incidence between French administrative districts. It also confirms the value of cross-referencing medico-administrative data to estimate the incidence at an administrative district level.
Introduction
En France, le cancer de la thyroïde est devenu fréquent chez la femme (4e position en termes de fréquence) tandis qu’il reste rare chez l’homme (14e rang). Sur le plan des variations géographiques, ce cancer se démarque par des disparités d’incidence majeures entre les départements couverts par un registre des cancers, tant chez les hommes que chez les femmes 1. Les données des registres sont cependant insuffisantes pour documenter les disparités d’incidence sur l’ensemble des départements français. En effet, les registres ne couvrent qu’une quinzaine de départements, soit environ 20% de la population française.
Différents travaux ont été menés ces dernières années afin d’évaluer l’intérêt d’utiliser des données médico-administratives en complément des données des registres pour fournir des estimations de l’incidence des cancers sur l’ensemble des départements français 2,3,4,5,6,7,8,9,10,11. L’estimation de l’incidence dans un département est réalisée en redressant le nombre de patients dénombré dans les bases médico-administratives par le rapport « Incidence/Données médico-administratives » mesuré dans les départements couverts par les registres. La qualité des estimations a été évaluée au préalable dans les départements de la zone « registre » en comparant l’incidence observée et estimée.
Jusqu’à présent, ces travaux se sont basés sur l’utilisation des données des registres en association avec soit les données d’affections de longue durée (ALD), soit les données du Programme de médicalisation des systèmes d’information (PMSI). Une étude s’intéressant spécifiquement au cancer de la thyroïde avait montré que, chez les femmes, les estimations départementales d’incidence obtenues en utilisant des indicateurs issus du PMSI et des données des registres permettaient de rendre compte des gradients géographiques d’incidence, malgré des erreurs d’estimation parfois importantes (i.e. un écart élevé entre l’incidence observée dans les départements couverts par un registre et l’incidence prédite) 6.
Depuis ces premiers travaux, plusieurs évolutions sont intervenues : (1) les critères méthodologiques définis pour estimer l’incidence départementale des cancers sont devenus plus restrictifs 8 et, à l’aune de ces critères, la production d’estimations départementales de l’incidence du cancer de la thyroïde à partir du PMSI ou des ALD n’a pas été possible 3,8 ; (2) depuis 2007, le chaînage des séjours hospitaliers dans le PMSI est exploitable au niveau départemental ; (3) le croisement entre les données ALD et les données PMSI est désormais possible à travers un même identifiant « patient », permettant la construction et l’étude d’un nouvel indicateur de surveillance des cancers basé sur le croisement de ces deux sources 12.
Dans ce contexte, cette étude a pour objectif de présenter les résultats des estimations de l’incidence du cancer de la thyroïde dans l’ensemble des départements de France métropolitaine, obtenues à partir des données des registres et d’un nouvel indicateur construit à partir de données médico-administratives croisées, en reprenant la méthodologie utilisée actuellement 8,12. Elle vise à décrire les variations départementales de l’incidence du cancer de la thyroïde. L’évaluation préalable de la qualité des estimations obtenues dans les départements avec registre est également brièvement présentée.
Cette étude est réalisée dans le cadre du partenariat en charge de la surveillance des cancers, associant le réseau Francim (réseau Français des registres des cancers), les Hospices civils de Lyon, l’Institut de veille sanitaire et l’Institut national du cancer.
Méthode
Sources de données
L’étude a porté sur les années 2007 à 2011, période sur laquelle le croisement des bases d’ALD et du PMSI était réalisable et exploitable au niveau départemental.
Les données d’incidence du cancer de la thyroïde (code C73 dans la Classification internationale des maladies pour l’oncologie, 3e révision, CIMO-3) ont été extraites de la base commune des registres des cancers du réseau Francim. Elles sont issues de 12 registres généraux et du registre spécialisé des cancers thyroïdiens Marne-Ardennes, l’ensemble couvrant 15 départements (Ardennes, Calvados, Doubs, Gironde, Hérault, Isère, Loire-Atlantique, Manche, Marne, Bas-Rhin, Haut-Rhin, Somme, Tarn, Vendée, Haute-Vienne).
Les données de mises en ALD pour cancer de la thyroïde (code C73 dans la Classification internationale des maladies, 10e révision, CIM-10) provenaient du Système national d’information inter-régimes de l’Assurance maladie (Sniiram) qui rassemble les données de la plupart des régimes d’assurance maladie, dont les plus fréquents, sauf celles du régime agricole qui ont été fournies par la Mutualité sociale agricole (MSA) ; les données du PMSI étaient extraites des bases nationales de l’Agence technique de l’information sur l’hospitalisation (Atih).
Un indicateur médico-administratif « ALD union PMSI » (AUP) a été construit à partir du croisement des données ALD et PMSI selon une méthodologie existante 12. Cet indicateur dénombre le nombre de patients considérés comme diagnostiqués pour la première fois d’un cancer invasif, ayant été hospitalisés ou admis dans le dispositif ALD en raison de ce cancer l’année N et désignés par « patients AUP ». Plus précisément, un patient est inclus dans le dénombrement selon l’un des critères suivants :
- soit s’il est hospitalisé pour un cancer de la thyroïde l’année N (code C73 de la CIM-10 en diagnostic principal), sans hospitalisation pour ce même cancer les deux années précédentes (code C73 de la CIM-10 en diagnostic principal, associé ou relié) ni mise en ALD pour ce cancer antérieure à l’année N ;
- soit s’il est mis en ALD pour cancer de la thyroïde l’année N, sans hospitalisation pour ce cancer les deux années précédentes ou sans hospitalisation pour un cancer in situ de la thyroïde l’année N (code D093 de la CIM-10 en diagnostic principal).
Les indicateurs ont été calculés par département de résidence, par tranche d’âge quinquennale et par sexe sur l’ensemble de la période 2007-2011.
Méthodologie statistique
La démarche statistique utilisée pour estimer l’incidence départementale et évaluer au préalable la validité des estimations a déjà été détaillée dans un précédent article portant sur les estimations régionales d’incidence 8. Nous en rappelons ici brièvement les principes.
Méthode d’estimation de l’incidence et évaluation préalable de la qualité de l’estimation dans la zone registre
Le principe général consiste à estimer, à partir d’un modèle statistique, séparément pour les hommes et les femmes, le rapport selon l’âge entre le nombre de patients AUP et le nombre de cas incidents (rapport AUP/Incidence) dans les départements couverts par un registre. Ce rapport moyen est par la suite utilisé pour estimer l’incidence en redressant le nombre de patients AUP de chaque département.
Les estimations sont d’autant plus proches du nombre de cas incidents que les rapports AUP/Incidence de chaque département sont proches du rapport AUP/Incidence moyen (i.e. que le rapport AUP/Incidence varie peu entre les départements). Le modèle statistique fournit une mesure de cette variabilité, prise en compte dans le calcul des intervalles de prédiction (IP).
Les estimations sont jugées valides si, dans chaque département couvert par un registre, l’amplitude de la différence entre le nombre de cas incidents observés et estimés, rapportée au nombre de cas incidents (erreur relative d’estimation, ER), est inférieure à 15%. Des erreurs plus importantes sont toutefois tolérées (jusqu’à 30%) lorsque les disparités d’incidence sont fortes d’un département/registre à l’autre. Dans ce cas, les estimations peuvent quand même être utilisées car elles permettent de rendre compte d’importantes disparités géographiques d’incidence 8.
Estimations de l’incidence départementales 2007-2011, France métropolitaine
Si l’évaluation préalable dans la zone registre est concluante, l’incidence est alors estimée par sexe et par âge pour chaque département métropolitain. Des rapports d’incidence standardisés sur l’âge (SIR) sont ensuite calculés pour chaque département, en prenant les taux d’incidence estimés par sexe et par âge pour la France métropolitaine comme référence. Les SIR sont représentés sous forme d’une carte (figure 1a) accompagnée de deux graphiques afin de rendre compte de leur variabilité et de leur précision (figure 1b et 1c). La figure 1b présente les SIR par ordre croissant avec leur intervalle de prédiction, et la figure 1c les SIR en fonction de leur précision, avec des bornes de confiance à 95 et 99,8% (graphe en entonnoir ou funnel plot 13). Les départements dont le SIR n’est pas significativement différent de 1 ont par ailleurs été hachurés sur les cartes.
Les taux d’incidence standardisés sur la structure d’âge de la population mondiale ont également été calculés pour la France métropolitaine et par département.
Résultats
Dans les 15 départements de la zone registre, le croisement des données ALD et PMSI identifiait :
- chez les hommes : 1 787 patients AUP en lien avec un cancer de la thyroïde pour 1 648 cas incidents observés de cancers de la thyroïde et 1 641 cas incidents estimés sur la période 2007-2011 ;
- chez les femmes : 5 883 patientes AUP, pour 5 378 cas incidents observés et 5 254 cas incidents estimés (tableau).
Sur cette même période, chez les hommes, un total de 10 505 patients AUP étaient identifiés sur l’ensemble de la France métropolitaine pour 9 659 cas incidents estimés. Chez les femmes, 32 783 patientes AUP étaient identifiées pour 29 284 cas incidents estimés.
Les résultats de l’évaluation dans les départements registres montrent, pour les deux sexes, une forte variabilité des rapports départementaux AUP/Incidence entre les registres. Dans les 15 départements registres, les erreurs relatives d’estimation étaient localement élevées en valeur absolue (jusqu’à 27% pour les hommes, 22% pour les femmes, voir tableau). Deux départements registres chez les hommes et trois départements registres chez les femmes présentaient des estimations qui s’écartaient de plus de 15% des incidences observées. Néanmoins, les variations géographiques de l’incidence observée dans les départements registres étaient suffisamment importantes pour tolérer ces écarts et produire des estimations informatives.
Les estimations des taux d’incidence standardisés sur la structure d’âge de la population mondiale sont, pour la France métropolitaine, de 4,5 pour 100 000 chez les hommes (IP à 95% [3,8;5,4]), et de 13,9 pour 100 000 chez les femmes (IP à 95% [11,6;16,7]). Ces taux varient entre les départements : les percentiles à 5 et 95% de la distribution des taux standardisés d’incidence entre les départements étaient de 2,8 et 7,1 pour 100 000 chez les hommes et de 8,3 et 21,2 pour 100 000 chez les femmes.
L’incidence estimée présente de fortes variations géographiques chez les hommes et chez les femmes (figure 1a, 1b, 1c), avec des départements pour lesquels les SIR s’écartent sensiblement des bornes de confiance des graphiques en entonnoir (figure 1c).
Les cartes des SIR (figure 1a) montrent que, pour les deux sexes, l’incidence était globalement moins élevée dans les départements du nord de la France métropolitaine, tandis qu’une sur-incidence par rapport à la moyenne métropolitaine était visible dans les départements de la côte sud-ouest et dans certains départements du Sud-Est. Les sur-incidences étaient particulièrement importantes pour les deux sexes dans les départements de l’Isère (SIR=1,7 pour les hommes et 1,9 pour les femmes) et des Deux-Sèvres (SIR=1,6 pour les hommes et 2,1 pour les femmes). On retrouvait également une sur-incidence marquée (SIR>1,5) dans les départements des Pyrénées-Atlantiques, de l’Ariège, des Landes, de la Haute-Corse et des Bouches-du-Rhône pour les hommes, et dans les départements de la Lozère, de la Vendée, des Hautes-Alpes et de la Corse-du-Sud pour les femmes. À l’inverse, l’incidence était faible (SIR<0,5) dans le département de la Manche pour les hommes et dans les départements des Vosges et du Haut-Rhin pour les femmes.
Discussion
Cette étude présente de nouvelles estimations de l’incidence du cancer de la thyroïde dans l’ensemble des départements de France métropolitaine, obtenues à partir d’un nouvel indicateur de données médico-administratives, issu du chaînage des ALD et du PMSI et du rapport AUP/Incidence observé dans la zone registre. La qualité des estimations ainsi obtenues a été évaluée au préalable dans les départements de la zone registre.
Dans les derniers travaux de ce type 3,8,10,11 qui utilisaient le PMSI seul ou les ALD seules, les estimations n’avaient pas été produites à l’échelle départementale pour le cancer de la thyroïde, car les erreurs d’estimations constatées dans la zone registre étaient jugées trop importantes. L’évaluation réalisée dans cet article confirme toute l’utilité du chaînage entre ALD et PMSI pour produire des estimations départementales de l’incidence du cancer de la thyroïde. Néanmoins, la variabilité des rapports AUP/Incidence et les écarts entre l’incidence estimée et observée dans les départements registres, qui ont été tolérés au regard de l’ampleur des disparités géographiques d’incidence, restent importants. L’intérêt de l’indicateur AUP pour l’estimation de l’incidence départementale du cancer de la thyroïde devra être confirmé par des travaux ultérieurs.
Cette étude illustre la complémentarité des données médico-administratives et des données des registres pour appréhender l’incidence départementale des cancers. Les registres enregistrent, de façon exhaustive et non biaisée, les cas incidents sur une partie du territoire. À l’inverse, les données médico-administratives n’en donnent qu’une quantification imparfaite (l’indicateur AUP est supérieur en moyenne de 10% à l’incidence, ce chiffre variant de –12 à +26% selon le département), mais sur la totalité du territoire. La confrontation des deux sources de données permet ainsi de calibrer les indicateurs médico-administratifs, d’évaluer leur utilisation pour estimer l’incidence et de mesurer correctement les erreurs d’estimations commises.
Une discussion détaillée sur la construction de l’indicateur médico-administratif croisé et sur les facteurs associés au repérage de cas incidents dans les bases médico-administratives dépasse le cadre de notre étude. Ces points ont été discutés dans de nombreux travaux 11,14 et, en particulier, un rapport détaille et discute la construction du nouvel indicateur médico-administratif issu du chaînage des bases ALD et PMSI 15.
Plusieurs précautions doivent être prises dans l’interprétation des estimations présentées ici. Un enjeu général de cette méthodologie est la représentativité de la zone registre en termes de variabilité départementale du rapport AUP/Incidence, qui conditionne à la fois l’évaluation préalable de la qualité des estimations et le calcul des intervalles de prédiction par la suite. Les départements de la zone registre présentent une grande diversité en termes de territoire mais aussi d’indice de défavorisation 3. Toutefois, ils n’incluent pas de zones fortement urbanisées, dans lesquelles les pratiques de recours aux soins et les pratiques médicales peuvent différer sensiblement. L’interprétation des incidences estimées dans ces départements urbains, en particulier en Île-de-France, requiert donc une prudence particulière. Hormis pour ces départements urbains, il n’y pas de raison a priori pour qu’un département non couvert par un registre des cancers soit éloigné de la diversité des situations représentées au sein de la zone registre. Par ailleurs, la qualité de l’indicateur AUP utilisé peut varier entre les départements. Par exemple, même si l’exhaustivité du chaînage des séjours hospitaliers enregistrés dans le PMSI s’est nettement améliorée ces dernières années, des disparités territoriales subsistent. Ainsi, sur la période 2007-2011, la proportion de séjours hospitaliers pour cancer de la thyroïde sans identifiant patient valide était supérieure à 10% pour l’un des deux sexes dans une dizaine de départements. Dans le cas de l’indicateur AUP, ces données manquantes n’impactent que les cas PMSI (non appariés aux ALD), qui représentent en moyenne 30% de l’indicateur pour la thyroïde. La sous-estimation du nombre de patients AUP qui en résulte est dès lors atténuée, d’autant plus que les patients hospitalisés sans identifiant seront comptabilisés dans l’indicateur AUP s’ils bénéficient d’une mise en ALD.
Les variations géographiques de l’incidence du cancer de la thyroïde mises en évidence dans cette étude sont très importantes, les rapports standardisés d’incidence variant d’un facteur 4 entre les départements métropolitains. Des variations de cette ampleur sont observées entre les départements couverts par un registre, en lien essentiellement avec des répartitions différenciées des cancers de la thyroïde de type papillaire 1,16. La nature descriptive de notre étude ne permet pas de statuer sur les facteurs à l’origine de ces contrastes. Ces variations sont vraisemblablement le reflet, en grande partie, de disparités de pratiques diagnostiques (échographie, cytoponction à l’aiguille fine, évolution des pratiques anatomopathologiques) et thérapeutiques (thyroïdectomie totale) des pathologies thyroïdiennes 1. Les pratiques médicales ont en effet un impact important sur l’incidence observée de ce cancer et sont principalement évoquées pour expliquer les évolutions de son incidence 17. Des facteurs de risque (exposition aux rayonnements ionisants, en particulier durant l’enfance, carence en iode…) sont susceptibles de contribuer également aux variations géographiques de l’incidence, mais les excès de risques induits sont a priori trop faibles pour avoir généré à eux seuls des contrastes aussi marqués entre les départements 18. Ces facteurs peuvent également agir à une échelle spatiale plus fine que l’échelon départemental, cet échelon tendant à masquer les contrastes. Enfin, il est à noter que, comme cela avait été observé dans d’autres études 6,18,19, les zones de sur-incidence ne se superposent pas aux zones des retombées radioactives de l’accident de Tchernobyl de 1986.
Conclusion
Le croisement des bases médico-administratives ALD et PMSI a rendu possible la production d’estimations validées de l’incidence des cancers de la thyroïde à un échelon départemental en France. Les variations spatiales de l’incidence de ce cancer sont importantes et laissent penser que le diagnostic et la prise en charge de ce cancer sont hétérogènes entre les départements. Des études complémentaires seraient néanmoins nécessaires afin de mieux comprendre la part relative des pratiques médicales et des facteurs de risque dans les différences géographiques de l’incidence.
Remerciements
Les auteurs remercient l’ensemble des acteurs des registres des cancers du réseau Francim, tous les producteurs de sources de données qui contribuent à l’enregistrement des cancers par les registres, les laboratoires et services d’anatomie et de cytologie pathologiques, les départements d’information médicale (DIM) des établissements de soins publics et privés, les échelons locaux des services médicaux de l’Assurance maladie, les cliniciens généralistes et spécialistes, ainsi que S. Gosselin de la Mutualité sociale agricole (MSA), pour leur avoir fourni les données nécessaires à la réalisation de cette étude.