Méthode d’estimation de l’incidence régionale des cancers à partir des données d’incidence des registres, des données de mortalité par cancer et des bases de données médico-administratives

A method to estimate cancer incidence at the administrative district level in France using incidence data from cancer registries, mortality data by cancer site and health administrative databases

Marc Colonna1,2 (mcolonna.registre@wanadoo.fr), Nicolas Mitton1, Laurent Remontet3, Aurélien Belot3, Nadine Bossard3, Pascale Grosclaude2,4, Zoé Uhry5

1 Registre des cancers de l’Isère, Grenoble, France
2 Réseau français des registres de cancer Francim, France
3 Service de biostatistique, Hospices civils de Lyon, France
4 Registre des cancers du Tarn, Institut Claudius Regaud (ICR), Toulouse, France
5 Institut de veille sanitaire, Saint-Maurice, France
Soumis le 02.07.2013 // Date of submission: 07.02.2013
Mots-clés : Cancer | Estimation régionale | Incidence | Registre | Affection de longue durée | PMSI | Mortalité
Keywords: Cancer | Regional estimation | Incidence | Registry | Long-duration disease data | PMSI | Mortality

Résumé

Objectifs –

En France, les registres des cancers couvrent seulement 20% de la population. Afin d’estimer l’incidence (I) régionale des cancers, différents corrélats peuvent être utilisés : Mortalité (M), Programme de médicalisation des systèmes d'information (PMSI) et Affection de longue durée (ALD). L’objectif de ce travail était d’évaluer la validité de ces corrélats et de les hiérarchiser pour fournir des estimations régionales d’incidence sur la période 2008-2010.

Méthode –

Le principe de l’estimation est identique pour les trois méthodes et consiste à appliquer le rapport M/I de la zone registre (ou ALD/I ou PMSI/I, respectivement) aux données régionales de mortalité (ou ALD ou PMSI, respectivement). Du fait de la couverture départementale des registres en France, ces méthodes ne peuvent être évaluées, et donc validées, qu’à cet échelon administratif dans les départements couverts par un registre. Un arbre de décision a été adopté pour classer chaque méthode par cancer, puis les hiérarchiser. Les localisations éligibles (une méthode au moins jugée valide) ont été distinguées. Des fourchettes d’estimations ont toutefois été fournies pour les localisations non éligibles.

Résultats –

Chez les hommes, 8 localisations sur 19 étaient éligibles, dont 6 à partir des ALD et 2 du PMSI. Chez les femmes, 9 localisations sur 21 étaient éligibles, dont 3 à partir des ALD, 5 du PMSI et 1 de la mortalité.

Conclusion –

Ce travail présente la première démarche structurée évaluant différentes approches d’estimation de l’incidence régionale. Il confirme l’apport des bases médico-administratives pour cette problématique.

Abstract

Objective –

Cancer registries in France cover only 20% of the population. Various correlates may be used to estimate the geographical regional incidence (I) of various cancers: mortality M), hospital administrative data (PMSI, Programme de Médicalisation des Systèmes d’Information), or long-term illness health insurance data (ALD, Affection de Longue Durée). The present study aimed to evaluate the validity of these correlates and prioritize them in terms of their ability to provide regional estimations of cancer incidence over the period 2008-2010.

Method –

The estimation principle was identical for all three correlates. It consisted in using the correlate (M, or PMSI or ALD, respectively) / I ratio of the registries area together with the corresponding observed M, or PMSI, or ALD regional data. As cancer registries only cover certain administrative districts (termed "Départements"), these methods cannot be evaluated at the administrative "Région" level but only at the "Département" level. The validity of each method has been thus evaluated in each "Département" with cancer registries. A decision tree was used to prioritize the accuracy of each method by cancer site. Eligible cancer sites (with at least one valid method) were determined. Estimate ranges were provided for non-eligible sites.

Results –

In men, 8 out of 19 sites were found to be eligible, 6 of which using ALD data and 2 using PMSI data. In women, 9 out of 21 sites were found to be eligible, 3 of which using ALD data, 5 using PMSI data, and 1 using mortality data.

Conclusion –

This study presents the first structured approach evaluating various incidence estimation methods at the regional scale. It confirms the value of using health administrative data to solve this problem.

Introduction

L’incidence des cancers est un indicateur épidémiologique indispensable pour appréhender le poids de cette pathologie. Étant donné l’importance de l’échelon régional dans la mise en œuvre de politiques de santé, la connaissance de cette incidence au niveau régional est essentielle.

En France, l’incidence est mesurée par des registres départementaux des cancers qui couvrent environ 20% de la population métropolitaine adulte à l’heure actuelle. L’incidence nationale des cancers est donc estimée en multipliant la mortalité nationale par cancer par le rapport Incidence /Mortalité (I/M) observé sur l’ensemble des départements couverts par un registre (zone registre) 1. Cette méthode est adaptée au niveau national 2, mais présente des limites au niveau régional 3. Elle suppose, en effet, un rapport I/M identique dans toutes les régions, autrement dit, qu’une même incidence produit une même mortalité d’une région à l’autre. Plusieurs facteurs peuvent mettre à mal cette hypothèse 3, en particulier des disparités régionales potentielles de survie. En l’absence d’une alternative aboutie à l’époque de ces études, des estimations régionales ont néanmoins été réalisées avec cette méthode, accompagnée d’un avertissement 3.

Depuis, différents travaux ont été menés afin d’évaluer l’intérêt d’utiliser des données médico-administratives comme corrélat de l’incidence départementale : Affection de longue durée (ALD) 4,5,6 et Programme de médicalisation des systèmes d’information (PMSI) 7,8,9,10. Notre étude s’inscrit dans la continuité de ces travaux. Elle présente pour la première fois une évaluation conjointe, pour 23 localisations cancéreuses, des trois méthodes : PMSI/Incidence (PMSI/I), ALD/Incidence (ALD/I) et Mortalité/Incidence (M/I), dans une perspective d’estimation de l’incidence régionale des cancers. Les objectifs de notre étude étaient de :

  • évaluer, par localisation cancéreuse, chaque méthode selon une méthodologie commune, dans les départements avec registre ;
  • hiérarchiser les méthodes par localisation cancéreuse pour identifier les localisations éligibles (une méthode au moins jugée valide) et la méthode la plus appropriée ;
  • estimer l’incidence régionale en France métropolitaine sur la période 2008-2010 pour les localisations éligibles.

Dans cet article, seuls les deux premiers objectifs sont abordés, l’ensemble des résultats étant disponibles en ligne sur le site Internet de l’Institut de veille sanitaire (http://www.invs.sante.fr).

Matériel et méthode

En préambule, notons que la méthode M/I repose sur un lissage préalable de l’incidence et de la mortalité à partir de 1975, selon une méthode adaptée de celle utilisée au niveau national 1. Il s’agit donc d’une approche longitudinale, qui n’a pas pu être appliquée aux méthodes I/PMSI et I/ALD en l’absence d’antériorité suffisante des données des bases médico-administratives (BMA). Dans ce cas, l’approche est transversale, sans lissage préalable des données.

Matériel

La période d’étude a été déterminée par la disponibilité des données.

Les données d’incidence ont été extraites de la base commune des registres du réseau Francim (France-cancer-incidence et mortalité) et couvraient la période 1975-2009 (11 registres généraux : Calvados, Doubs, Isère, Hérault, Loire-Atlantique, Manche, Bas-Rhin, Haut-Rhin, Somme, Tarn, Vendée et 9 registres spécialisés : Ardennes et Marne : cancer de la thyroïde ; Gironde, Orne : localisations hématologiques ; Saône-et-Loire, Finistère : localisations digestives ; Côte-d’Or : cancer du sein, localisations digestives et hématologiques). Elles sont codées selon la Classification internationale des maladies pour l'oncologie, 3e édition (CIM-O-3).

Les données de mortalité provenaient du Centre d’études sur les causes médicales de décès (CépiDc-Inserm) et couvraient la période 1975-2009. Elles sont codées selon la CIM-8 de 1975 à 1978, la CIM-9 de 1979 à 1999, puis la CIM-10 depuis 2000. Les données de mises en ALD de la période 2007-2010 provenaient des trois principales caisses d’assurance maladie : le régime général (CnamTS), le régime des indépendants (RSI) et le régime agricole (MSA), qui couvrent 96% de la population. Les données du PMSI de la période 2007-2010 ont été extraites des bases nationales. L’indicateur utilisé est le nombre de patients avec au moins un séjour et diagnostic principal de cancer sur la période d’étude. Ce choix est moins restrictif qu’une sélection intégrant également les actes médicaux, mais permet une sélection plus homogène 9. Les données d’ALD correspondent au nombre de premières demandes de mise en ALD sur la période d’étude. Les ALD et le PMSI sont codés selon la CIM-10. Les données de la période 2007-2009, disponibles pour les différentes approches, servent à évaluer et hiérarchiser les méthodes par localisation. Les estimations portent ensuite sur la période plus récente 2008-2010.

Méthode

Le principe de l’estimation était identique pour les trois méthodes (PMSI, ALD et mortalité) et reposait sur l’application des rapports PMSI/I (ou ALD/I ou M/I, respectivement) de la zone registre aux données régionales du PMSI (ou ALD ou M, respectivement). Ces méthodes supposent que le rapport PMSI/I (ou ALD/I ou M/I, respectivement) était identique dans toutes les régions. La validité de cette hypothèse ne peut être examinée qu’au niveau géographique couvert par les registres des cancers, c’est-à-dire au niveau départemental.

Méthodes d’estimation de l’incidence

Modélisation du rapport PMSI/I (ou ALD/I ou M/I, respectivement), période 2007-2009

Pour la méthode PMSI/I (ou ALD/I), le rapport entre le nombre de patients issus du PMSI (ou nombre de nouvelles demandes d’ALD, respectivement) et le nombre de cas incidents dans les différents registres au cours de la période 2007-2009 a été modélisé en fonction de l’âge (en continu) et du département (effet aléatoire) dans un modèle de Poisson à effets mixtes 11. Le modèle s’écrit :

Pa,j est le nombre de patients issus du PMSI (ou d’ALD) de la classe d’âge a et du département j, Ca,j le nombre de cas incidents correspondant, g une fonction continue de l’âge (spline) et bj l’effet aléatoire du département j. Le paramètre σd mesure la variabilité départementale du rapport. Ce modèle fournit le rapport moyen f(a) utilisé ensuite pour estimer l’incidence par âge, égal à exp(g(a)). L’analyse a été réalisée en utilisant la fonction glmmPQL de la librairie mass de S-Plus®, version 7.0.

Pour la méthode M/I, l’incidence et la mortalité dans la zone registre étaient chacune modélisées au préalable sur la période 1975-2009 (modèles âge-période-cohorte, voir Belot et coll. 1 pour la méthode détaillée). Le rapport M/I lissé h(a) ainsi obtenu était extrait pour la période 2007-2009 dans la zone registre, par classe d’âge. Cette modélisation a été réalisée en utilisant la fonction gam de SPlus®, version 7.0.

Estimation du nombre de cas incidents par région, 2008-2010

Pour la méthode PMSI/I (ou ALD/I), le nombre de cas incidents par région pour la période 2008-2010 était estimé à partir du nombre de patients PMSI de chacune des régions (ou ALD) et du rapport moyen f(a) issu du modèle (1), sous l’hypothèse d’un rapport moyen 2007-2009 et 2008-2010 identiques. Ceci permet de réaliser des estimations d’incidence pour une période aussi récente que possible compte-tenu des données disponibles :

Pa,r est le nombre de patients PMSI (ou ALD) de la période 2008-2010 pour la classe d’âge a dans la région r.

Pour la méthode M/I, l’estimation du nombre de cas incidents par région était obtenue par classe d’âge, à partir du rapport M/I lissé h(a) obtenu par modélisation, comme décrit au paragraphe précédent, et du nombre estimé de décès par région pour la période 2008-2010, par âge. Ce nombre était estimé à partir d‘une modélisation préalable (âge-période-cohorte) de la mortalité régionale sur la période 1975-2009, avec une projection à un an pour l’année 2010.

Intervalle de prédiction des estimations régionales

Afin d’évaluer la variabilité des estimations, les estimations ponctuelles (nombre total de cas par région, taux standardisés sur la population mondiale et taux bruts) sont fournies avec leurs intervalles de prédiction (IP) 12. La variabilité départementale des rapports ALD/I et PMSI/I est prise en compte dans ces IP, en supposant que les erreurs de prédiction ne sont pas corrélées entre les différents départements d’une même région. À noter que cette hypothèse n’est pas vérifiable en raison du faible nombre et de la dispersion spatiale des départements couverts par un registre. Cette hypothèse induit une sous-estimation des variances des estimations régionales dans le cas où la corrélation serait, en fait, positive. Les intervalles de prédiction ne pouvaient être calculés de cette façon pour la méthode I/M et ne sont pas fournis pour cette méthode.

Évaluation de la qualité des estimations dans les départements avec registre, période 2007-2009

Cette évaluation reposait sur trois éléments : l’adéquation entre incidence observée et prédite au niveau départemental, la variabilité départementale des rapports PMSI/I, ALD/I et M/I et l’ampleur des disparités géographiques d’incidence.

Mesure de l’adéquation entre incidence observée et prédite

Pour évaluer l’adéquation entre incidence observée et prédite à partir du PMSI, des ALD et de la mortalité, une comparaison entre nombre de cas observés et prédits a été effectuée par validation croisée 8 dans les différents départements couverts par un registre. L’erreur relative a été calculée pour chacun des départements couverts par un registre :

Où O est le nombre de cas incidents observé dans un département et E est le nombre de cas prédits. Pour évaluer la qualité de l’adéquation, la valeur absolue de l’erreur relative (ERA), exprimée en pourcentage a été utilisée.

Mesure de la variabilité départementale des rapports PMSI/I, ALD/I et M/I

Cette mesure (σd) est tirée directement du modèle (1) pour les rapports PMSI/I et ALD/I. Un modèle similaire a été réalisé pour le rapport M/I (où le nombre de décès est substitué au nombre patients PMSI), afin de fournir cette même mesure σd. Cette mesure témoigne de la validité de l’hypothèse de ces méthodes, c’est-à-dire de la validité de l’application d’un même rapport à toutes les régions. Elle est étroitement liée à la qualité des estimations.

Mesure de la variabilité départementale de l’incidence observée

La variabilité départementale de l’incidence observée, notée σk, est obtenue par un modèle similaire à (1), dans lequel le taux d’incidence est analysé en fonction de l’âge et du département en effet aléatoire. Elle témoigne de l’ampleur des disparités d’incidence entre les départements de la zone registre.

Classification et hiérarchisation des méthodes par localisation

Classification de chaque méthode, par localisation et par sexe

Afin d’évaluer la pertinence de chaque méthode pour les estimations régionales, une règle de décision a été établie (figure), conduisant au classement des localisations en 4 catégories : A++ et A+ (estimations acceptables) et B- ou B- - sinon (estimations non acceptables). Cette règle de décision est une évolution des règles adoptées précédemment dans le cadre des données d’ALD 6 et du PMSI 13.

Figure : Arbre décisionnel utilisé pour classer les méthodes d’estimation des incidences régionales de cancer, France
Agrandir l'image

Le classement reposait en premier lieu sur l’adéquation entre incidence observée et prédite. Si celle-ci était jugée satisfaisante (ERA faible dans tous les départements), la méthode était classée d’emblée en A++. Si elle était médiocre (ERA élevée dans un nombre important de départements), la méthode était classée en B--.

Pour les situations intermédiaires, un deuxième critère intervenait, comparant la variabilité départementale σd du rapport PSMI/I (ou ALD/I ou M/I, respectivement) à la variabilité de l’incidence (σk). Ce critère revient à considérer que des estimations, bien qu’imparfaites, sont acceptables (A+) lorsque les erreurs de prédictions sont « modérées » au regard de l’ampleur des disparités d’incidence. Une méthode était retenue et classée A- lorsque la variabilité interdépartementale de l’incidence était 2 fois plus élevée que celle de du rapport PMSI/I (ou ALD/I ou M/I, respectivement). Sinon, la méthode était classée B-.

Les localisations éligibles avec au moins une méthode jugée satisfaisante (A++) ou acceptable (A+) ont été considérées comme éligibles pour une estimation régionale. Il faut noter que la significativité statistique des ERA n‘intervient pas dans cette règle afin de ne pas écarter les localisations fréquentes lorsqu’elles ont des ERA significatives, mais mineures, et d’écarter au contraire les localisations avec des effectifs insuffisants pour évaluer la qualité des estimations. Ainsi, les classements B- et B-- regroupent à la fois des localisations pour lesquelles l’erreur de prédiction est jugée trop importante et des localisations avec des effectifs insuffisants pour évaluer la qualité des estimations.

Hiérarchisation des méthodes

Pour les localisations éligibles, la méthode la plus satisfaisante était retenue pour réaliser l’estimation de l’incidence (A++ préféré à A+). En cas d’ex-æquo, la méthode retenue était celle ayant l’ERA médiane la plus faible. Dans le cas où une même méthode permettait une estimation pour les deux sexes, cette méthode était préférée aux autres, même si elle était moins performante pour un des sexes.

Gestion des localisations non-éligibles

Pour répondre à la demande forte des pouvoirs publics de disposer d‘informations pour toutes les localisations cancéreuses, il a été décidé de fournir des fourchettes d’estimations (intervalle de prédiction : IP) pour les localisations non éligibles. En l’absence d’IP pour la méthode I/M, la méthode était choisie parmi PMSI/I ou ALD/I. En cas d’ex-aequo, la méthode ayant l’ERA médiane la plus faible était retenue.

Résultats

Parmi les 19 localisations cancéreuses étudiées chez les hommes, 8 ont fait l’objet d’une estimation d’incidence, dont 6 à partir des ALD et 2 à partir du PMSI (tableau 1). Parmi les 21 localisations étudiées chez les femmes, 9 ont fait l’objet d’une estimation d’incidence dont 3 à partir des ALD, 5 du PMSI et 1 de la mortalité. Les autres localisations n’étaient pas éligibles pour une estimation ponctuelle. Parmi les 12 localisations non éligibles chez les hommes, 8 étaient classées B-- pour les 3 méthodes. Chez les femmes, toutes les localisations non éligibles étaient classées B- - pour les 3 méthodes.

Tableau 1 : Classement des méthodes d’estimation d’incidence régionale de cancer en fonction de la localisation et du sexe, France
Agrandir l'image

Le tableau 2 présente, pour chaque localisation et chaque méthode, une synthèse des éléments pris en compte pour le classement de la méthode : σd, σk, nombre de départements avec une erreur relative absolue ≤15% et >30%. La mortalité est écartée d’emblée pour la grande majorité des localisations (B--) en raison d’erreur de prédictions trop importantes (tableau 2). Pour les 6 localisations spécifiques à un sexe, au moins une des méthodes ALD/I ou PMIS/I a été jugée éligible. Pour les 17 autres localisations étudiées, 4 sont éligibles pour les 2 sexes, 8 non éligibles pour les 2 sexes et 4 éligibles pour un seul sexe. Plus spécifiquement, un classement différent selon le sexe est rare pour les méthodes PMSI/I et M/I (1 et 3 localisations concernées respectivement), et plus fréquent pour la méthode ALD/I (5 localisations concernées). Au final, 3 localisations sur ces 17 sont éligibles avec une même approche pour les deux sexes (lèvre-bouche-pharynx, côlon-rectum, poumon). Cinq localisations cancéreuses sont éligibles pour un seul sexe (œsophage, larynx et lymphomes malins non hodgkiniens (LMNH) chez les hommes, vessie et estomac chez les femmes). Les 9 localisations cancéreuses restantes sont non éligibles, avec dans la plupart des cas un classement défavorable (B--), c’est-à-dire avec des erreurs de prédictions importantes dans les départements couverts par un registre.

Tableau 2 : Critères de classement par approche, localisation cancéreuse et sexe, France
Agrandir l'image

Discussion

En l’absence de registre national, la connaissance de l’incidence des cancers à un niveau infranational ne peut être obtenue qu’à partir d’une modélisation. Notre étude présente une évaluation des trois méthodes (PMSI/I, ALD/I, M/I) sur une unique période et selon une méthodologie commune. C’est la première démarche structurée réalisée au niveau régional, intégrant la méthode I/M utilisée jusqu’alors sans démarche d’évaluation. En adoptant des critères simples d’adéquation de l’incidence observée et prédite dans les départements avec un registre, et de comparaison de la variabilité de l’incidence observée avec celle du rapport PMSI/I (ou ALD/I ou M/I, respectivement), un nombre limité de localisations cancéreuses a été considéré comme éligible (8 localisations sur 19 chez les hommes et 9 sur 21 chez les femmes). Les localisations éligibles représentent toutefois plus de 70% des cas incidents 1.

Notre étude confirme les limites de l’utilisation de la mortalité pour estimer l’incidence régionale, limites qui avaient été énoncées mais non évaluées lors des précédentes estimations de l’incidence régionale en France 3. Sur les 23 localisations cancéreuses étudiées, la mortalité n’est éligible que dans 3 cas et n’a été retenue que pour une seule localisation (estomac chez les femmes). Ceci est dû à une très mauvaise adéquation entre incidence observée et prédite dans les départements couverts par un registre. Pour 6 localisations chez les hommes (prostate, testicule, larynx, mélanome, thyroïde et maladie de Hodgkin) et 7 localisations chez les femmes (col de l’utérus, larynx, œsophage, foie, mélanome, thyroïde et maladie de Hodgkin), la majorité des départements présentent une erreur relative absolue supérieure à 15% dans l’étape de validation. Ces localisations cancéreuses présentant en majorité un pronostic favorable, le décalage temporel entre incidence et mortalité peut contribuer à la faible capacité prédictive de la mortalité. Un autre facteur explicatif probable est la variabilité géographique des pratiques diagnostiques pour les cancers dont l’incidence est très sensible à ces pratiques (ie : thyroïde, mélanome, prostate), ou encore le poids des causes compétitives de décès pour les cancers du sujet âgé (ie : prostate). Il est utile de préciser ici que si l'utilisation des données de mortalité pour estimer l’incidence régionale des cancers est inadaptée, son utilisation pour l’estimation nationale de l‘incidence n’est pas remise en cause 2.

Les BMA sont plus adaptées pour l’estimation de l’incidence régionale que les données mortalité, même si leur capacité prédictive reste limitée. Chez les hommes, 8 localisations sur 19 sont éligibles à partir des BMA et 9 sur 21 chez les femmes. Les raisons de la relativement faible capacité prédictive des ALD et du PMSI sont multiples : hétérogénéité potentielle dans le codage (ie : cancers hématologiques), utilisation de définitions différentes de la maladie (ie : cancer de la vessie), nature de la prise en charge thérapeutique (ie : surveillance pour un certain nombre de cancers de la prostate) et lieu de prise en charge (ie : mélanome de la peau). La faiblesse des effectifs pourrait aussi expliquer une partie des discordances selon le sexe (ie : cancers de l’œsophage et du larynx). Enfin, de façon générale, il y a nécessairement une certaine variabilité dans les résultats obtenus, en particulier pour les localisations se situant à la limite des seuils de décision. La reproductibilité des résultats sur une autre période devra être prise en considération pour consolider le classement.

La règle de décision adoptée ici pour classer les méthodes est une évolution de règles précédemment adoptées dans le cadre de l’utilisation des d’ALD 6 et du PMSI 13 à des fins d’estimation départementale des cancers, qui reposaient sur le même type d’éléments (erreur de prédiction, comparaison de σd et σk). Le niveau régional est cependant une échelle particulière pour l’estimation de l’incidence des cancers, car on ne peut évaluer la qualité des estimations directement à cette échelle, seul le niveau départemental étant accessible à la validation. Or, la qualité des estimations est sans doute moindre au niveau départemental que régional. Nous avons de ce fait assoupli les exigences sur la qualité des estimations pour le niveau régional par rapport aux précédents travaux visant à produire une estimation départementale de l’incidence. Des fourchettes d’estimations ont de plus été fournies, au niveau régional, pour les localisations non éligibles.

Par rapport aux travaux cités précédemment, nous avons également simplifié la règle adoptée, pour un énoncé plus facile, et nous avons appliqué une règle de décision stricte, sans faire intervenir l’expertise des professionnels du PMSI et des ALD dans le choix final du classement. Cette discussion avec les experts était en effet difficile à mettre œuvre dans le cadre d’une première confrontation de trois approches. Elle introduit aussi un élément qualitatif difficile à formaliser. Il serait intéressant toutefois de reconsidérer cet aspect à terme. La comparaison brute des classements obtenus ici à ceux des précédents travaux n’est pas d’interprétation immédiate, les règles décisionnelles ayant évolué avec des périodes d’études différant d’une étude à l’autre. Une comparaison fine, en appliquant la règle de décision adoptée pour le niveau régional aux précédents travaux, est prévue et permettra une réelle discussion des règles de décisions adoptées. Toutefois, on peut d’ores et déjà remarquer qu’un certain nombre de localisations semblent particulièrement défavorables à l’utilisation des données médico-administratives pour une estimation d’incidence infranationale (mélanome, leucémie, myélome, cancer de la thyroïde).

Les critères que nous avons retenus pour la règle de décision ne reposent pas sur la significativité statistique des erreurs de prédiction. Une évaluation de la sensibilité de la règle de décision est donc très certainement à envisager afin d’identifier les localisations dont le classement serait changé avec de légères modifications des critères. Nous avons pris en considération non seulement la qualité des estimations, mais aussi un critère relatif mettant en regard qualité des estimations et ampleur des variations géographiques (comparaison de de σd et σk). La « balance » entre ces deux critères est sujette à discussion. En abandonnant par exemple le critère d’exclusion basé sur une erreur relative absolue supérieure à 30%, mais en conservant la comparaison de σd et σk, le cancer du pancréas et le LMNH chez les femmes deviendraient éligibles. Le très mauvais ajustement d’un seul département pourrait avoir une origine très spécifique, ce qui ne devrait alors pas limiter l’utilisation des données d’ALD (ou PMSI) sur l’ensemble du territoire. Cette hypothèse d’une origine spécifique n’est toutefois pas vérifiable en pratique, car nous sommes rarement en mesure d’identifier les facteurs expliquant une telle configuration. De façon générale, il est extrêmement difficile d’identifier les facteurs expliquant les variations géographiques des rapports BMA/I. Ce point a été abordé dans les travaux sur l’utilisation des données d’ALD à des fins d’estimations départementales 6. En particulier, on ne peut isoler des caractéristiques propres au département (eg défavorisation, caractère rural ou urbain, etc..), l’effet du département n’étant pas similaire selon les localisations. Les facteurs faisant varier les rapports BMA/I entre département sont très probablement multiples et résultent de spécificités locales, dépendantes de la localisation étudiée. Ils sont de ce fait très difficiles à mesurer.

L’utilisation des BMA pour une estimation de l’incidence régionale constitue une avancée par rapport à l’utilisation des données de mortalité, même si un nombre limité de localisations sont éligibles à ce jour. L’amélioration de la qualité du chaînage du PMSI depuis 2007 permettra à l’avenir d’exclure les cas prévalents de la sélection PMSI étudiée. Des perspectives méthodologiques sont de plus envisageables pour tenter d’améliorer l’utilisation des BMA et méritent d’être explorées: (i) l’évaluation des données appariées ALD-PMSI ; (ii) la prise en compte simultanément, dans un même modèle statistique, des données du PMSI, ALD et mortalité, qui nécessite un développement méthodologique important ; (iii) la prise en compte de données médico-administratives de manière longitudinale, sous réserve d’une homogénéité de la définition des cas au cours du temps. La modélisation permettrait dans ce cas de s’affranchir d’une partie des fluctuations des observations, qui sont importantes pour les localisations à faible incidence. Ces différentes pistes sont d’autant plus importantes pour progresser sur le niveau départemental, échelon géographique tout aussi indispensable et pour lequel il est encore plus difficile d’obtenir des estimations de qualité.

Remerciements

À toutes les sources de données qui contribuent à l'enregistrement des cancers par les registres en particulier : les laboratoires et services d'anatomie et de cytologie pathologiques, les départements de l'information médicale (DIM) des établissements de soins publics et privés, les échelons locaux des services médicaux de l'assurance maladie, les cliniciens généralistes et spécialistes.
Au Centre d'épidémiologie sur les causes médicales de décès (CépiDC-Inserm).
Aux caisses d’assurance maladie : A. Weill (CnamTS), F. Frete (MSA) et M. Altana (RSI).

Financement

Cette étude a été en partie réalisée dans le cadre d’un financement INCa (Appel à projet) - Étude Oncepi, et s’inscrit dans le cadre du Programme de travail partenarial Francim-HCL-InVS-INCa (financement InVS-INCa).

Références

[1] Belot A, Grosclaude P, Bossard N, Jougla E, Benhamou E, Delafosse P, et al. Cancer incidence and mortality in France over the period 1980-2005. Rev Epidémiol Santé Publique. 2008;56(3):159-75.
[2] Uhry Z, Belot A, Colonna M, Bossard N, Rogel A, Iwaz J, et al. National cancer incidence is estimated using the incidence/mortality ratio in countries with local incidence data: is this estimation correct? Cancer Epidemiol. 2013;37(3):270-7.
[3] Colonna M, Bossard N, Mitton N, Remontet L, Belot A, Delafosse P, et al. le réseau Francim. Some interpretation of regional estimates of the incidence of cancer in France over the period 1980-2005. Rev Epidémiol Santé Publique. 2008;56(6):434-40.
[4] Uhry Z, Remontet L, Colonna M, Belot A, Grosclaude P, Mitton N, et al. Estimation départementale de l’incidence des cancers à partir des données d’affection de longue durée (ALD) et des registres. Évaluation pour 24 localisations cancéreuses, 2000-2005. Saint-Maurice: Institut de veille sanitaire; 2011. 101 p. http://opac.invs.sante.fr/index.php?lvl=notice_display&id=10431
[5] Uhry Z, Remontet L, Colonna M, Belot A, Grosclaude P, Mitton N, et al. Évaluation de l‘utilisation des données d’affection de longue durée (ALD) pour estimer l’incidence départementale des cancers pour 24 localisations cancéreuses, 2000-2005. Bull Epidémiol Hebd. 2012;(5-6):71-7. http://opac.invs.sante.fr/index.php?lvl=notice_display&id=10440
[6] Uhry Z, Remontet L, Colonna M, Belot A, Grosclaude P, Mitton N, et al. Cancer incidence estimation at a district level without a national registry: A validation study for 24 cancer sites using French health insurance and registry data. Cancer Epidemiol. 2013;37(2):99-114.
[7] Uhry Z, Colonna M, Remontet L, Grosclaude P, Carré N, Couris CM, et al. Estimating infranational and national thyroid cancer incidence in France from cancer registries data and national hospital discharge database. Eur J Epidemiol. 2007;22(9):607-14.
[8] Remontet L, Mitton N, Couris CM, Iwaz J, Gomez F, Olive F, et al. Is it possible to estimate the incidence of breast cancer from medico-administrative databases? Eur J Epidemiol. 2008;23(10):681-8.
[9] Mitton N, Colonna M, Trombert B, Olive F, Gomez F,  Iwaz J, et al. A Suitable approach to estimate cancer incidence in area without cancer registry. J Cancer Epidemiol. 2011;2011:418968. http://dx.doi.org/10.1155/2011/418968
[10] Bossard N, Gomez F, Remontet L, Uhry Z, Olive F, Mitton N, et al. Utilisation des données du PMSI pour estimer l’incidence des cancers en France à l’échelon infranational : la démarche du groupe Oncepi. Bull Epidémiol Hebd. 2012;(5-6):77-80. http://opac.invs.sante.fr/index.php?lvl=notice_display&id=10441
[11] Breslow NE, Clayton DG. Approximate inference in generalized linear mixed models. JASA. 1993;88(421):9-25.
[12] Hakulinen T, Dyba T. Precision of incidence predictions based on Poisson distributed observations. Stat Med. 1994;13(15):1513-23.
[13] Colonna M. Pour une observation du cancer au niveau départemental en France : estimation de l’incidence et de la prévalence. Rapport d’activité, Appel à projets, INCa, 2013.

Citer cet article

Colonna M, Mitton N, Remontet L, Belot A, Bossard N, Grosclaude P, et al. Méthode d’estimation de l’incidence régionale des cancers à partir des données d’incidence des registres, des données de mortalité par cancer et des bases de données médico-administratives. Bull Epidémiol Hebd. 2013;(43-44-45):566-74