Logo SFP

Data Challenge 2022-23 Français

Data Challenge SFP 2022-23

Le projet VisioMel : à la recherche d’une signature numérique évaluant le risque d’évolution métastatique des mélanomes localisés dans les 5 années suivant le diagnostic initial.

Introduction

Ce projet, porté par la Société Française de Pathologie,  la Société Française de Dermatologie, le Groupe de Cancérologie Cutanée et le Conseil National Professionnel des Pathologistes, a pour objectif l’organisation d’un data challenge en mai 2023 sur le thème du mélanome. Cet événement, en collaboration avec le Health Data Hub et avec le soutien de la Banque Publique d’Investissement (BPI), est une compétition internationale ayant pour but de répondre en un temps imparti, et à partir de données spécifiques et anonymisées, à une question posée. Il s'adresse ainsi à des data scientists (chercheurs, industriels, étudiants…), de diverses nationalités. Cette année, les compétiteurs devront créer un algorithme d’intelligence artificielle (IA) permettant de prédire la récidive à 5 ans des patients atteints de mélanome. Dans une ultime étape, l’accessibilité des données et des algorithmes issus du data challenge est encouragée afin de permettre à la recherche de poursuivre sa progression dans l’intérêt de tous.

Contexte

Le mélanome est un cancer de la peau ou plus rarement des muqueuses, se développant à partir des mélanocytes (cellules responsables de la pigmentation cutanée).
 
Les causes de cette maladie sont multifactorielles mais dépendent principalement de l’interaction entre l’exposition aux UV (durée et intensité), des facteurs individuels (présence/abondance de naevus* (*voir lexique ci-dessous), type de peau etc.) ainsi que de facteurs génétiques.
 
En 2018, l’Institut National du Cancer estime que 15500 nouveaux cas de mélanomes cutanés ont été dépistés en France métropolitaine (7900 hommes et 7600 femmes). Avec 1800 décès cette même année (1040 hommes et 840 femmes), ce cancer représente 1.2% des décès par cancer tous sexes confondus. Il fait partie des cancers dont l'incidence* comme la mortalité ont significativement augmenté ces dernières décennies.
 
Les mélanomes représentent 10% des cancers de la peau et sont les plus graves du fait de leur haut potentiel métastatique. L’apparition de métastases est en effet un facteur de mauvais pronostic* car elle signifie que des cellules cancéreuses de la tumeur primitive ont colonisé des tissus sains régionaux ou à distance. Cette colonisation entraîne la formation de tumeurs secondaires au niveau des relais ganglionnaires (on parle de métastases régionales) ou dans d’autres organes (on parle de métastases à distance). Cette évolution métastatique est rarement observée au diagnostic initial du mélanome. En effet, elle survient le plus souvent au cours du suivi.
 
Le diagnostic du mélanome se fait par analyse microscopique après exérèse* de la tumeur par un médecin anatomopathologiste. A partir d’une lame histologique colorée, le médecin réalise le diagnostic de certitude de la maladie et détermine la gravité des lésions par l’analyse de facteurs pronostiques* (épaisseur de la tumeur mesurée en mm, ulcération, mitoses, ...). Ces facteurs pronostiques* sont alors synthétisés en un stade associé au cancer selon la classification AJCC.
Cette analyse couplée avec les facteurs pronostiques cliniques de la maladie (âge, sexe, antécédents, etc.) permet au médecin dermatologue d’adapter la prise en charge du patient selon la sévérité du mélanome.
 
La survie* du patient dépend principalement du stade au moment du diagnostic. En ce qui concerne les mélanomes primitifs cutanés sans métastase, le pronostic est principalement lié à l’épaisseur du mélanome. Ainsi, à un stade précoce (mélanomes fins de moins de 1 mm d’épaisseur) la survie à 5 ans est évaluée à plus de 95%. Les mélanomes épais (de plus de 4 mm) ont quant à eux, un risque de rechute de 50% dans les 5 ans. Si le mélanome est d’emblée métastatique ou s’il a récidivé, des traitements complémentaires chirurgicaux (curage ganglionnaire, exérèse de métastases) ou médicaux, (immunothérapie, thérapie ciblée,) peuvent alors être proposés.

Les problématiques explorées par le projet VisioMel

  • Problématique 1 : Les mélanomes fins (moins de 1 mm d’épaisseur) associés à un bon pronostic, sont cependant à l’origine d’une proportion importante de rechutes et de décès, sans que la pratique clinique n’arrive à les expliquer et les prédire. De même, pour les mélanomes d’épaisseur intermédiaire (compris entre 1 et 4 mm) à plus haut risque de récidive, on manque de facteurs prédictifs de cette potentielle évolution métastatique. Il existe aujourd’hui des traitements adjuvants* permettant de limiter ce risque pour certains mélanomes opérables évalués à risque élevé de rechute. Cependant, au-delà de leur coût élevé, ces traitements exposent les patients à des toxicités médicamenteuses importantes. C’est pourquoi, il devient urgent de pouvoir distinguer les patients qui, sans traitement adjuvant, ne rechutent pas, afin de cibler uniquement les patients pouvant obtenir un bénéfice clinique de ces thérapies. Ces traitements pourraient de même, dans l’avenir, être envisagés en situation néo-adjuvante*.

 
La recherche de nouveaux marqueurs prédictifs de la récidive pour les mélanomes primitifs non métastatiques par l’intelligence artificielle permettrait de compléter l’analyse du médecin anatomopathologiste et d’adapter ainsi la prise en charge du patient. De plus, cette identification dans le cas de mélanome peu épais, dont la récidive est particulièrement complexe à prédire, constituerait une avancée majeure .
 

  • Problématique 2 : En parallèle, la détermination du statut mutationnel de la tumeur (notamment vis-à-vis du gène BRAF V600E) est indispensable à la prescription d’une thérapie ciblée. La présence ou l’absence d’une telle mutation permet également de distinguer différents types de mélanomes pouvant avoir des évolutions cliniques distinctes. La recherche d’une telle mutation nécessite actuellement la réalisation de techniques complémentaires pouvant être coûteuses. En conséquence, ces techniques ne sont actuellement demandées que pour des lésions de stade élevé.

 
La prédiction de ce statut par le biais d’une analyse algorithmique de l’image permettrait de faciliter sa détermination chaque fois que c’est nécessaire. 
 
Les approches IA sont particulièrement pertinentes pour la création d’un outil au service des médecins afin de les accompagner dans la détection des cas potentiels de récidives de façon rapide et précise. En effet, il est essentiel d’identifier de nouveaux facteurs pronostiques que l’examen clinique ou l’examen histologique peuvent ne pas percevoir. Des approches utilisant l’IA ont déjà été utilisées. Il s’agit toutefois d’IA basées sur des échantillons d’assez petites tailles et utilisant des méthodes d’apprentissage très supervisées. La taille de la cohorte envisagée ici permettra l’utilisation de méthodes non supervisées. De plus, coupler variables cliniques, histologiques et moléculaires permettrait d’aller au-delà de la segmentation actuelle des disciplines (clinique, histologique et moléculaire) et d’augmenter les chances d’identification de « pattern » pronostiques.

Matériel et méthodes

Schéma général du projet VisioMel

Sélection des patients : La problématique étant la prédiction des évolutions métastatiques de mélanomes, seuls les patients ayant une maladie localisée au moment du diagnostic (stade 0 à IIB) sont inclus dans l’étude. La sélection des patients est effectuée à partir de la base de données RIC-Mel. Grâce à l’effort d’un réseau de médecins issus de 49 centres inclueurs français, cette base de données nationale créée en 2012 recueille aujourd’hui les données d’environ 40000 patients atteints de mélanomes.
3000 patients ont été sélectionnés selon les critères suivant :

  • Stade du cancer entre 0 et IIB
  • Inclusion entre 2012 et 2016 (car la récidive à prédire est dans les 5 années suivant le diagnostic initial) 

Variables sélectionnées pour le challenge : L’apprentissage de la prédiction de la récidive à 5 ans des mélanomes primitifs non métastatiques par l’algorithme se fera sur la base de données cliniques, histologiques et moléculaires. L’algorithme ainsi construit devra prédire la récidive et le statut mutationnel de la tumeur sur la base unique d’analyse d’images, c’est-à-dire des données histologiques.
 
Dans un premier temps, grâce à l’implication des centres inclueurs, les variables suivantes sont extraites de la base de données RIC-Mel ou à partir des comptes rendus anatomopathologiques :

  • âge,
  • sexe,
  • historique médical du patient,
  • localisation du mélanome (jambe, bras, buste, visage etc.),
  • stade de la tumeur primitive,
  • antécédents familiaux,
  • recherche moléculaire de la mutation BRAF,
  • évolution du cancer/récidive dans les 5 ans. 

Dans un second temps, les lames histologiques correspondant à ces patients sont en parallèle désarchivées et numérisées après pseudonymisation afin d’être intégrées à la base de données du challenge. Cette tâche est réalisée par les laboratoires d’anatomie et cytologie pathologique (ACP) ayant traité l’analyse de l’exérèse de la tumeur primitive.
Un grand soin est apporté à la qualité des données par implication des centres inclueurs et vérification de l’exhaustivité de ces dernières.
 
Anonymisation : Les données sont par la suite solidement anonymisées sans retour possible au nom du patient. Une analyse de risque de ré-identification est menée en collaboration avec DrData .
 
Déroulement du challenge : La base de données une fois constituée sera disponible sur la plateforme hébergeant le data challenge pour une durée de 7 semaines. Les données des 3000 patients seront séparées en trois sets différents de la façon suivante:

  • 1200 échantillons seront accessibles pour la phase d’apprentissage (lames + données cliniques et moléculaires)
  • 600 échantillons seront accessibles pour les phases de test (uniquement les lames histologiques)
  • 1200 échantillons sur lesquels se fera la phase de validation (uniquement les lames histologiques). 

Chaque set sera construit de façon à s'affranchir des biais potentiels dus à des facteurs exogènes : laboratoire ACP (préparation et coloration des lames), type de scanner etc. De même, le stade du cancer et le sexe du patient seront répartis de façon équilibrée dans les différents sets.
La compétition se déroulera sur les 1200 derniers échantillons histologiques. Le but sera de quantifier la performance de l’algorithme dans la prédiction de la récidive et du statut mutationnel de la tumeur.
 
La performance des algorithmes proposés par les challengers sera évaluée sur des critères simples, binaires (absence ou présence d’une mutation, absence ou présence d’une évolution métastatique à 5 ans). L’erreur entre la prédiction et la “vérité de terrain” sera pondérée par la gravité de cette erreur à l’aide d’une métrique. Cette pondération mathématique aura un sens clinique et sera communiquée au moment de la compétition.

Encadrement réglementaire du projet

Toutes les étapes du projet ont été encadrées et validées par DrData. Cette structure de conseil spécialisée dans la protection des données personnelles dans le secteur de la santé. Leurs équipes d’experts accompagnent des hôpitaux, des professionnels de santé et des entreprises du numérique (intelligence artificielle, télémédecine…) dans leur conformité RGPD et le privacy by design de tous leurs process et projets.

Financement

Le projet est soutenu financièrement par la Banque Publique d’Investissement (BPI) ainsi que par des dons de la part Bristol Myers Squibb (BMS) et Pierre Fabre.

Liens utiles

  • Présentation du projet en vidéo par le Docteur Frédéric Staroz, responsable du projet VisioMel, lors d'un évènement organisé par le Health Data Hub en mai 2022.
  • Podcast dans lequel le Dr Frédéric Staroz présente notamment les bénéfices de ces Data Challenges pour l’écosystème de santé et les entrepreneurs.

Lexique

Source : Fondation contre le cancer

Exérèse : Une exérèse est une intervention chirurgicale consistant à retirer de l’organisme, et si possible en totalité, un élément qui lui est nuisible ou inutile.

Facteur pronostique : Situation, état ou caractéristique d'une personne qu'on considère lorsqu'on établit un pronostic. Il existe de nombreux facteurs pronostiques différents, y compris le type et le stade du cancer ainsi que l'âge et l'état de santé global de la personne atteinte.

Incidence : Nombre total de nouveaux cas d’une maladie diagnostiqués chez une population donnée pendant une période de temps déterminée.

Naevus : Grain de beauté. C’est une tache plane ou en relief qui correspond à un amas de cellules de la peau : les mélanocytes.

Pronostic : Issue ou évolution prévue d’une maladie ou chance de guérison ou risque de récidive.

Récidive: Cancer qui se manifeste de nouveau (récidive) après une période au cours de laquelle le patient n’a éprouvé aucun signe ou symptôme (rémission). On parle de récidive locale lorsque le cancer réapparaît dans la même région du corps que l’emplacement initial (siège primitif) de la tumeur. On parle de récidive à distance lorsque le cancer se manifeste de nouveau dans une région du corps autre que l'emplacement initial (siège primitif) de la tumeur.

Survie : Pourcentage de personnes atteintes d’une maladie qui sont toujours en vie à un certain moment donné après avoir reçu leur diagnostic. Les données statistiques sur la survie au cancer sont souvent fournies pour une période de survie de 5 ans. Ces données indiquent le pourcentage de personnes atteintes d’une maladie en particulier qui sont toujours en vie 5 ans après avoir reçu leur diagnostic. Il peut s’agir de personnes qui n’ont pas de récidive, qui sont en rémission ou qui reçoivent encore des traitements.

Traitement adjuvant : traitement administré en plus du traitement de première intention (premier traitement ou traitement standard) pour aider à réduire le risque de réapparition (récidive) de la maladie.

Traitement néo-adjuvant : La thérapie néoadjuvante est l'administration d'agents thérapeutiques avant un traitement principal.

Dernière mise à jour de la page: