Ce projet de thèse en cotutelle EC2U serait sous la direction de : M. Raphaël THUILLIER (U. Poitiers) et M. Carlos PRIETO (U. Salamanque)

Unités de recherche : IRMETIST (U. Poitiers) / U. Salamanque – Espagne (cotutelle EC2U)

École doctorale : Rosalind Franklin – Énergie, Environnement, Bio santé

Intitulé du sujet :

Combiner les omics et l’intelligence artificielle pour la prochaine génération de diagnostics : un jumeau biologique pour améliorer le succès de la transplantation

Combining omics and machine Learning towards the next generation of diagnosis: a biological twin to improve transplantation success

Début de thèse : à partir du 01/10/2025

Mots clés : Application numérique, transplantation, intelligence artificielle, jumeau biologique, métabolomique

Résumé:

Ce projet vise à développer un nouvel outil d’aide à la décision en transplantation rénale, pour laquelle l’absence de moyens d’évaluation objectifs de l’organe freine l’accès à de nouveaux donneurs. Cette absence est exacerbée par la carence d’organes actuelle : en 2023 il y a eu 4354 transplantations pour 9816 patients sur liste d’attente active. Il y a donc un besoin critique de nouveaux donneurs, et de l’optimisation de leur prise en charge pour assurer la réussite de la greffe, mais cela est entravé par le manque d’outils de détermination de la qualité des organes. Pour construire un tel outil, nous proposons de mettre à profit le déploiement des spectromètres de masses à haute résolution dans les services de biologie clinique, qui permettent l’observation précise du métabolome. Ce terme regroupe l’ensemble des molécules des réactions régissant le fonctionnement de l’organisme, ainsi leur exploration permet d’obtenir une image très fidèle de la situation du patient, et de ses organes, à un instant donné.

Afin d’exploiter les données de métabolomique, nous utiliserons l’intelligence artificielle, seule technologie d’analyse des données permettant une approche holistique des nombreux signaux issus de la spectrometrie de masse à haute résolution, créant ainsi un ‘jumeau biologique’ du patient. Cette approche multidisciplinaire est permise par la collaboration au cœur de ce projet entre l’unité Inserm U1313 IRMETIST de Poitiers qui apporte l’expertise métabolisme et omique, et le Servicio de Bioinformática de l’Universidad de Salamanca et son expertise de bioinformatique appliquée aux techniques omiques.

Le livrable principal de notre projet serait donc une application, disponible sur smartphone et page web, dans laquelle la concentration de 10-15 métabolites clés seraient entrées. La mesure de ces métabolites se ferait par une spectroscopie de masse disponible dans la plupart des laboratoires de biologie médicale selon un protocole précis, un autre des livrables de notre projet. A partir de ces concentrations le calcul pourra se faire sur l’application pour apporter la prédiction de qualité du greffon, exprimée sous forme de probabilité de fonction une fois transplanté (seuil de GFR, durée avant la reprise de fonction, etc).

La nature pluridisciplinaire d’IRMETIST rentre ici aussi en ligne de compte, notamment concernant la participation des cliniciens de la région Nouvelle Aquitaine du don d’organes et de la transplantation. Leurs apports dans ce projet seront très précieux car ils nous permettront de ne jamais perdre le contact avec l’objectif principal : le bien-être du patient ; et par extension les attentes et limitations de l’utilisateur cible de notre application : le transplanteur.

———————————

The aim of this project is to develop a new decision-support tool for kidney transplantation, where the lack of objective organ evaluation means hinders access to new donors. This absence is exacerbated by the current organ shortage: in 2023 there were 4354 transplants for 9816 patients on the active waiting list. There is therefore a critical need for new donors, and for optimizing their management to ensure transplant success, but this is hampered by the lack of tools for determining organ quality.

To build such a tool, we propose to take advantage of the deployment of high-resolution mass spectrometers in clinical biology departments, which enable precise observation of the metabolome. This term covers all the molecules involved in the reactions  governing the body’s functioning, and their exploration provides a highly accurate picture of the patient’s situation, and that of his or her organs, at a given moment.

In order to exploit metabolomics data, we will use artificial intelligence, the only data analysis technology enabling a holistic approach to the many signals generated by high-resolution mass spectrometry, thus creating a “biological twin” of the patient.

This multi-disciplinary approach is made possible by the collaboration at the heart of this project between the Inserm U1313 IRMETIST unit in Poitiers, with its expertise in metabolism and omics, and the Servicio de Bioinformática at the Universidad de Salamanca, with its expertise in bioinformatics applied to omics techniques. The main deliverable of our project would therefore be an application, available on smartphone and web page, in which the concentration of 10-15 key metabolites would be entered. These metabolites would be measured by mass spectroscopy, available in most medical biology laboratories, according to a precise protocol – another of our project’s deliverables. Based on these concentrations, the application could be used to predict graft quality, expressed as a probability of function once transplanted (GFR threshold, time to resumption of function, etc.). The multi-disciplinary nature of IRMETIST is also a factor here, particularly as regards the participation of organ donation and transplantation clinicians from the Nouvelle Aquitaine region. Their contributions to this project will be invaluable, as they will ensure that we never lose touch with our main objective: patient well-being, and by extension, the expectations and limitations of our application’s target user: the transplant physician.

 

Contexte et problématique :

La transplantation est victime de son succès : le nombre de patients en attente de greffe ne cesse d’augmenter alors que le nombre de greffes réalisées par an reste stable, effectivement en 2023 il y a eu 4354 transplantations pour 9816 patients sur liste d’attente active. Cette pénurie d’organes conduit à prélever des greffons dits « marginaux », issus de donneurs âgés de plus de 60 ans ou âgés entre 50 et 59 ans présentant des facteurs de comorbidité (hypertension, diabètes, etc). En 2023, 40% des donneurs ont plus de 65 ans, et la moitié d’entre eux ont plus de 75 ans. La conséquence directe est que les organes issus de ces donneurs sont plus fragiles et donc sensibles aux lésions d’ischémie-reperfusion (IR), qui compromettent considérablement leur bonne fonction à long terme.

L’IR (pour revue, voir [1]) est inévitable en transplantation : l’ischémie prend place dès le prélèvement de l’organe chez le donneur, pendant le transport et jusqu’à la fin des anastomoses du receveur. Durant cette période, le greffon est conservé à l’aide d’une solution acellulaire et généralement en hypothermie (4°C). Bien que cette phase soit sensée ralentir le métabolisme et protéger l’organe, les travaux de l’U1313 montrent que d’importantes altérations ont lieu au niveau cellulaire, impactant négativement le devenir du greffon. Les travaux récents ont notamment montré le rôle de la voie du stress du réticulum dans l’évolution de ces lésions [2]. Une fois les anastomoses terminées, le greffon est déclampé et le sang peut à nouveau circuler dans l’organe : c’est la reperfusion. Celle-ci se caractérise par une intense activation des processus lésionnels dans le greffon, parmi lesquels le stress oxydant mais aussi des voies de résistance et de survie. L’intensité de ces lésions est parfaitement corrélée à la durée d’ischémie froide [3] mais également aux conditions du donneur. Elle détermine le niveau d’activation de la réponse immunitaire post-transplantation, et est ainsi en directe association avec le devenir du greffon.

A l’heure actuelle, il n’existe aucun protocole permettant d’évaluer avec exactitude l’état lésionnel de l’organe dans la periode peri-tranplantation (avant le prélèvement ou juste après). Certains algorithmes tels que le KDPI intègrent un certain nombre de paramètres du donneur, notamment l’âge, les antécédents médicaux, et rendent un score (en pourcentage) associé à la survie du greffon à long terme. Cependant, la performance de ce test est limitée (c statistique : 0,66 sur la population française). Ainsi, il y a toujours un manque crucial de marqueurs mécanistiques pour guider le clinicien vers la meilleure option thérapeutique possible. Il est donc essentiel de fournir aux transplanteurs de nouveaux outils diagnostiques visant à mesurer avec le plus de précision possible la qualité des organes ainsi que leur résistance aux stress de l’IR.

 

Description du sujet :

C’est ici que l’objectif de notre travail prend tout son sens : créer un algorithme de détermination de la qualité des greffons, compatible avec les réalités de la clinique en termes de temporalités et disponibilité des équipes, facilement accessible et utilisable au plus grand nombre de centre.

Il est important de préciser que la technologie d’acquisition des données, la spectrométrie de masse, est très répandue dans les laboratoires cliniques. L’utilisation proposée de l’intelligence artificielle et la modélisation de jumeaux biologique est parfaitement en adéquation avec les politiques de développement des outils numériques au service de la santé. Couplé au fait qu’il est très aisé de produire des applications ‘user friendly’ à partir des algorithmes développés sur R et Python, par exemple avec l’interface ShinyApp, (https://shiny.posit.co/), qui nous ait déjà familière [8], la mise en application des livrables de notre projet au sein des services cliniques est facilement envisageable.

Afin d’exploiter les données de métabolomique ainsi produites, nous utiliserons l’intelligence artificielle, seule technologie d’analyse des données permettant une approche holistique des nombreux signaux issus de la spectrométrie de masse à haute résolution, créant ainsi un ‘jumeau biologique’ du patient. Cette approche multidisciplinaire est permise par la collaboration au cœur de ce projet entre l’unité Inserm U1313 IRMETIST de Poitiers qui apporte l’expertise métabolisme et omique, et le Servicio de Bioinformática de l’Universidad de Salamanca (Bioinformático) et son expertise de bioinformatique appliquée aux techniques omiques.

 

Méthodologie et mise en œuvre :

– Cohorte de patients : La collecte d’échantillons biologiques (sang et urine) de patients donneurs d’organes décédés de mort encéphalique a débuté en 2017 et comprend aujourd’hui 110 séries d’échantillons. Cette cohorte est complétée ici par une biobanque du CHU de Nantes, comptant 70 donneurs. A ce jour, il s’agira de la plus grande biobanque de donneurs d’organes disponible pour la recherche de biomarqueurs.

– Métabolomique : un extrait de plasma est injecté dans le système de chromatographie liquide-spectroscopie de masse à haute résolution (LC-HRMS), selon 4 programmes successifs, combinant deux technologies de colonnes (C18 et HILIC) et deux types d’ionisation (négative ou positive). L’acquisition est réalisée sur un Orbitrap Exploris 120 (Thermo Fisher). Ce protocole est le fruit d’une longue optimisation [9] et il a été démontré qu’il produisait la meilleure qualité et la meilleure quantité de données pour la recherche sur les biomarqueurs.

– Analyse du signal à l’aide de l’intelligence artificielle : L’objectif est de produire un algorithme capable d’estimer la qualité de l’organe, que nous assimilons à la fonction de l’organe une fois transplanté, à court et à long terme.

Deux étapes sont nécessaires :

– Sélection des variables (Feature Selection) :

Avant de construire un modèle prédictif d’apprentissage automatique, il est essentiel de ne sélectionner que les caractéristiques les plus pertinentes et les plus informatives qui contribuent de manière significative au pouvoir prédictif du modèle. La réduction du nombre de caractéristiques a pour but de réduire le coût informatique de la modélisation et d’améliorer les performances du modèle et sa généralisation à des données inédites.
A l’heure actuelle nous procédons d’une manière ‘classique’ en deux temps : 1) en sélectionnant les signaux qui ont une valeur de p inférieur à 0,2 sur un t-test basique entre les deux groupes, et 2) en faisant tourner deux algorithmes (GLM et RandomForest), qui nous permettent d’isoler leurs VIP (les variables les contributives). Ces deux étapes nous permettent d’identifier les 15-20 signaux les plus pertinents pour créer un modèle final.

Nous prévoyons dans FUSE d’améliorer significativement cette étape. Plusieurs pistes sont considérées, notamment la comparaison de méthodes agnostiques ou sur modèle d’apprentissage :

– Agnostiques : Ces méthodes utilisent uniquement le jeu de données pour estimer une mesure de la relation entre chaque variable explicative et la variable cible, puis sélectionnent celles ayant une intensité élevée. Des exemples incluent l’information mutuelle ou UMAP.

-Basées sur un modèle d’apprentissage : Un exemple classique est une combinaison d’ACP et de modèle linéaire, comme la régression des moindres carrés partiels (Partial Least Squares ou PLS en anglais).

Nous explorerons également l’utilisation de réseaux de neurones (neural network), en particulier pour leur faculté de ‘plongement’.

 

Profil recherché :

Le candidat ou la candidate devra avoir une formation solide en data science et bioinformatique. La connaissance du codage en multiples langages est indispensable, et une démonstration de la maîtrise des outils d’apprentissage automatique et d’intelligence artificielle sera demandée.

Vu la configuration particulière de ce projet en lien avec l’université de Salamanque, la maitrise de l’anglais est essentielle.

L’unité IRMETIST est un petit groupe de chercheur(e)s et étudiant(e)s attachés à une atmosphère sympatique dans le laboratoire et au maintient d’un haut niveau de convivialité. Un esprit ouvert et une bonne humeur seront donc un plus pour le ou la candidate.

 

Contact pour plus d’informations et pour candidater jusqu’au 16/05/25 :
raphael.thuillier@univ-poitiers.fr

Accès et plan