L’IA et le machine learning sont déjà utilisés aujourd’hui pour aider au diagnostic des patients. En quoi peuvent-ils être utiles ?
Mounîm El Yacoubi. Tout d’abord, il faut souligner que le diagnostic ne se résume pas à un simple tri des patients. Il n’existe pas de frontière nette entre le « normal » et le « pathologique ». C’est pourquoi les médecins restent maîtres de leurs diagnostics, et que les solutions de machine learning ne sont que des aides, qui n’ont pas vocation à se substituer aux médecins mais à les aider à prioriser, par exemple.
Néanmoins, aujourd’hui, le machine learning a des choses à apporter, notamment dans la détection des anomalies dans les IRM. Ce type de méthode repose sur un apprentissage supervisé à partir de millions d’images. Les systèmes arrivent ainsi à repérer des anomalies, avec des taux de classification très élevés, parfois plus fins que ceux des médecins.
L’IA peut donc nous servir à aller au-delà des tests actuels ?
En effet. Les méthodes classiques de diagnostic, qui s’appuient sur des tests sanguins, sur l’imagerie médicale ou sur la mesure d’autres paramètres biologiques, essaient de mettre en évidence une anomalie ou les symptômes caractéristiques d’une pathologie.
Elles fonctionnent assez bien, mais ne sont pas parfaites : elles sont souvent invasives et coûteuses termes d’équipement et de personnel. Il faut aussi que les patients viennent à l’hôpital ou au laboratoire de biologie médicale. Pour toutes ces raisons, les outils de diagnostic basés sur du machine learning, sur des données issues de capteurs peu couteux et non invasifs, intéressent le milieu médical.
De votre côté, vous n’exploitez pas des données médicales classiques…
Non, en effet. Nous travaillons sur des données dites écologiques, comme l’écriture manuscrite, la démarche ou la voix.
Pour la maladie de Parkinson, nous menons un projet de recherche européen, en collaboration avec l’Institut du Cerveau et de la Moelle épinière. L’objectif est de parvenir à détecter dans la voix et les expressions du visage du patient des anomalies typiques de la maladie, et ce au cours d’un simple appel vidéo. Les personnes souffrant de ce trouble neurodégénératif présentent en général une hypomimie, c’est-à-dire une réduction de l’amplitude des mouvements expressifs, ou des altérations de la voix. Nous développons ainsi une méthode de machine learning pour détecter automatiquement ces signaux, et nous cherchons à comparer ses résultats aux données d’IRM ou d’autres indicateurs cliniques. Nous espérons que notre approche pourra aider à mieux caractériser les patients et à stratifier la maladie, c’est-à-dire à identifier des critères permettant de détecter des groupes de patients parkinsoniens avec des comportements différents, qui pourraient donc être traités par les médecins avec des traitements et des thérapies différents.
Avec un tel outil, une première étape diagnostique pourrait être réalisée sans même avoir à faire venir le patient !
Il s’agit même de données imperceptibles par les médecins !
En théorie, le médecin pourrait déceler ces signes, mais en pratique c’est très compliqué, parce qu’il faudrait comparer l’évolution des expressions sur plusieurs mois. Nous avons développé une approche similaire pour la maladie d’Alzheimer, en collaboration avec l’Hôpital Broca, à Paris. Il s’agissait de repérer les dégradations de l’écriture manuscrite, de la voix et de la marche imputables à la maladie.
Pour ces travaux sur les maladies neurodégénératives, la difficulté consiste à concilier spécificité et sensibilité. Nous voulons être capables de repérer les patients atteints de formes précoces sans les confondre avec d’autres troubles neurologiques, comme des troubles cognitifs légers ou d’autres pathologies. C’est très délicat.
Les objets connectés peuvent-ils vous aider à déployer ces approches ?
Pour le diabète de type 2, nous utilisons des capteurs de glycémie connectés. Ils permettent de lire la glycémie en continu; nous n’avons pas besoin de demander aux patients de se piquer et nous pouvons disposer de valeurs 24 heures sur 24. Nous associons à ces données les informations liées à la prise de repas et d’insuline, que le patient peut nous communiquer grâce à une application de suivi de diabète sur smartphone, ainsi que son activité physique, enregistrée via un bracelet connecté. En combinant ces informations, nous arrivons à prévoir la valeur de la glycémie (le taux de glucose dans le sang).
Il s’agissait de repérer les dégradations de l’écriture manuscrite, de la voix et de la marche imputables à la maladie
C’est un véritable défi car chaque personne a son propre métabolisme, sa propre génétique… Nous avons donc créé des modèles personnalisés, fondés sur des modèles de « deep learning séquentiel ». Ce travail a été l’objet d’une thèse menée par Maxime de Bois, que j’ai codirigée avec Mehdi Ammi de l’Université Paris-Saclay. Maxime a développé sa technique sur une base de patients synthétiques, validée par la FDA, l’autorité réglementaire américaine. Puis il l’a testée auprès de 6 patients en collaboration avec le réseau Revesdiab.
Avez-vous rencontré des difficultés ?
Oui, plusieurs, mais nous avons su les résoudre. Pour pallier le manque de données, nous utilisons une méthode d’apprentissage par transfert, qui nous autorise à pré-entraîner le modèle à partir d’autres patients en veillant à ce qu’il génère les paramètres les plus généraux possibles, donc les plus adaptables à un nouveau patient.
Pour améliorer l’acceptabilité du système auprès des médecins, nous avons tenu compte des écarts de prédictions dans le choix de nos métriques.
Pour expliquer comment notre modèle fonctionne, nous avons intégré à notre réseau de neurones profonds (la méthode d’apprentissage) des couches pour estimer le poids de chaque variable dans le temps. Pour chaque prédiction, nous sommes ainsi capables d’indiquer, à chaque instant, quelle variable (glycémie, alimentation ou insuline) a été déterminante. C’est un aspect aussi très intéressant car les médecins eux-mêmes ne savent pas quel paramètre est prépondérant à un instant donné.
Est-ce votre seul projet avec des objets connectés ?
Non, nous avons également un projet destiné à améliorer le diagnostic de l’arythmie cardiaque grâce à un bracelet connecté qui mesure la rigidité artérielle. Il s’agira là aussi de confronter nos résultats à ceux obtenus avec des électrocardiogrammes.
Toutes les données sont bonnes à prendre… Pensez-vous que, dans le futur, notre frigo connecté pourra nous alerter d’un risque de comportement dépressif ?
C’est en effet un bon objet pour repérer des changements d’habitudes… On peut imaginer que ces données puissent être corrélées à celles d’un smartphone ou à la nature et les activités sur les sites Internet fréquentés. Cela posera un enjeu important sur la protection des données. Autoriserons-nous notre médecin à consulter les analyses issues de notre frigo ? Notre moteur de recherche ou nos réseaux sociaux nous préviendront-ils si notre comportement évolue dangereusement ? On imagine que des personnes atteintes de pathologies chroniques et qui connaissent des changements de phases, comme les diabétiques ou les bipolaires, seraient plus susceptibles de donner un accord éclairé à ce type d’approches.
Pour aller plus loin:
- DIGIPD : Validating DIGItal biomarkers for better personalized treatment of Parkinson’s Disease, https://www.erapermed.eu/wp-content/uploads/2021/01/Newsletter-ERA-PerMed_final.pdf, 2021.
- Maxime De Bois, Mounim A. El-Yacoubi, Mehdi Ammi, “Adversarial multi-source transfer learning in healthcare: Application to glucose prediction for diabetic people,” Computer Methods Programs Biomedicine, 199: 105874 (2021).
- Maxime De Bois, Mounim A. El-Yacoubi, Mehdi Ammi, “Enhancing the Interpretability of Deep Models in Heathcare Through Attention: Application to Glucose Forecasting for Diabetic People,” International Journal of Pattern Recognition and Artificial Intelligence, to appear, 2021.
- Mounîm A. El-Yacoubi, Sonia Garcia-Salicetti, Christian Kahindo, Anne-Sophie Rigaud, and Victoria Cristancho-Lacroix, « From aging to early-stage Alzheimer’s: Uncovering handwriting multimodal behaviors by semi-supervised learning and sequential representation learning, » Pattern Recognition, Vol. 86, pp. 112–133, 2/2019.
- Saeideh Mirzaei, Mounim El Yacoubi, Sonia Garcia-Salicetti, Jerome Boudy, C Kahindo, V Cristancho-Lacroix, Hélène Kerhervé, A‑S Rigaud, “Two-stage feature selection of voice parameters for early Alzheimer’s disease prediction,” IRBM, Vol. 39, No. 6, pp. 430–435, 2018.