third
Novembre 2021

Numéro Sept

Retrouvez le numéro sept de
Third : Soigner avec le numérique

Third | Novembre 2021

Les promesses de l’IA en santé
Il reste encore quelques écueils à passer

Jean Charlet, chercheur en intelligence artificielle pour le domaine de la santé à l’AP-HP, membre du LIMICS (Laboratoire d’Informatique Médicale et d’Ingénierie des Connaissances en Santé) à Sorbonne Université et à l’Institut de national de santé et de la recherche médicale (INSERM).

 

L’Intelligence Artificielle (IA) est un buzzword qui nous promet un avenir meilleur, en particulier par rapport à notre santé. Nous essayons de la repositionner en tant que technologie au service de l’humanité et proposons d’analyser des réalisations et projets faisant usage de l’IA.

En santé, l’IA est une composante de réflexion et de recherches et se développe au sein de projets informatiques traitant des données et connaissances médicales. À ce jour, les résultats sont là mais pas au niveau rêvé : il faut encore beaucoup d’intervention humaine dans les systèmes d’IA en santé, loin des diagnostics automatiques mais permettant d’entrevoir des systèmes de plus en plus efficaces

 

Qu’est-ce que l’intelligence artificielle ?

 
L’Intelligence Artificielle (IA) est née dans les années 1950 avec l’objectif de faire produire les tâches humaines par des machines mimant l’activité du cerveau. Face aux déboires des premières heures, deux courants se sont constitués :

Les tenants de l’Intelligence Artificielle forte visent à concevoir une machine capable de raisonner comme l’humain, avec le risque supposé de générer une machine supérieure à l’homme et dotée d’une conscience propre. Cette voie de recherche est toujours explorée aujourd’hui, même si de nombreux chercheurs en IA estiment qu’atteindre un tel objectif est impossible à moyen terme.

Les tenants de l’Intelligence Artificielle faible mettent en œuvre toutes les technologies disponibles pour concevoir des machines capables d’aider les hu- mains dans leurs tâches. Ce champ de recherche mobilise de nombreuses disciplines, de l’informatique aux sciences cognitives en passant par les mathématiques, sans oublier les connaissances spécialisées des domaines auxquels on souhaite l’appliquer.

Ces systèmes, de complexité très variable, ont en commun d’être limités dans leurs capacités ; ils doivent être adaptés pour accomplir d’autres tâches que celles pour lesquelles ils ont été conçus.
 

Certains systèmes d’IA utilisent la logique…

 
L’approche la plus ancienne historiquement s’appuie sur l’idée que nous raisonnons en appliquant des règles logiques (déduction, classification, hiérarchisation…). Les systèmes conçus sur ce principe appliquent différentes méthodes, qu’elles soient fondées sur l’élaboration de modèles d’interaction entre agents (systèmes multi-agents), de modèles syntaxiques et linguistiques (traitement automatique des langues) ou d’élaboration d’ontologies (représentation des connaissances). Ces modèles peuvent être utilisés ensuite par des systèmes de raisonnement logique pour produire des faits nouveaux. L’approche, dite « symbolique », a permis le développement, dans les années 1970-80, d’outils capables de reproduire les mécanismes cognitifs d’un expert, et baptisés pour cette raison systèmes experts.

Les difficultés de modélisation des connaissances ont amené un certain échec de ces systèmes. Actuellement, des systèmes dits « d’aide à la décision » sont développés. Ils bénéficient de meilleurs modèles de raisonnement ainsi que de meilleures techniques de description des connaissances médicales, des patients et des actes médicaux. De plus, ils ne cherchent plus à remplacer le médecin mais à l’épauler dans un raisonnement fondé sur les connaissances médicales de sa spécialité. Ces systèmes permettent aussi d’effectuer des tâches de pilotage de systèmes multi-agent ou de traitement automatique des langues, etc.

Au cœur de ces systèmes, on trouve un mode de représentation des connaissances fondé sur des langages formels, les ontologies informatiques. Nous sommes dans l’IA symbolique.
 

…D’autres exploitent l’expérience passée…

 
Contrairement à l’approche symbolique, l’approche dite « numérique », raisonne sur les données. Le système cherche des régularités dans les données disponibles pour extraire des connaissances, sans modèle préétabli. Cette méthode née dans les années 1980 s’est popularisée depuis le début des années 2000 grâce à l’augmentation de puissance des ordinateurs et à l’accumulation des gigantesques quantités de données qu’il est convenu d’appeler méga données ou big data.

Une majorité des systèmes actuels procèdent par apprentissage automatique, une méthode fondée sur la représentation informatique et statistique de situations existantes et connues, dans le but d’apprendre à généraliser à des données nouvelles. La force de cette approche est que l’algorithme apprend la tâche qui lui a été assignée par essais et erreurs, avant de se débrouiller tout seul. De tels systèmes s’attaquent aux mêmes problématiques que l’IA symbolique avec des résultats parfois plus probants : des applications existent en aide à la décision, en traitement automatique des langues, etc.

L’apprentissage profond a notamment obtenu des résultats significatifs en analyse d’images, par exemple pour repérer, sur les photos de peau, de possibles mélanomes, ou bien pour détecter des rétinopathies diabétiques sur des images de rétines. Leur mise au point nécessite de grands échantillons d’apprentissage : 50.000 images pour le mélanome, 128.000 pour la rétine sont nécessaires pour entraîner l’algorithme à identifier les signes de pathologies. Pour chacune de ces images, on lui indique à quel ensemble elle appartient. À la fin de l’apprentissage, l’algorithme arrive à reconnaître, avec une excellente performance, de nouvelles images présentant une anomalie. Notons que la performance hors contexte des algorithmes ne veut pas dire que l’on va pouvoir mettre en place un processus/système fondé sur l’IA1 et utilisable.
 

Quelles difficultés ?

 
En pratique, l’IA en santé propose des solutions dans un certain nombre de cas. Mais les résultats ne sont pas facilement reproductibles. On se trouve alors souvent dans deux situations :

a) avec des systèmes qui ne sont utilisables que par des chercheurs, spécialistes du domaine de l’application impliquée (voir note précédente), ou

b) avec des applications qui fonctionnent en tant que preuve de concepts mais pour lesquels la généralisation qui passe par la réadaptation à un nouveau problème, demande de retravailler, de « recontextualiser » les méthodes mises au point dans une première étape.

L’autre difficulté est réglementaire : les données des patients (comme toutes les données personnelles) sont dépendantes du RGPD qui est très contraignant. Il n’empêche que, en tant que patient, nous sommes bénéficiaires de la protection de nos données et de leur utilisation (ou pas). Les chercheurs ou les institutions qui traitent les données doivent organiser de nouvelles façons de les appréhender, de les traiter.
 

Quelles solutions ?

 
Je ne m’étendrai pas ici sur les problèmes liés au RGPD : ils se solutionnent en développant de nouvelles architectures de partage et de connexion mais également en mettant en place de nouvelles façons d’organiser la prise en compte du consentement du patient ou le retrait de ce consentement selon les situations. Cette problématique amène, dans ce contexte, à prendre en charge l’anonymisation des données du patient. Cette anonymisation est beaucoup plus complexe qu’il n’en a l’air : il est très compliqué d’anonymiser les données textuelles (qui représentent la majorité des données patient), c’est-à-dire rendre impossible la réidentification du patient. Et si on y arrive, on peut se trouver devant des données qui ont perdu de leur intérêt. À ce jour, les institutions qui respectent le RGPD pratiquent alors une désidentification des données qui permet de réidentifier les patients mais qui assure un niveau de protection suffisant pour que les acteurs d’un essai clinique à l’intérieur d’une institution – ex : un hôpital – puissent collaborer. Je ne traite pas ici non plus les problèmes d’éthique qui arrivent avec les systèmes d’IA2.

Je vais me concentrer sur les problèmes scientifiques et techniques et développer quatre types d’application qui utilisent beaucoup l’IA et montrent ce qu’elle permet en santé, avec les promesses et les limites.
 

1. Les entrepôts de données de santé, un nouveau cadre pour la recherche

 
En quelques années, l’organisation des données dans les hôpitaux a évolué fondamentalement : il a été acté qu’il fallait séparer les bases des données patients liées aux soins des bases liées à la recherche qui récupèrent les mêmes données pour les mettre dans des formats facilitant leur traitement : les entrepôts de données cliniques (ou entrepôts de données de santé – EDS). Accessoirement, cela permet d’interroger la 2ème base sans empiéter sur la 1ère qui assure la continuité des données liées au soin.

Ainsi, les EDS se répandent en France et dans le monde, rassemblant une grande quantité de données sur les parcours des patients à l’hôpital (en 2021, 50 millions de rapports à l’AP-HP, 20 millions au CHU de Rouen). De tels volumes ouvrent de vastes perspectives d’applications nouvelles pour le soin, la recherche et le pilotage médico-économique. En particulier, la promesse d’une médecine personnalisée, guidant les médecins vers des choix thérapeutiques plus adaptés au profil des patients grâce à l’étude de larges cohortes, a motivé de nombreuses publications et de nombreux programmes de recherche. Deux grandes classes de tâches ont émergé ces dernières années en ce qui concerne l’utilisation automatique et massive des documents hospitaliers pour la médecine personnalisée : d’une part, la structuration d’informations présentes de façon non structurée dans les dossiers patients, et d’autre part la prédiction d’événements en fonction des caractéristiques propres à un patient. Cette prédiction peut concerner la réponse à un traitement ou la survenue d’un problème (hospitalisation, rechute, décès…)3.

Pourtant, une mise en production efficace et générale de systèmes automatiques dans les hôpitaux ou au service d’une système de santé tarde à se mettre en place, pour des raisons diverses liées à la problématique générale de la reproductibilité des approches employées4. Les problèmes habituels de variabilité des données sont en effet, dans le domaine clinique, accentués par de nombreux paramètres. On peut en citer trois : a) la nature technique des documents et le nombre élevé de spécialités médicales, conduisant à un vocabulaire pléthorique avec un faible niveau de normalisation des systèmes d’information et des terminologies utilisées dans les hôpitaux ; b) l’hétérogénéité des natures de données : texte, image, données numériques (résultats d’analyse), séries temporelles (EEG, ECG. . . ), données omiques ; c) l’utilisation des langues locales dans le cadre du soin mais de l’anglais en recherche.

Ainsi, des systèmes conçus ou des modèles d’apprentissage entraînés sur certains types de données s’avèrent souvent inefficaces lors de leur application à un problème similaire sur des données légèrement différentes. Enfin, le caractère hautement confidentiel des données manipulées empêche le partage entre les différents acteurs, freinant les initiatives structurantes autour d’une communauté et limitant fortement la reproductibilité et la comparaison des approches, en l’absence de benchmark commun.

En 2021, les EDS sont opérationnels dans plusieurs CHU. Leur mise en œuvre nécessite des moyens techniques et humains comme tout système informatique mais le traitement des données de chaque essai clinique nécessite des ajustements de paramètres – la contextualisation – par des spécialistes, les data scientists des EDS.
 

2. Les plateformes de la bioinformatique, pour la médecine personnalisée

 
Le développement de la génomique avec l’accès au séquençage de l’ADN à des coûts toujours plus faibles a créé un domaine de recherche et de soin, la médecine génomique, où les algorithmes de l’IA se déploient rapidement et où des bases de connaissances sont développées pour décrire les résultats de la recherche. Ces résultats relient de façon plus ou moins directe la description des éléments cliniques des patients a des parties du génome, que ce soit les parties codantes, la description des protéines, etc. Chaque nouvelle recherche clinique tend à enrichir ces bases mais l’accumulation de ces connaissances est complexe car chacune des recherches décrit les éléments reliés selon des classifications différentes et avec des modalités différentes, de la donnée structurée au texte libre. Encore plus, la connaissance génomique se déploie d’abord sur d’autres animaux que l’être humain. Arriver à proposer des explications génomiques à des phénotypes des patients amène à croiser des informations entre les espèces.

L’IA intervient alors de plusieurs manières complémentaires, a) en fournissant les classifications ou les ontologies de description des données cliniques (HPO ou NCIt pour en citer quelques-unes pour le phénotype du patient mais aussi GO (Gene Ontology), MGI (Mouse Genome Informatics) et MP (Mammalian Phenotype Ontology, etc.), et b) en mettant en œuvre les algorithmes d’apprentissage qui vont permettre d’expliciter des profils clinique-génomique de patients.

Ces recherches sont nécessaires pour faire « fonctionner » les types d’approche que l’on met en œuvre dans la cadre du Plan France Médecine Génomique 2025 (PFMG 2025)5. Pour le plan comme en général, la principale difficulté est l’appariement des données cliniques et génomiques comme décrit au paragraphe précédent. Les profils des patients servent alors dans les deux contextes de travail : la recherche où le profil du patient comprenant les données cliniques et génomiques aussi complètes que possibles enrichit les bases décrites précédemment et le soin, où le profil d’un patient, comparé aux autres, permet de lui proposer des pronostics sur des maladies et, encore plus important, des pronostics sur des taux de réussite de thérapeutiques. Ce profilage est le moyen de proposer une « médecine personnalisée ».

En 2021, les plateformes de bioinformatiques se développent par dizaines, chacune avec ses attendus, en respectant plus ou moins les mêmes modélisations ontologiques et avec une utilisation qui ne se fait que par les chercheurs maîtrisant ces ontologies et les modèles d’apprentissage. La recherche se développe alors sur l’amélioration des algorithmes, par exemple pour tenir compte de la structure ontologique des connaissances. La médecine personnalisée, promesse du PFMG 2025, attendra l’avancement du plan pour se généraliser.
 

3. PsyCARE, la prévention en ligne de mire

 
La schizophrénie et la psychose chronique sont parmi les troubles les plus invalidants qui frappent les adolescents et les jeunes adultes, impliquant des troubles cognitifs et une réduction de la réussite professionnelle et de la qualité de vie. Des études récentes montrent que la psychose à un stade précoce est une fenêtre d’opportunité pour prévenir son apparition ou sa progression vers la chronicité. Ainsi, l’objectif général de PsyCARE6 est d’améliorer l’intervention précoce en cas de psychose avec l’hypothèse que le renforcement de la neuroprotection et de la neuroplasticité améliorera le niveau de résilience d’un individu et atténuera l’impact négatif des anomalies précoces du développement lorsqu’il sera confronté à des facteurs de stress pendant la phase critique de l’adolescence cérébrale (entre 12-25 ans).

Pour remplir cet objectif général, le projet PsyCARE se propose d’identifier des biomarqueurs pour améliorer le diagnostic, la détection du stade de la maladie et la prédiction du devenir fonctionnel et d’expliciter une liste de cibles pour les stratégies de modification de la maladie. Pour satisfaire ces buts, il y a un certain nombre d’outils à développer comme : de nouveaux outils portables pour le phénotypage numérique dans la pratique courante, y compris l’évaluation motrice, l’analyse automatique du texte et de la parole ; une application pour l’entraînement cognitif personnalisé et une autre centrée sur le patient facilitant la gestion des cas et l’engagement du patient. Finalement, un système d’aide à la décision guidera la stratégie thérapeutique personnalisée.

L’IA est convoquée, principalement, dans sa composante symbolique, sur le développement d’une ontologie de la psychiatrie permettant d’intégrer toutes les données et, dans sa composante numérique, sur l’élaboration des modèles de décision du système d’aide à la décision.

PsyCARE est paradigmatique du nécessaire développement de la prévention pour la psychiatrie et d’autres domaines. Il nécessite une montée en compétence autour des outils numériques, des divers acteurs, cliniciens comme patients. Le pari n’est pas gagné mais ce sont des projets comme celui-ci qui devraient contribuer à cette montée en compétence et diminuer la dépendance des cliniciens à des informaticiens. Les outils numériques et l’IA sont aussi l’occasion de développer la prévention, une prévention personnalisée qui permettra un moindre recours aux soins.
 

4. SUOG, la combinaison raisonnée du symbolique et du numérique

 
SUOG7 est un logiciel qui vise à améliorer la qualité des examens échographiques durant la grossesse face à leur complexité croissante et aux ressources limitées des experts. SUOG fournit à l’échographiste, en temps réel et pendant l’examen, des informations pertinentes lorsqu’il est confronté à des caractéristiques inhabituelles. Il fournit des conseils intelligents itératifs (ce qu’il est pertinent de rechercher, sur la base des résultats normaux et anormaux précédents, et de l’hypothèse de diagnostic) et affiche des images échographiques pertinentes validées par des experts pour appliquer les conseils fournis.

SUOG intègre une base de connaissances conçue par des experts en gynécologie obstétrique et en médecine fœtale. Dès le premier examen, des opérateurs non experts recueillent des séries d’images de haute qualité, proches de ce que feraient des opérateurs experts. Ils peuvent demander un deuxième avis d’expert sur la base de ces images et, si nécessaire, orienter les femmes vers des centres experts adéquats.

L’IA intervient dans le projet, sur le pan symbolique, avec la construction d’une ontologie et la mise en place d’un système d’annotation des images pour représenter leur contenu et permettre des calculs de similarité sémantique d’images. Elle intervient, sur le pan numérique, avec des mesures de similarité numériques des images. Les deux mesures de similarité sont combinées pour construire une similarité composite la plus fiable possible pour ramener aux experts les images les plus pertinentes. Ainsi, SUOG s’appuie sur une IA composite et ses processus de décision restent lisibles par l’homme : en effet, une partie du calcul de similarité des images dépend des annotations faites avec l’ontologie et elles sont compréhensibles par le clinicien.

À la fin du projet, en 2022, l’assistant SUOG sera validé cliniquement et entièrement fonctionnel. Ce projet est réaliste dans la mesure où son champ est spécifique (échographie prénatal). Il n’est pas visé un développement dans un autre contexte – pas de recontextualisation – mais les méthodes d’élaboration du projet (construction de l’ontologie, d’une mesure de similarité composite) peuvent être partagées dans d’autres situations.
 

Conclusion

 
Pour conclure, notons d’abord que la médecine ne supporte pas l’erreur ou l’approximation. La recommandation de vacances ou d’achats n’a pas les mêmes enjeux que la santé des humains.

La santé fait intervenir un grand nombre de métiers différents (médecins praticiens, spécialistes de la génomique, spécialistes des protocoles cliniques, infirmières…) qui ont des points de vue différents sur le malade, des corpus de connaissances spécialisés et différents. C’est pour cela que la médecine manipule de nombreuses terminologies et ontologies avec chacune des visées différentes au sein d’agrégateurs de termes comme UMLS ou HETOP8. Ces agrégateurs sont fondés sur beaucoup de technologies d’IA et sollicitent évidemment beaucoup de ressources humaines pour rendre des services d’interopérabilité indispensables. Le découpage entre IA symbolique et IA numérique permet de caractériser les méthodes et leur contexte d’utilisation mais montre surtout que ce sont des travaux qui utilisent les 2 approches qui sont prometteurs et qu’il faut combiner les outils des deux types pour faire des systèmes les plus efficaces possibles et qui auront une chance d’être utilisés plus largement.

Les projets décrits ici apportent des solutions et des promesses mais ils nécessitent beaucoup de développements et, dans les cas où l’on cherche des contextes d’application larges, des compétences humaines spécialisées en IA. C’est l’un des enjeux de l’acceptation de l’IA : la mettre à la disposition des humains et former les gens aux attendus, hypothèses et fonctionnement de l’IA. Les cliniciens ne doivent pas être formés à l’IA comme des étudiants de master qui vont passer un examen, ils doivent être formés à ce qui s’appelle maintenant la « santé numérique », domaine mettant souvent en œuvre de l’IA. C’est à ce prix que naîtront des applications permettant de rendre un vrai service médical avec les médecins.
 

L’œil de la revue Third

 
Le brillant exercice de synthèse de Jean Charlet nous a permis de comprendre de quoi l’intelligence artificielle était le nom en médecine. Une analyse indispensable pour ne pas fantasmer un sujet qui fait l’objet d’une grande attention médiatique mais d’une analyse parfois imprécise dans les détails.



1 | https://www.ticpharma.com/story.php?story=1747 et l’article original : https://www.bmj.com/content/374/bmj.n1872. (Retour au texte 1)
2 | https://www.allistene.fr/files/2019/05/rapport_numerique_et_sante_19112018.pdf. (Retour au texte 2)
3 | Récemment, l’EDS de Rouen a été utilisé pour sélectionner les patients à vacciner en urgence contre le Covid-19. (Retour au texte 3)
4 | Pour une analyse plus précise des difficultés du traitement automatique des langues en santé, voir https://hal.archives-ouvertes.fr/hal-02917175 (Retour au texte 4)
5 | https://pfmg2025.aviesan.fr. (Retour au texte 5)
6 | http://psy-care.fr. (Retour au texte 6)
7 | https://www.suog.org/suog/. (Retour au texte 7)
8 | https://www.nlm.nih.gov/research/umls/ et https://www.hetop.eu/hetop/. (Retour au texte 8)

partager cet article
Partager sur

Ce site utilise des cookies d'audience afin d'améliorer la navigation et les fonctionnalités.