third
Novembre 2021

Numéro Sept

Retrouvez le numéro sept de
Third : Soigner avec le numérique

Third | Novembre 2021

« En matière de santé publique, le numérique a fait ses preuves depuis longtemps. Il a eu un impact déterminant dans la gestion de l’épidémie de Covid-19 »

Entretien avec Rodolphe Thiébaut, Professeur de santé publique, directeur du département de recherche Santé publique de l’université de Bordeaux, directeur d’une équipe de recherche Inserm-Inria et chef du service d’information médicale au CHU de Bordeaux

 

Third (T) : A quoi sert exactement la recherche dans le domaine de la santé publique et pourquoi avez-vous décidé de vous s’y intéresser ?

 
Rodolphe Thiébaut (RT) : La santé publique c’est la santé des populations. Dans cette discipline, qui ne concerne pas seulement la médecine, le raisonnement ne s’effectue plus à l’échelle des individus mais à l’échelle d’une population ; à la différence du médecin clinicien qui va en général s’intéresser à un problème individuel.

Si par exemple, on reçoit à l’hôpital l’information selon laquelle une personne vaccinée par Sars-CoV-2 a été infectée par le Covid-19, alors il s’agit d’un problème personnel, individuel. La question de santé publique qui y est associée, est d’essayer de savoir si le virus est complètement résistant au vaccin à l’échelle de la population et donc d’anticiper un problème général au niveau de la collectivité qui risque d’être réinfectée par le vaccin ou, au contraire, si on se rend compte finalement que ce problème n’est qu’individuel. Autre exemple illustrant une approche de santé publique, la couverture vaccinale d’une population (aux alentours de 80% à 95% selon l’infection), crée une immunité grégaire suffisante pour contrôler l’épidémie, bien qu’une partie de la population ne soit pas vaccinée.

Mon orientation en santé publique provient d’une expérience personnelle que je raconte souvent. Jeune étudiant en médecine, je me suis engagé au Burkina Faso pour donner des soins en dispensaire. A notre retour, avec mes camarades de l’époque, nous avons demandé des moyens financiers et des médicaments pour continuer à travailler sur place. En réponse, on nous a demandé ce que nos initiatives apportaient à l’échelle de la population, et non à l’échelle individuelle. Nous avons donc entamé une enquête de santé communautaire pour identifier les problèmes généraux de la population, voir ce qui était pris en charge par d’autres ONG et finalement nous avons travaillés sur des troubles locaux dus à la carence en iode (notamment par rapport aux goitres1 constatés). Nous avons réalisé une étude épidémiologique2 pour apporter les chiffres au gouvernement afin de mettre en place des interventions notamment à base de sel enrichi en iode. Cette approche qui m’a captivée relevait de la santé publique et c’est donc tout naturellement qu’après les ECN3, je me suis orienté vers la santé publique. Cette spécialité est beaucoup plus visible avec le Covid-19. A Bordeaux nous avons un département conséquent en santé publique avec plus de 500 professionnels. La santé publique est multidisciplinaire, nous travaillons mêmes avec des juristes ! Pour ma part, j’ai complété cette formation par une thèse universitaire en statistiques, qui me permet aujourd’hui de mieux appréhender les enjeux numériques liés à la santé publique.
 

T : Quel est l’apport du numérique à la santé publique ? Quel est le lien entre santé publique et numérique ?

 
RT : A mon sens, le numérique en santé publique, représente la santé publique d’aujourd’hui. La digitalisation du monde engendre de nouvelles opportunités et de nouveaux besoins. A cet égard, j’ai intégré le numérique, tant dans ma pratique de recherche (je travaille depuis longtemps avec des données et nous avons notamment mis en place une banque de données au CHU de Bordeaux sur laquelle nous reviendrons) que dans les formations que je dispense auprès des étudiants en santé publique numérique (les étudiants apprennent pendant leur formation à collecter des données dans le respect du cadre légal existant, à les enregistrer et à les utiliser pour répondre à des questions de santé publique).

Il y a eu une période de l’histoire de la médecine où l’on a appris, à l’instar de John Snow4 avec le choléra, qu’il faut recueillir des informations. De nos jours, les méthodes et le numérique ont bouleversé l’état des choses et permettent d’avoir accès à encore plus d’informations. Au niveau des méthodes par exemple, une goutte de sang donne accès à des centaines de milliers de marqueurs. Les données peuvent aussi être collectées facilement sur les réseaux sociaux ou via la localisation de votre téléphone. Aujourd’hui il est même possible d’échanger avec les individus par le biais de nouveaux modes comme un sms pour le rappel de la prise du traitement, soit par des agents communicants qui vont adapter leurs questions en fonction des réponses de l’interlocuteur avec des algorithmes d’intelligence artificielle (IA). C’est un autre monde.

Des projets de recherche ont même l’ambition de pouvoir détecter des signes avant-coureurs de dépression, en examinant ce que vous postez sur les réseaux sociaux. Cela permettrait de repérer la proportion de gens qui fréquentent les réseaux sociaux et qui sont dans un état de mal-être. L’aspect plus interventionnel qu’on peut imaginer ensuite (en respectant la vie privée), consisterait à l’inciter à s’orienter vers un professionnel adapté.
 

T : Pouvez-vous nous donnez des exemples de projet de recherche ou d’initiative mis en place permettant d’illustrer l’utilité de l’exploitation des données dans la gestion de la crise du Covid-19 ?

 
RT : Nous avons eu dans ce grand malheur une chance inouïe qui a été la mise en lumière de notre discipline. Il y a en effet pléthore d’exemples qui soulignent l’impact déterminant du traitement de données de santé pour comprendre et réagir à l’épidémie. Prenons deux exemples :

– Dans le premier cas, s’est posée la question suivante : « sur le plan immunologique, que se passe-t-il lorsqu’on on est infecté et lorsqu’on est vacciné ? ». Pour y répondre, il est possible d’examiner des marqueurs assez simples et connus de tous comme les anticorps (l’information obtenue est alors très parcellaire), mais aujourd’hui, avec les progrès biotechnologiques, on peut générer beaucoup plus d’informations comme la dynamique de dizaines de milliers de populations cellulaires, ou celle de centaine de milliers d’expressions de gènes5. Cela va permettre de comprendre ce qui se passe et notamment d’expliquer pourquoi certaines personnes développent un Covid sévère, modéré ou asymptomatique. Cela permet aussi de voir comment réagit l’organisme en cas de vaccination.

– Un autre cas sur lequel nous travaillons est celui de la surveillance de l’épidémie. A cette fin, énormément d’initiatives ont été mises en place pour rendre disponibles les données de santé très utilisées pour les travaux de modélisation. A cet égard il faut saluer l’immense travail de l’équipe de Yann le Strat, responsable des données à Santé Publique France, qui a tout mis en œuvre pour ouvrir un maximum et rendre accessibles sur GÉODES6 les données de Santé Publique France. Ces données ont permis aux équipes de modélisateurs de construire des scénarios en fonction des interventions du gouvernement. C’est ce qui nous a guidé de façon continue depuis mars 2020. On a beaucoup entendu parler de Simon Cauchemez ou encore de Vittoria Colizza qui ont été précurseurs avec leurs équipes et ont travaillé en continu sur ces sujets. Ils ne sont pas seuls et la communauté scientifique travaille de concert. En effet, les différentes équipes de chercheurs en santé publique dont la mienne avec le projet Inria GESTEPID, se sont réunies chaque semaine pour confronter les données et vérifier l’adéquation des résultats. L’exploitation des données de santé, utilisée au quotidien a aidé le politique (pour prendre des décisions) et le citoyen (pour comprendre la situation).

A notre niveau, nous avons organisé au Centre Hospitalier Universitaire (CHU) de Bordeaux, depuis 2018 un entrepôt de données hospitalières contenant les données générées à l’hôpital. Nous avions démarré avec les données de 800.000 patients qui permettaient déjà d’accéder à des centaines de millions d’enregistrements7. Aujourd’hui notre entrepôt a une taille de 1.800.000 patients comptabilisant 1.420.000.000 enregistrements.

En fonction du type de données qu’on utilise, elles ne sont pas toujours au même endroit et avec le même niveau de sécurité. Les données hospitalières de soin sont la partie la plus sensible de ce qu’on peut faire en matière de données de santé. Elles se trouvent sur des serveurs sécurisés, au sein du CHU : pour travailler dessus nous devons être dans les locaux du CHU.

Ces données permettent de surveiller ce qui se passe en termes de dynamique de diagnostic positif de Covid-19, de prise en charge des patients, y compris aux urgences et avec les appels au SAMU. Nous essayons d’avoir un état des lieux constant et d’utiliser des outils de prédiction pour nous organiser. Ces indicateurs sont utilisés deux fois par semaine au CHU de Bordeaux en cellule de crise Covid-19. Nous venons d’obtenir une aide de la région pour déployer ce système sur les autres CHU.
 

T : Êtes-vous les seuls à avoir mis en place un tel système ? Si oui, existe-t-il des systèmes de coopérations entre les hôpitaux pour le partage des données ?

 
RT : Nous ne sommes pas les seuls, le même genre de travail a été conduit à l’Assistance Publique des Hôpitaux de Paris (APHP) et dans plusieurs hôpitaux de province. Ce qui est encore plus intéressant, c’est qu’un certain nombre d’hôpitaux, utilisent tous un système commun qui a été développé par Isaac Kohane à l’Université d’Harvard. Un consortium international s’est mis en place pour récupérer les informations agrégées de l’ensemble de ces hôpitaux pour avoir un suivi à l’échelle internationale. Il s’agit du Consortium for Clinical Characterization of Covid-19 by EHR (Consortium 4CE) qui opère à l’échelle mondiale. Malgré l’avancée fondamentale en termes de partage de données qu’il représente, il faut se garder de tout triomphalisme car, bien que de nombreux hôpitaux y participent, cela ne représente qu’une faible part à l’échelle mondiale. Cependant, nous pourrions rêver qu’à terme tous les systèmes hospitaliers mondiaux soient capables de partager leurs données. Ainsi nous aurions une vision mondiale et très efficiente en cas de nouvelle épidémie de ce type. A l’heure actuelle, bien que des efforts soient fait par l’ensemble des hôpitaux, les solutions ne sont pas encore totalement transposables et partageables.
 

T : Pouvez-vous nous en dire plus sur le système conçu par Isaac Kohane ?

 
RT : Le système consiste en un principe d’organisation des données qui vise à répondre à un besoin. En effet, à l’hôpital, on se retrouve facilement face à une information désorganisée car celle-ci a d’abord une visée clinique individuelle. Dans la transmission d’information qui s’effectue à l’échelle individuelle, l’objectif est que le médecin recevant sache immédiatement ce qu’il en est pour un patient donné. A l’inverse, le raisonnement à l’échelle d’une population implique une utilisation nécessairement différente de ces données. Un exemple simple l’illustre bien : si je dis dans un rapport à un confrère que ce patient est infecté indifféremment par le « SARS-CoV-2 », par le « corona » ou encore que ce patient a « la Covid-19 » ou « un Covid-19 », ce dernier me comprendra parfaitement. En revanche, si je me permets cette approximation dans une base de données, celle-ci enregistrera quatre informations différentes et on imagine la pagaille que cela peut engendrer. Il est donc crucial d’avoir des principes clairs d’organisation des données pour permettre leur échange et pour permettre au système de partage des données de fonctionner.

Il faut bien comprendre que ce principe tient davantage à l’organisation des données qu’à l’unité du format des données échangées. Le nouveau paradigme lié au numérique a plusieurs conséquences. D’une part, la donnée est digitalisée car aujourd’hui le médecin au lieu de remplir un papier, va directement rentrer les informations sur son ordinateur ou scanner les comptes rendus. D’autre part, cela s’est accompagné d’énormes progrès en informatique médicale liés à l’ambition de ce genre de systèmes. De ce principe d’organisation découle un langage universel qui permet de retrouver l’information initiale à partir des données brutes. Le traitement des données médicales est relativement poussé, on va traiter des données brutes et faire ce que l’on appelle de l’extraction de connaissance. Par exemple, on utilise l’apprentissage profond (deep learning), en particulier le traitement automatique de la langue, pour que l’algorithme lise les courriers de diagnostics échangés entre médecins et en extrait de l’information.

Enfin, précisons, lorsqu’on évoque la collaboration et le regroupement des données à l’échelle internationale, qu’il n’est pas question de données brutes mais de données agrégées et anonymisées, rendant l’identification des patients impossible. La granularité d’agrégation est faite de telle manière qu’il n’y a plus aucun problème pour échanger ce type d’informations.
 

T : Quels sont vos principaux fournisseurs de données ? En avez-vous d’autres que l’hôpital et les patients ?

 
RT : Les données que nous utilisons ne se limitent pas à celles recueillies à l’hôpital. Cela va dépendre des questions de recherches et des questions applicatives. En santé publique, énormément de type de données vont nous intéresser. Elles peuvent être fournies par des patients de l’hôpital, qu’on va enrichir avec des technologies spécifiques. Elles peuvent aussi être issues d’essais cliniques chez des volontaires sains extérieurs à l’hôpital. Si on s’intéresse à la nutrition, au comportement des étudiants, à leur santé on peut aussi travailler avec des cohortes qui sont aussi des données extérieures à l’hôpital. Les fournisseurs sont indénombrables. Certaines études démographiques par exemple peuvent intéresser la santé publique, mais aussi les données collectées sur internet et les réseaux sociaux. Récemment certains chercheurs ont aussi utilisé les données de localisation Google pour faire de la modélisation de l’épidémie. A partir du moment où une information est digitalisée, elle peut être utile pour faire de la recherche en santé publique.
 

T : Aujourd’hui, quels obstacles rencontrez-vous dans votre pratique quotidienne de la recherche en santé publique ?

 
RT : En matière de santé publique, la collaboration entre chercheurs et le partage de données est monnaie courante depuis les années 1990. Aujourd’hui, nous aimerions que ce soit encore plus facile et instantané. Mais il ne faut pas oublier que l’échange de données entre chercheurs et entre hôpitaux se fait au prix d’un travail conséquent d’harmonisation et de structuration auquel il faut ajouter des aspects réglementaires relativement chronophages. La question qui se pose n’est donc pas celle de la faisabilité mais davantage celle du temps qu’on y consacre. Ces obstacles organisationnels et règlementaires empêchent parfois, en cas d’épidémie, d’apporter une réponse rapide.

L’obstacle organisationnel majeur qu’on rencontre aujourd’hui et qui explique le fait que les résultats sont limités au regard de l’ambition c’est le manque de data scientist, c’est-à-dire d’experts qui savent exploiter et analyser des données et qui nous permettraient de gagner un temps précieux. Le problème majeur c’est que nous avons fait un bon technologique mais que nous manquons de gens formés pour analyser les données. D’autant plus que la recherche génère chaque jour de nouvelles données8 que nous n’avons pas le temps d’analyser. A titre personnel, je continue à énormément travailler avec les experts avec qui j’applique mes méthodes, comme les immunologistes, car j’ai la conviction que c’est indispensable pour poser les bonnes questions et être pertinent dans la recherche. Mais si je rencontrais un problème de sociabilisation soudain, je pourrais tout à fait rester dans mon bureau et faire de la recherche à temps plein à partir de données disponibles en accès libre.

Un autre obstacle, mais qu’il faut davantage relativiser et essayer de comprendre, est l’obstacle règlementaire. En tant que professionnel des données, nous travaillons avec la Commission Nationale de l’Informatique et des libertés (CNIL) depuis 1978 et la fameuse loi Informatique et Libertés9. Nous avons ainsi l’habitude de nous conformer depuis longtemps à une législation sur les données à laquelle le Règlement Général sur la Protection des Données10 (RGPD) n’a pas apporté grande modification, sauf en matière de demandes d’analyses de risques qui n’existaient pas auparavant. Malgré cela, le RGPD a été en interne un outil idéal de communication pour faire comprendre aux collaborateurs l’importance de la protection des données et de leur utilisation précautionneuse. En effet, nous avons un devoir éthique, réglementaire et de confiance vis-à-vis du citoyen de ne pas faire n’importe quoi avec les données. Je porte un regard positif sur ce règlement qui permet en outre d’adopter des règles communes de protection des données personnelles permettent de faciliter la collaboration entre pays européens. Enfin, j’ai tendance à penser que faire un effort sur la protection des données s’associe assez facilement avec un effort sur la qualité des données obtenues, pour se prémunir d’effets délétères sur le résultat des analyses. C’est le principe connu sous le nom de « garbage in, garbage out ».

Cependant, en tant que chercheurs, on a conscience que l’open data représente une opportunité scientifique extrêmement intéressante permettant de réutiliser les données et de les rendre vivantes (par opposition aux cimetières de données). Ici on touche à une réelle problématique car pour travailler sur des données il faut qu’elles soient accessibles. Parfois cela ne pose pas de problème car la donnée n’est pas identifiante. Mais parfois il est impossible de traiter la donnée car elle permet de remonter à la personne et de l’identifier (par exemple le lieu, le service et l’horaire d’hospitalisation d’un individu). Pour contourner ce problème de données identifiantes, on peut flouter les données ou alors générer des données in silico, c’est-à-dire que l’on va avoir des modèles qui apprennent la structure des données réelles et qui vont générer des données virtuelles par simulation pour pouvoir travailler sur ces données plus librement. J’y ai notamment recours pour certains projets avec mes étudiants.

Cela étant dit, nous avons bien conscience qu’il ne sera jamais question de full open data. Sur certains aspects scientifiques, cela peut être embêtant, mais c’est un effet secondaire indésirable qu’il faut savoir accepter. Par exemple, le Gouvernement ne nous a pas autorisé à récupérer les données générées par l’application TousAntiCovid. C’était le marché pour l’utiliser, car la condition de la création de cet outil était la confiance. Pourtant, scientifiquement, cela aurait présenté un réel intérêt de pouvoir exploiter ces données.
 

T : Selon vous l’IA peut-elle, à terme, remplacer le médecin ? 

 
RT : Je pense que ça n’a pas de sens d’imaginer que l’intelligence artificielle va remplacer les médecins. Elle améliore le médecin et le rend plus performant. C’est déjà le cas aujourd’hui : un radiologue peut utiliser un algorithme d’IA pour faire une reconstitution 3D mais, en définitive, c’est lui seul qui établira le diagnostic définitif. L’IA permet de nombreuses applications très intéressantes, comme des algorithmes permettant au médecin de prescrire à bon escient et capables d’anticiper les interactions médicamenteuses à la lecture d’une ordonnance. En matière d’imagerie médicale, l’IA permet aussi de réaliser des progrès remarquables, les algorithmes proposant des diagnostics et même des informations de pronostics (qui permettent d’évaluer la gravité et le risque de mort). Cette technologie est au service du médecin et lui permet à terme de se concentrer sur d’autre dimensions de son métier.

Quand on envisage la concurrence entre l’IA et le médecin, il ne faut pas perdre à l’esprit que la place de l’humain est clé dans le domaine médical. Lorsqu’il faut annoncer sa maladie à un patient, il y’a une dimension impalpable pour des algorithmes d’IA telle l’empathie. L’algorithme en est incapable et quel patient voudrait sérieusement se voir annoncer une telle nouvelle par un robot ? Ainsi, en libérant l’esprit du médecin des sujets techniques, on l’invite à être holistique, plus efficient et à avoir plus de temps pour gérer l’humain.

Le dernier aspect, après avoir exclu l’idée qui conduirait à penser que le médecin va être remplacé par l’intelligence artificielle, est de dire que cette dernière va pouvoir aller combler des manques là où le médecin n’était pas. L’exemple qui l’illustre bien est celui de la prévention. Ainsi se développent des applications mobiles utilisant des agents conversationnels virtuels qui collectent des données et permettent d’établir un contact avec les patients. L’agent conversationnel va ainsi pouvoir donner des recommandations aux individus ou leur faire prendre conscience d’un comportement à risque (cigarette, tabac, troubles du sommeil, etc). La digitalisation permet par ce biais de changer les comportements en amont du médecin : l’agent conversationnel collecte de la donnée, suggère des hypothèses et détecte des modifications de comportements. On va vers la personnalisation des solutions.
 

T : Le fait que l’IA apporte au médecin de plus en plus d’aide, de suggestions de diagnostic, n’induit-il pas un comportement du médecin qui serait incité à ne pas dédire la machine pour éviter d’engager sa responsabilité ?

 
RT : Il y a plusieurs éléments de réponse.

Le premier c’est que c’est le médecin qui est responsable. C’est le principe. Il existe des outils que le médecin peut comprendre, et donc sa responsabilité se comprend s’il les utilise et décide de les dépasser. Mais aujourd’hui on a des discussions sur la responsabilisation des créateurs de l’algorithmes. En effet, si on devait se retrouver avec des outils que le médecin ne peut pas comprendre, n’a pas la connaissance pour comprendre (notamment sur le fonctionnement de l’algorithme), mais qu’il veut suivre, alors il faut réfléchir au partage de responsabilité avec une responsabilité entre médecin et créateur de l’algorithme.

Ces réflexions me viennent des questions méthodologiques que nous avons eues avec les autorités de régulation telle l’Agence nationale de sécurité du médicament et des produits de santé (ANSM). L’algorithme pose un réel problème quand on cherche à l’évaluer car il est en apprentissage constant. A la différence du médicament qui est fabriqué et terminé avant d’être évalué. Dans ces discussions, à un moment, il y a eu celle sur la responsabilité du créateur de l’outil, quand cet outil a la prétention de « remplacer le médecin ». La problématique c’est qu’on a une telle quantité d’informations qu’elle n’est pas gérable par un médecin. Depuis une vingtaine d’années, 50% des connaissances médicales sont renouvelées au bout de cinq ans. Qui est capable de toutes les avoir dans sa tête comme au moment du concours d’internat ? Personne. C’est une problématique clé : on parle ici de pallier une carence pour rendre le médecin plus performant.
 

L’œil de la revue Third

 
Cet entretien nous a ouvert les yeux sur la santé publique, une discipline à part entière, au cœur de la médecine. Grâce à Rodolphe Thiébaut nous avons compris l’importance des outils numériques pour la santé publique, dont la pertinence a été grandement mise en valeur par la crise du Covid-19.



1 | Le goitre est une augmentation de volume de la glande thyroïde, glande située à la base du cou. (Retour au texte 1)
2 | L’épidémiologie est une discipline de la santé publique qui étudie les ennuis de santé dans les populations humaines, leur fréquence, leur distribution dans le temps et dans l’espace, ainsi que les facteurs influant sur la santé et les maladies de populations. (Retour au texte 2)
3 | Concours classant à la fin de la 6ème année de médecine permettant de choisir une spécialité en fonction de son classement pour la septième année et les suivantes. (Retour au texte 3)
4 | John Snow (15 mars 1813– 16 juin 1858) est un médecin britannique, pionnier dans les domaines de l’anesthésie, de l’hygiène et la santé publique. Ses travaux sur la propagation du choléra lui ont donné une place importante dans l’histoire de l’épidémiologie. (Retour au texte 4)
5 | Nous n’avons que 20 000 gènes, mais en les répétant au cours du temps on voit la dynamique de leur expression au cours du temps. (Retour au texte 5)
6 | Plateforme de Santé Publique France qui permet d’avoir accès à énormément de données en santé publique en open access. (Retour au texte 6)
7 | Ce chiffre particulièrement élevé s’explique par le fait que les patients sont hospitalisés, ré-hospitalisés, changent de service, etc. L’ensemble des examens génèrent beaucoup d’informations différentes. (Retour au texte 7)
8 | La recherche en biologie, particulièrement friande en nouvelles technologies, est un domaine par exemple où les chercheurs génèrent énormément de nouvelles données chaque jour qui n’ont pas le temps d’être toutes analysées. (Retour au texte 8)
9 | Loi n° 78-17 du 6 janvier 1978 relative à l’informatique, aux fichiers et aux libertés (Retour au texte 9)
10 | Règlement (UE) 2016/679 du Parlement européen et du Conseil du 27 avril 2016, relatif à la protection des personnes physiques à l’égard du traitement des données à caractère personnel et à la libre circulation de ces données, et abrogeant la directive 95/46/CE (règlement général sur la protection des données). (Retour au texte 10)

partager cet article
Partager sur

Ce site utilise des cookies d'audience afin d'améliorer la navigation et les fonctionnalités.