Datavers mise sur l’interdisciplinarité au service du parcours patient

Compatibilità
Salva(0)
Condividi

Mis à jour le 07/10/2025

Les données de santé sont si hétérogènes qu’elles s’avèrent particulièrement difficiles à exploiter. Un défi qui n’effraie pas les membres de la nouvelle équipe-projet Inria Datavers: ceux-ci comptent adapter les méthodes d’apprentissage statistique pour fournir aux cliniciens des modèles d’outils d’aide à la décision en matière de parcours patient.

Mathieu Génon / Inria

Axer le traitement statistique des données de santé sur le parcours patient

Datavers, une nouvelle équipe-projet du Centre Inria de l’Université de Lille, a vu le jour le 1er août. Le résultat d’un projet mûri de longue date : « Nous avons commencé à réfléchir dès 2020 à la thématique vers laquelle nous souhaitions nous orienter puisque l’équipe Modal, à laquelle je participais, vivait ses dernières années, retrace Cristian Preda, responsable de Datavers. Comme je m’intéresse au traitement statistique des données qui évoluent dans le temps, et que par ailleurs, j’ai travaillé un moment au sein de la faculté de médecine de Lille, j’ai proposé que nous nous consacrions aux applications en santé et au parcours patient en particulier. » 

L’idée fédère, mais rapidement, les scientifiques d’Inria ressentent le besoin d’une équipe interdisciplinaire. « Nous ne souhaitions pas rester entre mathématiciens, poursuit Cristian Preda. Le projet avait beaucoup plus de sens selon nous s’il intégrait des professionnels hospitaliers. » Alors en 2021, pour tester d’éventuelles synergies en amont de la création de l’équipe, Modal (commune à Inria et au laboratoire Paul Painlevé, du CNRS) met sur pied une action exploratoire, baptisée Path (PArcours paTient en milieu Hospitalier), à laquelle participe également l’équipe METRICS (Université de Lille), qui réunit des cliniciens et des méthodologistes en ergonomie, biostatistiques, informatique médicale, sciences de la donnée et économie de la santé. 

Path, le chemin vers Datavers

Le projet s’appuie notamment sur la cohorte DAMAGE, qui rassemble près de 3000 personnes âgées et est étudiée par l’équipe de recherche en gériatrie du CHU de Lille, dirigée par les professeurs Puisieux et Beuscart. L’objectif : analyser le parcours de ces patientes et patients pendant l’année suivant leur passage dans l’unité de gériatrie. 

Image

Verbatim

Au départ, il n’était pas évident de travailler tous ensemble, car certains résultats statistiques peuvent avoir une portée pour le mathématicien mais pas pour le médecin.

Auteur

Cristian Preda

Poste

Chercheur, responsable de l'équipe-projet Datavers

« Mais nous avons finalement réussi à identifier neuf profils ayant du sens d’un point de vue clinique. Nous préparons actuellement une publication démontrant l’intérêt de ces données », note Cristian Preda.

Mathieu Génon / Inria
Cristian Preda présente des travaux en apprentissage non supervisé pour le suivi de patients en gériatrie.

Surtout, cette première collaboration a prouvé que l’interdisciplinarité ouvrait la porte à de nouvelles applications de l’apprentissage statistique… et a donc mis en avant la pertinence d’une équipe basée sur ce modèle. Parmi la douzaine de scientifiques impliqués dans l’action exploratoire Path, six intègrent ainsi la future équipe Datavers : deux viennent du laboratoire Painlevé, un d’Inria et trois de l’équipe Metrics. Parmi ceux-ci figure Emmanuel Chazard, professeur des universités-praticien hospitalier (PU-PH) et docteur en santé publique : « Nous disposons d’importants volumes de données issues directement des soins des patients, relève-t-il. Celles-ci sont beaucoup plus complexes que celles habituellement utilisées par les mathématiciens pour établir des outils statistiques, notamment parce qu’elles évoluent dans le temps et ne sont pas uniquement quantitatives. Il nous faut donc des méthodes à la hauteur de cette complexité, et c’est tout l’intérêt de travailler avec des mathématiciens sur les données de la vie réelle. »

De la recherche fondamentale à l’outil d’aide à la décision

Les scientifiques de l’équipe vont donc unir leurs expertises autour de trois axes. Le premier : faire avancer la recherche fondamentale sur l’utilisation de données complexes en adaptant les méthodes d’apprentissage statistique, supervisées ou non. « L’hôpital fournit une source de données très hétérogènes, sous forme de signaux, de chiffres, d’états…, détaille Cristian Preda. Nous allons donc utiliser à la fois des méthodes de clustering, pour identifier des groupes de données aux caractéristiques communes, mais aussi des modèles de régression pour expliquer des résultats cliniques, comme la mortalité, la qualité de vie, le risque de réhospitalisation, etc. »

Quant au deuxième axe, il vise à prendre en compte la dimension temporelle de ces données hétérogènes, ce qui en augmente encore la difficulté de traitement. Évidemment, ces deux axes ne peuvent pas être étudiés l’un sans l’autre et seront donc étroitement imbriqués. Enfin, le troisième objectif de l’équipe est de décliner l’ensemble de ces recherches fondamentales au service du parcours patient, avec une ambition : proposer des modèles de systèmes d’aide à la décision

Mathieu Génon / Inria
Christophe Biernacki utilise l’apprentissage non-supervisé sur de gros jeux de données pour mettre en évidence des "clusters" aux caractéristiques communes.

Prévoir les réhospitalisations, les effets indésirables… et même repenser le soin

Par exemple, les scientifiques vont travailler avec le professeur François Pattou, du CHU de Lille, sur le suivi des patients après une chirurgie bariatrique afin d’identifier, grâce à l’apprentissage statistique, les mécanismes qui gouvernent les réhospitalisations, la mortalité ou d’autres événements. 

Ils vont également essayer, dans le cadre du CDP (Cross-disciplinary project) NuMetaB, porté par les professeurs François Pattou et Guillemette Marot, d’évaluer l’impact des données en « omique » (génomique, protéomique…) sur la mortalité et les hospitalisations dans le cadre de l’obésité et du diabète. « D’une manière générale, les hôpitaux sont très intéressés pour pouvoir prédire au bout de combien de temps un patient risque la réhospitalisation, afin de gérer au mieux les entrées et sorties », précise Cristian Preda. 

Emmanuel Chazard, envisage d’autres applications encore : « Il existe aujourd’hui des logiciels capables d’émettre des alertes sur les effets indésirables lors de la prescription médicamenteuse, mais ils sont si peu précis et leurs alertes sont donc si nombreuses que personne n’y prête plus attention. »

Image

Verbatim

En nous basant sur des outils statistiques efficaces, nous pourrions prédire des probabilités d’effets indésirables beaucoup plus pertinentes.

Auteur

Emmanuel Chazard

Poste

Professeur des universités - praticien hospitalier, membre de Datavers

À plus long terme, il serait même envisageable, grâce aux nouvelles méthodes statistiques que l’équipe souhaite mettre au point, d’imaginer un changement de paradigme dans le soin : des analyses permanentes des bases de données patients pourraient prédire les probabilités de telle ou telle pathologie et permettre aux soignantes et soignants de contacter les patientes et patients avant l’apparition des problèmes.

La confidentialité des données, un enjeu de taille

Ce challenge scientifique s’accompagne d’un autre obstacle, d’ordre légal cette fois : celui de la confidentialité des données patients. En effet, si celles-ci peuvent être exploitables dans le cadre d’appels à projets particuliers, les cliniciens ne peuvent transmettre telles quelles leurs informations de cohorte aux scientifiques pour leurs études. « Obtenir l’accord de chaque patient est impensable, donc nous allons opter pour une autre solution : la mise au point de nos outils d’apprentissage statistique se fera en se basant sur des données synthétiques », révèle Cristian Preda. 

Des algorithmes seront donc chargés de créer des jeux de données ressemblant aux données réelles. Mais encore faudra-t-il s’assurer qu’elles soient effectivement assez proches de la réalité pour que les méthodes testées à leur niveau puissent bien s’appliquer aux cas concrets ensuite. Et c’est là un autre sujet d’études pour Datavers.

Pour avancer sur ces différents points, Cristian Preda compte sur les appels à projets : « Notre interdisciplinarité nous permettra d’y répondre et d’obtenir les fonds dont nous avons besoin pour recruter des doctorantes et doctorants, qui seront le moteur de notre équipe. » Datavers est en ordre de marche pour faire avancer les prédictions du parcours patient.

Mathieu Génon / Inria
Guillemette Marot, membre de l'équipe-projet Datavers, cherche des marqueurs biologiques permettant d'anticiper le développement d’une maladie.

Les membres permanents de l’équipe Datavers

Evgeniya Babykina, maître de conférences en statistique à l’Université de Lille, membre de l’équipe METRICS team.

Christophe Biernacki, directeur de recherche Inria.

Emmanuel Chazard, professeur d’informatique médicale à l’Université de Lille, Professeur des universités - praticien hospitalier au CHU de Lille, membre de l’équipe METRICS.

Sophie Dabo-Niang, professeure à l’Université de Lille, membre du laboratoire Paul Painlevé.

Guillemette Marot, professeure à l’Université de Lille, membre de l’équipe METRICS.

Cristian Preda, professeur à l’Université de Lille, membre du laboratoire Paul Painlevé, responsable de l’équipe-projet Datavers.

Recapiti
Inria