Mis à jour le 15/09/2025
Une collaboration entre l'équipe-projet SODA d’Inria, et des diabétologues et épidémiologistes de l’APHP pourrait contribuer à améliorer le diagnostic et l’accompagnement médical des patients atteints du diabète de type 2 à risque de complications.
Peut-on tirer du sens des données de suivi des patients atteints du diabète pour améliorer leur prise en charge ? C’est pour répondre à cette question que Louis Potier, médecin dans le service "Diabétologie et endocrinologie" de l'Hôpital Bichat - Claude-Bernard, a sollicité les équipes d’Inria en 2021. Objectif : exploiter les données de l'Entrepôt de Données de Santé (EDS) de l'AP-HP créé en juillet 2017, qui répertorie les données de plus de 19 millions de patients ayant reçu des soins dans l'un des 38 hôpitaux de l'AP-HP. « Pendant la crise du Covid, j’avais monté un projet visant à exploiter cette immense source de données pour évaluer l’impact du virus chez les sujets vivant avec un diabète. C’est tout naturellement que j’ai souhaité continuer à l’explorer pour améliorer l’aide au diagnostic des patients les plus à risque de complications », retrace le spécialiste. C’est ainsi que se monte le projet TRADIAB (Trajectoire du risque de complications et réponses thérapeutiques dans le diabète de type 2), impliquant les équipes du professeur Potier, l’équipe-projet SODA du Centre Inria de Saclay, et le centre de pharmaco-épidémiologie de la Pitié Salpêtrière.
Identifier les patients les plus à risque
L’enjeu est de taille puisque le diabète constitue la première cause de handicap acquis de l'adulte. Cette maladie chronique peut en effet être à l’origine de complications multiples - ophtalmologiques, rénales, cardiovasculaires, podologiques – pouvant mener à des conséquences sévères comme la cécité ou des amputations.
Image
Verbatim
Même si les principaux déterminants du risque sont connus – comme le déséquilibre nutritionnel, la sédentarité, l’âge – nous devons encore affiner notre capacité à identifier les patients qui ont le plus de chance d’être concernés.
Auteur
Louis Potier
Poste
Médecin dans le service "Diabétologie et endocrinologie" de l'Hôpital Bichat - Claude-Bernard
Les chercheurs ont ainsi formé la cohorte CODIA à partir des quelque 1,3 millions de dossiers de patients de l’EDS identifiés comme diabétiques. Ceux-ci renferment toutes leurs informations de suivi : données sociodémographiques, résultats d’analyses de sang, compte-rendu médicaux, etc… Une mine d’or qui permet d’établir des liens statistiques entre certaines caractéristiques des patients et l’évolution de leur maladie.
Un immense travail de tri des donnes
Problème : ces données sont brutes et hétérogènes.
Image
Verbatim
Comptes-rendus médicaux inégalement remplis, prescriptions dont la rédaction est variable selon les médecins, dates d’analyses parfois manquantes ou inexactes, etc… Il y avait un immense travail à mener pour modéliser les informations manquantes et rendre l’ensemble exploitable.
Auteur
Judith Abécassis
Poste
Chercheuse Inria au sein de l’équipe-projet SODA
C’est là que l’expertise en sciences des données de l’équipe Soda, en particulier en Machine Learning, la famille de techniques à l’origine de l’explosion récente de l’IA, a pris tout son sens « Ces méthodes fonctionnent très bien pour traiter de gigantesques masses de données par rapport à d’autres méthodes statistiques conventionnelles, parfois plus adaptées à de petits échantillons », précise la chercheuse. L’équipe a aussi apporté son savoir-faire en traitement du langage naturel (NLP), indispensable pour extraire l’information des compte-rendu écrits.
L'équipe-projet SODA
La recherche de l'équipe SODA est à l'intersection de l'apprentissage statistique, des bases de données, et des sciences sociales quantitative (par exemple économétrie, épidémiologie).
Les membres de l'équipe développent des outils de traitement de données pour générer de la compréhension et des prédictions à partir des grandes bases de données disponibles de nos jours pour caractériser les populations. Ils contribuent à des outils d'apprentissage statistique pour répondre à des questions de science des données, typiquement sur des données relationnelles, dont les applications principales sont la santé et l'éducation.
Confirmer les études cliniques avec des données de la vie réelle
Verbatim
Dans ce projet, nos compétences sont très complémentaires : Inria a apporté cette expertise en science des données, et les diabétologues leur connaissance de la pathologie et des questions médicalement pertinentes sur le sujet. Nous avons ajouté notre expertise sur la conception d’une étude épidémiologique en santé, en particulier la connaissance des biais à éviter et les particularités liées à l’utilisation des données comme celles des entrepôts de données de santé.
Auteur
Florence Tubach
Poste
Cheffe du département de Santé Publique de la Pitié Salpêtrière Salpêtrière et du Centre de pharmaco-épidémiologie de l’APHP
Les deux études premières sont venues confirmer à grande échelle des résultats déjà suggérés par des études cliniques établies sur des échantillons de population plus restreints. De fait, la réplication de résultats connus est un élément-clé pour valider la qualité de la cohorte CODIA et ainsi permettre la réalisation d’études sur des sujets plus innovants. La première étude caractérise le devenir de patients atteint d’ulcères du pied diabétique (UDP) - une complication sévère du diabète. « Elle retrouve les taux plus élevés de décès et d'amputation chez les patients hospitalisés pour un premier UDP que dans d’autre cohortes, ainsi que les facteurs de risque déjà connus, et elle souligne également le rôle possible de l'inflammation », résume Judith Abécassis. Cette première étude vient être publiée dans la revue Diabetes and Metabolism. La seconde, dédiée au suivi de deux traitements connus (dont le sémaglitude-Ozempic), confirme leurs bénéfices et limites sur le contrôle du poids et de la glycémie des patients. « L’intérêt de ces études est qu’elles sont menées sur des données de « vie réelle », qui sont représentatives de toute la diversité des patients que nous sommes amenés à traiter, là où les études cliniques sont menées sur des échantillons de population soigneusement sélectionnés. Ce qui peut introduire des biais, comme une absence de patients au-dessus de 70 ans ou une surreprésentation des personnes de type caucasien », souligne Louis Potier.
Mieux étudier l’influence du système immunitaire
La troisième étude, réalisée dans le cadre d’un projet Européen coordonné par Nicolas Venteclef (INEM) et baptisée Intercept-T2D, est plus novatrice dans ses conclusions. Elle établit un lien entre certains profils « pro-inflammatoires » - c’est à dire présentant une activation du système immunitaire supérieure à la moyenne – et le risque de développer des complications, notamment cardiovasculaires. Si des études antérieures suggéraient déjà ce lien, nous avons montré plus précisément que certains patients avec un taux élevé de monocytes, un type particulier de globule blanc, étaient particulièrement à risque. précise Judith Abécassis. Cela ouvre la voie à une aide au diagnostic précoce de ce sous-groupe de patients. Les partenaires préparent maintenant une seconde étude dans laquelle ils proposeront un nouveau score de dépistage - un outil d'aide à la décision médicale agrégeant en une seule valeur les différents facteurs de risque. « Par rapport aux scores existants, celui-ci accordera plus d’importance aux marqueurs inflammatoires, qui sont par ailleurs des indicateurs facilement mesurables, via une simple prise de sang déjà réalisée en routine », précise Louis Pottier. L’objectif est de tester ce nouveau score sur la cohorte CODIA. S’il révèle de meilleures prédictions de complications, cela incitera les médecins à adapter leurs prescriptions de traitement : médicaments différents ou dosage différents, suivi cardiovasculaire rapproché…
Un projet majeur pour la diabétologie française
« Nous projetons aussi de pousser plus loin l’analyse des profils inflammatoires, en prenant en compte une plus grande diversité de marqueurs immunitaires, et en étudiant leurs impacts sur l’évolution de la maladie », ajoute Judith Abécassis. « Les travaux passés et à venir sur la cohorte CODIA constituent une avancée majeure pour la diabétologie et les autorités de santé, mais aussi pour les industriels qui développent de nouvelles molécules thérapeutiques et pourront faire évaluer leur efficacité sur des données issues de la vie réelle, en complément des études cliniques », conclut Florence Tubach.