Comment étudier les interactions entre macromolécules alors que celles-ci sont par nature dynamiques ? En combinant "dynamic data" et IA, répond la nouvelle équipe-projet Delta du Centre Inria de l’Université de Lorraine, portée par son responsable, Hamed Khakzad, directeur de recherche Inria. Et ses premiers résultats montrent déjà qu’une telle approche ouvre la voie au protein design, c’est-à-dire à la conception de nouvelles protéines, porteuses d’espoir dans le domaine thérapeutique.
De gauche à droite et de bas en haut : Hamed Khakzad, Omid Mokhtari, Jalim Singh, Nicolas Buton, Victor Pryakhin et Yasaman Karami
Penser les protéines dans toute leur dynamique
Dynamic, deep learning, design. Voilà les "3D" du triangle dans lequel s’inscrit la nouvelle équipe-projet Delta. Si l’équipe-projet est toute récente, ses membres sont déjà à pied d’œuvre depuis près d’un an. « Nos recherches portent sur l’interaction entre les macromolécules et il s’agit d’un domaine très compétitif, explique Hamed Khakzad, son responsable. Nous ne pouvions donc pas les mettre en attente alors qu’elles étaient opportunes : il nous fallait avancer et mettre en œuvre nos idées au bon moment. » Et des idées, l’équipe n’en manque pas tant les défis à relever dans le domaine sont nombreux.
« Jusqu’ici les chercheurs étudiaient ces interactions en partant du principe que la conformation des molécules était statique, poursuit le chercheur. Or nous savons qu’elle est dynamique et que ces changements de conformation impactent les interactions. L’arrivée du deep learning offre l’opportunité de prendre cela en compte. »
C’est ainsi que les deux premiers "D" de l’équipe s’articulent : le deep learning, conçu pour repérer et analyser des motifs récurrents dans de larges jeux de données, est mis au service de l’analyse et de la compréhension de la conformation dynamique des macromolécules.
Une base de données de 5 milliards de conformations
Mais encore faut-il disposer de ces données. C’est donc à cette tâche ardue qu’a commencé à s’atteler Yasaman Karami, chargée de recherche Inria dans l’équipe-projet : pour chacune des centaines de milliers de macromolécules connues, elle a simulé les différents états dynamiques, ce qui représente pour le moment une base de données de 5 milliards de conformations !
Ces simulations n’ont pu être réalisées que grâce à la mise à disposition du supercalculateur Jean Zay, capable d’effectuer 125,9 millions de milliards d’opérations par seconde, ainsi qu’au soutien du consortium européen MDDB (Molecular dynamic data base), qui vise justement à collecter de telles conformations, et enfin, à l’aide précieuse de Frédéric Beck, ingénieur de recherche Inria, qui les a assistés sur ce projet.
« Ce dernier avance très vite, mais nous n’en sommes qu’au début et chaque simulation nécessite beaucoup de temps de préparation, puis une importante puissance de calcul, tempère Hamed Khakzad. Nous avons cependant déjà mis notre base de données à disposition de la communauté scientifique et un article présentant ces recherches vient d’être publié dans la revue Nucleic Acid Research. »
Déjà deux algorithmes d’IA opérationnels
En parallèle, l’équipe avance sur le développement d’algorithmes de deep learning capables de traiter de telles données dynamiques pour prédire les interactions entre protéines. « C’est un enjeu crucial pour la recherche en biologie et en médecine, car les macromolécules ne travaillent jamais seules, elles interagissent entre elles en permanence », insiste le chercheur.
Hamed Khakzad et son doctorant, Omid Mokhtari, ont ainsi mis au point un algorithme, baptisé DynamicGT : un modèle qui, considérant la conformation dynamique d’une molécule, peut prédire où se trouvent ses sites de liaison. Un article exposant cette avancée a déjà été accepté dans la prestigieuse revue Cell Systems. Luiz Felipe Piochi, autre doctorant de Delta, a quant à lui développé ppIRIS, un modèle de deep learning capable d’analyser la totalité d’un protéome (soit des milliers de protéines) pour prédire les interactions par paires en quelques minutes seulement; un article a été publié dans Advanced Science.
Enfin, une autre approche, nommée ComPASS, a été développée par Sneha Bheemireddy, alors postdoctorante auprès de Yasaman Karami : elle permet d’analyser systématiquement les données de simulation de dynamique moléculaire pour fournir des informations précises sur les voies de communication au sein des complexes macromoléculaires. Une avancée, là encore, reconnue : l’article présentant la découverte a été illustré sur la couverture du Journal of Chemical Theory and Computation.
« Ces premiers algorithmes sont en quelque sorte un échantillon pour prouver que notre méthode fonctionne, annonce Hamed Khakzad. Et nous allons à présent pouvoir la décliner pour de nombreuses applications, y compris dans le cadre du dernier D : le protein design. »
Concevoir de nouvelles molécules
Pouvoir prédire les interactions permet en effet de créer des molécules présentant des capacités de liaison renforcées avec des protéines d’intérêt. Delta collabore ainsi avec l’EPFL (École polytechnique fédérale de Lausanne, en Suisse) et l’entreprise pharmaceutique danoise Novo Nordisk pour élaborer de petits fragments protéiques capables de se lier à chacune des quelque 3000 protéines de surface des cellules humaines. Les scientifiques ont déjà passé en revue 500 000 fragments potentiels et identifié, grâce au deep learning, ceux qui sont capables de se lier spécifiquement aux protéines de surface.
« Nous avons testé expérimentalement la conception de trois de ces fragments de liaison et constaté de très bons résultats, se félicite Hamed Khakzad. Les données sont disponibles sur un site dédié pour l’ensemble de la communauté et pourraient avoir un impact majeur, par exemple dans la lutte contre le cancer. » Les protéines de surface sont en effet connues pour jouer un rôle important dans le développement et la progression de la maladie : pouvoir y fixer des molécules d’intérêt ouvrirait de nouvelles pistes de traitement. Les résultats de cette étude ont été récemment publiés dans PNAS .
L’équipe-projet poursuit également le partenariat amorcé avec l’université suédoise de Lund autour de la conception de nouveaux anticorps destinés à lutter contre le streptocoque du groupe A, ou encore le Sars-Cov-2. Un brevet est en cours de dépôt et une publication devrait suivre.
Des interactions synonymes d’opportunités thérapeutiques
Autre application de la "méthode Delta" ? Mieux comprendre et même prédire les interactions des protéines intrinsèquement désordonnées (PID) : constituant un tiers du protéome humain, ces protéines se replient lorsqu'elles se lient à leurs cibles. C'est le cas, par exemple, de certains facteurs de virulence bactériens qui utilisent cette technique pour se lier efficacement à une ou plusieurs protéines humaines.
Les travaux de Delta pourraient permettre de mieux comprendre ces mécanismes en connaissant leurs cibles. Là encore, des applications thérapeutiques pourraient en découler, par exemple en concevant des protéines capables d'empêcher l'interaction qui conduit au repliement lors de la liaison avec leurs cibles.
Une révolution thérapeutique à l’horizon
Face aux multiples perspectives, Hamed Khakzad se montre très enthousiaste : « Nous avons devant nous encore d’autres options vers lesquelles orienter nos recherches, comme la prédiction d’interactions entre composés chimiques et protéines, qui pourrait ouvrir la voie à une révolution thérapeutique ! »
Toutefois, pour explorer toutes ces idées, l’équipe va devoir s’étoffer. Outre les deux permanents, elle compte quatre doctorants et trois postdoctorants, mais espère bien recruter au moins un ou deux permanents de plus. « Le Centre Inria de l’Université de Lorraine nous a parfaitement soutenus jusqu’ici pour monter l’équipe, la direction a cru en nos projets et nos idées. Nous allons maintenant pouvoir monter en puissance », annonce Hamed Khakzad. En un an, Delta a déjà réalisé des avancées majeures et d’ailleurs obtenu cinq bourses ANR ; nul doute que cette force de travail supplémentaire sera le gage de nouvelles découvertes rapidement…
Hamed Khakzad en cinq dates
- 2019 : soutenance de thèse en sciences du numérique à l’université de Zurich, en Suisse.
- 2019-2022 : deux postdoctorats, l’un au Collège de France, l’autre à l’École polytechnique fédérale de Lausanne, en Suisse.
- 2022 : poste de professeur junior au Centre Inria de l'Université de Lorraine.
- 2023-2025 : obtention de quatre bourses ANR.
- 2025 : obtention de l’habilitation à diriger des recherches (HDR) et lancement de l’équipe-projet Delta avec Yasaman Karami.
En savoir plus
- Protéines - Chapitre 1 : Qu est ce qu'une protéine ? (vidéo), Voyage au coeur du vivant, 12/1/2023.
- Les macromolécules - Speed Cortex #11 (vidéo), Cortex, 22/06/2021.
- Prix Nobel de chimie 2024 : design des protéines et prédiction de leurs structures, deux facettes d’une même médaille, The Conversation, 10/10/2024.
- Matthias Mann - Analyser les protéines pour diagnostiquer les maladies (vidéo), European Patent Office, 7/5/2019.
Pour les experts
- "DynaRepo and Beyond: Computational Tools to Decode Dynamics and Interactions in Macromolecular Complexes" (MDDB webinar series), vidéo en anglais avec Yasaman Karami et Hamed Khakzad, Cecam Channel, 5/6/2025.
- Piochi et al. "Rapid Proteome-Wide Discovery of Protein–Protein Interactions With ppIRIS", Advanced Science (2026).
- Balbi et al. "Mapping targetable sites on the human surfaceome for the design of novel binders", PNAS (2026).