Le Cloud se réinvente : quand les serveurs mutualisent leurs ressources

Compatibilità
Salva(0)
Condividi

Le Cloud et les datacenters sont aujourd’hui une infrastructure essentielle, au même titre que l’électricité ou les transports. C’est dans ces immenses "usines à serveurs" que sont stockées, traitées et sécurisées la plupart de nos données numériques. Mais cette infrastructure doit évoluer : les datacenters consomment près de  2 % de l’électricité mondiale et la demande ne cesse de croître. 

Pour répondre à ces besoins, il faudra des architectures plus souples, décentralisées et économes, capables d’éviter le gaspillage actuel des ressources. C’est précisément l’ambition du projet DiVa (pour "Désagrégation virtualisée"), porté par l’équipe Benagil d’Inria commune avec Télécom SudParis, membre d’Institut Polytechnique de Paris, et financé dans le cadre du PEPR Cloud, un programme national de recherche qui fédère des acteurs publics autour des grands défis du secteur.

De la virtualisation à la désagrégation

Aujourd’hui, les datacenters reposent sur la virtualisation. Chaque utilisateur travaille dans une "machine virtuelle" : un ordinateur simulé qui partage, avec d’autres, un serveur physique. Cela permet d’optimiser l’usage des machines, mais avec une limite : une machine virtuelle ne peut accéder qu’aux ressources du serveur qui l’héberge. 

Selon Microsoft Azure, jusqu’à 25 % de la mémoire des datacenters peut ainsi être gaspillée.

La désagrégation propose de casser ce verrou : séparer les ressources (processeurs, mémoire, stockage) pour les mutualiser entre toutes les machines virtuelles. « Un serveur en manque de mémoire pourrait alors aller en chercher sur un autre. Cette approche permettrait d’utiliser pleinement les capacités existantes et de réduire sensiblement la consommation énergétique », poursuit le chercheur.

Le défi de la latence

L’idée est prometteuse, mais elle se heurte à une difficulté majeure : accéder à une ressource distante est environ dix fois plus lent qu’à une ressource locale. Cette latence peut annuler tout gain de performance et d’énergie. Le défi scientifique de DiVa est de masquer cette lenteur, afin que les applications tournent presque aussi vite qu’en local. 

Cela suppose de trouver un équilibre subtil : « si l’on cache complètement la désagrégation, le système risque de faire de mauvais choix car il ne connaît pas les besoins réels des applications. Mais si on montre toute cette complexité aux développeurs et développeuses, leurs logiciels deviennent beaucoup trop compliqués à concevoir », résume Gaël Thomas. L’enjeu est ainsi d’offrir des outils simples mais intelligents, qui laissent aux en charge de développement juste assez de contrôle pour tirer parti de cette nouvelle architecture.

L’équipe Benagil, un atout clé pour DiVa

Créée il y a deux ans, l’équipe Benagil concentre ses recherches sur trois domaines : le Cloud, les supercalculateurs et la blockchain. Son expertise se situe au niveau dit "système", c’est-à-dire l’interface entre les applications logicielles et le matériel : systèmes d’exploitation, langages, communications entre machines. Jusqu’ici, le Centre Inria de Saclay ne disposait pas d’une équipe aussi spécialisée dans ce domaine stratégique. « Notre atout, explique Gaël Thomas, directeur scientifique de DiVa, c’est la complémentarité : chaque scientifique de l'équipe est expert en systèmes, mais avec une spécialisation différente (bases de données, environnements d’exécution pour des langages comme Java ou Python, calcul haute performance, infrastructures cloud). Cette diversité nous permet de proposer des solutions robustes et utiles aux développeurs. » 

Des solutions techniques

En deux ans, l’équipe Benagil a déjà élaboré plusieurs pistes concrètes, à commencer par de nouveaux “ramasse-miettes” (garbage collectors). Ces programmes libèrent la mémoire non utilisée dans les applications. Très efficaces en environnement classique, ils deviennent vite gourmands lorsqu’ils doivent gérer des données éparpillées sur plusieurs serveurs. L’équipe a conçu des versions adaptées pour limiter ces inconvénients.

Les chercheurs testent aussi une nouvelle forme de mémoire dite "persistante". Aujourd’hui, les données du Cloud sont souvent stockées loin, dans de grandes armoires de disques, ce qui en ralentit l’accès. « L’idée est d’ajouter, juste à côté des serveurs, cette mémoire ultra-rapide où les applications peuvent écrire immédiatement. Ensuite, les données sont transférées automatiquement vers les gros stockages en arrière-plan, sans que l’utilisateur ne s’en rende compte », résume Gaël Thomas.

Dernière piste explorée : une gestion fine du cache processeur. Le cache est une petite mémoire ultrarapide intégrée au processeur. Les chercheurs sont en train de mettre au point une technique pour mieux contrôler quand et comment ses données sont transférées, réduisant ainsi les échanges intempestifs entre machines.

Et des résultats prometteurs

Mises bout à bout, ces avancées laissent entrevoir des perspectives ambitieuses. « Pour des applications de bases de données, nous avons déjà réussi en laboratoire à diviser significativement le temps d’accès aux données », indique Gaël Thomas. 

Un autre volet essentiel du projet concerne la cybersécurité. En effet, la désagrégation abolit les frontières strictes entre serveurs physiques. Si un logiciel malveillant prenait le contrôle d’une machine, il pourrait alors menacer l’ensemble du datacenter. L’équipe Benagil explore donc des pistes pour renforcer les mécanismes de sécurité à la base même du système, souvent exploité sur des environnements Linux.

Une question de souveraineté

Prévu encore sur cinq ans, le projet DiVa entre aujourd’hui dans son rythme de croisière. Les premiers résultats devraient être publiés prochainement sous forme de logiciels open source, accessibles à toute la communauté scientifique et aux développeurs. 

Car au-delà des performances et des économies d’énergie, DiVa répond à un enjeu de souveraineté numérique. Le marché européen du Cloud est dominé à 70 % par les géants américains (Amazon Web Services, Microsoft Azure, Google Cloud). 

Recapiti
Inria