Actualités > La recherche
Retour à la liste des actualités

Jean-François Lutz, co-lauréat d’un financement de 20M€ pour révolutionner le stockage de données.

Quand on évoque le stockage des données, nous pensons immédiatement à ces immenses datacenters réfrigérés. A l’heure de la transition énergétique et de l’explosion du volume de données informatiques stockées dans le monde, le recours massif à ces serveurs énergivores pose un réel problème écologique. En 2020, le volume de données stockées sur terre atteignait 64 Zettabits, soit 64×1021 bits, donc 64 000 000 000 000 000 000 000 bits (!). La même année, environ 1 à 2% de l’électricité mondiale était destinée à l’alimentation et le refroidissement des datacenters².
La solution miracle ? Stocker une très grande quantité d’informations sur un support peu gourmand en énergie et prenant peu de place. Développer ces technologies de rupture, c’est l’ambition du projet MoleculArXiv porté par 7 laboratoires français dont celui de Jean-François Lutz, chercheur à l’Institut Charles Sadron à Strasbourg1.

Le projet MoleculArXiv en bref

Financement sur 7 ans : 20 millions €

4 projets ciblés :

  • Synthèse de l’ADN
  • Des données numériques à la base d’ADN
  • Polymères synthétiques numériques
  • Applications

7 laboratoires impliqués dans le 3ème projet ciblé :

  • 4 Université de Strasbourg (l’ICS, l’IPHC, l’IGBMC et le Lima)
  • 1 Université de Haute Alsace (IS2M)
  • 1 Université d’Evry (Lambe)
  • 1 Université Aix Marseille (ICR)

Pilotage du projet ciblé sur les polymères : Jean-François Lutz

À la recherche du disque dur du futur

Les chercheurs ont réalisé un constat simple : les molécules d’ADN d’une seule cellule permettent de stocker une très grande quantité d’information (les plans d’instruction pour recréer un organisme entier, rien que ça). 1 gramme d’ADN a une capacité de stockage de 455×1018  bits, il suffirait donc d’environ 140g d’ADN pour stocker nos 64 Zettabits de données présents dans les serveurs du monde entier en 2020 ! Le tout, sans refroidissement ni apport d’énergie.

Autre avantage : la stabilité dans le temps. Le stockage classique est peu durable : les données archivées sur disques ou bandes magnétiques doivent être transférées tous les 10 ans environ3 alors que l’ADN mets (dans certaines conditions) plusieurs centaines de milliers d’années à se dégrader à température ambiante4.

Un des axes du projet MoleculArXiv sera de développer le stockage d’informations sur ADN, mais Jean-François Lutz a eu une autre idée, et ça, il y a déjà presque 10 ans : troquer la molécule d’ADN contre des polymères plus simple à manipuler.

De l’information directement stockée au cœur du plastique

S’il y a bien une matière qui résiste à l’épreuve du temps et qui demande peu d’entretien, c’est bien le plastique. Jean-François Lutz développe des polymères composés de deux monomères différents. L’alternance de ces monomères marche sur le même principe que les bits (les successions de 0 et 1 de nos ordinateurs). Ordonner cette séquence de monomères permet alors de stocker durablement des informations, sans refroidissement ni entretien.

Ces perspectives prometteuses sont développées dans un deuxième axe du projet MoleculArXiv, piloté par Jean-François Lutz. Le chercheur précise également que le gain de place conféré par ce type de stockage permettrait de stocker « tout le savoir humain dans une pièce de quelques mètres cubes »1.

Convertir des données informatiques

Système Binaire informatique :
Suites de 0 et de 1 (des bits)

Polymères synthétiques

Composé d’au moins 2 monomères différents associés à la valeur 0 ou 1 (densité de stockage de 1 bit/monomère).

Des alphabets augmentés peuvent aussi être utilisés :
Lorsque 4 monomères différents sont utilisés, ils peuvent être associés aux valeurs 00, 01, 10 et 11 (densité de stockage de 2 bits/monomère).

Lorsque 8 monomères différents sont utilisés, ils peuvent être associés aux valeurs 000, 001, 010, 100, 011, 101, 110 et 111 (densité de stockage de 3 bits/monomère).

ADN

L’ADN est composé de 4 nucléotides : l’adénine (A),
la thymine (T), la cytosine (C) et la guanine (G).

A l’instar des polymères, chacune des bases peut être associée à 1 ou 2 bits suivant les mêmes principes.

Chaque lettre de l’alphabet est codée par 8 bits, soit un octet.

La lettre A en bits = 01000001, La lettre B = 01000001

Lorsque deux monomères sont utilisés pour coder, la lettre A ou B est stockée sur une séquence de 8 monomères :

Lorsque quatre monomères sont utilisés pour coder, la lettre A ou B est stockée sur une séquence plus courte de seulement 4 monomères :

Principal verrou : l’accessibilité des données

Qu’elles soient stockées dans le plastique ou l’ADN, comment rendre accessible rapidement ces données ?

En effet, pour extraire les informations stockées dans l’ADN, un équipement de séquençage est nécessaire et l’opération est lente et coûteuse. La lecture des polymères est également loin d’être instantanée et nécessite l’utilisation d’un spectromètre de masse. En 2017, Le laboratoire de Jean-François Lutz (en collaboration avec l’Institut de Chimie Radicalaire de Marseille) a établi un record mondial en termes de quantité d’information pouvant être séquencée par spectrométrie de masse5. Ces résultats, publiés dans la revue Nature Communications, ont conférés aux chercheurs français une solide réputation internationale, un atout français de poids dans cet axe de recherche stratégique.

Aujourd’hui, ce type de stockage semble être indiqué pour l’archivage de données dites « froides » (c’est-à-dire des données auxquelles l’accès est peu fréquent). Demain, avec l’amélioration des équipements permettant la synthèse et la lecture de ces polymères, ce type de support de stockage pourraient bien révolutionner le secteur.

Un programme stratégique pour placer la France en leader de cette technologie de pointe

Lancé officiellement en janvier pour une durée de sept ans et financé à hauteur de 20M€, ce projet est piloté par le CNRS dans le cadre du Programmes et Equipements Prioritaires (PEPR) exploratoires.

Hautement sélectif, l’objectif de ce programme est de constituer des équipes de laboratoires français pour répondre à des enjeux clés dans des domaines de recherche très stratégiques, comme celui des technologies du numérique respectueuses de l’environnement6. Les PEPR exploratoires représentent 1 milliard d’euros qui seront investis afin de construire ou consolider un leadership français dans des domaines scientifiques prioritaires liés à une transformation de grande ampleur, qu’elle soit technologique, économique, sociétale, sanitaire ou environnementale.