Une équipe de chercheurs de Hong-Kong affirme être parvenue à stocker 90 gigaoctets de données dans un gramme de solution contenant des bactéries.
Si l'on en juge sur la photo de la page d'accueil, c'est une équipe très jeune qui travaille pour la Chinese University of Hong-Kong. Elle prétend être parvenue à atteindre deux objectifs:
Le principe consiste à convertir les lettres en nombres, et les nombres en nucléobases A, T, C, G. Le système binaire comporte deux valeurs, 0 et 1 et le système ADN quatre valeurs. Réaliser un algorithme de conversion quaternaire est élémentaire.
Par exemple, la lettre i correspond au code ASCII 105, et dans la numération quaternaire, 105 devient 1221. (Les chiffres vont de 0 à 3). L'équivalence ADN est 0=A, 1=T, 2=C, 3=G, et la lettre i, en séquence ADN, s'écrit TCCT.
En ajoutant un algorithme de compression similaire à celui que l'on utilise pour les images, une quantité importante de données peut être réduite à une sequence assez courte. 18 cellules suffisent à coder la déclaration d'indépendance des Etats-Unis.
L'équipe voit dans le stockage bactérien un moyen d'avenir pour le stockage des données. Dans un gramme de solution contenant des bactéries de type Escherichia coli, on peut stocker 90 gigaoctets de données (1 gramme de cellules en contient 10 millions).
La lecture des données se fait par séquençage. Les cellules se dédoublent ce qui assure l'intégrité des données.
La durabilité du stockage est assurée par la capacité des bactéries à se reproduire. Cependant, on doit faire face au problème des mutations. Contre cela on envisage de passer aux Eucaryotes qui disposent d'un système de réparation de l'ADN plus efficace...
| Tweet |
|