Lorsque Nous Manquerons D'espace Pour Stocker Des Données Numériques, Nous Utiliserons DNA - Vue Alternative

Table des matières:

Lorsque Nous Manquerons D'espace Pour Stocker Des Données Numériques, Nous Utiliserons DNA - Vue Alternative
Lorsque Nous Manquerons D'espace Pour Stocker Des Données Numériques, Nous Utiliserons DNA - Vue Alternative

Vidéo: Lorsque Nous Manquerons D'espace Pour Stocker Des Données Numériques, Nous Utiliserons DNA - Vue Alternative

Vidéo: Lorsque Nous Manquerons D'espace Pour Stocker Des Données Numériques, Nous Utiliserons DNA - Vue Alternative
Vidéo: Marseille : un outil de stockage de données numériques, l'ADN 2024, Mai
Anonim

Le monde connaît une pénurie d'espace libre pour stocker des données numériques. Ce problème existe depuis plusieurs années, mais les gens ordinaires n'y pensent presque jamais. Il n'y a pas si longtemps, il fut un temps où l'espace libre pour l'enregistrement de données numériques était limité par la taille du disque dur de votre ordinateur. Lorsque la limite a été atteinte, nous avons opté pour un nouveau disque dur ou tout enregistré sur un support optique. À la fin, nous avons simplement supprimé les anciennes données et en avons enregistré de nouvelles. Mais il y a ceux qui ne suppriment jamais les données.

Par exemple, de nombreuses entreprises ne le font pas, en particulier celles dont le domaine d'activité et la valeur dépendent des informations numériques qu'elles possèdent. Le temps change. La technologie progresse. Désormais, les informations ne sont pas supprimées, elles sont transférées vers le «cloud». D'ailleurs, le terme même de «nuage» est très éphémère et ne reflète pas du tout un véritable phénomène physique naturel. Il semblait juste très confortable et beau, et ils l'ont quitté. Où sont stockées les données? Cela n'a pas d'importance du tout, du moins tant que nous pouvons nous tourner vers eux à tout moment. Est-il probable que nous finissions par manquer d'espace de stockage dans le cloud? Personne n'y pense. Tant que vous payez l'abonnement, tout va bien. Petit espace? Vous choisissez un nouveau plan tarifaire et vous obtenez encore plus d'espace pour vos informations.

Ce désordre a rendu difficile pour les gens d'imaginer même qu'un jour nous pourrions manquer d'espace libre pour stocker des données numériques. Comme il était difficile d'imaginer que tôt ou tard de l'eau douce puisse s'épuiser sur Terre, dont les réserves se reconstituent en raison de sa circulation dans la nature. Mais voici la réalité. En 2018, les approvisionnements en eau du Cap, en Afrique du Sud, approchaient rapidement de leur épuisement total. Et nous, les gens qui n'y pensons pas, nous approchons rapidement d'un manque d'espace libre pour stocker des données numériques.

Données, données, données autour

La raison principale de cet épuisement de l'espace libre est bien entendu liée à la vitesse à laquelle nous produisons de nouvelles données. Chaque jour dans le monde, grâce à 3,7 milliards d'internautes, environ 2,5 quintillions d'octets d'informations sont générés. De toutes les données numériques disponibles aujourd'hui, 90% ont été créées au cours des deux dernières années seulement. Et avec la croissance du nombre d'appareils intelligents usagés qui se connectent au World Wide Web (le même «Internet des objets»), ces chiffres augmenteront encore plus dans un proche avenir.

Image
Image

«Quand les gens parlent de stockage dans le cloud, ils veulent souvent dire qu'il existe une sorte d'espace de stockage gratuit infini», commente Hyun Jun Park, directeur et co-fondateur de Catalog, une société de stockage de données, à Digital Trends.

Vidéo promotionelle:

«Cependant, le cloud est le même ordinateur qui stocke vos données. Les gens ne se rendent tout simplement pas compte que tant de données numériques sont générées dans le monde que le rythme auquel elles sont produites est bien en avance sur notre capacité à tout stocker. Dans un avenir très proche, nous verrons un énorme écart entre la quantité de données utiles et notre capacité à les stocker en utilisant les médias traditionnels."

Étant donné que les entreprises de stockage dans le cloud sont constamment occupées à construire de nouveaux centres de données ou à étendre les centres existants, il est très difficile de prédire quand nous perdrons réellement tout l'espace libre. Néanmoins, selon le même parc, d'ici 2025, l'humanité dans son ensemble peut générer plus de 160 zettaoctets d'informations numériques (des zettaoctets, pour ceux qui ne le savent pas, c'est un billion de gigaoctets). Combien de ce volume pouvons-nous réellement économiser? Environ 12,5 pour cent, dit Park.

Ce problème doit absolument être résolu.

L'ADN est-il la réponse?

Ainsi disons Park, Nathaniel Rocket et leurs collègues du Massachusetts Institute of Technology. Ensemble, ils ont fondé Catalog, dans les murs duquel a été développée une technologie qui, selon ses créateurs, pourrait changer la façon dont nous pensons à la façon dont toutes nos données numériques seront stockées dans un proche avenir. Selon eux, ou plutôt une déclaration, les données numériques du monde entier peuvent bientôt s'intégrer dans une zone pas plus grande qu'une armoire.

Image
Image

Le catalogue propose le codage ADN comme solution appropriée. Tout cela ressemble à l'une des histoires de l'écrivain de science-fiction américain Michael Crichton, mais la solution évolutive et abordable qu'ils offrent est assez réaliste et a même attiré 9 millions de dollars en financement de capital-risque, ainsi que le soutien de professeurs de premier plan des universités de Stanford et de Harvard.

«On me pose souvent la question: de quel ADN utilisons-nous? C’est comme si les gens pensent que nous prenons l’ADN d’une personne et que nous la transformons en mutants ou quelque chose du genre », rit Park.

Mais ce n'est pas du tout ce que fait Catalog. L'ADN utilisé par Catalog pour coder les données est un polymère synthétique. Il n'est pas d'origine biologique et n'est pas créé sur des paires de bases azotées dans lesquelles des informations sont enregistrées. Une série de zéros et de uns qui est écrite dans le polymère ne peut pas non plus être le code de quoi que ce soit vivant. Néanmoins, le produit résultant est biologiquement pratiquement impossible à distinguer de ce que nous avons l'habitude de rencontrer dans une cellule vivante.

L'idée selon laquelle l'ADN peut être considéré comme un support alternatif pour stocker des informations numériques remonte à plusieurs décennies. En fait, lorsque James Watson et Francis Crick ont proposé pour la première fois le modèle de structure de l'ADN en 1953. Cependant, jusqu'à présent, un certain nombre de limitations importantes ne permettaient pas de voir l'énorme potentiel de l'utilisation de l'ADN comme moyen de stocker des informations numériques, sans parler de la façon de traduire tout cela en réalité.

Dans son point de vue habituel, la méthode de stockage de l'information par l'ADN est centrée sur la synthèse de nouvelles molécules d'ADN; faire correspondre des séquences de bits d'information à des séquences de quatre paires d'ADN et produire suffisamment de molécules pour représenter tous les nombres que vous souhaitez stocker. Le problème avec cette méthode est que le processus est coûteux et lent. En outre, de nombreuses restrictions sont associées au stockage réel des données elles-mêmes.

Image
Image

L'approche de Catalog suggère de déconnecter la synthèse des molécules de leur codage. Essentiellement, l'entreprise produit d'abord une quantité énorme de certaines molécules uniquement (ce qui réduit considérablement le coût de production), puis encode les informations en utilisant une variété de molécules prêtes à l'emploi.

Par analogie, Catalog compare l'approche précédente de la production de disques durs personnalisés avec des informations déjà préenregistrées dessus. Dans ce cas, l'enregistrement de nouvelles informations implique la nécessité de créer un nouveau disque dur à partir de zéro. La nouvelle approche du catalogue peut être comparée à la production en série de disques durs vierges et à l'écriture de nouvelles informations codées sur eux si nécessaire.

Tout est question de stockage

La beauté de ceci est à quel point la quantité de données peut être stockée dans un espace très compact. À titre de démonstration, Catalog a utilisé sa technologie pour coder divers livres de science-fiction en ADN. Par exemple, tout le cycle de romans Le guide de l'auto-stoppeur de la galaxie. Mais ce sont toutes des bagatelles avant les possibilités d'ouverture.

«En comparant des chiffres comparables, le nombre de bits que vous pouvez stocker avec l'ADN est un million de fois plus élevé que ce qui est offert par les mêmes disques SSD. Par exemple, prenons la taille d'un lecteur flash ordinaire. En utilisant la méthode ADN de stockage d'informations, vous pouvez écrire un million de fois plus d'informations sur un périphérique de la taille de ce lecteur flash que sur un lecteur flash ordinaire."

La comparaison avec les disques SSD, notent les développeurs, n'est toujours pas tout à fait exacte. DNA vous permet de stocker beaucoup plus d'informations dans un volume comparable, mais la technologie ne vous permet pas de fournir un accès instantané, comme par exemple dans le cas des mêmes clés USB. La technologie de catalogue transforme les informations en une pastille physique solide (granule) à partir d'un polymère synthétique.

Image
Image

Pour accéder à ces informations, vous devez prendre un culot de polymère synthétique codé, le réhydrater avec de l'eau, puis le «lire» à l'aide d'un séquenceur d'ADN. Dans le cadre du processus, il sera possible d'isoler les paires de bases d'ADN, qui pourront ensuite être utilisées pour calculer le nombre de zéros et de uns qui forment l'information. Du début à la fin, ce processus peut prendre au moins quelques heures.

Pour cette raison, cette technologie est principalement destinée au marché de l'archivage, où un accès rapide aux informations n'est pas nécessaire. Habituellement, cela signifie des données qui ne sont pas utilisées ou qui sont très rarement utilisées après l'enregistrement, mais qui sont extrêmement importantes pour la conservation. Disons, comme la garantie de votre réfrigérateur, uniquement à l'échelle de l'entreprise.

Comment tout cela profitera-t-il aux utilisateurs ordinaires? Au début de l'article, nous avons parlé du fait que la plupart d'entre nous ne pensons pas à ce qui se passe et à l'endroit où nos informations sont stockées. Sur les supports à semi-conducteurs? Oui, même si ce n'est que sur bande magnétique. Cela ne nous intéresse pas tant que nous y avons accès à tout moment.

En raison de la longueur du processus de récupération des informations, il est peu probable que nous atteignions jamais le niveau auquel certains Google Cloud ou Yandex. Disk stockeront nos informations dans des cuves géantes d'ADN. Si la même technologie de catalogue prouve son efficacité, alors, très probablement, elle trouvera sa niche dans les domaines où l'approche du stockage d'informations à long terme est appliquée. Quant à la méthode de stockage à court terme, où les disques durs et les disques SSD sont actuellement utilisés, nous devrons nous fier à d'autres méthodes.

Présentation des perspectives

Ce tube à essai contient des millions de copies de données codées en ADN
Ce tube à essai contient des millions de copies de données codées en ADN

Ce tube à essai contient des millions de copies de données codées en ADN.

Néanmoins, vous pouvez voir ici des possibilités presque de science-fiction.

«Imaginez qu'un granule implanté sous votre peau contienne toutes les informations sur votre santé: vos données d'angiographie par résonance magnétique, vos informations de groupe sanguin, une radiographie pour votre dentiste», explique Park.

«Vous voulez probablement que toutes ces données soient toujours disponibles pour vous, mais vous ne voulez pas les stocker quelque part dans le« cloud »ou sur un serveur d’hôpital non sécurisé. En ayant ces données sous forme d'ADN avec vous à tout moment, vous pouvez les gérer physiquement, y accéder si nécessaire, les restreindre à tout le monde et les ouvrir directement à vos médecins traitants.

«Presque tous les hôpitaux modernes ont un séquenceur d'ADN. Je ne dis pas que nous poursuivons actuellement exactement cet objectif d'utiliser cette technologie, mais à l'avenir, tout cela pourrait devenir tout à fait possible », déclare le développeur.

Le catalogue est actuellement engagé dans des projets expérimentaux visant à démontrer l'efficacité de la technologie qu'ils ont développée.

«Nous ne sommes pas confrontés à des difficultés scientifiques insolubles, nous parlons désormais davantage des tâches d'optimisation des processus mécaniques», a déclaré Park.

De son propre aveu, Park, il a décidé de s'impliquer dans la recherche de moyens de stocker des données à l'aide de l'ADN simplement parce qu'il pensait que c'était une approche technologique très cool et innovante pour résoudre le gros problème existant. Maintenant, selon l'expert, cette technologie peut devenir l'une des technologies les plus importantes de notre temps.

Nikolay Khizhnyak

Recommandé: