L'ADN Comme Lecteur Flash: Pourquoi écrire Des Données Numériques Dans Le Génome - Vue Alternative

Table des matières:

L'ADN Comme Lecteur Flash: Pourquoi écrire Des Données Numériques Dans Le Génome - Vue Alternative
L'ADN Comme Lecteur Flash: Pourquoi écrire Des Données Numériques Dans Le Génome - Vue Alternative

Vidéo: L'ADN Comme Lecteur Flash: Pourquoi écrire Des Données Numériques Dans Le Génome - Vue Alternative

Vidéo: L'ADN Comme Lecteur Flash: Pourquoi écrire Des Données Numériques Dans Le Génome - Vue Alternative
Vidéo: COLLOQUE ADN, POLYMÈRES ET BIG DATA 2024, Mai
Anonim

La croissance du volume des informations numériques incite les scientifiques à rechercher des moyens plus compacts de les enregistrer et de les stocker. Et quoi de plus compact que l'ADN? RIA Novosti, avec un expert, a découvert comment coder des mots avec des nucléotides et combien de données contient une molécule.

Codes de raisons

L'ADN est une séquence de nucléotides. Il n'y en a que quatre: l'adénine, la guanine, la thymine, la cytosine. Pour coder les informations, chacun d'eux reçoit un code numérique. Par exemple, thymine - 0, guanine - 1, adénine - 2, cytosine - 3. Le codage commence par le fait que toutes les lettres, tous les chiffres et toutes les images sont convertis en un code binaire, c'est-à-dire une séquence de zéros et de uns, et ils sont déjà convertis en une séquence de nucléotides, c'est-à-dire un code quaternaire.

Avant de coder les données en ADN, vous devez les traduire en code numérique / Illustration par RIA Novosti. Alina Polyanina
Avant de coder les données en ADN, vous devez les traduire en code numérique / Illustration par RIA Novosti. Alina Polyanina

Avant de coder les données en ADN, vous devez les traduire en code numérique / Illustration par RIA Novosti. Alina Polyanina.

Seuls trois nucléotides peuvent être utilisés pour construire un code (code ternaire), et le quatrième consiste à diviser les séquences en parties. Il existe une option avec la construction de bases sous la forme d'un code binaire, lorsque deux d'entre elles correspondent à zéro et deux correspondent à un.

Plusieurs techniques sont utilisées pour la lecture. L'une des plus courantes est qu'une chaîne d'une molécule d'ADN est copiée à l'aide de bases, chacune ayant une étiquette de couleur. Ensuite, un détecteur très sensible lit les données et l'ordinateur utilise les couleurs pour reconstruire la séquence nucléotidique.

«La molécule d'ADN est très volumineuse. Même chez les bactéries, il contient généralement environ un million de bases, et chez les humains, jusqu'à trois milliards. Autrement dit, chaque cellule humaine transporte un volume d'informations comparable à la capacité d'un lecteur flash. Et nous avons des milliards de ces cellules. Une énorme quantité de données peut être enregistrée dans l'ADN, mais l'écriture et la lecture à partir d'un tel support sont encore trop lentes et coûteuses », explique Alexander Panchin, Ph. D., chercheur principal à l'Institute for Information Transmission Problems nommé d'après A. A. Kharkevich, Académie russe des sciences.

Vidéo promotionelle:

La densité d'enregistrement augmente

En juin 1999, la revue Nature a publié un article de scientifiques américains qui ont développé une technique d'envoi de messages secrets à l'aide d'ADN. Ils ont synthétisé une molécule en incorporant une séquence nucléotidique formée à l'aide d'un code quaternaire. L'ADN secret du mélange a été envoyé à un autre laboratoire. Ses employés, à l'aide de clés chimiques spéciales, ont trouvé la molécule désirée et en ont extrait des informations.

«En général, il existe deux approches pour enregistrer les données sur l'ADN. Le premier est lorsque vous synthétisez un ADN complètement nouveau à l'aide d'un synthétiseur chimique. À la commande de l'ordinateur, les nucléotides sont ajoutés à la solution dans un certain ordre, et la chaîne de base requise "grandit" progressivement. Dans le second cas, les données sont encodées dans l'ADN déjà existant d'un organisme », explique Panchin.

En mai 2010, le groupe de Craig Venter, qui a d'abord cartographié le génome humain, a publié un article sur la création d'une bactérie artificielle. Ils ont pris une cellule bactérienne purifiée du génome comme base et y ont placé la séquence de base formée. Le résultat est une nouvelle bactérie, assez active et vivante, qui ne diffère de l'ordinaire que par le fait que son ADN a été créé à la main. De plus, l'équipe a fait preuve d'un sens de la beauté en écrivant leurs noms et citations de classiques en utilisant un code quaternaire dans l'ADN bactérien.

En 2012, un groupe dirigé par le biologiste moléculaire George Church a adopté une approche plus fondamentale et a codé l'ADN d'un livre de 52000 mots Regenesis: How Synthetic Biology Will Reinvent Nature and Ourselves, plusieurs images et un programme Java. Ils ont utilisé du code binaire. La quantité totale de données était de 658 kilo-octets. La densité d'information s'est avérée être de près de 1018 octets par gramme de molécules. A titre de comparaison, un disque dur de 1012 octets pèse une centaine de grammes. Le principal inconvénient de cette méthode est l'instabilité des informations enregistrées.

«La molécule d'ADN a tendance à muter, ce qui réduit la fiabilité du stockage des données. Surtout si le porteur de l'ADN est une cellule vivante capable de division: lorsque l'ADN est dupliqué, les erreurs s'infiltrent particulièrement souvent. La fiabilité du stockage des données augmentera si vous disposez de milliers de copies du même message. Ou stockez simplement l'ADN, par exemple, dans le congélateur. A basses températures, la capacité d'une molécule à muter est considérablement réduite », explique l'expert.

De plus, des informations sont parfois perdues lors de la lecture. Les erreurs peuvent être de nature chimique, lorsqu'une base incorrecte est attachée à un élément, ou purement calculées, c'est-à-dire en fonction de l'ordinateur.

Cher, fiable

En mars 2017, le magazine Science a publié un article de scientifiques américains qui ont réussi à écrire 2 * 1017 octets par gramme d'ADN. Les biologistes soulignent qu'ils n'ont pas perdu un seul octet. En termes simples, ce que nous avons enregistré est ce que nous avons obtenu à la sortie.

Pour un utilisateur ordinaire, un «lecteur flash génétique» n'est pas encore disponible, car il est très coûteux d'y stocker des informations et la vitesse de lecture / écriture est faible. Les scientifiques estiment que la lecture d'un seul mégaoctet nécessite environ trois mille cinq cents dollars et plusieurs heures de temps.

Les avantages incontestables de l'enregistrement d'informations sur l'ADN comprennent l'énorme densité de stockage des données, ainsi que la stabilité du support - cependant, uniquement à basse température.

Recommandé: