23.9 C
Brüssel
Dienstag, Mai 14, 2024
NewsDNA-Datenspeicher mit hoher Kapazität: Könnten alle Ihre digitalen Fotos gespeichert werden?

DNA-Datenspeicher mit hoher Kapazität: Können alle Ihre digitalen Fotos als DNA gespeichert werden?

HAFTUNGSAUSSCHLUSS: Die in den Artikeln wiedergegebenen Informationen und Meinungen sind die derjenigen, die sie angeben, und es liegt in ihrer eigenen Verantwortung. Veröffentlichung in The European Times bedeutet nicht automatisch Zustimmung zu einer Meinung, sondern das Recht, sie zu äußern.

HAFTUNGSAUSSCHLUSS ÜBERSETZUNGEN: Alle Artikel auf dieser Website werden in englischer Sprache veröffentlicht. Die übersetzten Versionen werden durch einen automatisierten Prozess erstellt, der als neuronale Übersetzungen bekannt ist. Im Zweifel immer auf den Originalartikel verweisen. Danke für dein Verständnis.

DNA-Datenspeicherung

MIT-Bioingenieure haben einen Weg demonstriert, um Datendateien, die als DNA gespeichert sind, einfach abzurufen. Dies könnte ein Schritt in Richtung Nutzung von DNA-Archiven zur Speicherung enormer Mengen an Fotos, Bildern und anderen digitalen Inhalten sein. Kredit: Bild: MIT News. Kleine Symbole mit freundlicher Genehmigung der Forscher

Eine Technik zum Kennzeichnen und Abrufen von DNA-Datendateien aus einem großen Pool könnte dazu beitragen, die Speicherung von DNA-Daten durchführbar zu machen.

Auf der Erde gibt es derzeit etwa 10 Billionen Gigabyte an digitalen Daten, und jeden Tag produzieren Menschen E-Mails, Fotos, Tweets und andere digitale Dateien, die sich auf weitere 2.5 Millionen Gigabyte an Daten summieren. Viele dieser Daten werden in riesigen Einrichtungen gespeichert, die als Exabyte-Rechenzentren bekannt sind (ein Exabyte ist 1 Milliarde Gigabyte), die die Größe mehrerer Fußballfelder haben können und deren Bau und Wartung etwa 1 Milliarde US-Dollar kosten.

Viele Wissenschaftler glauben, dass eine alternative Lösung in dem Molekül liegt, das unsere genetischen Informationen enthält: DNA, die sich entwickelt hat, um riesige Informationsmengen in sehr hoher Dichte zu speichern. Eine Kaffeetasse voller DNA könnte theoretisch alle Daten der Welt speichern, sagt Mark Bathe, Professor für Biotechnologie am MIT.

„Wir brauchen neue Lösungen für die Speicherung dieser riesigen Datenmengen, die weltweit anfallen, insbesondere der Archivdaten“, sagt Bathe, der auch assoziiertes Mitglied des Broad Institute of MIT und Harvard ist. „DNA ist tausendmal dichter als Flash-Speicher, und eine weitere interessante Eigenschaft ist, dass das DNA-Polymer nach der Herstellung keine Energie mehr verbraucht. Sie können die DNA schreiben und dann für immer speichern.“

DNA-Dateien Foto

Ein Foto der DNA-„Dateien“. Jede Silica-Kugel enthält DNA-Sequenzen, die ein bestimmtes Bild kodieren, und die Außenseite der Kugel ist mit Nukleotid-Barcodes beschichtet, die den Bildinhalt beschreiben. Kredit: Mit freundlicher Genehmigung der Forscher

Wissenschaftler haben bereits gezeigt, dass sie Bilder und Textseiten als DNA kodieren können. Es wird jedoch auch eine einfache Möglichkeit benötigt, um aus einer Mischung vieler DNA-Stücke die gewünschte Datei herauszusuchen. Bathe und seine Kollegen haben nun einen Weg demonstriert, dies zu tun, indem sie jede Datendatei in ein 6-Mikrometer-Siliciumdioxid-Partikel einkapseln, das mit kurzen DNA-Sequenzen markiert ist, die den Inhalt enthüllen.

Mit diesem Ansatz zeigten die Forscher, dass sie einzelne Bilder, die als DNA-Sequenzen gespeichert sind, aus einem Satz von 20 Bildern genau herausziehen können. Angesichts der Anzahl möglicher Labels, die verwendet werden könnten, könnte dieser Ansatz bis zu 10 . skaliert werden20 Dateien.

Bathe ist leitender Autor der Studie, die heute in . erscheint Nature Materials. Die Hauptautoren des Papiers sind der Senior Postdoc am MIT, James Banal, der ehemalige MIT-Forschungsmitarbeiter Tyson Shepherd und der MIT-Student Joseph Berleant.

Stabile Lagerung

Digitale Speichersysteme codieren Text, Fotos oder andere Arten von Informationen als Folge von Nullen und Einsen. Dieselbe Information kann in der DNA unter Verwendung der vier Nukleotide kodiert werden, die den genetischen Code bilden: A, T, G und C. Zum Beispiel könnten G und C verwendet werden, um 0 darzustellen, während A und T 1 darstellen.

DNA hat mehrere andere Eigenschaften, die sie als Speichermedium wünschenswert machen: Sie ist extrem stabil und lässt sich relativ einfach (aber teuer) synthetisieren und sequenzieren. Aufgrund seiner hohen Dichte – jedes Nukleotid, das bis zu zwei Bit entspricht, ist etwa 1 Kubiknanometer groß – könnte ein Exabyte an als DNA gespeicherten Daten in Ihre Handfläche passen.

In der DNA gespeicherte Bilder

Die Forscher speicherten solche Bilder in der DNA. Kredit: Mit freundlicher Genehmigung der Forscher

Ein Hindernis für diese Art der Datenspeicherung sind die Kosten für die Synthese so großer DNA-Mengen. Derzeit würde es 1 Billion US-Dollar kosten, ein Petabyte an Daten zu schreiben (1 Million Gigabyte). Um mit Magnetbändern, die häufig zur Speicherung von Archivdaten verwendet werden, wettbewerbsfähig zu werden, müssten die Kosten für die DNA-Synthese nach Schätzungen von Bathe um etwa sechs Größenordnungen gesenkt werden. Bathe geht davon aus, dass dies innerhalb von ein oder zwei Jahrzehnten geschehen wird, ähnlich wie die Kosten für die Speicherung von Informationen auf Flash-Laufwerken in den letzten Jahrzehnten drastisch gesunken sind.

Abgesehen von den Kosten ist der andere große Engpass bei der Verwendung von DNA zum Speichern von Daten die Schwierigkeit, die gewünschte Datei aus allen anderen auszuwählen.

„Angenommen, die Technologien zum Schreiben von DNA erreichen einen Punkt, an dem es kosteneffektiv ist, ein Exabyte oder Zettabyte an Daten in die DNA zu schreiben, was dann? Sie werden einen Haufen DNA haben, das sind Unmengen von Dateien, Bildern oder Filmen und anderem Zeug, und Sie müssen das eine Bild oder den Film finden, nach dem Sie suchen“, sagt Bathe. "Es ist, als würde man versuchen, die Nadel im Heuhaufen zu finden."

Derzeit werden DNA-Dateien konventionell mittels PCR (Polymerase-Kettenreaktion) abgerufen. Jede DNA-Datendatei enthält eine Sequenz, die an einen bestimmten PCR-Primer bindet. Um eine bestimmte Datei herauszuziehen, wird dieser Primer der Probe hinzugefügt, um die gewünschte Sequenz zu finden und zu amplifizieren. Ein Nachteil dieses Ansatzes besteht jedoch darin, dass es zu einem Crosstalk zwischen dem Primer und den Off-Target-DNA-Sequenzen kommen kann, wodurch unerwünschte Dateien herausgezogen werden. Außerdem erfordert der PCR-Retrieval-Prozess Enzyme und verbraucht am Ende den größten Teil der DNA, die sich im Pool befand.

„Man verbrennt den Heuhaufen, um die Nadel zu finden, weil die gesamte andere DNA nicht amplifiziert wird und man sie im Grunde wegwirft“, sagt Bathe.

Dateiabruf

Als alternativen Ansatz entwickelte das MIT-Team eine neue Abruftechnik, bei der jede DNA-Datei in ein kleines Siliziumdioxid-Partikel eingekapselt wird. Jede Kapsel ist mit einzelsträngigen DNA-„Barcodes“ gekennzeichnet, die dem Inhalt der Datei entsprechen. Um diesen Ansatz kostengünstig zu demonstrieren, kodierten die Forscher 20 verschiedene Bilder in DNA-Stücke mit einer Länge von etwa 3,000 Nukleotiden, was etwa 100 Bytes entspricht. (Sie zeigten auch, dass die Kapseln DNA-Dateien mit einer Größe von bis zu einem Gigabyte aufnehmen können.)

Jede Datei war mit Strichcodes versehen, die Etiketten wie „Katze“ oder „Flugzeug“ entsprachen. Wenn die Forscher ein bestimmtes Bild herausziehen möchten, entfernen sie eine DNA-Probe und fügen Primer hinzu, die den gesuchten Markierungen entsprechen – zum Beispiel „Katze“, „Orange“ und „Wild“ für ein Bild eines Tigers oder „Katze“, „Orange“ und „Hauskatze“ für eine Hauskatze.

Die Primer sind mit fluoreszierenden oder magnetischen Partikeln markiert, so dass sie leicht herausgezogen und eventuelle Übereinstimmungen aus der Probe identifiziert werden können. Auf diese Weise kann die gewünschte Datei entfernt werden, während der Rest der DNA intakt bleibt und wieder eingelagert werden kann. Ihr Abrufprozess ermöglicht boolesche logische Aussagen wie „Präsident AND 18“th Jahrhundert“, um als Ergebnis George Washington zu generieren, ähnlich dem, was mit einem Google-Bild abgerufen wird search.

„Bei unserem aktuellen Proof-of-Concept-Stand haben wir eine Suchrate von 1 Kilobyte pro Sekunde. Die Suchrate unseres Dateisystems wird durch die Datengröße pro Kapsel bestimmt, die derzeit durch die unerschwinglichen Kosten für das Schreiben von Daten im Wert von 100 Megabyte auf die DNA und die Anzahl der Sorter, die wir parallel verwenden können, begrenzt ist. Wenn die DNA-Synthese billig genug wird, könnten wir mit unserem Ansatz die Datengröße, die wir pro Datei speichern können, maximieren“, sagt Banal.

Für ihre Barcodes verwendeten die Forscher einzelsträngige DNA-Sequenzen aus einer Bibliothek mit 100,000 Sequenzen, jede etwa 25 Nukleotide lang, die von Stephen Elledge, einem Professor für Genetik und Medizin an der Harvard Medical School, entwickelt wurde. Wenn Sie jeder Datei zwei dieser Etiketten hinzufügen, können Sie 10 eindeutig kennzeichnen10 (10 Milliarden) verschiedene Dateien und mit jeweils vier Etiketten können Sie 10 . eindeutig beschriften20 Dateien.

George Church, Professor für Genetik an der Harvard Medical School, beschreibt die Technik als „einen riesigen Sprung für Wissensmanagement und Suchtechnologie“.

„Der schnelle Fortschritt beim Schreiben, Kopieren, Lesen und der energiesparenden Archivierungsdatenspeicherung in DNA-Form hat wenig erforschte Möglichkeiten für den präzisen Abruf von Datendateien aus riesigen (1021 Byte-, Zetta-Skala)-Datenbanken“, sagt Church, der nicht an der Studie beteiligt war. „Die neue Studie geht dies auf spektakuläre Weise an, indem sie eine völlig unabhängige äußere Schicht der DNA verwendet und verschiedene Eigenschaften der DNA (Hybridisierung statt Sequenzierung) nutzt und darüber hinaus vorhandene Instrumente und Chemie verwendet.“

Bathe stellt sich vor, dass diese Art der DNA-Verkapselung nützlich sein könnte, um „kalte“ Daten zu speichern, dh Daten, die in einem Archiv aufbewahrt werden und auf die nicht sehr oft zugegriffen wird. Sein Labor entwickelt ein Startup namens Cache DNA, das derzeit Technologien für die Langzeitspeicherung von DNA entwickelt, sowohl für die langfristige Speicherung von DNA-Daten als auch für klinische und andere bereits vorhandene DNA-Proben in naher Zukunft.

„Obwohl es eine Weile dauern kann, bis DNA als Datenspeichermedium brauchbar ist, besteht bereits heute ein dringender Bedarf an kostengünstigen, massiven Speicherlösungen für bereits vorhandene DNA- und RNA-Proben aus Covid-19-Tests, humaner Genomsequenzierung und anderen.“ Bereiche der Genomik“, sagt Bathe.

Referenz: „Random access DNA memory using Boolean search in an archival file storage system“ von James L. Banal, Tyson R. Shepherd, Joseph Berleant, Hellen Huang, Miguel Reyes, Cheri M. Ackerman, Paul C. Blainey und Mark Bathe, 10. Juni 2021, Nature Materials.
DOI: 10.1038/s41563-021-01021-3

Die Forschung wurde vom Office of Naval Research, der National Science Foundation und dem US Army Research Office finanziert.

- Werbung -

Mehr vom Autor

- EXKLUSIVER INHALT -spot_img
- Werbung -
- Werbung -
- Werbung -spot_img
- Werbung -

Muss lesen

Neueste Artikel

- Werbung -