WERBUNG

DNA als Medium zur Speicherung riesiger Computerdaten: sehr bald Realität?

Eine bahnbrechende Studie ist ein bedeutender Schritt vorwärts bei der Entwicklung eines DNA-basierten Speichersystems für digitale Daten.

Digital technische Daten wächst heute exponentiell aufgrund unserer Abhängigkeit von Gadgets und erfordert eine robuste Langzeitspeicherung. Die Datenspeicherung wird langsam zu einer Herausforderung, da die aktuelle digitale Technologie keine Lösung bieten kann. Ein Beispiel ist, dass in den letzten zwei Jahren mehr digitale Daten erstellt wurden als in der gesamten Geschichte der Computer, tatsächlich werden 2.5 Trillionen Byte {1 Trillion Byte = 2,500,000 Terabyte (TB) = 2,500,000,000 Gigabyte (GB)} an Daten erstellt jeden Tag auf der Welt. Dazu gehören Daten zu sozialen Netzwerken, Online-Banking-Transaktionen, Aufzeichnungen von Unternehmen und Organisationen, Daten von Satelliten, Überwachung, Forschung, Entwicklung usw. Diese Daten sind riesig und unstrukturiert. Daher ist es jetzt eine große Herausforderung, die enormen Speicheranforderungen für Daten und ihr exponentielles Wachstum zu bewältigen, insbesondere für Organisationen und Unternehmen, die eine robuste Langzeitspeicherung benötigen.

Die derzeit verfügbaren Optionen sind Festplatte, optische Disks (CDs), Speichersticks, Flash-Laufwerke und das fortschrittlichere Bandlaufwerk oder optische Blu-Ray-Discs, die ungefähr bis zu 10 Terabyte (TB) an Daten speichern. Obwohl solche Speichervorrichtungen allgemein verwendet werden, haben sie viele Nachteile. Zum einen haben sie eine geringe bis mittlere Lagerfähigkeit und sie müssen unter idealen Temperatur- und Feuchtigkeitsbedingungen gelagert werden, um viele Jahrzehnte überdauern zu können und erfordern daher speziell konzipierte physische Lagerräume. Fast alle verbrauchen viel Strom, sind sperrig und unpraktisch und können bei einem einfachen Sturz beschädigt werden. Einige davon sind sehr teuer, oft von Datenfehlern geplagt und damit nicht robust genug. Eine von Unternehmen allgemein akzeptierte Option heißt Cloud Computing – eine Vereinbarung, bei der ein Unternehmen im Wesentlichen einen „externen“ Server für die Abwicklung aller seiner IT- und Datenspeicheranforderungen, die sogenannte „Cloud“, anmietet. Einer der Hauptnachteile von Cloud Computing sind Sicherheits- und Datenschutzprobleme sowie die Anfälligkeit für Hackerangriffe. Hinzu kommen andere Probleme wie hohe Kosten, eingeschränkte Kontrolle durch die Mutterorganisation und Plattformabhängigkeit. Cloud Computing wird nach wie vor als gute Alternative für die Langzeitspeicherung angesehen. Es sieht jedoch so aus, als ob die weltweit generierten digitalen Informationen unsere Fähigkeit, sie zu speichern, sicherlich überholen, und es werden noch robustere Lösungen benötigt, um dieser Datenflut gerecht zu werden und gleichzeitig Skalierbarkeit zu bieten, um auch zukünftige Speicheranforderungen zu berücksichtigen.

Kann DNA bei der Computerspeicherung helfen?

Unsere DNA (Desoxyribonukleinsäure) wird als spannendes alternatives Medium für die digitale Datenspeicherung betrachtet. DNA ist das selbstreplizierende Material, das in fast allen lebenden Organismen vorhanden ist und unsere genetische Information ausmacht. Ein künstliches oder synthetisches DNA ist ein haltbares Material, das unter Verwendung kommerziell erhältlicher Oligonukleotid-Synthesemaschinen hergestellt werden kann. Der Hauptvorteil von DNA ist ihre Langlebigkeit, da eine DNA 1000-mal länger hält als Silizium (Silizium-Chip – das Material, das zum Bauen verwendet wird). Computer). Erstaunlicherweise nur ein einziger Kubikmillimeter DNA kann eine Trillion von Bytes an Daten aufnehmen! DNA ist auch ein ultrakompaktes Material, das sich nie zersetzt und Hunderte von Jahrhunderten an einem kühlen, trockenen Ort aufbewahrt werden kann. Die Idee, DNA zur Speicherung zu verwenden, gibt es schon seit langem, bis ins Jahr 1994 zurück. Der Hauptgrund ist die ähnliche Art und Weise, in der Informationen in einem Computer und in unserer DNA gespeichert werden – da beide die Blaupausen der Informationen speichern. Ein Computer speichert alle Daten als Nullen und Einsen und die DNA speichert alle Daten eines lebenden Organismus mit den vier Basen – Thymin (T), Guanin (G), Adenin (A) und Cytosin (C). Daher könnte DNA wie ein Computer als Standardspeichergerät bezeichnet werden, wenn diese Basen als 0en (Basen A und C) und 1s (Basen T und G) dargestellt werden können. DNA ist robust und langlebig. Die einfachste Überlegung ist, dass unser genetischer Code – der Bauplan all unserer in der DNA gespeicherten Informationen – effizient und wiederholt von einer Generation zur nächsten weitergegeben wird. Alle Software- und Hardware-Giganten sind daran interessiert, synthetische DNA zum Speichern großer Mengen zu verwenden, um ihr Ziel zu erreichen, die langfristige Archivierung von Daten zu lösen. Die Idee besteht darin, zuerst die Computercodes 0 und 1 in den DNA-Code (A, C, T, G) umzuwandeln, der umgewandelte DNA-Code wird dann verwendet, um synthetische DNA-Stränge herzustellen, die dann in ein Kühllager gebracht werden können. Wann immer erforderlich, können DNA-Stränge aus dem Kühllager entnommen und ihre Informationen mit einer DNA-Sequenziermaschine entschlüsselt werden, und die DNA-Sequenz wird schließlich zurück in das binäre Computerformat von 0 und 1 übersetzt, um auf dem Computer gelesen zu werden.

Es wurde gezeigt1 dass nur wenige Gramm DNA Trillionen Byte an Daten speichern und bis zu 2000 Jahre intakt halten können. Dieses einfache Verständnis stand jedoch vor einigen Herausforderungen. Erstens ist es ziemlich teuer und auch schmerzhaft langsam, Daten in die DNA zu schreiben, dh die eigentliche Umwandlung von 0 und 1 in die DNA-Basen (A, T, C, G). Zweitens, sobald die Daten auf die DNA „geschrieben“ sind, ist es schwierig, Dateien zu finden und abzurufen, und erfordert eine Technik namens DNA-Sequenzierung – ein Verfahren zur Bestimmung der genauen Reihenfolge der Basen innerhalb eines DNA-Moleküls – wonach die Daten wieder dekodiert werden 0s und 1s.

Eine neuere Studie2 von Wissenschaftlern von Microsoft Research und der University of Washington haben einen „random access“ auf die DNA-Speicherung erreicht. Der Aspekt „Random Access“ ist sehr wichtig, denn er bedeutet, dass Informationen an oder von Orten (in der Regel ein Speicher) übertragen werden können, an denen jeder Ort, egal wo in der Reihenfolge und direkt zugegriffen werden kann. Mit dieser Technik des Direktzugriffs können Dateien im Vergleich zu früher selektiv aus dem DNA-Speicher abgerufen werden, wenn ein solcher Abruf die Sequenzierung und Dekodierung eines gesamten DNA-Datensatzes erforderte, um die wenigen gewünschten Dateien zu finden und zu extrahieren. Die Bedeutung des „random access“ wird mit zunehmender Datenmenge weiter erhöht und wird enorm, da dies die Anzahl der erforderlichen Sequenzierungen verringert. Es ist das erste Mal, dass der Direktzugriff in einem so großen Maßstab gezeigt wurde. Die Forscher haben auch einen Algorithmus entwickelt, um Daten effizienter zu decodieren und wiederherzustellen, mit mehr Toleranz gegenüber Datenfehlern, wodurch das Sequenzierungsverfahren auch schneller wird. Mehr als 13 Millionen synthetische DNA-Oligonukleotide wurden in dieser Studie kodiert, bei der es sich um Daten mit einer Größe von 200 MB handelte, die aus 35 Dateien (mit Video, Audio, Bildern und Text) mit einer Größe von 29 KB bis 44 MB bestanden. Diese Dateien wurden einzeln ohne Fehler abgerufen. Außerdem haben die Autoren neue Algorithmen entwickelt, die beim Schreiben und Lesen der DNA-Sequenzen robuster und fehlertoleranter sind. Diese Studie veröffentlicht in Nature Biotechnology in einem bedeutenden Fortschritt, der ein praktikables, groß angelegtes System für die DNA-Speicherung und -Wiedergewinnung zeigt.

Das DNA-Speichersystem sieht sehr ansprechend aus, da es eine hohe Datendichte, hohe Stabilität und einfache Speicherung aufweist, aber es hat offensichtlich viele Herausforderungen, bevor es universell eingesetzt werden kann. Wenige Faktoren sind die zeit- und arbeitsintensive Entschlüsselung der DNA (die Sequenzierung) sowie die Synthese der DNA. Die Technik erfordert mehr Genauigkeit und eine breitere Abdeckung. Obwohl in diesem Bereich Fortschritte erzielt wurden, entwickelt sich das genaue Format, in dem Daten langfristig als DNA gespeichert werden, noch weiter. Microsoft hat sich geschworen, die Produktion synthetischer DNA zu verbessern und die Herausforderungen anzugehen, um eine voll funktionsfähige DNA Speichersystem bis 2020.

***

{Sie können das ursprüngliche Forschungspapier lesen, indem Sie auf den unten angegebenen DOI-Link in der Liste der zitierten Quellen klicken}

Quelle (n)

1. Erlich Y und Zielinski D 2017. DNA Fountain ermöglicht eine robuste und effiziente Speicherarchitektur. Wissenschaft. 355(6328). https://doi.org/10.1126/science.aaj2038

2. Organick L et al. 2018. Random Access in groß angelegten DNA-Datenspeichern. Natur Biotechnologie. 36. https://doi.org/10.1038/nbt.4079

SCIEU-Team
SCIEU-Teamhttps://www.ScientificEuropean.co.uk
Scientific European® | SCIEU.com | Bedeutende Fortschritte in der Wissenschaft. Auswirkungen auf die Menschheit. Inspirierende Köpfe.

Abonnieren Sie unseren Newsletter

Aktualisierung mit den neuesten Nachrichten, Angeboten und Sonderankündigungen.

Beliebteste Artikel

Voyager 2: Die vollständige Kommunikation wurde wiederhergestellt und unterbrochen  

Im Missionsupdate der NASA vom 05. August 2023 heißt es, Voyager...

Scientific European verbindet allgemeine Leser mit der ursprünglichen Forschung

Scientific European veröffentlicht bedeutende Fortschritte in der Wissenschaft, Neuigkeiten aus der Forschung, ...

Hilft regelmäßiges Frühstück beim Essen wirklich, das Körpergewicht zu reduzieren?

Eine Überprüfung früherer Studien zeigt, dass das Essen oder...
- Werbung -
94,669FansLike
47,715FollowerFolgen Sie uns
1,772FollowerFolgen Sie uns
30AbonnentenAbonnieren