11.1 C
Bruselas
Sábado, abril 27, 2024
NoticiasAlmacenamiento de datos de ADN de alta capacidad: ¿podrían almacenarse todas sus fotos digitales...

Almacenamiento de datos de ADN de alta capacidad: ¿Se pueden almacenar todas sus fotos digitales como ADN?

EXENCIÓN DE RESPONSABILIDAD: Las informaciones y opiniones reproducidas en los artículos son propias de quienes las expresan y es de su exclusiva responsabilidad. Publicación en The European Times no significa automáticamente la aprobación de la opinión, sino el derecho a expresarla.

DESCARGO DE RESPONSABILIDAD TRADUCCIONES: Todos los artículos de este sitio se publican en inglés. Las versiones traducidas se realizan a través de un proceso automatizado conocido como traducción neuronal. En caso de duda, consulte siempre el artículo original. Gracias por entender.

Almacenamiento de datos de ADN

Ingenieros biológicos del MIT han demostrado una forma de recuperar fácilmente archivos de datos almacenados como ADN. Este podría ser un paso hacia el uso de archivos de ADN para almacenar enormes cantidades de fotos, imágenes y otro contenido digital. Crédito: Imagen: MIT News. Pequeños iconos cortesía de los investigadores.

Una técnica para etiquetar y recuperar archivos de datos de ADN de un gran grupo podría ayudar a que el almacenamiento de datos de ADN sea factible.

En la Tierra en este momento, hay alrededor de 10 billones de gigabytes de datos digitales, y todos los días, los humanos producen correos electrónicos, fotos, tweets y otros archivos digitales que suman otros 2.5 millones de gigabytes de datos. Gran parte de estos datos se almacenan en enormes instalaciones conocidas como centros de datos de exabytes (un exabyte equivale a mil millones de gigabytes), que pueden tener el tamaño de varios campos de fútbol y su construcción y mantenimiento cuestan alrededor de mil millones de dólares.

Muchos científicos creen que una solución alternativa radica en la molécula que contiene nuestra información genética: el ADN, que evolucionó para almacenar cantidades masivas de información a muy alta densidad. Una taza de café llena de ADN teóricamente podría almacenar todos los datos del mundo, dice Mark Bathe, profesor de ingeniería biológica del MIT.

“Necesitamos nuevas soluciones para almacenar estas enormes cantidades de datos que el mundo está acumulando, especialmente los datos de archivo”, dice Bathe, quien también es miembro asociado del Broad Institute of MIT y Harvard. “El ADN es mil veces más denso que incluso la memoria flash, y otra propiedad que es interesante es que una vez que se produce el polímero de ADN, no consume energía. Puedes escribir el ADN y luego almacenarlo para siempre ".

Foto de archivos de ADN

Una foto de los “archivos” de ADN. Cada esfera de sílice contiene secuencias de ADN que codifican una imagen en particular, y el exterior de la esfera está cubierto con códigos de barras de nucleótidos que describen el contenido de la imagen. Crédito: Cortesía de los investigadores.

Los científicos ya han demostrado que pueden codificar imágenes y páginas de texto como ADN. Sin embargo, también se necesitará una manera fácil de seleccionar el archivo deseado de una mezcla de muchos fragmentos de ADN. Bathe y sus colegas ahora han demostrado una forma de hacerlo, encapsulando cada archivo de datos en una partícula de sílice de 6 micrómetros, que está etiquetada con secuencias cortas de ADN que revelan el contenido.

Con este enfoque, los investigadores demostraron que podían extraer con precisión imágenes individuales almacenadas como secuencias de ADN de un conjunto de 20 imágenes. Dada la cantidad de posibles etiquetas que podrían usarse, este enfoque podría escalar hasta 1020 archivos.

Bathe es el autor principal del estudio, que aparece hoy en Nature Materials. Los autores principales del artículo son el postdoctorado senior del MIT James Banal, el ex investigador asociado del MIT Tyson Shepherd y el estudiante graduado del MIT Joseph Berleant.

Almacenamiento estable

Los sistemas de almacenamiento digital codifican texto, fotos o cualquier otro tipo de información como una serie de 0 y 1. Esta misma información se puede codificar en el ADN usando los cuatro nucleótidos que componen el código genético: A, T, G y C. Por ejemplo, G y C podrían usarse para representar 0 mientras que A y T representan 1.

El ADN tiene varias otras características que lo hacen deseable como medio de almacenamiento: es extremadamente estable y es bastante fácil (pero costoso) de sintetizar y secuenciar. Además, debido a su alta densidad (cada nucleótido, equivalente a hasta dos bits, tiene aproximadamente 1 nanómetro cúbico), un exabyte de datos almacenados como ADN podría caber en la palma de su mano.

Imágenes almacenadas en el ADN

Los investigadores almacenaron imágenes como estas, en la foto, en el ADN. Crédito: Cortesía de los investigadores.

Un obstáculo para este tipo de almacenamiento de datos es el costo de sintetizar cantidades tan grandes de ADN. Actualmente costaría $ 1 billón escribir un petabyte de datos (1 millón de gigabytes). Para volverse competitivo con la cinta magnética, que a menudo se utiliza para almacenar datos de archivo, Bathe estima que el costo de la síntesis de ADN debería reducirse en aproximadamente seis órdenes de magnitud. Bathe dice que anticipa que eso sucederá dentro de una década o dos, similar a cómo el costo de almacenar información en unidades flash se ha reducido drásticamente en las últimas dos décadas.

Aparte del costo, el otro cuello de botella importante en el uso de ADN para almacenar datos es la dificultad para elegir el archivo que desea de todos los demás.

“Suponiendo que las tecnologías para escribir ADN lleguen a un punto en el que sea rentable escribir un exabyte o zettabyte de datos en el ADN, ¿entonces qué? Vas a tener un montón de ADN, que es un trillón de archivos, imágenes o películas y otras cosas, y necesitas encontrar la única imagen o película que estás buscando ”, dice Bathe. "Es como intentar encontrar una aguja en un pajar".

Actualmente, los archivos de ADN se recuperan convencionalmente mediante PCR (reacción en cadena de la polimerasa). Cada archivo de datos de ADN incluye una secuencia que se une a un cebador de PCR en particular. Para extraer un archivo específico, ese cebador se agrega a la muestra para encontrar y amplificar la secuencia deseada. Sin embargo, un inconveniente de este enfoque es que puede haber diafonía entre el cebador y las secuencias de ADN fuera del objetivo, lo que lleva a que se extraigan archivos no deseados. Además, el proceso de recuperación por PCR requiere enzimas y termina consumiendo la mayor parte del ADN que estaba en el grupo.

"Estás quemando el pajar para encontrar la aguja, porque el resto del ADN no se amplifica y básicamente lo estás tirando", dice Bathe.

Recuperación de archivos

Como enfoque alternativo, el equipo del MIT desarrolló una nueva técnica de recuperación que implica encapsular cada archivo de ADN en una pequeña partícula de sílice. Cada cápsula está etiquetada con “códigos de barras” de ADN monocatenario que corresponden al contenido del archivo. Para demostrar este enfoque de manera rentable, los investigadores codificaron 20 imágenes diferentes en trozos de ADN de aproximadamente 3,000 nucleótidos de longitud, lo que equivale a unos 100 bytes. (También demostraron que las cápsulas podían caber en archivos de ADN de hasta un gigabyte de tamaño).

Cada archivo estaba etiquetado con códigos de barras correspondientes a etiquetas como "gato" o "avión". Cuando los investigadores quieren extraer una imagen específica, extraen una muestra del ADN y agregan cebadores que corresponden a las etiquetas que están buscando, por ejemplo, "gato", "naranja" y "salvaje" para una imagen. de un tigre, o "gato", "naranja" y "doméstico" para un gato doméstico.

Los cebadores están etiquetados con partículas fluorescentes o magnéticas, lo que facilita la extracción e identificación de las coincidencias de la muestra. Esto permite eliminar el archivo deseado y dejar intacto el resto del ADN para volver a almacenarlo. Su proceso de recuperación permite declaraciones de lógica booleana como "presidente Y 18th siglo” para generar George Washington como resultado, similar a lo que se recupera con una imagen de Google Buscar.

“En el estado actual de nuestra prueba de concepto, estamos en la tasa de búsqueda de 1 kilobyte por segundo. La tasa de búsqueda de nuestro sistema de archivos está determinada por el tamaño de los datos por cápsula, que actualmente está limitado por el costo prohibitivo de escribir incluso 100 megabytes de datos en el ADN, y la cantidad de clasificadores que podemos usar en paralelo. Si la síntesis de ADN se vuelve lo suficientemente barata, podríamos maximizar el tamaño de los datos que podemos almacenar por archivo con nuestro enfoque ”, dice Banal.

Para sus códigos de barras, los investigadores utilizaron secuencias de ADN monocatenario de una biblioteca de 100,000 secuencias, cada una de unos 25 nucleótidos de largo, desarrollada por Stephen Elledge, profesor de genética y medicina en la Escuela de Medicina de Harvard. Si coloca dos de estas etiquetas en cada archivo, puede etiquetar de forma única 1010 (10 mil millones) de archivos diferentes, y con cuatro etiquetas en cada uno, puede etiquetar 1020 archivos.

George Church, profesor de genética en la Facultad de Medicina de Harvard, describe la técnica como "un gran paso para la gestión del conocimiento y la tecnología de búsqueda".

“El rápido progreso en la escritura, copia, lectura y almacenamiento de datos de archivo de baja energía en forma de ADN ha dejado oportunidades poco exploradas para la recuperación precisa de archivos de datos de enormes (1021 bytes, escala zetta) ”, dice Church, que no participó en el estudio. "El nuevo estudio aborda esto de manera espectacular utilizando una capa externa de ADN completamente independiente y aprovechando diferentes propiedades del ADN (hibridación en lugar de secuenciación) y, además, utilizando instrumentos y químicas existentes".

Bathe prevé que este tipo de encapsulación de ADN podría ser útil para almacenar datos “fríos”, es decir, datos que se guardan en un archivo y no se accede a ellos con mucha frecuencia. Su laboratorio está desarrollando una startup, Cache DNA, que ahora está desarrollando tecnología para el almacenamiento de ADN a largo plazo, tanto para el almacenamiento de datos de ADN a largo plazo, como para muestras clínicas y otras muestras de ADN preexistentes a corto plazo.

“Si bien puede pasar un tiempo antes de que el ADN sea viable como medio de almacenamiento de datos, hoy en día ya existe una necesidad urgente de soluciones de almacenamiento masivo y de bajo costo para muestras preexistentes de ADN y ARN de pruebas Covid-19, secuenciación genómica humana y áreas de la genómica ”, dice Bathe.

Referencia: "Acceso aleatorio a la memoria de ADN mediante la búsqueda booleana en un sistema de almacenamiento de archivos" por James L. Banal, Tyson R. Shepherd, Joseph Berleant, Hellen Huang, Miguel Reyes, Cheri M. Ackerman, Paul C. Blainey y Mark Bathe, 10 junio 2021, Nature Materials.
DOI: 10.1038/s41563-021-01021-3

La investigación fue financiada por la Oficina de Investigación Naval, la Fundación Nacional de Ciencias y la Oficina de Investigación del Ejército de EE. UU.

- Publicidad -

Más del autor

- CONTENIDO EXCLUSIVO -punto_img
- Publicidad -
- Publicidad -
- Publicidad -punto_img
- Publicidad -

Debe leer

Últimos artículos

- Publicidad -