Янив Эрлив из Колумбийского университета и Дина Зелински из Нью-Йоркского центра генома представили методику “DNA Fountain”, которая позволяет архивировать большие объемы данных в ДНК. В рамках соответствующего исследования ученые успешно сохранили и извлекли из цепочек макромолекулы 6 крупных файлов, включая операционную систему KolibriOS, французский фильм 1985 года – “Прибытие поезда на вокзал Ла-Сьота”, компьютерный вирус, исследование Клода Шеннона в области теории информации за 1948 год и другие образчики. Но это не предел: по утверждениям исследователей, их алгоритм способен записать до 215 петабайт в одном грамме ДНК без существенных потерь информации.
Ключевое отличие методики “DNA Fountain” от предыдущих разработок – среднее количество информации, которое удается записать в одном нуклеотиде. Теоретически туда можно поместить две цифры, однако с учетом данных необходимых для сбора и записи информации эта емкость снижается до 1,8 бит. При условии этого “потолка”, команде Эрлива и Зелински удалось разместить в среднем 1,6 бит в нуклеотиде, что на 60% больше чем результат ближайших предшественников – группы Черча-Косури, которая в 2012 году достигла результата в 1,28 Пб/г ДНК.
В процессе эксперимента ученые собрали все файлы-образцы в один, после чего поделили полученный массив данных на короткие строки двоичного кода. Далее, используя свой алгоритм, они случайным образом упаковали строки в блоки (каждый с соответствующей меткой) и конвертировали пары 00, 01, 10, 11 в нуклеотидные основания: аденин (А), цитозин (С), гуанин (G) и тимин (Т). Полученные в результате этих манипуляция 72 000 цепочек ДНК исследователи отправили в Сан-Франциско коллегам из стартапа Twist .IOscience. Там цифровой массив конвертировали в биологический и спустя две недели отправили обратно пробирку с молекулами.
Далее, при помощи технологий секвенирования для чтения нитей ДНК и специального ПО для перевода генетического кода обратно в двоичный файл, исследователям удалось успешно восстановить и запустить заархивированные файлы. Правда, сколько времени занял этот процесс — в отчете не сообщается.
Основной проблемой массового применения технологии является ее стоимость. По утверждениям авторов эксперимента, архивация данных в ДНК на данном этапе исследования стоит около $3500/Мб. Тем не менее, группа Ярлива и Зелински видят, как минимум, два способа удешевления своего метода – за счет совершенствования химических процессов синтеза ДНК, а также использования их упрощенных вариаций, где ошибки будут компенсироваться за счет представленного ими алгоритма “DNA Fountain”.
Ранее AIN.UA сообщал об исследователях из университетов Джорджии в США и Бен-Гуриона в Израиле, которые создали самый маленький диод в мире из молекулы ДНК.