LINUX.ORG.RU
ФорумTalks

900 терабайт на 1 г бактерий


0

1

Осторожно, Habr

Группа исследователей из Китайского университета Гонконга нашла способ шифрования и хранения данных в бактериях. В 1 г живого материала помещается примерно 900 ТБ информации. Проект называется Bioencryption (см. презентацию), и создан он был для международного конкурса iGEM-2010 (International Genetically Engineered Machine).

Шифрование осуществляется методом перемешивания ДНК (DNA shuffle). Считывание информации из бактерий подтверждается контрольной суммой.

Для хранения данных, как и можно было предположить, используется четверичная система счисления, по количеству нуклеотидов (0 = A, 1 = T, 2 = C, 3 = G).

Текст переводится в цифры по таблице ASCII (i = 105; G = 71; E = 69; M = 77), затем в четверичную систему (105 → 1221; 71 → 0113; 69 → 0111; 71 → 0131), а потом в цепочку нуклеотидов.

iGem → 1221011301110131 → ATCTATTGATTTATGT

Затем информацию пропускают через алгоритм компрессии, чтобы не тратить впустую нуклеотиды.

Для шифрования и хранения данные разбиваются на блоки по 1 КБ (столько помещается в одну клетку бактерии) и создаётся 4-уровневая структура адресации, с заголовком и футером для каждого фрагмента.

Для хранения используются организмы E.coli DH5 α. Учёные синтезируют ДНК с необходимой последовательностью нуклеотидов и внедряют её в клетки бактерий. В 1 грамме бактерий содержится примерно 10 миллионов клеток, так что информация может быть продублирована сотни тысяч раз естественным методом (путём деления клеток).

Заметим, что синтез ДНК до сих пор остаётся дорогим удовольствием (примерно $0,29 за базовую пару), и оборудование для этого нужно очень дорогое.

По информационной ёмкости 1 грамм бактерий равен примерно 900 ТБ. Учёные считают, что созданная ими информационная система может использоваться для хранения мультимедийных файлов: фотографий, музыки, кинофильмов. Они предупреждают только, что в синтетические бактерии лучше всего изначально вставлять штрихкоды, чтобы не перепутать их с биологическими организмами.

★★★★

> для хранения мультимедийных файлов: фотографий, музыки, кинофильмов.

То есть для противозаконной деятельности, конечно же.

Terrens
()
Ответ на: комментарий от isden

а, кажись понятно.

синтез ДНК до сих пор остаётся дорогим удовольствием (примерно $0,29 за базовую пару), и оборудование для этого нужно очень дорогое.


но это же ппц. к тому же одноразовый и медленный. и вопрос еще в считывании данных :)

isden ★★★★★
()
Ответ на: комментарий от isden

интересно, как они собираются записывать данные в каждую бактерию?

Сидит бабуля на рынке и кричит: "Травка от тараканов. Кому травку от тараканов?" Подходит к ней мужик и спрашивает:
- Что за травка? И, вообще, как ей пользоваться?
- Хорошая травка. Берёшь в руку пучок, подходишь к таракану и по морде его, по морде!
r_asian ★☆☆
()
Ответ на: комментарий от isden

>но это же ппц. к тому же одноразовый и медленный. и вопрос еще в считывании данных :)

Но верной дорогой идут, я думаю (сейчас это эдакий аналог перфокарт, я думаю). Если допилят — будет интересно.

drakmail ★★★★
() автор топика
Ответ на: комментарий от derlafff

«В твоём теле масса живых клеток, значит, ты можешь в них записывать информацию - ты должен платить за свои живые клетки или не пользоваться ими!»

Terrens
()
Ответ на: комментарий от Terrens

Вопрос какие их них мне не жалко для всяческих мутаций.

r_asian ★☆☆
()
Ответ на: комментарий от derlafff

чем после этого свои терабайты забивать будешь?!?! Он же запретит распространение порнухи.

irq
()

>по таблице ASCII

какая-то устаревшая технология - когда перейдут на юникод, можно будет обсуждать.

bender ★★★★★
()
Ответ на: комментарий от isden

>интересно, как они собираются записывать данные в каждую бактерию?

Это не так интересно, как то, как они потом записанное собираются читать :)

KRoN73 ★★★★★
()

Когда уже можно будет копировать терабайты филь...информации через рукопожатия?

record ★★★★★
()
Ответ на: комментарий от KRoN73

секвенирование геномов процедура вполне себе отлаженная. Тем более, насколько я понял, каждый фрагмени снабжается меткой, характеризующей его положение. Вот только скорость чтения маловата, да. Но бэкапы делать можно.

silw ★★★★★
()
Ответ на: комментарий от silw

представляю объяснение : «мы потеряли все бэкапы потому что кто-то забыл налить в банку с бактериями питательный раствор»

PakMaH
()
Ответ на: комментарий от PakMaH

станцию непрерывной подачи сделать ничего не стоит. А вообще на одной порции агара они и так могут жить черти сколько, если численность регулировать.

silw ★★★★★
()

Вот теперь и появятся настоящие компьютерные _вирусы_.

З.Ы. А бактерии могут тупо сдохнуть? Тогда всю инфу потеряешь.

Pavval ★★★★★
()

Я сохранил с свою коллекцию порнографии, получилась чума и убила весь город

vertexua ★★★★★
()
Ответ на: комментарий от isden

> вопрос еще в считывании данных :)
Считывание элементарное. Человек заражается этой бактерией. Человек смотрит фильм, или слушает музыку. Потом таблеточку антибиотика и сеанс окончен.

Lumi ★★★★★
()

Не, вот кто-нибудь сделает подделку со штаммом O157:H7, или сами копирасты будут его юзать:

Энтерогеморрагический штамм бактерии Escherichia coli и частая причина пищевых отравлений.

По оценкам, каждый год происходит около 73 тыс. случаев заражений этой инфекцией и 61 смертей только в США, хотя такие отравления более часты в менее развитых странах. Инфекция часто приводит к кровавой диарее и иногда к почечной недостаточности. Большинство случаев болезни связаны с недожаренной или неправильно приготовленой пищей, особенно загрязненной говядиной, хотя болезнь также передается от человека к человеку при контакте, особенно из-за использования той же посуды, из-за потребления непастеризованного молока или зараженной воды.
...
Чаще всего повышенная или нормальная температура. Инфекция проявляется в виде гемморагического поноса (возможен и обычный), приступобразными острыми резями в животе.

zloy_buratino
()

Смотри какой я себе фонарик ультрафиолетовый купил, прикольный! Ишь как светит? А чего это ты в лице изменился? Что, там бекапы были?

MageasteR ★★★★★
()

Интересно как быть:

1) с вирусами
2) гомологичной и не очень рекомбинацией
3) внезапным подыханием бактерий

ps А представляете нелегальное копирование пересевом на чашку Петри? А реверсинженеринг?

DNA_Seq ★★☆☆☆
()
Ответ на: комментарий от silw

Но бэкапы делать можно.

Зачем? Они же сами делаются! Главное подкармливать колонию бактерий и отсаживать «бэкапы» в отдельные пробирки =).

Deleted
()
Ответ на: комментарий от drakmail

>[Здесь могла бы быть шутка про Михалкова]

Плывут значит сперматозоиды клином, плывут-плывут а на встречу им что-то округлое

- Привет, Яйцеклетка! - дружно орут сперматозоиды
- Я вообще-то Кишечная Палочка :-[ - смущается она

DNA_Seq ★★☆☆☆
()
Ответ на: комментарий от melkor217

>Бактерии сдохнут через пару часов - и вот вам 900 терабайт.

На шачке Петри бактерии спокойно хранятся пару месяцев, в толще агара - более года, в жидком азоте - практически вечно (вот только разумеется не все)

DNA_Seq ★★☆☆☆
()
Ответ на: комментарий от zloy_buratino

>Энтерогеморрагический штамм бактерии Escherichia coli

Его раньше отдельным видно считали (Shigella dysenteriae) пока не проанализировали геном.

DNA_Seq ★★☆☆☆
()
Ответ на: комментарий от melkor217

Делаем отказоустойчивый бактериологический RAID-массив.

YAR ★★★★★
()
Ответ на: комментарий от drakmail

>Или на все ввозимые бактерии :)

вывозить бактерии уже сейчас запрещено, разве что в себе

DNA_Seq ★★☆☆☆
()

> в синтетические бактерии лучше всего изначально вставлять штрихкоды

Ага, прямо на лоб им приклеивать.

one_more_hokum ★★★
()

А вообще килобайт на бактерию это очень мало. Размер хромосомы большинства бактерий - около 5 млн пар нуклеотидов, то есть примерно 10 мегабайт. Плюс к этому может быть несколько десятков плазмид до 200 тысяч пар нуклеотидов, то есть метр-два на клетку нормальный должен умещаться с учетом служебной информации. Но синтез днк и тем более перенос ее в клетку сложный и трудоемкий процесс. Тут надо что-то более высокоуровневое всякие мобильные генетические элементы. Допустим иммунная система собирается комбинацей сравнительно стандартных запчастей, у бактерий вот сравнительно недавно обнаружили повторы по функциональности напоминающие компьютерный антивирус с базой сигнатур - http://en.wikipedia.org/wiki/CRISPR, вот в этих повторах можно было-бы что-то разместить а вносить информацию теми же фагами. Проблема лишь в том как потом прочитать, секвенирование тоже сейчас хоть и отлаженная рутинная технология но аппараты стоят шестизначные суммы в баксах

DNA_Seq ★★☆☆☆
()
Ответ на: комментарий от DNA_Seq

> На шачке Петри бактерии спокойно хранятся пару месяцев, в толще агара - более года, в жидком азоте - практически вечно (вот только разумеется не все)

Всё-таки тяжело будет все бактерии обработать. Лучше действительно рейд-массив сделать.

melkor217 ★★★★★
()
Ответ на: комментарий от melkor217

На данный момент - невозможно практически. Действительно интересно было бы если их научили бы извлекать инфу самостоятельно (мерцанием например)

DNA_Seq ★★☆☆☆
()
Ответ на: комментарий от DNA_Seq

Сейчас разрабатывается куча альтернативных сравнительно дешёвых технологий секвенирования ДНК. Например, если пропустить ДНК в нанодырку в листе графена, разделяющего два резервуара с водой, по которому течёт электрический ток, то по мере протягивания ДНК будет изменяться электрическое сопротивление этого листа.

anonymfus ★★★★
()
Ответ на: комментарий от anonymfus

Ну вообще пиросиквенирование становится мейнстримом но это все равно дорого. Я же говорю - научить бактерию секвенировать себя гораздо интереснее, тот же GFP белок по сути переставляет собой дырку посередине которой расположен пигмент. Соблазнительно было бы заставить пигмент менять цвет в зависимости от проходящего рядом основания. А уж мембран в клетке хоть в рулоны заворачивай. Но увы до разумного дизайна белков еще ооочень далеко

DNA_Seq ★★☆☆☆
()
Ответ на: комментарий от zloy_buratino

Токсины бактерий по большей части сидят в плазмидах а плазмиды носятся между клетками как угорелые. Тот же безобидный Bacillus cereus линковкой пары «модулей» превращается в сибирскую язву - B. anthracis

DNA_Seq ★★☆☆☆
()

Интересная тема. На харды на бактериях - это что-то новенькое )

информация может быть продублирована сотни тысяч раз естественным методом (путём деления клеток).


Рэйдокапец.

Siado ★★★★★
()
Ответ на: комментарий от bender

>какая-то устаревшая технология - когда перейдут на юникод, можно будет обсуждать.

Плюсую. Запарили уже со своим ASCII

Siado ★★★★★
()
Ответ на: комментарий от Zhbert

>Представил винчестер будущего - стоит ведро, в него воткнут шнурок..

В ведре хватит на огромный датацентр.

Вопрос: а зачем бактерии и почему ДНК? Разве нет контейнеров поудобнее?

jcd ★★★★★
()

И вообще, это направление исследований ведёт нас к био-юсб-порту на заднице.

jcd ★★★★★
()

> информация может быть продублирована сотни тысяч раз естественным методом (путём деления клеток).

Теперь копирасты запретят деление клеток

cvs-255 ★★★★★
()
Ответ на: комментарий от DNA_Seq

> А вообще килобайт на бактерию это очень мало.

Потому что кодировать можно только в «простаивающие» участки ДНК. А таких у бактерий очень мало

cvs-255 ★★★★★
()
Ответ на: комментарий от DNA_Seq

еще интересно, как определять, как упорядочены бактерии. Они же все вместе должны храниться. иначе профита никакого.

cvs-255 ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.