Секвенаторное-2
May. 4th, 2009 05:41 pm![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
Окончание. Начало - тут.
В предыдущей серии мы рассматривали вариант с получением "DNA fingerprints", т.е. нас не интересовал код как таковой, интересовали только индивидуальные различия, по которым можно идентифицировать носителя. Однако не во всех случаях этого достаточно даже для судебной медицины (см., например, историю с близнецами-алиментщиками). Тем более недостаточно этого для исследований типа полного скана генома человека.
Для непосредственного чтения последовательностей нуклеотидов в цепи ДНК в промышленных масштабах долгое время существовал один основной метод - секвенирование (от англ. sequence) по Сенгеру (более ранние и громоздкие мы рассматривать не будем, это уже чистая химия, которая за пределы исследовательских лабораторий практически не выходила).
Основа метода - та же ПЦР, которую мы рассматривали в прошлый раз, но чуть хитрее. На этот раз исходный материал (некоторое количество копий молекулы ДНК, которую хотим прочитать) мы разливаем по четырем пробиркам. В каждую их них мы добавляем стандартный набор реагентов для ПЦР: ДНК-полимеразу, которая будет достраивать цепочки, праймер, который пометит нам место, с которого мы хотим читать код, и стройматериалы - четыре типа нуклеотидов А, Г, Т, Ц (подкрасив их изотопами или еще как, чтобы лучше были видны потом на пластинке). Но дополнительно мы добавляем в каждую из пробирок по одному "бракованному" типу нуклеотидов.
Как вы помните, у каждого нуклеотида есть два "хвостика"-разъема: через один их них он цепляется к комплиментарному нуклеотиду в соседней спирали ДНК, создавая относительно слабую водородную связь, а через другой к нему цепляется следующий нуклеотид в цепочке:
Рост молекулы ДНК может идти только на этих самых "хвостиках" (т.н. 3'-группе), за которую другие нуклеотиды цепляются своим фосфатным крючком (5'-группой), образуя мощную фосфодиэфирную связь. Собственно, за счет этого и работают праймеры в ПЦР - после отжига они создают на цепи ДНК свободный 3'-хвостик, который служит затравкой роста.
Так вот, "бракованные" нуклеотиды для севенирования по Сенгеру не имеют 3' хвоста. Что в результате происходит при ПЦР? В первой пробирке наша ДНК начинает, как и положено, достраиваться от праймера с использованием плавающих вокруг нуклеотидов А=, Г=, Т=, Ц= и "бракованного" А, которого значительно меньше, чем правильного А=.
АТГЦ строчными буквами - это наш заранее синтезированный праймер, ТГЦ - уже достроенная часть, а знаки >>> - полимераза, которая в настоящий момент как раз собирается достроить комплимент к "букве" Т. Для этого ей нужен нуклеотид А. Поскольку раствор у нас хорошо перемешан, то ей может попасться как "нормальный" А, так и "бракованный" (хотя с меньшей вероятностью, т.к. мы добавили его меньше). Если попадется нормальный, то цепь продолжит строиться дальше, иначе - оборвется на "бракованном" А. Повторив цикл копирования в амплификаторе достаточное количество раз, мы в результате получим кучу цепочек, которые начинаются в одном и том же месте (на праймере), а обрываются в разных - но всегда там, где в анализируемой цепочке есть буква "А".
Например, если исходная цепочка у нас такая (я показываю сразу комплиментарную, начиная с праймера, чтобы не возиться с соответствиями, жирным - праймер и искомые "буквы"):
АТГТЦТГТАТЦТАГТЦАТЦТЦГАТЦТЦ...,
то в растворе у нас получатся такие ее неполные копии (штрихом я помечаю "бракованный" нуклеотид):
1. АТГТЦТГТА'
2. АТГТЦТГТАТЦТА'
3. АТГТЦТГТАТЦТАГТЦА'
4. АТГТЦТГТАТЦТАГТЦАТЦТЦГА'.
То же самое происходит в трех других пробирках, только там "бракованными" будут соответственно Т, Г, Ц.
Теперь помещаем то, что получилось, на гелевую пластинку, на четыре отдельные дорожки, и разгоняем с помощью электрофореза (см. предыдущий пост). Молекулы длиной 20 нуклеотидов проползут, допустим, 10 миллиметров, 21 нуклеотид - 9мм, 22 - 8 мм и т.д. (разумеется, реальные размеры и праймеров, и анализируемых кусков несколько больше, чем в моих примерах) .
В результате у нас все молекулы распределяются по длине, и получается пластинка, на которой полоски подкрашенных молекул занимают как раз те места от конца пластинки, которые соответствуют положению соответствующей буквы в цепочке. Действительно, кусок праймера у нас постоянен везде, его игнорируем. Молекула 1 из примера выше будет на 5 позиции от конца, 2 - на 9 и т.д.
По-моему, очень остроумно.
Выглядит все это примерно так:

При "промышленном" секвенировании ДНК, естественно, используется всяческая автоматизация. Вместо электрофореза на пластинках он проводится в капиллярах в специальных машинах-секвенаторах, куда заряжают сразу целый планшет с пробирками, подача растворов из пробирок в капилляры выполняется роботизированным манипулятором (как раз эту часть процесса обычно и показывают в CSI), считывание вспышек на выходе капилляра осуществляется камерами с немедленной передачей данных в компьютер, который выполняет их "склеивание". Кроме того, ПЦР может проводиться не в четырех пробирках, а в одной, просто разные нуклеотиды подкрашиваются разными цветами. Однако это уже технология, базовый принцип тот же.
Понятно, что в любом случае считываемый фрагмент не может быть очень уж длинным. Чтобы прочитать мало-мальски большой кусок - нужно много раз повторять процедуру для разных праймеров, для ускорения и распараллеливания процесса использовать могокапиллярные машины (сейчас применябтся в основном 4- и 16-капиллярные секвенаторы) и объединять их в целые фермы (как было сделано, в частности, для чтения полного генома человека). Но все равно - долго и дорого. В связи с этим недавно был придуман новый метод - пиросеквенирование, о котором постараюсь написать завтра.
В предыдущей серии мы рассматривали вариант с получением "DNA fingerprints", т.е. нас не интересовал код как таковой, интересовали только индивидуальные различия, по которым можно идентифицировать носителя. Однако не во всех случаях этого достаточно даже для судебной медицины (см., например, историю с близнецами-алиментщиками). Тем более недостаточно этого для исследований типа полного скана генома человека.
Для непосредственного чтения последовательностей нуклеотидов в цепи ДНК в промышленных масштабах долгое время существовал один основной метод - секвенирование (от англ. sequence) по Сенгеру (более ранние и громоздкие мы рассматривать не будем, это уже чистая химия, которая за пределы исследовательских лабораторий практически не выходила).
Основа метода - та же ПЦР, которую мы рассматривали в прошлый раз, но чуть хитрее. На этот раз исходный материал (некоторое количество копий молекулы ДНК, которую хотим прочитать) мы разливаем по четырем пробиркам. В каждую их них мы добавляем стандартный набор реагентов для ПЦР: ДНК-полимеразу, которая будет достраивать цепочки, праймер, который пометит нам место, с которого мы хотим читать код, и стройматериалы - четыре типа нуклеотидов А, Г, Т, Ц (подкрасив их изотопами или еще как, чтобы лучше были видны потом на пластинке). Но дополнительно мы добавляем в каждую из пробирок по одному "бракованному" типу нуклеотидов.
Как вы помните, у каждого нуклеотида есть два "хвостика"-разъема: через один их них он цепляется к комплиментарному нуклеотиду в соседней спирали ДНК, создавая относительно слабую водородную связь, а через другой к нему цепляется следующий нуклеотид в цепочке:
А=Т=Г=Ц= | | | | Т=А=Ц=Г=
Рост молекулы ДНК может идти только на этих самых "хвостиках" (т.н. 3'-группе), за которую другие нуклеотиды цепляются своим фосфатным крючком (5'-группой), образуя мощную фосфодиэфирную связь. Собственно, за счет этого и работают праймеры в ПЦР - после отжига они создают на цепи ДНК свободный 3'-хвостик, который служит затравкой роста.
Так вот, "бракованные" нуклеотиды для севенирования по Сенгеру не имеют 3' хвоста. Что в результате происходит при ПЦР? В первой пробирке наша ДНК начинает, как и положено, достраиваться от праймера с использованием плавающих вокруг нуклеотидов А=, Г=, Т=, Ц= и "бракованного" А, которого значительно меньше, чем правильного А=.
а=т=г=ц=Т=Г=Ц=>>> | | | | | | | ...=А=Т=Т=А=Ц=Г=А=Ц=Г=Т=T=T=Г=Ц
АТГЦ строчными буквами - это наш заранее синтезированный праймер, ТГЦ - уже достроенная часть, а знаки >>> - полимераза, которая в настоящий момент как раз собирается достроить комплимент к "букве" Т. Для этого ей нужен нуклеотид А. Поскольку раствор у нас хорошо перемешан, то ей может попасться как "нормальный" А, так и "бракованный" (хотя с меньшей вероятностью, т.к. мы добавили его меньше). Если попадется нормальный, то цепь продолжит строиться дальше, иначе - оборвется на "бракованном" А. Повторив цикл копирования в амплификаторе достаточное количество раз, мы в результате получим кучу цепочек, которые начинаются в одном и том же месте (на праймере), а обрываются в разных - но всегда там, где в анализируемой цепочке есть буква "А".
Например, если исходная цепочка у нас такая (я показываю сразу комплиментарную, начиная с праймера, чтобы не возиться с соответствиями, жирным - праймер и искомые "буквы"):
АТГТЦТГТАТЦТАГТЦАТЦТЦГАТЦТЦ...,
то в растворе у нас получатся такие ее неполные копии (штрихом я помечаю "бракованный" нуклеотид):
1. АТГТЦТГТА'
2. АТГТЦТГТАТЦТА'
3. АТГТЦТГТАТЦТАГТЦА'
4. АТГТЦТГТАТЦТАГТЦАТЦТЦГА'.
То же самое происходит в трех других пробирках, только там "бракованными" будут соответственно Т, Г, Ц.
Теперь помещаем то, что получилось, на гелевую пластинку, на четыре отдельные дорожки, и разгоняем с помощью электрофореза (см. предыдущий пост). Молекулы длиной 20 нуклеотидов проползут, допустим, 10 миллиметров, 21 нуклеотид - 9мм, 22 - 8 мм и т.д. (разумеется, реальные размеры и праймеров, и анализируемых кусков несколько больше, чем в моих примерах) .
В результате у нас все молекулы распределяются по длине, и получается пластинка, на которой полоски подкрашенных молекул занимают как раз те места от конца пластинки, которые соответствуют положению соответствующей буквы в цепочке. Действительно, кусок праймера у нас постоянен везде, его игнорируем. Молекула 1 из примера выше будет на 5 позиции от конца, 2 - на 9 и т.д.
По-моему, очень остроумно.
Выглядит все это примерно так:

При "промышленном" секвенировании ДНК, естественно, используется всяческая автоматизация. Вместо электрофореза на пластинках он проводится в капиллярах в специальных машинах-секвенаторах, куда заряжают сразу целый планшет с пробирками, подача растворов из пробирок в капилляры выполняется роботизированным манипулятором (как раз эту часть процесса обычно и показывают в CSI), считывание вспышек на выходе капилляра осуществляется камерами с немедленной передачей данных в компьютер, который выполняет их "склеивание". Кроме того, ПЦР может проводиться не в четырех пробирках, а в одной, просто разные нуклеотиды подкрашиваются разными цветами. Однако это уже технология, базовый принцип тот же.
Понятно, что в любом случае считываемый фрагмент не может быть очень уж длинным. Чтобы прочитать мало-мальски большой кусок - нужно много раз повторять процедуру для разных праймеров, для ускорения и распараллеливания процесса использовать могокапиллярные машины (сейчас применябтся в основном 4- и 16-капиллярные секвенаторы) и объединять их в целые фермы (как было сделано, в частности, для чтения полного генома человека). Но все равно - долго и дорого. В связи с этим недавно был придуман новый метод - пиросеквенирование, о котором постараюсь написать завтра.
Бог был философом, бог был математиком, бог был геометр
Date: 2009-05-04 07:11 pm (UTC)--
Коган-варвар
Re: Бог был философом, бог был математиком, бог был геоме
Date: 2009-05-04 07:34 pm (UTC)Re: Бог был философом, бог был математиком, бог был геоме
Date: 2009-05-04 09:19 pm (UTC)сплошные патчи на патчах и переусложнения
Re: Бог был философом, бог был математиком, бог был геоме
Date: 2009-05-04 10:12 pm (UTC)--
Коган-варвар
Re: Бог был философом, бог был математиком, бог был геоме
Date: 2009-05-04 10:35 pm (UTC)Нет, на самом деле, как подумаешь о молекуле, которая надевается на другую молекулу и ездит по ней, как головка по ленте машины Поста, да с теми же примерно функциями и психика начинает опасно крениться. :-)
--
Коган-варвар
Re: Бог был философом, бог был математиком, бог был геоме
Date: 2009-05-05 06:24 am (UTC)Re: Бог был философом, бог был математиком, бог был геоме
Date: 2009-05-05 06:58 am (UTC)Re: Бог был философом, бог был математиком, бог был геоме
Date: 2009-05-05 07:02 am (UTC)Re: Бог был философом, бог был математиком, бог был геоме
Date: 2009-05-05 08:00 am (UTC)Однако это в любом случае не машина Поста, т.к. та предполагает операцию записи в ленту и возможность свободного перемещения по меткам.
А ДНК - ридонли, кусками от промотора до стопа (маркеров начала и конца транскрипции конкретного белка/белкового комплекса).
Re: Бог был философом, бог был математиком, бог был геоме
Date: 2009-08-29 10:34 am (UTC)ничего, недолго осталось
Re: Бог был философом, бог был математиком, бог был геоме
Date: 2009-08-29 10:39 am (UTC)Re: Бог был философом, бог был математиком, бог был геоме
Date: 2009-08-29 10:57 am (UTC)Но в прикладном смысле - результаты будут именно, как от такой машины :)
Re: Бог был философом, бог был математиком, бог был геоме
Date: 2009-08-29 11:06 am (UTC)Вот если вы скажете "уже скоро мы будем переписывать ДНК половых клеток, как флэшку" - никаких возражений, да, видимо, скоро будем (а в определенной степени - уже умеем, даже школьники вон уже на лабах это делают). Соматических - видимо нет, не скоро, тут вопрос не в чтении-записи ДНК, а в транскрипции оных.
Re: Бог был философом, бог был математиком, бог был геоме
Date: 2009-05-05 07:01 am (UTC)Или кат-н-пейстом гигантских кусков из чужого кода.
И считывающая головка ездит только в одном направлении.
в тему
Date: 2009-05-05 11:42 am (UTC)лентегуглоридере:Потихоньку начинается: http://diybio.org/ уже год. Это организация биохакеров (в старом, программистском значении этого слова. Надо думать, биокракеры тоже появятся, и вирусописателей найдется немало). Но не просто биохакеров, а биохакеров-любителей: термин do-it-yourself biology, любительская генная инженерия (http://tech.mit.edu/V128/N39/biohack.html).
Присоединяйтесь: учебные ресурсы на эту биохакерскую тему растут, как грибы после дождя -- http://openwetware.org/wiki/Main_Page.
(с) ailev (http://ailev.livejournal.com/681466.html)
Re: в тему
Date: 2009-05-05 01:02 pm (UTC)Re: в тему
Date: 2009-05-05 06:34 pm (UTC)Re: в тему
Date: 2009-05-05 08:39 pm (UTC)Re: в тему
Date: 2009-05-05 09:04 pm (UTC)Re: в тему
Date: 2009-05-05 09:11 pm (UTC)Не, этот не страшный. Ему ручки пообшибать легко.
Re: в тему
Date: 2009-05-05 09:33 pm (UTC)кибернетическое устройство, когда-либо существовавшее. С каким-то там
феноменальным быстродействием, необозримой памятью и все такое... И
проработала эта машина ровно четыре минуты. Ее выключили, зацементировали
все входы и выходы, отвели от нее энергию, заминировали и обнесли колючей
проволокой. Самой настоящей ржавой колючей проволокой - хотите верьте,
хотите нет.
- А в чем, собственно, дело? - спросил Банин.
- Она начала _в_е_с_т_и_ с_е_б_я, - сказал Горбовский.
- Не понимаю.
- И я не понимаю, но ее едва успели выключить.
- А кто-нибудь понимает?
- Я говорил с одним из ее создателей. Он взял меня за плечо,
посмотрел мне в глаза и произнес только: "Леонид, это было страшно".
:-)
--
Коган-варвар
Re: в тему
Date: 2009-05-05 09:47 pm (UTC)хардветвара и 20 лет на инсталляцию ОС и софта. А порядков на 5 быстрее. И без ограничений со стороны биологии на предел вычислительной мощности.Re: в тему
Date: 2009-05-06 09:46 am (UTC)Re: в тему
Date: 2009-05-10 11:06 pm (UTC)В первом случае немалые (но безуспешные) усилия направлены на предотвращение копирования пассивного, в смысле позывов к размножению, софта и данных. Во втором софт таки активно размножается, но в остальном - туп как буратино. С чего бы вдруг для софта активного, разумного, с рефлексией в отношение себя и окружающей среды, коммуницирующего между собой и с людьми эти проблемы стали решаться проще?
Re: в тему
Date: 2009-05-11 06:43 am (UTC)Сходство между биологическим и компьютерным вирусом состоит в том, что это очень небольшие программы, практически чистый софт, который, благодаря своей простоте и малому размеру может использовать для размножения готовую чужую инфраструктуру, причем ему совершенно безразлично ее назначение - он почти ничего больше и не делает.
Человеку для развмножения и захвата власти нужны исполнительные механизмы (член, руки, ноги) и сложный производственный процесс, использующий специализированный биореактор (матку) и обслуживающий комплекс к нему (мамку и папку).
Аналогичному по сложности искину понадобится то же самое. Скайнету нужно дать доступ к автоматизированным конвейерным линиям по сборке боевых роботов и пойти поспать пару лет, пока он будет ковать нам терминаторов на погибель и переписывать террабайты своего кода им в мозги. В принципе люди делали и более глупые вещи, но все-таки это риск не первого уровня в отличие от игр с вирусами.
Re: в тему
Date: 2009-05-11 10:39 am (UTC)Где-то так.
Re: в тему
Date: 2009-05-13 08:16 am (UTC)Re: в тему
Date: 2009-05-07 07:28 am (UTC)Re: в тему
Date: 2009-05-07 12:17 pm (UTC)Но в принципе - да. Я бы поставил на промежуток в 5-10 лет.
Re: в тему
Date: 2009-05-05 09:12 pm (UTC)Есть еще ьакая отрасль фантастики - рибофанк...
--
Коган-варвар
Re: в тему
Date: 2009-05-05 09:24 pm (UTC)Re: в тему
Date: 2009-05-05 09:44 pm (UTC)--
Коган-варвар
ЫК!
Date: 2009-05-05 09:37 pm (UTC)Школа хоть не в ex-USSR?
Re: ЫК!
Date: 2009-05-05 09:49 pm (UTC)Утешу - в простых классах такого не делают. Он был в Biology Honors Class. То-есть, где-то на уровне (относительном) советской спецшколы. Есть еще выше - Advanced Placement, там им просто университетские курсы читают. А есть еще Princeton Special... :)
--
Коган-варвар
Re: ЫК!
Date: 2009-05-28 06:56 pm (UTC)