Entry tags:
Секвенаторное-2
Окончание. Начало - тут.
В предыдущей серии мы рассматривали вариант с получением "DNA fingerprints", т.е. нас не интересовал код как таковой, интересовали только индивидуальные различия, по которым можно идентифицировать носителя. Однако не во всех случаях этого достаточно даже для судебной медицины (см., например, историю с близнецами-алиментщиками). Тем более недостаточно этого для исследований типа полного скана генома человека.
Для непосредственного чтения последовательностей нуклеотидов в цепи ДНК в промышленных масштабах долгое время существовал один основной метод - секвенирование (от англ. sequence) по Сенгеру (более ранние и громоздкие мы рассматривать не будем, это уже чистая химия, которая за пределы исследовательских лабораторий практически не выходила).
Основа метода - та же ПЦР, которую мы рассматривали в прошлый раз, но чуть хитрее. На этот раз исходный материал (некоторое количество копий молекулы ДНК, которую хотим прочитать) мы разливаем по четырем пробиркам. В каждую их них мы добавляем стандартный набор реагентов для ПЦР: ДНК-полимеразу, которая будет достраивать цепочки, праймер, который пометит нам место, с которого мы хотим читать код, и стройматериалы - четыре типа нуклеотидов А, Г, Т, Ц (подкрасив их изотопами или еще как, чтобы лучше были видны потом на пластинке). Но дополнительно мы добавляем в каждую из пробирок по одному "бракованному" типу нуклеотидов.
Как вы помните, у каждого нуклеотида есть два "хвостика"-разъема: через один их них он цепляется к комплиментарному нуклеотиду в соседней спирали ДНК, создавая относительно слабую водородную связь, а через другой к нему цепляется следующий нуклеотид в цепочке:
Рост молекулы ДНК может идти только на этих самых "хвостиках" (т.н. 3'-группе), за которую другие нуклеотиды цепляются своим фосфатным крючком (5'-группой), образуя мощную фосфодиэфирную связь. Собственно, за счет этого и работают праймеры в ПЦР - после отжига они создают на цепи ДНК свободный 3'-хвостик, который служит затравкой роста.
Так вот, "бракованные" нуклеотиды для севенирования по Сенгеру не имеют 3' хвоста. Что в результате происходит при ПЦР? В первой пробирке наша ДНК начинает, как и положено, достраиваться от праймера с использованием плавающих вокруг нуклеотидов А=, Г=, Т=, Ц= и "бракованного" А, которого значительно меньше, чем правильного А=.
АТГЦ строчными буквами - это наш заранее синтезированный праймер, ТГЦ - уже достроенная часть, а знаки >>> - полимераза, которая в настоящий момент как раз собирается достроить комплимент к "букве" Т. Для этого ей нужен нуклеотид А. Поскольку раствор у нас хорошо перемешан, то ей может попасться как "нормальный" А, так и "бракованный" (хотя с меньшей вероятностью, т.к. мы добавили его меньше). Если попадется нормальный, то цепь продолжит строиться дальше, иначе - оборвется на "бракованном" А. Повторив цикл копирования в амплификаторе достаточное количество раз, мы в результате получим кучу цепочек, которые начинаются в одном и том же месте (на праймере), а обрываются в разных - но всегда там, где в анализируемой цепочке есть буква "А".
Например, если исходная цепочка у нас такая (я показываю сразу комплиментарную, начиная с праймера, чтобы не возиться с соответствиями, жирным - праймер и искомые "буквы"):
АТГТЦТГТАТЦТАГТЦАТЦТЦГАТЦТЦ...,
то в растворе у нас получатся такие ее неполные копии (штрихом я помечаю "бракованный" нуклеотид):
1. АТГТЦТГТА'
2. АТГТЦТГТАТЦТА'
3. АТГТЦТГТАТЦТАГТЦА'
4. АТГТЦТГТАТЦТАГТЦАТЦТЦГА'.
То же самое происходит в трех других пробирках, только там "бракованными" будут соответственно Т, Г, Ц.
Теперь помещаем то, что получилось, на гелевую пластинку, на четыре отдельные дорожки, и разгоняем с помощью электрофореза (см. предыдущий пост). Молекулы длиной 20 нуклеотидов проползут, допустим, 10 миллиметров, 21 нуклеотид - 9мм, 22 - 8 мм и т.д. (разумеется, реальные размеры и праймеров, и анализируемых кусков несколько больше, чем в моих примерах) .
В результате у нас все молекулы распределяются по длине, и получается пластинка, на которой полоски подкрашенных молекул занимают как раз те места от конца пластинки, которые соответствуют положению соответствующей буквы в цепочке. Действительно, кусок праймера у нас постоянен везде, его игнорируем. Молекула 1 из примера выше будет на 5 позиции от конца, 2 - на 9 и т.д.
По-моему, очень остроумно.
Выглядит все это примерно так:

При "промышленном" секвенировании ДНК, естественно, используется всяческая автоматизация. Вместо электрофореза на пластинках он проводится в капиллярах в специальных машинах-секвенаторах, куда заряжают сразу целый планшет с пробирками, подача растворов из пробирок в капилляры выполняется роботизированным манипулятором (как раз эту часть процесса обычно и показывают в CSI), считывание вспышек на выходе капилляра осуществляется камерами с немедленной передачей данных в компьютер, который выполняет их "склеивание". Кроме того, ПЦР может проводиться не в четырех пробирках, а в одной, просто разные нуклеотиды подкрашиваются разными цветами. Однако это уже технология, базовый принцип тот же.
Понятно, что в любом случае считываемый фрагмент не может быть очень уж длинным. Чтобы прочитать мало-мальски большой кусок - нужно много раз повторять процедуру для разных праймеров, для ускорения и распараллеливания процесса использовать могокапиллярные машины (сейчас применябтся в основном 4- и 16-капиллярные секвенаторы) и объединять их в целые фермы (как было сделано, в частности, для чтения полного генома человека). Но все равно - долго и дорого. В связи с этим недавно был придуман новый метод - пиросеквенирование, о котором постараюсь написать завтра.
В предыдущей серии мы рассматривали вариант с получением "DNA fingerprints", т.е. нас не интересовал код как таковой, интересовали только индивидуальные различия, по которым можно идентифицировать носителя. Однако не во всех случаях этого достаточно даже для судебной медицины (см., например, историю с близнецами-алиментщиками). Тем более недостаточно этого для исследований типа полного скана генома человека.
Для непосредственного чтения последовательностей нуклеотидов в цепи ДНК в промышленных масштабах долгое время существовал один основной метод - секвенирование (от англ. sequence) по Сенгеру (более ранние и громоздкие мы рассматривать не будем, это уже чистая химия, которая за пределы исследовательских лабораторий практически не выходила).
Основа метода - та же ПЦР, которую мы рассматривали в прошлый раз, но чуть хитрее. На этот раз исходный материал (некоторое количество копий молекулы ДНК, которую хотим прочитать) мы разливаем по четырем пробиркам. В каждую их них мы добавляем стандартный набор реагентов для ПЦР: ДНК-полимеразу, которая будет достраивать цепочки, праймер, который пометит нам место, с которого мы хотим читать код, и стройматериалы - четыре типа нуклеотидов А, Г, Т, Ц (подкрасив их изотопами или еще как, чтобы лучше были видны потом на пластинке). Но дополнительно мы добавляем в каждую из пробирок по одному "бракованному" типу нуклеотидов.
Как вы помните, у каждого нуклеотида есть два "хвостика"-разъема: через один их них он цепляется к комплиментарному нуклеотиду в соседней спирали ДНК, создавая относительно слабую водородную связь, а через другой к нему цепляется следующий нуклеотид в цепочке:
А=Т=Г=Ц= | | | | Т=А=Ц=Г=
Рост молекулы ДНК может идти только на этих самых "хвостиках" (т.н. 3'-группе), за которую другие нуклеотиды цепляются своим фосфатным крючком (5'-группой), образуя мощную фосфодиэфирную связь. Собственно, за счет этого и работают праймеры в ПЦР - после отжига они создают на цепи ДНК свободный 3'-хвостик, который служит затравкой роста.
Так вот, "бракованные" нуклеотиды для севенирования по Сенгеру не имеют 3' хвоста. Что в результате происходит при ПЦР? В первой пробирке наша ДНК начинает, как и положено, достраиваться от праймера с использованием плавающих вокруг нуклеотидов А=, Г=, Т=, Ц= и "бракованного" А, которого значительно меньше, чем правильного А=.
а=т=г=ц=Т=Г=Ц=>>> | | | | | | | ...=А=Т=Т=А=Ц=Г=А=Ц=Г=Т=T=T=Г=Ц
АТГЦ строчными буквами - это наш заранее синтезированный праймер, ТГЦ - уже достроенная часть, а знаки >>> - полимераза, которая в настоящий момент как раз собирается достроить комплимент к "букве" Т. Для этого ей нужен нуклеотид А. Поскольку раствор у нас хорошо перемешан, то ей может попасться как "нормальный" А, так и "бракованный" (хотя с меньшей вероятностью, т.к. мы добавили его меньше). Если попадется нормальный, то цепь продолжит строиться дальше, иначе - оборвется на "бракованном" А. Повторив цикл копирования в амплификаторе достаточное количество раз, мы в результате получим кучу цепочек, которые начинаются в одном и том же месте (на праймере), а обрываются в разных - но всегда там, где в анализируемой цепочке есть буква "А".
Например, если исходная цепочка у нас такая (я показываю сразу комплиментарную, начиная с праймера, чтобы не возиться с соответствиями, жирным - праймер и искомые "буквы"):
АТГТЦТГТАТЦТАГТЦАТЦТЦГАТЦТЦ...,
то в растворе у нас получатся такие ее неполные копии (штрихом я помечаю "бракованный" нуклеотид):
1. АТГТЦТГТА'
2. АТГТЦТГТАТЦТА'
3. АТГТЦТГТАТЦТАГТЦА'
4. АТГТЦТГТАТЦТАГТЦАТЦТЦГА'.
То же самое происходит в трех других пробирках, только там "бракованными" будут соответственно Т, Г, Ц.
Теперь помещаем то, что получилось, на гелевую пластинку, на четыре отдельные дорожки, и разгоняем с помощью электрофореза (см. предыдущий пост). Молекулы длиной 20 нуклеотидов проползут, допустим, 10 миллиметров, 21 нуклеотид - 9мм, 22 - 8 мм и т.д. (разумеется, реальные размеры и праймеров, и анализируемых кусков несколько больше, чем в моих примерах) .
В результате у нас все молекулы распределяются по длине, и получается пластинка, на которой полоски подкрашенных молекул занимают как раз те места от конца пластинки, которые соответствуют положению соответствующей буквы в цепочке. Действительно, кусок праймера у нас постоянен везде, его игнорируем. Молекула 1 из примера выше будет на 5 позиции от конца, 2 - на 9 и т.д.
По-моему, очень остроумно.
Выглядит все это примерно так:

При "промышленном" секвенировании ДНК, естественно, используется всяческая автоматизация. Вместо электрофореза на пластинках он проводится в капиллярах в специальных машинах-секвенаторах, куда заряжают сразу целый планшет с пробирками, подача растворов из пробирок в капилляры выполняется роботизированным манипулятором (как раз эту часть процесса обычно и показывают в CSI), считывание вспышек на выходе капилляра осуществляется камерами с немедленной передачей данных в компьютер, который выполняет их "склеивание". Кроме того, ПЦР может проводиться не в четырех пробирках, а в одной, просто разные нуклеотиды подкрашиваются разными цветами. Однако это уже технология, базовый принцип тот же.
Понятно, что в любом случае считываемый фрагмент не может быть очень уж длинным. Чтобы прочитать мало-мальски большой кусок - нужно много раз повторять процедуру для разных праймеров, для ускорения и распараллеливания процесса использовать могокапиллярные машины (сейчас применябтся в основном 4- и 16-капиллярные секвенаторы) и объединять их в целые фермы (как было сделано, в частности, для чтения полного генома человека). Но все равно - долго и дорого. В связи с этим недавно был придуман новый метод - пиросеквенирование, о котором постараюсь написать завтра.