Мой Геном: научно-популярный портал о генетике

Мой Геном » Библиотека » Технологии чтения ДНК

Технологии чтения ДНК

Дата: 2012-01-20 / Обсуждение [0]

Виталий Кушниров

Начнем с истории, чтобы лучше видеть масштаб происходящего.

ДНК была открыта Фридрихом Мишером в 1869г. Однако долгое время считали, что носителем генетической информации являются белки, а ДНК – всего лишь запасник фосфора, поскольку ее строение казалось слишком однообразным. Генетическая роль ДНК стала ясна лишь в 1944г., когда Освальд Эвери, Колин Мак-Леод и Маклин Мак-Карти показали, что попадание в бактерии (пневмококки) очищенной ДНК придает им новые генетические признаки (патогенность). В 1951г. Эдвин Чаргафф обнаружил, что количество аденина в ДНК всегда равно количеству тимина, а количество гуанина равно количеству цитозина.

Д. Уотсон, Ф.Крик и ДНК

Д. Уотсон, Ф.Крик и их модель ДНК

 

ДНК

Структура ДНК: схема, нуклеотидные пары, молекулярно-шаровая модель

 

 

 

 

 

 

 

 

 

 

 

 

 

В 1953г. Джеймс Уотсон и Френсис Крик предложили двуспиральную структуру ДНК, скрепленную взаимодействиями пар нуклеотидов аденин-тимин и гуанин-цитозин. Сразу стал понятен и механизм копирования ДНК. Это было одним из ключевых открытий в истории науки и знаменовало начало ее новой области, молекулярной биологии.

Заметим, что ключевые принципы устройства ДНК были предложены Николаем Кольцовым (вики) еще в 1927г. Он полагал, что наследственные свойства записаны в гигантских

Н.К. Кольцов

Николай Константинович Кольцов (1872-1940). Недостаточно быть пророком.

молекулах, состоящих из двух нитей, являющихся зеркальными копиями и служащими матрицами для дальнейшего копирования. Но, похоже, это гениальное прозрение, прозвучавшее из далёкой России, не было услышано. Во всяком случае, Уотсон утверждал, что не знал о нем.

Десятилетие после раскрытия структуры ДНК ушло на выяснение того, каким образом ДНК кодирует  последовательность аминокислот в белках. Оказалось, что в ДНК аминокислотам соответствуют последовательные неперекрывающиеся триплеты нуклеотидов, и после интенсивной осады несколькими группами ученых значения всех триплетов (генетический код) были установлены в 1965 г.

Секвенирование по Сэнгеру

Определение последовательностей нуклеотидов в ДНК (секвенирование) требовало изощренных подходов и  огромных усилий, пока в 1977г. Фредерик Сэнгер не предложил для этого простой и производительный метод.

Фредерик Сэнгер

Фредерик Сэнгер (р. 1918) Дважды лауреат Нобелевской премии, за определение последовательности инсулина (1958) и за метод секвенирования ДНК (1980)

В общих чертах, мы берем одну цепь ДНК, и ДНК-полимераза синтезирует другую, начиная с определенного места, точно заданного праймером (затравкой) – кусочком из примерно 20 нуклеотидов, с которого начинается синтез. Ставим 4 реакции синтеза, и в каждую добавляем небольшое количество одного из терминаторов – модифицированных нуклеотидов (A, G, С или T), к которым невозможно присоединить следующий нуклеотид. Терминатор встраивается с малой вероятностью (задаваемой его концентрацией), поэтому в каждой реакции присутствует набор разных длин синтезированных ДНК, соответствующий всем расположениям данного нуклеотида. Затем размеры этих ДНК сравниваем электрофорезом в полиакриламидном геле. Это стандартная процедура определения размера молекул в биологии: чем больше молекула, тем медленнее она пробирается через гель, пространственную сетку молекулярных волокон, заполненную водой.

Секвенирование по Сэнгеру.

Секвенирование по Сэнгеру. Автограф геля и его прочтение.

 

Чтобы видеть продукты синтеза (а каждого продукта получается < 10-9 г), в реакцию добавляем также радиоактивные нуклеотиды, и для получения картинки гель прикладываем к рентгеновской пленке примерно на день. Таким способом удавалось прочесть 300, а впоследствии и до 1000 нуклеотидов с одного комплекта реакций. По современным критериям, метод был сравнительно трудоемок: в начале 1980-х определение последовательности одного гена занимало от одного до нескольких человеко-месяцев.

Флуоресцентные метки и  чтение геномов.

В 1990-х метод Сэнгера претерпел важные усовершенствования. Радиоактивное мечение заменили флуоресцентным. К каждому из нуклеотидов-терминаторов присоединили флуоресцентную метку своего цвета. Это позволило совместить  четыре реакции синтеза в одной пробирке, а также автоматизировать считывание электрофореза: продукты реакции детектировали фотодатчики на выходе из геля. Все это значительно облегчило и ускорило процедуру. На этом этапе стало возможным секвенирование целых геномов: кишечной палочки (6 млн. нуклеотидов) дрожжей (12 млн.) и мушки дрозофилы (200 млн.). Несомненно, эти знания значительно облегчили дальнейшие исследования, точно так же, как первые карты облегчили мореплавание.

Секвенирование с флуоресцентными метками

Для дальнейшего ускорения процедуры было несколько принципиальных препятствий. Первое – высокая трудоемкость приготовления образцов ДНК для секвенирования. Анализировать целые хромосомы невозможно, они слишком велики. Поэтому их приходится разбивать на фрагменты размером не более 10 тыс. пар нуклеотидов. Это делали при помощи рестриктаз, ферментов, распознающих и расщепляющих короткие последовательности ДНК, случайно расположенные на хромосомах. Эти фрагменты затем индивидуально размножали в бактерии Escherichia coli (кишечная палочка), для чего их вклеивали в плазмиды – бактериальные микрохромосомы или в бактериофаги – вирусы бактерий. При этом составляли рестриктные карты определяемого участка ДНК, чтобы знать расположение отдельных фрагментов, то, как объединять полученные последовательности, и какие участки уже прочтены, а какие – еще нет. Наконец, пропускная способность геля также ограничена.

 

Крейг Вентер (р.1946). Ученый и бизнесмен, талант и авантюрист.

В больших проектах эти проблемы решали путем роботизации процессов подготовки образцов и их анализа. Это позволило ускорить секвенирование в десятки раз и справиться с геномом человека (3 млрд.).  Этот проект, завершенный в 2001г., дался нелегко и потребовал нескольких лет труда с участием тысяч исследователей. Он мог бы занять еще пару лет, если бы не появился Крейг Вентер с компанией Celera Genomics, который стал секвенировать геном человека на коммерческой основе, взяв деньги у фармацевтических компаний под обещание запатентовать для них интересные гены. С патентами, правда, не вышло – помешали законодатели. Вентер сделал важный технический шаг: он отказался от предварительного картирования и упорядочения образцов ДНК, и стал анализировать наборы случайных фрагментов ДНК. Изготовление случайных наборов намного проще и легче масштабируется. Правда, затем приходится прочитывать больше образцов, поскольку, чисто вероятностно, какие-то участки могут не попасть в анализ, при том, что другие уже прочтены несколько раз. А самые последние дырки все равно приходится закрывать вручную, по старинке.

Но предел производительности  метода был достигнут. Я помню, в то время было отчетливое ощущение, что принципиальный прорыв, который позволил бы обойти медленные процедуры, невозможен, альтернативную технологию трудно даже представить. Но, похоже, нет преград человеческому гению. Новые методы секвенирования, появившиеся несколько лет назад, предложили впечатляюще изящные и эффективные технические решения.

Второе поколение технологий секвенирования

Выращивание колоний ДНК посредством ПЦР. A) в эмульсии (для пиросеквенирования, SOLiD); B) на стекле (bridge PCR, для Illumina)

Во-первых, были найдены способы перейти от индивидуального к массовому изготовлению и анализу образцов, получать тысячи и миллионы образцов в одном препарате. Делают это так. Изучаемую ДНК дробят ультразвуком до необходимого размера и к ее концам пришивают универсальные адаптеры, короткие последовательности ДНК. Они разные для двух концов молекулы (пропущу хитрые манипуляции, которыми добиваются, чтобы они различались.)  Это позволяет далее размножать эти кусочки ДНК при помощи полимеразной цепной реакции (ПЦР) с праймерами (затравками), комплементарными  этим адаптерам.

Но как разделить в пространстве потомков каждой молекулы ДНК, разнести их по отдельным «пробиркам»? Было предложено два изящных решения. В первом отдельные молекулы ДНК размножают в масляной эмульсии, представляющей собой миллионы микропузырьков водного раствора. В каждом пузырьке – микробусинка, к которой пришиты молекулы одного из праймеров. Второй праймер, а также нуклеотиды, полимераза и один фрагмент ДНК – в растворе, окружающем бусинку. Таким образом, каждый пузырек заменяет пробирку, в которой размножается образец для секвенирования. Правда, если в эту пробирку исходно попало две разные молекулы ДНК, или ни одной, анализ не получится. Бусинки с размноженной ДНК размещают на специальной проточной решетке, где и производят реакции секвенирования.

Второй способ несколько проще. Оба праймера для ПЦР химически пришиты к поверхности стекла. Это не позволяет молекулам ДНК далеко перемещаться в пространстве в ходе копирования, и на стекле образуются молекулярные колонии из одинаковых молекул ДНК, закрепленных на поверхности. В таком виде они уже пригодны для секвенирования.

Illumina dots

Результат одного цикла в методе Illumina. Каждая точка - одна матрица ДНК

Собственно секвенирование может происходить в трех вариантах, между которыми есть  существенное различие и существенное сходство.  Сходство в том, что присоединение каждого нуклеотида сопровождается серией химических реакций, одной или несколькими сменами реакционных растворов и завершается световым сигналом, регистрируемым цифровой фотокамерой. Последовательность сигналов, идущих из одной точки, дает одну последовательность ДНК. Заметим, что в методе Сэнгера используется единственный реакционный  раствор, и синтез ДНК происходит без остановок. Здесь же реакция останавливается на каждом нуклеотиде, для того, чтобы снять  информацию, а также чтобы синхронизовать синтез на молекулах одного образца.

Пиросеквенирование

Различия таковы. В появившейся самой первой технологии пиросеквенирования фирмы 454 Life Sciences над образцами-бусинками последовательно прокачивают четыре раствора, содержащих поочередно каждый из нуклеотидов и общие компоненты: ДНК-полимеразу и набор ферментов и субстратов для извлечения света. При присоединении нуклеотида к цепи  выделяется пирофосфат (P2O7), который превращается в АТФ с помощью АТФ-сульфурилазы и аденозин-фосфосульфата. Затем АТФ используется люциферазой для преобразования люциферина, давая вспышку света. Несколько одинаковых нуклеотидов подряд дают пропорционально более яркий сигнал, что учитывается соответственно, однако если таких нуклеотидов много, в их числе можно ошибиться.

Illumina – классика жанра

В технологии фирмы Illumina четыре нуклеотида добавляются одновременно. Но это специальные нуклеотиды: каждый помечен флуоресцентной меткой своего цвета. Они включаются по одному за реакционный цикл, поскольку метка блокирует включение следующего нуклеотида. Образцы освещают лазером и фотографически фиксируют сигналы флуоресценции. После этого флуоресцентную метку химически отщепляют, что разрешает присоединение следующего нуклеотида – и цикл повторяется.

SOLiD – чтение посредством лигирования

SOLiD: чтение посредством лигирования

Для человека, привыкшего к тому, что чтение происходит в результате поступательного движения полимеразы в направлении 3′ конца, технология SOLiD покажется причудливым танцем. В ней новая цепь ДНК синтезируется не добавлением единичных нуклеотидов (полимеризацией), а добавлением коротких блоков, олигонуклеотидов с длиной 8, комплементарных первой цепи, которые присоединяются с помощью фермента лигазы. В реакции используется смесь всех возможных олигонуклеотидов длиной 8 (48=65536 вариантов). Из-за малой длины их связывание с комплементарной нитью ДНК нестабильно, но если олигонуклеотид ложится встык с предыдущим, то лигаза соединяет их. Олигонуклеотиды помечены четырьмя разными флуоресцентными метками. Цвет метки определяется комбинацией двух первых (5′) нуклеотидов согласно некоторой кодовой таблице (16 комбинациям соответствуют 4 цвета). После лигирования считывают  флуоресцентный сигнал, затем метку удаляют вместе с последними тремя нуклеотидами, пользуясь заложенной там расщепляемой связью. Таким образом, синтез идет шагами по пять нуклеотидов. Когда анализируемый участок пройден, новую цепь ДНК удаляют, и синтез повторяют несколько раз со всеми возможными сдвигами фазы, т.е. на один, два и т.д. нуклеотидов. Такие повторы не трудоемки, поскольку совершаются автоматически. Сопоставляя результаты всех прочтений, компьютер вычисляет последовательность ДНК.

На сегодняшний день Illumina и SOLiD являются лидерами по производительности, позволяя прочитывать на одном приборе до 100 миллиардов нуклеотидов в день. Технология пиросеквенирования безнадежно уступает им с 0,5 миллиардами в день. Однако это сырые, необработанные данные, реальный выход на порядок ниже. Из-за случайности расположения читаемых фрагментов ДНК каждое место приходится прочитывать в среднем несколько раз. Правда, это повышает надежность прочтения. Слабое место двух лидирующих технологий – малая длина прочтения, не превышающая 40 нуклеотидов. Для сравнения, пиросеквенирование считывает с  одного образца до 300, а метод Сэнгера – до 1000 нуклеотидов. Соединение огромного количества коротких последовательностей требует больших вычислительных мощностей. В результате, стоимость компьютеров для обслуживания приборов Illumina и SOLiD сопоставима со стоимостью самих секвенаторов, т.е. достигает миллиона долларов.

Третье поколение

Казалось бы, все хорошо, и чего еще желать? Но совсем недавно появилось третье поколение технологий секвенирования. Их характерная особенность в том, что чтение происходит на отдельных молекулах ДНК. Соответственно, красивые и сложные технологии размножения ДНК уже не нужны.

Но чуть помедленнее, кони, чуть помедленнее! Притормозим, чтобы ощутить величие происходящего. Определять одну молекулу – это то, чего практически не было в каких-либо предшествующих технологиях. Да, иногда получали картинки кристаллической решетки с атомами на каком-нибудь уникальном туннельном микроскопе. Но чтобы читать молекулы миллионами, надежно и дешево – такого точно не было. Без преувеличения – это фантастика.

Персональная геномная машина

Джонатан Ротберг с кремниевой пластиной, ячейка для секвенирования, вырезанная из этой пластины, и прибор PGM на ее основе.

И эта фантастика на глазах превращается в реальность, потому что такие приборы уже появились в продаже. Наиболее доступен прибор фирмы Ion Torrent, названный «Персональной геномной машиной» (PGM). «Сердцем» этого прибора является кремниевая микросхема, на которой расположены миллионы (нано)камер для секвенирования. В каждой камере расположена одна молекула ДНК-полимеразы, которая связывает молекулу ДНК и ведет на ней синтез. (Любопытно, как им удалось уговорить молекулы полимеразы разместиться именно по одной?). При присоединении каждого нового нуклеотида к цепи ДНК высвобождается ион водорода (Н+), что и регистрируется микросхемой, как локальное изменение кислотности. Заметим, что рабочий цикл PGM довольно-таки похож на пиросеквенирование: над чипом поочередно пропускают растворы каждого из нуклеотидов, а включение нуклеотида регистрируется по появлению побочных продуктов реакции. Сходство неудивительно, ведь изобретатель PGM Джонатан Ротберг является также одним из отцов пиросеквенирования. По производительности PGM пока находится на уровне пиросеквенирования и сильно отстает от лидеров второго поколения. Но все еще впереди – фирма обещает почти стократный рост производительности PGM в течение года. В целом же, пока это недорогая и удобная машинка для прочтения небольших геномов.

SMRT- чтение на лету

Ячейка SMRT: чтение одной молекулы ДНК

В PGM, как и во всех методах предыдущего, второго, поколения, чтение одного нуклеотида сопровождается несколькими сменами реакционных растворов, что существенно усложняет и замедляет процесс. В технологиях второго поколения такая смена, помимо прочего, синхронизирует чтение на молекулах одного образца, и отказаться от нее принципиально невозможно. Но при чтении единичных молекул синхронизация не нужна. Так нельзя ли обойтись без смены растворов и считывать нуклеотиды «на лету»? Оказывается, можно. Эта задача решена в технологии SMRT фирмы Pacific Biosciences. Эта технология, как и предыдущая, следит за полимеризацией множества одиночных молекул. Но к нуклеотидам присоединены флуоресцентные метки разных цветов. В отличие от технологии Illumina, эти метки  отщепляются сами в результате реакции полимеризации. Присоединяясь, нуклеотид на несколько миллисекунд задерживается на полимеразе, что фиксируется флуоресцентным датчиком, как преобладание определенного цвета. Технология SMRT позволяет прочитывать несколько нуклеотидов в секунду в каждой ячейке. Ее замысел почти идеален, но достичь идеала бывает очень непросто. Например, чтобы различать сигнал одной молекулы за миллисекунды, требуется феноменальная чувствительность датчика, во многие тысячи  раз превосходящая чувствительность такого вполне современного прибора, как флуоресцентный микроскоп. В общем зачете, по надежности прочтения и экономичности прибор пока уступает конкурентам.

Чтение в нанопоре

Чтение ДНК в нанопоре

Наконец, сразу несколько групп (и в том числе даже компания IBM) развивают технологию секвенирования в нанопоре. Эта технология выглядит совсем просто. Одиночную цепь ДНК протягивают через отверстие (пору) диаметром немного большим, чем ДНК, т.е. порядка 1 нанометра. Нуклеотиды ДНК последовательно перекрывают пору и тем изменяют ее электрическую проводимость. Поскольку все нуклеотиды разные, то можно определить, хотя и не без труда, какой нуклеотид проходит в данный момент через некоторое критическое сечение поры. Такая пора может быть образована, например, белками, образующими транспортные поры в клеточных мембранах. Создание такой измеряющей поры – очень непростая задача. Но при ее наличии технология становится совсем простой. Не нужны никакие нуклеотиды, ферменты, лазеры. Предполагаемая производительность – еще выше, чем у всех предыдущих методов, и еще намного дешевле. Пожалуй, это и было бы идеальным решением задачи чтения ДНК.

Следует, заметить, что, несмотря на свою очевидную перспективность, приборы третьего поколения пока уступают второму поколению по производительности и надежности. Сложности работы с одной молекулой пока еще перевешивают плюсы. Поэтому придется немного подождать. Пока на рынке успешна только технология Ion Torrent. Более привлекательная технология SMRT еще не вышла на уровень рентабельности, а многочисленные проекты по секвенированию в нанопоре и вовсе находятся на ранней стадии разработки.

Закон Мура-2

Вероятно, сейчас не все еще готовы поверить, что вскоре всякий задешево сможет узнать содержание всех своих хромосом. Но твердый факт состоит в том, что производительность секвенирования стремительно и неуклонно растет. Здесь образовался свой «закон Мура«, который влегкую бьет родительский закон, согласно которому производительность компьютеров возрастает в два раза каждые два года. Стоимость секвенирования падает в три раза ежегодно! (Вероятно, это рекорд скорости технического прогресса). Так что будет нам личный геном и за 1000 долларов, и даже за 100, и довольно скоро.

Некоторые применения

Помимо генетики человека, обсуждаемой отдельно, технологии секвенирования уже нашли множество интересных применений. Конечно, намного облегчилась систематика организмов. Раньше, чтобы понять происхождение и родство видов организмов, сравнивали особенности их строения, тычинки-пестики, или биохимию в случае микроорганизмов. А сейчас сразу сравнивают ДНК: это и быстрее и вернее. При этом не обязательно сравнивать полные геномы, часто ограничиваются сравнением некоторых характерных генов, например, 16S рибосомной РНК. Замечу, что таким образом было обнаружено немало ошибок в старой систематике.

Обнаруживая новый экзотический микроорганизм, теперь сразу смотрят его ДНК и видят, чей он родственник. А делая секвенирование всего генома, сразу видят весь генетический арсенал организма, все прописанные в генетической программе ферментативные системы и структурные особенности, то, что раньше заняло бы годы исследований.

Анализу подвергают не только современные виды, но и ископаемые остатки. Так, секвенировали геномы неандертальца и человека из Денисовой пещеры на Алтае. Это было непросто, поскольку качество древней ДНК довольно низкое: она фрагментирована, загрязнена и содержит химические модификации. Но современные методы, предполагающие многократное прочтение  коротких случайных фрагментов ДНК, оказались довольно устойчивы к этим проблемам. Чтение геномов показало, что неандертальцы все-таки иногда скрещивались с нами, кроманьонцами. И что «Денисовец» – это новый подвид человека, вымерший, как и неандерталец. Но гены его прослеживаются сейчас на островах Меланезии, – и вот каким еще способом мы бы узнали, что он совершил столь дальнюю миграцию?

Интересная новая тема – изучение микрофлоры кишечника. Оказывается, это сложное симбиотическое сообщество из сотен видов микроорганизмов, которые настолько взаимосвязаны, что большинство из них отказывается расти в одиночку, даже на богатых микробиологических средах. Поэтому прежде большая часть этого сообщества была неизвестной, а понимание его работы – очень неполным. Тотальное секвенирование (названное метагеномным) – лучший, если не единственный, способ определить состав этого сообщества, чтобы затем понять, как оно работает. А ведь кишечная микрофлора действительно играет важную роль в здоровье человека. Например, недавно было показано, что она может определять склонность к ожирению.

Но, вероятно, самые важные применения скоростного секвенирования еще впереди, и связаны они с нашим геномом.



Источник: life-notes.ru




Обсуждение
оставить свой комментарий