Мой Геном: научно-популярный портал о генетике

Мой Геном » Интервью » Биолог Константин Северинов - о геномике, биоинформатике, селекции и больших данных

Биолог Константин Северинов - о геномике, биоинформатике, селекции и больших данных

Дата: 2014-11-23 / Обсуждение [0]

Ученый с мировым именем, доктор биологических наук, заведующий лабораторией регуляции экспрессии генов элементов прокариот Института молекулярной генетики РАН, заведующий лабораторией молекулярной генетики микроорганизмов Института биологии гена РАН, профессор Университета Ратгерса (США) и института «Сколтех» Константин Северинов рассказывает о том, как технологии приближают нас к искусственной жизни.

– Что можно назвать самым существенным технологическим прорывом в биологии за последнее время? 

КОНСТАНТИН

– Увеличение скорости прочтения генетической информации, закодированной в ДНК. Появилась новая наука – геномика, технически она заключается в определении полной генетической информации организмов. Эта информация хранится в виде последовательности «букв»-нуклеотидов ДНК и называется «геном». Может быть геном бактерии, геном человека, геном растения или геном целого сообщества микроорганизмов, тогда его называют «метагеномом». Практически сейчас можно определять геномы любых живущих организмов (и даже некоторых вымерших организмов, например мамонта или неандертальца) за не очень большие деньги. 

– Насколько это большой объем информации? 

КОНСТАНТИН

– Геном человека, который впервые был прочитан после более чем десяти лет работы объединенными усилиями сотен ученых из США и Великобритании, стоил 3 или 4 миллиарда долларов, содержит в себе три миллиарда букв. Это как тысяча книг размером с «Войну и мир». Так что объем данных немаленький, хотя современные компьютеры легко обрабатывают и куда большие массивы.

В принципе, в последовательности генома содержится вся информация, которая нужна, например, чтобы вас или меня создать. Отдельные гены, у нас с вами их около тридцати тысяч, кодируют белки – длинные цепочки аминокислот, и эти белки выполняют различные функции, необходимые для жизни клетки и всего организма. Последовательность букв ДНК однозначно определяет последовательность аминокислот в белке. Изменилась последовательность ДНК – возникла мутация. Это может привести к изменению последовательности аминокислот в продукте гена – белкe, что, в свою очередь, может привести к потере белком своей функции, болезни, смерти.

В геноме не содержится ничего связанного с нашим личным опытом, воспоминаниями, образованием, языком, на котором мы говорим, – это все наносное, но большинство качеств, связанных с внешним видом, некоторыми способностями, предрасположенностями к генетическим болезням, там содержится. У разных людей геномы отличаются мало, можно сказать, что это одна и та же книга, в которой встречаются опечатки: в среднем они составляют около 0,1 процента от общего числа букв в геноме. То есть на одну тысячу букв генетического текста – вашего и моего – есть одна опечатка, одна буква, которая отличается. Учитывая, что у нас три миллиарда букв, разница между вами и мной составляет три миллиона букв. Соответственно, слегка отличаются белки, из которых мы состоим. Так как индивидуальные «опечатки» у разных людей находятся в разных местах генома, то получается огромное многообразие: каждый человек на геномном уровне уникален. 

– Итак, мы научились быстро и недорого расшифровывать геномы. И что мы теперь с ними делаем? 

КОНСТАНТИН

– Кроме геномики в узком смысле, то есть определения геномных последовательностей, что является технологической задачей, есть биоинформатика, которая пытается читать генетические тексты и, в частности, сравнивать их друг с другом. Можно, например, брать большое количество «книг» – геномов разных людей – и сравнивать их между собой, пытаясь определить, нет ли какого-то общего набора опечаток у тех, кто, к примеру, пьет запоем или кто шизофреник и еще что-нибудь. Если опечатки, общие для какой-то группы людей, будут найдены, можно предположить, что именно они и определяют интересующее нас свойство. 

– Но для этого нужно иметь действительно очень много расшифрованных геномов конкретных людей? 

КОНСТАНТИН

– Да. Но для этого появляется все больше возможностей. Лет пятнадцать назад прочитать полную геномную последовательность организма, даже такого простого, как бактерия, было почти то же самое, что стать космической или ядерной державой. Например, Бразилия уже в конце 90-х стала первой страной развивающегося мира, которая расшифровала полный геном организма, – это был геном бактерии, которая поражает цитрусовые. Длина этого генетического текста была около миллиона букв. Результат был опубликован в престижнейшем научном журнале Nature. A когда несколько лет назад группой российских ученых был определен геном русского человека, что бы это ни значило, результат был опубликован в никому не известном русском журнале, и «событие» осталось совершено незамеченным. Расшифровкой геномов сейчас занимается множество коммерческих фирм, вы можете расшифровать собственный геном, и сделать это относительно недорого – за пару тысяч долларов. 

– Когда-то расшифровка генома человека была сенсацией, казалось, мы так глубоко проникли в собственное устройство, что сейчас начнем легко лечить все болезни. А в действительности изменилось мало что. Почему? 

КОНСТАНТИН

– Когда в конце прошлого века налогоплательщикам объясняли, зачем нужен геном человека, говорили: вот будет геном – будут прорывы в медицине. И вот геном уже 12 лет есть, но счастье все равно пока недостижимо, потому что одно дело – иметь этот «Розеттский камень», другое – прочитать, что там написано, и третье – понять, как этот текст реализуется в ходе развития организма в норме и при патологии. Про геном правильнее думать, что это не «Война и мир», а поваренная книга. Там записано, как приготовить организм. Это удивительная книга, потому что она сама же себя и читает. Во время зачатия смешиваются половина генов от мамы, половина от папы, образуется оплодотворенная яйцеклетка, а потом она начинает делиться – на две, на четыре, на восемь клеток и т.д., все это потихонечку растет, а потом возникает человек, в котором триллионы клеток, и они совсем не похожи друг на друга: клетки печени отличаются от клеток почек, от клеток кожи и так далее. Отличны они, несмотря на то что генная информация одна и та же, просто в разных клетках работают разные гены, синтезируются разные белки. А как гены узнают, где и когда им надо работать, как это решается во время развития, мы, в общем, не очень хорошо понимаем. Еще хуже мы понимаем, как активность одних генов и их продуктов влияет на другие, а ведь в нашем геноме около 30 тысяч генов, и речь может идти об очень тонких и непрямых эффектах. Отсутствие этого знания ограничивает пользу от геномов, и это сильно недооценивалось, когда нам исходно объясняли, как важно расшифровать геном. 

– И болезни мы так и не научились лечить? 

КОНСТАНТИН

– Сейчас речь скорее может идти о диагностике; лечение в смысле «направленное исправление генетических опечаток, приводящих к болезни», – это задача совершенно другого уровня, и пока он недостижим. Например, рак может развиться в определенном возрасте с большей или меньшей вероятностью в зависимости от того, каков ваш генотип, какой у вас фон опечаточек в геноме. Рак сам по себе – свойство клеток расти и делиться не там, где нужно, и не в то время. Происходит это потому, что определенные гены начинают работать или выключаются неправильно. И как именно на такие события влияет генетический контекст, мы, за несколькими редкими исключениями, не знаем. Поэтому многие генетические сервисы, которые сейчас процветают и оценивают вероятность возникновения того или другого заболевания, глядя на ваш геном, – обычное надувательство. Только в редких случаях нам понятна связь конкретных генов с повышением вероятности развития конкретных болезней, в том числе некоторых видов рака. 

– Но в будущем мы сможем понять все эти связи, разобраться, как работает поваренная книга? 

КОНСТАНТИН

– Это будет непросто и, мне кажется, не скоро. С другой стороны, возможны новые, неожиданные подходы. Есть, например, масса людей, которые надеются использовать социальные сети как мощный инструмент для идентификации групп генов, ответственных за те или иные свойства. Основная идея все та же: мы предполагаем, что набор опечаточек в геноме влияет на конкретные вещи, которые происходят с человеком, – от развития рака до склонности покупать туфли на высоком каблуке. Проблема в том, что этот генетический сигнал очень зашумлен, то есть на наши болезни и склонности влияют не только гены, но и внешние факторы: образ жизни, возраст, культура, воспитание. И для того, чтобы весь этот шум убрать, чтобы выделить в нем именно генетическую составляющую и определить, как одни варианты генов влияют на другие, а все вместе они влияют на те или иные свойства, нужно иметь возможность анализировать очень большую выборку людей. В идеале хорошо бы иметь геном каждого человека. А затем сравнивать геномы, соотносясь с дополнительной информацией, полученной из профилей или особенностей поведения в социальных сетях. А затем с помощью компьютерного анализа находить связи и корреляции. За счет привлечения очень большого количества людей через социальные сети, возможно, корреляции тех или иных особенностей генома с какими-то свойствами – от болезней до склонностей – можно будет выявить с достаточно высокой достоверностью. По идее, это можно начинать делать уже сейчас, используя популярные сервисы по выявлению генеалогии. Генеалогические деревья делаются не на основе генома, а на основе более простой штуки – за счет сравнения профилей так называемых полиморфизмов, но анализ полногеномных последовательностей будет более точным. 

– То есть если к профилю каждого человека в социальной сети прикрутить еще и его геном, то мы могли бы сильно продвинуться вперед? 

КОНСТАНТИН

– Ну да, но желательно еще знать как можно больше о человеке: историю его жизни, болезней, его привычки, а для тех, кто умер, – причину смерти. Если анализировать такую информацию для семи миллиардов человек, используя имеющиеся и разрабатываемые в настоящее время технологии big data, больших данных, кластеризации и т.д., это, возможно, позволит по-новому взглянуть на многие медицинские проблемы. Потенциально такой анализ также могут использовать люди, занимающиеся политикой, коммерцией. Представьте, как полезно это будет для страховых компаний. Словом, потенциальных интересантов много, и среди них, конечно, может быть много негодяев. 

– Звучит страшно. 

КОНСТАНТИН

– Важно понимать, что полезных следствий такой открытости будет очень много. Например, при условии нормального развития технологий стволовых клеток можно дойти до того, что, если вас переехал автомобиль или какая-то часть тела перестала работать, этот же инструмент может помочь найти подходящего донора. Другой пример: многие боятся Эболы, хотя пока это, конечно, крохотная эпидемия. И есть люди, которые выздоравливают, хоть большинство от этой болезни умирают. Так же со СПИДом. Конечно, страшно интересно посмотреть, нет ли для этого генетической подоплеки. И почти наверняка она будет. И сама эта информация, если она будет достоверной, может оказаться полезной и подсказать, как лечить людей. То же самое со старением – можно будет с большой точностью понять, какие генетические факторы имеют к нему отношение, путем анализа геномов долгожителей. 

– Такой глобальный генетический анализ действительно имеет шансы реализоваться? 

КОНСТАНТИН

– Думаю, да. Прогресс не остановить. Ведь если что-то можно технически сделать и тем более на этом заработать, кто-нибудь это обазательно сделает. Уже сегодня многие просто так делают свою генетическую информацию публичной, со временем количество таких людей будет только возрастать. Мы же, как правило, не скрываем своей группы крови (кстати, это тоже не что иное, как простой генетический признак). 

– Расшифровка генома дает еще одну головокружительную перспективу – создание искусственной жизни. Что происходит в синтетической биологии? 

КОНСТАНТИН

– Шум вокруг синтетической биологии пока в основном торговля ожиданиями. Даже четкого определения того, что такое синтетическая биология, нет. Скажем, генная инженерия существует с середины 70-х годов, когда были впервые разработаны процедуры клонирования ДНК. Суть которого состоит в том, что определенные фрагменты ДНК можно помещать в специальные самореплицирующиеся молекулы ДНК – плазмиды, а потом размножать такие рекомбинантные молекулы, которые в природе не встречаются, и получать огромное количество продуктов, кодируемых теми участками ДНК, которые вы ввели плазмиду. По этой схеме сейчас получаются интерфероны, моноклональные антитела для борьбы с раком и многие другие продукты. В сущности, очень многие блокбастерные лекарства, на которых держится большая фарма, получены именно таким образом. И все это до некоторой степени можно назвать синтетической биологией, потому что и сами активные вещества, и клеточные линии, которые создаются для из производства, – результат генной модификации. Многие боятся слова «генномодифицированный», но миллионы диабетиков ведут нормальный образ жизни за счет инъекций инсулина, который, безусловно, генномодифицирован. 

– Но сегодня у нас появилось намного больше возможностей по сравнению с 70-ми годами? 

КОНСТАНТИН

– И да и нет. С одной стороны, мы умеем читать геномы – вот эти книжки, но как они работают, как рецепт превращается в блюдо, мы на самом деле не знаем. Поэтому и в генной инженерии приходится пользоваться селекцией, потому что мы не можем точно гарантировать, что генная модификация в каждом случае будет работать правильно. Сегодня для нас не проблема искусственно собрать молекулу ДНК нужной длины. Есть специальные машины, которые без проблем синтезируют гены. Вы задаете последовательность, машина работает, и у вас в пробирке плавают молекулы ДНК, последовательность которых соответствует определенному гену. Можно, например, синтезировать ген устойчивости к колорадскому жуку и запустить его в картошку. Один из методов для этого выглядит так: берут специальную пушку, дробинки смачивают в растворе гена и стреляют в лист картошки. За счет травматического повреждения новая ДНК попадает внутрь ядер каких-то клеток картошки и там встраивается в собственный геном растения. Но встраивается он куда придется, более-менее случайно. Поэтому неизбежен этап селекци; из клеток, получивших чужеродную ДНК, получают целые растения, а затем вы просматриваете многочисленные растения, чтобы выбрать те экземпляры, где ген устойчивости вставился куда надо, где он хорошо работает и делает плохо жукам. Вот борцы с прогрессом – люди, которые выступают против ГМО, – часто говорят: вы сами не знаете, куда вы там ген вставили и что произошло с активностью других генов. В этом есть доля резона – мы действительно не можем абсолютно точно предсказать, какие именно изменения возникнут. С другой стороны, ясно, что координированная система работы тысяч генов в клетках отобранного в ходе миллионов лет эволюции организма довольно устойчива к внешним и внутренним воздействиям. Поэтому оснований ожидать существенных перестроек работы тысяч генов после введения одного чужеродного гена нет. 

– В целом объем данных о функциях генов копится, и со временем мы сможем в них разобраться на основе статистического анализа? 

КОНСТАНТИН

– Проблема с анализом больших данных вот какая. Основной критерий доказательности в биологии – прямой эксперимент. Эффективность предсказаний, которые можно делать на основе анализа данных, мало чем ограничена, потому что предсказания можно делать о чем угодно, а биологический эксперимент ограничен – ценой, временем, да просто технической осуществимостью. И выбирать, какие предсказания проверять, а какие нет, очень сложно. Некоторые биоинформатики, например Евгений Кунин, наш соотечественник из Вашингтона, у которого индекс Хирша больше, чем у всей нашей страны, умеют делать правильные предсказания, или, вернее, они чаще делают правильные предсказания. То есть биохимики и генетики подтверждают то, что он сказал, и поэтому на проверку его предсказаний не жалко тратить время и силы. Но в общей ситуации экспериментальная валидация просто не поспевает за предсказаниями, а без нее они мало что значат. 

– Это ограничение, связанное с нашими экспериментальными возможностями, не удастся снять в скором будущем? 

КОНСТАНТИН

– В скором нет, и я как экспериментальный биолог этому скорее рад, без работы я и мои коллеги в ближайшее время не останемся. Но знаете, количество в конечном счете побеждает. Технологии сравнения больших последовательностей, работы с большими данными разработаны и постоянно совершенствуются, осталось набрать статистику, очень-очень много статистики. И анализировать данные так, что, может статься. выводы из такого анализа перестанут восприниматься как предсказания, а будут восприниматься как факты. Тогда придется переквалифицироваться в управдомы или хотя бы в биоинформатика.

 

SLON.RU 2014 http://slon.ru/specials/future-tech/tech-changes-biology/



Обсуждение
оставить свой комментарий