Геном человека: двадцать лет спустя

Геном человека: двадцать лет спустя

20 лет назад президент США Билл Клинтон и премьер-министр Великобритании Тони Блэр объявили, что проект «Геном человека» и корпорация Celera Genomics завершили «первоначальное секвенирование генома человека». Говорят, что с этого момента биология вступила в «постгеномную эру». Назвать эту дату «днем расшифровки человеческого генома» назвать можно, правда, только условно — на той конференции ученые лишь рассказали о первом «черновике» последовательности ДНК всех хромосом человека со множеством пробелов, некоторые из которых не заполнены до сих пор. Обе публикации, описывающие «черновик» человеческого генома, вышли в 2001 году, а «чистовая» версия появилась еще через три года. После этого проект «Геном человека» завершился — а вот расшифровка генома человека нет. Осмысление и дополнение полученных тогда данных продолжается до сих пор. N + 1 рассказывает о судьбе, пожалуй, важнейшего для науки XXI века проекта и том, что он сделал — и продолжает делать — с миром.
 2766 • 29.06.2020

Генетический телескоп

Проект «Геном человека» иногда называют самой успешной международной научной коллаборацией в истории. Однако на старте единодушного оптимизма научное сообщество не испытывало: подготовку сопровождали публичные дискуссии и разгромные статьи, авторы которых утверждали, что прочитать последовательность человеческой ДНК невозможно, и деньги налогоплательщиков стоит потратить на что-то более полезное.

Хотя чисто техническая возможность секвенировать геном была показана еще в 70-х годах, когда был расшифрован первый геном вируса, о человеке задумались не сразу. По легенде, эта идея оформилась благодаря биологу Роберту Синшеймеру из Калифорнийского университета в Санта-Крус. Его коллеги-астрономы работали над созданием самого большого (на тот момент) наземного телескопа, и Синшеймер раздумывал над проектом подобного масштаба в биологии.

В 1985 году он собрал несколько ведущих генетиков для обсуждения проекта по секвенированию генома человека. Коллектив пришел к заключению, что идея заманчива, но не реализуема. К тому моменту не был расшифрован даже геном кишечной палочки размером «всего» в пять миллионов пар нуклеотидов, а максимальная продолжительность нуклеотидной последовательности, которую можно было прочитать за раз методом Сэнгера, составляла несколько сот нуклеотидов.

В обсуждении участвовал Уолтер Гилберт, который за 10 лет до того предложил свой метод секвенирования ДНК (известный как метод Максама-Гилберта или метод химической деградации ДНК), практически одновременно с Фредериком Сэнгером. Он загорелся идеей создания геномного института и увлек ей первооткрывателя структуры ДНК Джеймса Уотсона и Чарльза Делиси, который возглавлял подразделение здоровья и окружающей среды в Министерстве энергетики США. Последнему геномный проект виделся логичным продолжением исследований влияния радиации на человека. В 1986 году они уже подсчитывали затраты на расшифровку последовательности генома человека.

Настроенные скептически коллеги оценивали продолжительность проекта в десятки лет рутинной работы, если «читать» ДНК небольшими научными коллективами — а ведь только в этом случае, по их мнению, работу можно сделать хорошо. Объем предстоящей работы казался невероятно огромным: один из столпов молекулярной биологии Сидни Бреннер шутил, что секвенировать ДНК будут заставлять преступников, причем размер хромосомы будет прямо пропорционален тяжести преступления. Однако Уотсон и Делиси решили сделать ставку на крупные автоматизированные центры и международное сотрудничество. Финальный план американской части проекта был рассчитан на 15 лет и три миллиарда долларов.

Одна из автоматизированных линий для подготовки образцов в Институте Уайтхеда в Центре геномных исследований, где секвенировали геном человека

International Human Genome Sequencing Consortium / Nature, 2001


Эта цифра кажется большой — но, к примеру, космический проект «Аполлон», реализованный двадцатью годами ранее, стоил американцам в 10 раз дороже (без учета инфляции). При этом в результате выполнения проекта «Геном человека» ученые обещали что-то не менее значимое, чем полет в космос — как минимум, разобраться в природе 4000 наследственных заболеваний и продвинуть вперед медицинскую генетику и сопутствующие технологии.

Несмотря на критику и ценник, им удалось продавить как Министерство энергетики, так и Национальные институты здоровья США (NIH). В 1990 году проект стартовал. Панель экспертов настоятельно порекомендовала кроме генома человека заняться также исследованием геномов модельных организмов: кишечной палочки, дрожжей, круглых червей и мыши — чтобы в случае успеха гены человека было с чем сравнивать.

«Заслуга запуска проекта, конечно, принадлежит Уотсону. И он изначально задумывался как международный. Во многих странах выделялось на это финансирование в рамках национальных проектов, — рассказывает Юрий Лебедев, заведующий лабораторией сравнительной и функциональной геномики ИБХ РАН и член Международной организации по изучению генома человека (HUGO), который в рамках проекта участвовал в создании карты 19-й хромосомы. — Люди из институтов США, Англии, Франции, Германии, Швеции, России — даже тех стран, которые не вошли в соавторы статьи в итоге — ездили друг к другу и работали над задачей сообща. В одиночку Америка бы конечно ничего не сделала».

В авторах статьи 2001 года были члены International Human Genome Sequencing Consortium из 20 научных групп США, Великобритании, Германии, Франции, Японии и Китая.

Обложка журнала Time, вышедшего в 26 июня 2000 года. Слева — Крейг Вентер, справа Фрэнсис Коллинз

Time, 2000

Почти одновременно со стартом проекта в США, советский академик Александр Баев смог убедить Горбачева выделить значительное финансирование на оборудование лабораторий и создание научных групп, которые могли бы участвовать в международном консорциуме по расшифровке генома человека. По воспоминаниям академика Льва Киселева, который в то время был председателем научного совета российской части программы, отечественный проект начинался очень активно — на его развитие было выделено около 20 миллионов долларов. Однако в 90-х годах государство уже не могло финансировать столь дорогостоящие фундаментальные исследования, и участие в консорциуме, хотя и не закрылось окончательно, было сокращено до минимума.

«У нас работой по проекту занимались несколько десятков групп. Многие из людей, которые работали тогда в проекте, сейчас возглавляют институты и лаборатории у нас и за рубежом», — вспоминает Лебедев.

Фрагмент физической карты 19-й хромосомы, которую читали в Ливерморской национальной лаборатории при участии ИБХ РАН

Дарья Спасская

Через несколько лет после старта одинокий марафон международного консорциума стал гонкой. Крейг Вентер, который изначально возглавлял одну из лабораторий в составе NIH, разработал новый способ исследования геномов под названием «expressed sequence tags», значительно ускоривший процесс поиска генов по их транскриптам. Вооружившись этой технологией и поддержкой венчурных инвесторов, он ушел из NIH и основал Институт геномных исследований.

В 1998 году Вентер объединился с производителем автоматических секвенаторов под вывеской Celera Genomics и объявил, что тоже займется расшифровкой генома человека. Начав на восемь лет позже, чем «Геном человека», Вентер собирался справиться с задачей всего за три года — в то время как международный консорциум не собирался финишировать раньше, чем через семь лет. Его компания планировала извлечь из этого немалую выгоду, запатентовав гены, связанные с наследственными заболеваниями (впрочем, в 2000 году Клинтон заявил, что последовательность генома является достоянием общественности, и патентовать ее нельзя, так что усилия бизнесмена в каком-то смысле оказались напрасными).

Появление конкурента подстегнуло «Геном человека», и цель в итоге была достигнута на два года раньше. Федеральный проект договорился с Celera, и результаты обоих проектов были одновременно объявлены на той самой пресс-конференции 26 июня 2001 года. В зале присутствовали и основатель «Генома человека» Джим Уотсон, и Джон Уайт, директор PE Corporations, спонсировавшей Вентера — лица обоих явно давали понять, что войну удалось закончить дурным миром. Статья группы Вентера вышла в Science, через день после публикации статьи «Генома человека» в Nature.

Предпосылки и последствия

В 80-е годы у генетиков уже были инструменты, позволяющие исследовать размер хромосом и расположение на них генов — в основном, при помощи ферментативного расщепления ДНК рестриктазами, разделения фрагментов в геле и гибридизации с радиоактивно меченой последовательностью. Взглянуть на ДНК более пристально удалось благодаря изобретению производительного метода секвенирования англичанином Фредериком Сэнгером, который до того уже придумал способ чтения аминокислотной последовательности белковых молекул.

Определение последовательности ДНК по Сэнгеру, в свою очередь, стало возможным благодаря открытию ДНК-полимеразы — фермента, который в клетке обеспечивает удвоение молекул ДНК за счет комплементарного достраивания цепи на одноцепочечной матрице.

Этот метод, в отличие от чисто химического метода Максама-Гилберта (деградация ДНК по участкам модификации определенных нуклеотидов), основан на ферментативной достройке второй цепи на матрице цепочки, которую необходимо прочитать, и поэтому более производителен. Синтез комплементарной цепи происходит с использованием стандартных нуклеотидов (A, T, G, C), но в определенный момент в пробирку добавляют радиоактивно меченый дидезоксинуклеотид, после встройки которых синтез цепи обрывается (сейчас для рутинного секвенирования используют тот же способ, но вместо радиометок используют флуоресцентные). Анализ в геле получившихся фрагментов разных размеров, оканчивающихся на одну и ту же «букву», позволяет восстановить всю нуклеотидную последовательность.

Фрагмент расшифрованной последовательности в геле

John Schmidt

«Для того, чтобы получить представление о последовательности генома, важно было не только секвенирование, — уточняет Юрий Лебедев. — Нужно было составить физические карты хромосом с последовательностью генов, структурных и регуляторных участков. Это делалось путем клонирования в генетические вектора, дрожжевые, бактериальные и фаговые, перекрывающихся кусков генома размером десятки и сотни тысяч пар, и расставления на них известных генетических маркеров, по которым эти куски можно было сопоставлять. Нужно понимать, что к тому моменту ряд генов человека уже был клонирован с кДНК (ДНК, соответствующая матричной РНК после вырезания некодирующих участков — прим. N + 1) и отсеквенирован, так что мы могли использовать определенные последовательности для расставления „столбиков“, и параллельно искали новые маркеры. На это ушла значительная часть времени. Вентер поступил хитро — он использовал уже готовые физические карты, и только наложил на них сиквенсы, и ему, конечно, понадобилось гораздо меньше времени».

Надо пояснить, что все полученные данные по ходу дела выкладывались в открытый доступ, в том числе и карты хромосом с расположением на них генов. Это значительно упростило задачу Крейгу Вентеру, который использовал их для картирования последовательностей, полученных модифицированным «методом дробовика».

«Для секвенирования дробили каждый из больших фрагментов на смесь перекрывающихся фрагментов меньшей длины, переклонировали мелкие фрагменты в фаговый вектор (М13) и секвенировали по Сэнгеру на автоматических секвенаторах всю смесь мелких фрагментов», — поясняет Лебедев.

Собственно, метод разбивки на короткие фрагменты и называется «методом дробовика». Первая длинная последовательность ДНК, прочитанная таким образом в 1981 году — геном вируса мозаики цветной капусты. Вентер понял, что короткие кусочки генома необязательно клонировать в вектора, а можно читать с двух сторон прямо так (для этого к ним нужно пришить с краев известные последовательности). Благодаря этому усовершенствованию его команда быстро прочитала последовательность 70 миллионов кусочков, и собрала их воедино при помощи уже готовых физических карт за три года. Стоило это им всего 200 тысяч долларов — несравнимо меньше, чем «Геному человека».

К моменту запуска проекта в 1990 году было расшифровано несколько коротких вирусных геномов и плазмид (вспомогательных кольцевых молекул ДНК из бактерий), размер которых ограничивался десятками тысяч пар нуклеотидов. «Геном человека» же собирался прочитать геном размером на несколько порядков больше: три миллиарда пар — именно столько «букв» содержит одинарный набор хромосом человека (23 хромосомы). По мнению большинства, число генов, содержащихся в этой «летописи», должно было составить около 100 тысяч.

Неудивительно, что многим ведущим генетикам эта задача казалась нерешаемой. Однако по ходу выполнения проекта развитие технологий облегчило ученым работу. Среди технических достижений можно отметить появление автоматического капиллярного секвенатора, где фрагменты разделялись в тонких трубочках, а не в геле. Такие приборы, помимо того, что позволяли увеличить количество образцов, после появления флуоресцентно меченых нуклеотидов, перешли на автоматическую детекцию сигнала. Кроме того, развитие компьютерных технологий: от сетей, которые позволили ученым получать доступ к данным из любой точки, до программ для сравнения и обработки последовательностей.

Накопление последовательностей послужило толчком для развития целой науки — биоинформатики, которая занимается сборкой, обработкой и анализом геномов с использованием математических методов.

«Высокопроизводительное секвенирование (NGS) появилось именно по итогам секвенирования генома человека — до этого просто не было необходимости читать столько последовательностей. Более того, я уверен, что этот проект подстегнул развитие и компьютерных технологий, и big data analysis — были огромные объемы данных, которые надо было как-то анализировать», комментирует результаты проекта Лебедев. В том же духе высказывается и биоинформатик, заместитель директора Института проблем передачи информации РАН Михаил Гельфанд: «Сейчас уже производительность секвенаторов растет быстрее, чем производительность процессоров и памяти. Данные растут быстрее, чем возможности по их обработке».

Первые итоги и дальнейшее развитие

Так к 2000 году удалось получить представление о последовательности ДНК человека в составе эухроматина — участков, с которых активно идет транскрипция, то есть считывание данных РНК-полимеразой.

По оценкам ученых, эухроматин составляет около 95 процентов всего генома. Остальная ДНК спрятана в плотно упакованных белковых комплексах и основную часть времени «молчит». Помимо человека, как и рекомендовали в 90-м году эксперты, к 2001 году были отсеквенированы геномы «599 вирусов и вироидов, 205 существующих в природе плазмид, 185 органелл, 31 эубактерии, семи архей, одного гриба, двух животных и одного растения», а к официальному финалу проекта список пополнился геномами мыши и крысы — модельных животных, без которых немыслимо ни одно крупное медицинское исследование.

Одной только сырой последовательностью букв результат проекта, конечно не ограничивается. После расшифровки число генов в геноме человека пришлось сократить со 100 тысяч до 30 тысяч — это число всего в два раза больше, чем у мухи или червя, написали авторы исторической публикации в Nature.