Проект «Энциклопедия элементов ДНК» (ENCODE) позволяет лучше понять регуляторные области генома

Проект «Энциклопедия элементов ДНК» (ENCODE) позволяет лучше понять регуляторные области генома

В рамках третьего этапа проекта «Энциклопедия элементов ДНК» (ENCODE) исследователи обнаружили миллионы дополнительных регуляторных областей в геноме человека.
 1856 • 09.08.2020

В более чем дюжине статей, появившихся в Nature и других журналах, исследователи ENCODE привели почти 6000 дополнительных баз данных, которые они создали для поиска функциональных элементов в геномах человека и мыши.

Проект ENCODE стартовал в 2003 году вскоре после того, как было объявлено о завершении расшифровки генома человека. Если первая фаза проекта включала исследования 1 % генома человека, во второй фазе исследовался весь геном с использованием технологий, основанных на секвенировании. Третий этап начался в 2012 году и подразумевал еще больше анализов и больше типов клеток.

В новых публикациях исследователи ENCODE опирались на анализ около 500 образцов клеток или тканей — предыдущие исследования в основном опирались на клеточные линии — и разработали реестр цис-регуляторных элементов. Они также создали карты доступности ДНК и сайтов, где транскрипционные факторы и другие белки могут связываться с геномом. Одновременно команда ENCODE разработала веб-инструменты, позволяющие другим ученым визуализировать свои данные.

«Данные, полученные ENCODE 3, значительно расширяют наше понимание генома человека,- говорит Брентон Грейвли (Brenton Graveley) из UConn Health, соавтор одного из исследований. - Проект позволил с большей степенью разрешения и ясности взглянуть на прежние результаты, касающиеся ДНК-связывающих белков и хроматиновых маркеров, а также предоставил новые данные о взаимодействиях отдалённых участков ДНК друг с другом и белков с РНК».

Основываясь на 5992 новых наборах экспериментальных данных, исследователи проекта ENCODE создали реестр из 926 535 цис-регуляторных элементов-кандидатов у человека и 339 815 цис-регуляторных элементов-кандидатов у мыши, сообщается в статье в Nature. Это, подчёркивают авторы, на 22 % больше, чем было получено в ходе второй фазы проекта. Элементы-кандидаты могут быть классифицированы как enhancer-like, promoter-like или CTCF-only. CTCF элементы могут быть инсуляторами, блокаторами энхансеров или якорными элементами петель хроматина.

В других работах проекта исследовалась организация генома. Учёные под руководством Ваутера Мулемана (Wouter Meuleman) из Института биомедицинских наук Altius разработали карты гиперчувствительных участков для ДНКазы I (DHSs) с высоким разрешением на основе более чем 700 биологических образцов человека. Им удалось проиндексировать 3,6 миллиона DHSs. В то же время Джефф Виерстра ( Jeff Vierstra), также из Altius, и его коллеги создали карты сайтов расщепления для ДНКазы 1 высокой плотности, а Кристофер Партридж (Christopher Partridge) и его коллеги из HudsonAlpha Institute for Biotechnology, используя метод анализа ДНК-белковых взаимодействий ChIP-seq, отметили на карте участки связывания для 208 белков, из которых 171 являлся транскрипционным фактором.

Майкл Снайдер (Michael Snyder) из Стэнфордского университета и его коллеги дополнительно использовали метод ChIA-PET для картирования петель хроматина в двух десятках типов человеческих клеток. Они обнаружили отличия чуть более чем в четверти петель хроматина в зависимости от типа клеток, что, по-видимому, отражает различную экспрессию генов.

А исследователи во главе с Эриком ван Нострандом (Eric Van Nostrand) из Калифорнийского университета в Сан-Диего сосредоточились на РНК-связывающих белках, которые также регулируют экспрессию генов. Они применили метод, получивший название eCLIP. Он использует ультрафиолетовый свет для сшивания РНК с белками. Применив этот метод к 150 РНК-связывающим белкам, они сосредоточились на участках связывания белков с РНК и начали выяснять, каковы их функции.

«Почему они активируются в одном месте и подавляются, когда связываются с другим сайтом, - это загадка, - говорит Кристофер Бердж (Christopher Burge) из Массачусетского технологического института. - Но наличие такого набора карт может помочь исследователям выяснить, какие особенности белка связаны с каждым паттерном активности».

В рамках проекта ENCODE также исследовались цис-регуляторные элементы у мышей в процессе онтогенеза, поскольку это могло бы дать информацию и о развитии человека. Например, исследователи из Института Исследований Рака Людвига и других организаций использовали комбинацию ChIP-seq и ATAC-seq для создания Карты доступности хроматина мыши на 72 различных стадиях развития, в то время как Юпэн Хэ (Yupeng He) и его коллеги из Института биологических исследований Солка профилировали метиломы 12 мышиных тканей или органов на девяти стадиях развития. В целом они отметили общее снижение CG метилирования во время внутриутробного развития. Они также определили более 460 000 предполагаемых тканеспецифических энхансеров у эмбрионов.

Кроме того, команда исследователей из Калифорнийского технологического института профилировала мышиную полиА-РНК в 17 тканях и органах в процессе развития плода мыши. С учётом данных по отдельным клеткам и ряда других данных они начали определять, какие энхансеры активны и в каких типах клеток.

Ряд других работ проекта ENCODE, появившихся в Nature Communications и Nature Methods, были посвящены транскрипционной активности мышиных псевдогенов, пользовательской аннотации наборов данных ENCODE для использования в онкологии и подходам к прогнозированию активных энхансеров.

Также в рамках третьего этапа проекта ENCODE исследователи разработали специализированный браузер под названием SCREEN. «Главным приоритетом ENCODE 3 была разработка средств для обмена данными из тысяч экспериментов с более широким исследовательским сообществом, чтобы помочь расширить наше понимание функции генома, - поясняет Эрик Грин (Eric Green), директор Национального исследовательского института генома человека, который финансировал этот проект. - Инструменты поиска и визуализации ENCODE 3 делают эти данные доступными, тем самым продвигая открытую науку».

В своем комментарии в Nature Чунг-Чау Хон (Chung-Chau Hon) и Пьеро Карнинчи (Piero Carninci) из Центра интегративных медицинских наук РИКЕНА отметили, что «еще не законченная энциклопедия уже стала важнейшим инструментом для понимания механизмов регуляции генов и генетической предрасположенности к заболеваниям».

Четвертая фаза проекта ENCODE будет заключаться в дальнейшем расширении спектра изучаемых клеток и тканей, включая транскриптомы отдельных клеток и дополнительные анализы открытого хроматина, что позволит лучше понять гетерогенность клеток и тканей, отметили руководители проекта в Nature.

Хон и Карнинчи добавили, что они хотели бы, чтобы в четвертой фазе проекта выяснилось, действительно ли цис-регуляторные элементы, каталогизированные в ходе третьей фазы ENCODE, выполняют предсказанные для них функции.

Источник: genomeweb.com

Автор: Ольга Хрущова 

Актуальное

Главное


Партнеры

Все партнеры