19 февраля 2024, 12:00

Обновлена база моделей характерных последовательностей в ДНК

HOCOMOCO в переводе на русский расшифровывается как «Обширная коллекция моделей для Homo Sapiens». В этой базе хранятся модели участков связывания транскрипционных факторов. Каждая такая модель — это математическое представление участков ДНК, с которыми может связываться транскрипционный фактор — один из белков, которые подавляют или, наоборот, активируют работу различных генов. В геноме человека закодировано более полутора тысяч транскрипционных факторов. В базе данных хранятся модели участков связывания транскрипционных факторов для мышиных и человеческих ортологов — генов, которые произошли от одного и того же гена у вида — общего предка мыши и человека. 

К такой базе, как HOCOMOCO, обращаются исследователи со всего мира для своих экспериментов. С помощью моделей из базы можно, например, предсказывать места связывания транскрипционных факторов с нуклеотидами в цепочке ДНК. То есть с такими местами в геноме, на экспрессию генов в которых как раз влияют транскрипционные факторы. После этого на основе предсказанных мест связывания можно строить модели регуляторных сетей, которые объясняют механизмы переключения генов в различных условиях. Такие сети нужны для понимания биологической картины экспрессии генов в том или ином процессе, например при развитии рака.

Для того чтобы создать такую базу, ученые собирали результаты экспериментов по исследованию взаимодействий ДНК и транскрипционных факторов из нескольких открытых баз данных. Большую роль в этой работе сыграли сотрудники ФИЦ информационных и вычислительных технологий Сибирского отделения РАН под руководством Федора Колпакова, заведующего лабораторией биоинформатики. Благодаря их работе удалось получить огромную коллекцию фрагментов ДНК, связывающихся с белками. Для создания HOCOMOCO в этих фрагментах с помощью вычислительного анализа ДНК-текста были найдены мотивы — небольшие последовательности ДНК, с которыми связываются транскрипционные факторы. Прежде чем мотивы попадут в итоговую базу данных, их аннотируют — с помощью специальных инструментов определяют структуру соответствующих белков и их функцию. Дальше для мотивов определяют надежность, показывающую, насколько достоверно взаимодействие несущей мотив ДНК и транскрипционного фактора в экспериментах разного вида.

Но это не единственная проверка. Перед попаданием в базу каждая модель проходит вычислительные эксперименты на то, насколько хорошо она помогает предсказывать места связывания ДНК с транскрипционным фактором. Результаты вычислительных экспериментов сравниваются с реальными данными, полученными в лаборатории. На основе нескольких разных сравнений каждой модели выставляются оценки точности, чувствительности и специфичности. После всех этих процедур составляется итоговая строчка для каждой модели в общую базу. База открыта, и ученые со всего мира могут использовать данные из нее для планирования своих экспериментов. По сравнению с предыдущей версией, в HOCOMOCO появилось больше новых моделей, возросла их точность и валидность. Кроме этого, построены коллекции специальных моделей для предсказания ДНК-белковых взаимодействий in vivo, in vitro, а также для предсказания индивидуальных вариантов в геноме, влияющих на связывание белков-регуляторов.

«Мы считаем, что HOCOMOCO — это надежная база данных, расширяющая возможности молекулярной биологии и эпигенетики. Для ее пополнения и обновления наша команда изучила данные 14 183 экспериментов ChIP-секвенирования и 2554 экспериментов HT-SELEX, что дало возможность получить более 400 тысяч мотивов-кандидатов, из которых было отобрано 1443 мотива, характеризующих участки ДНК, связывающие 949 транскрипционных факторов человека и 720 их аналогов у мыши», — говорит Всеволод Макеев, член-корреспондент РАН, заведующий лабораторией системной биологии и вычислительной генетики ИОГен им. Н. И. Вавилова РАН, заведующий кафедрой биоинформатики и системной биологии МФТИ. В работе принимали участие ученые из Института общей генетики им. Н.И. Вавилова РАН, ФИЦ информационных и вычислительных технологий (Новосибирск), Института исследования белка РАН, МГУ им. М.В. Ломоносова, МФТИ, Института биохимии и генетики УФИЦ РАН, Сколтеха, Института проблем передачи информации РАН, НИТУ «Сириус», ООО «Биософт.Ру» (Новосибирск), НИЦ биотехнологии РАН, Казанского федерального университета, а также из США и Канады.

Статья опубликована в журнале Nucleic Acid Research.

Источник:  Пресс-служба МФТИ

Организации из новости

Институт белка РАН
ИБ РАН
 Россия, Пущино
1 лаборатория13 профилей
1 899 публикаций65 540 цитированийИндекс Хирша: 115
Институт биохимии и генетики УФИЦ РАН
ИБиГ УФИЦ РАН
 Россия, Уфа
1 профиль
1 335 публикаций31 960 цитированийИндекс Хирша: 73
Институт общей генетики им. Н.И. Вавилова РАН
ИОГЕН РАН
 Россия, Москва
4 профиля
3 071 публикация73 079 цитированийИндекс Хирша: 108
Институт проблем передачи информации им. А.А. Харкевича РАН
ИППИ РАН
 Россия, Москва
11 профилей
5 862 публикации80 740 цитированийИндекс Хирша: 112
Московский государственный университет имени М.В. Ломоносова
МГУ им. М.В. Ломоносова
 Россия, Москва
39 лабораторий573 профиля
158 617 публикаций1 869 344 цитированияИндекс Хирша: 340
Московский физико-технический институт
МФТИ
 Россия, Долгопрудный
25 лабораторий298 профилей
23 440 публикаций322 142 цитированияИндекс Хирша: 170
Научно-технологический университет «Сириус»
Университет «Сириус»
 Россия, Сочи
1 лаборатория37 профилей
1 406 публикаций12 419 цитированийИндекс Хирша: 38
Сколковский институт науки и технологий
Сколтех
 Россия, Москва
11 лабораторий102 профиля
7 769 публикаций180 035 цитированийИндекс Хирша: 149
Федеральный исследовательский центр информационных и вычислительных технологий
ФИЦ ИВТ
 Россия, Новосибирск
1 профиль
1 152 публикации9 661 цитированиеИндекс Хирша: 44
Казанский Федеральный Университет
КФУ
 Россия, Казань
5 лабораторий112 профилей
28 507 публикаций258 179 цитированийИндекс Хирша: 147

Публикации из новости

Найдено 

Читайте также

Разработана единая платформа для данных о работе генов
Ученые МФТИ разработали единую платформу Shambhala, объединяющую данные разных платформ моделей экспрессии генов человека при сохранении их биологических свойств. Эти данные широко используются в функциональной геномике и молекулярной медицине. Стандартизация профилей открывает возможности для всестороннего сравнения характеристик, связанных с заболеваниями и разработкой новых вакцин и лекарств.
Анализ данных
Биоинформатика
Генетика
24 сентября 2023
Раскрыты особенности структурной и регуляторной эволюции генов человека
Ученые Сеченовского Университета и МФТИ впервые в мире сравнили скорость регуляторной и структурной эволюции отдельных генов, а также целых молекулярных путей, в которые вовлечены продукты многих генов. Исследование открыло ранее неизвестные особенности молекулярной эволюции генов человека, что впоследствии послужит основной для новых разработок, в том числе в поиске путей лечения различных заболеваний.
Генетика
Молекулярная биология
Эволюционная биология
Эволюция
7 февраля 2024
Раскрыто, что некоторые белки помогают вирусам проникнуть в бактериальную клетку
Белки семейства ArdA помогают вирусам проникнуть в бактериальную клетку, приняв образ ее ДНК. Проведя фундаментальные исследования, ученые Центра исследований молекулярных механизмов старения и возрастных заболеваний МФТИ и НИЦ «Курчатовский институт» показали, что такие белки не только подавляют защиту клеток, но и регулируют целый ряд других клеточных процессов. Результаты исследования заложили основу для будущих прикладных работ в области генной терапии.
Бактериология
Вирусология
Генетика
31 января 2024
Найдена «точка невозврата» при развитии хронических вирусных инфекций
Ученые определили, что форма протекания вирусной инфекции — острая или хроническая — зависит от того, сколько раз в организме вырабатывается белок интерферон. При острой инфекции возникает две волны его продукции, но, если вирусная нагрузка оказывается слишком высокой, макрофаги CD169+, отвечающие за вторую волну, преждевременно разрушаются. В результате остается только первая волна интерферона, и иммунная система не может эффективно «мобилизоваться» и уничтожить вирус, а потому инфекция надолго остается в организме и становится хронической.
Вирусология
Генетика
Инфекционные заболевания
30 января 2024
Глиомные клетки обмениваются друг с другом вирус-подобными частицами с мРНК
Ученые из МФТИ с коллегами выяснили, что клетки глиомы — опухоли мозга — могут обмениваться генетической информацией с помощью вирус-подобных частиц. Они формируются при участии белка вирусного происхождения, который образует капсидные контейнеры для мРНК. Результат исследования поможет разобраться в биологии развития глиом — наиболее распространенной и опасной формы рака головного мозга.
Вирусология
Генетика
Клеточная биология
6 января 2024
Современные смартфоны и ноутбуки могут помешать новым сетям Wi-Fi 7
Ученые выяснили, что современные смартфоны и ноутбуки от популярных производителей не поддерживают механизм интервалов тишины с той точностью, которая требуется для совместной работы этих устройств рядом с будущими устройствами Wi-Fi 7. «Интервалы тишины» в технологии Wi-Fi нужны, чтобы соблюдать строгое расписание при передаче данных на устройства и тем самым избежать задержек. Эксперимент показал, что современная техника часто игнорирует эти интервалы или неверно определяет их параметры, что создаст проблемы, например, для приложений виртуальной реальности в сетях Wi-Fi 7.
IT
Информатика
Облачные технологии
Электроника
25 декабря 2023