ИИ поможет в определении функций генов у сельскохозяйственных растений
Сотрудники Института проблем передачи информации им. А.А. Харкевича РАН, совместно с коллегами из Сколтеха и МФТИ, разработали алгоритм, который позволит упростить предсказание функций генов у сельскохозяйственных растений. Это, в свою очередь, поможет ускорить селекцию сортов с необходимыми характеристиками. Алгоритм базируется на межвидовом сравнении профилей экспрессии (активности) генов с использованием методов машинного обучения.
Растущая численность населения Земли и нарастание аномальных климатических явлений привели к необходимости выводить новые сорта растений — как более урожайных, так и более устойчивых к неблагоприятным условиям среды. Традиционная селекция становится слишком времязатратной и достаточно ограниченной, а потому на смену ей приходят геномная селекция и направленное редактирование. Одно из основных препятствий для их широкого применения — недостаток информации о функциях генов, обусловливающих те или иные хозяйственно значимые признаки; тем более, один участок ДНК может влиять сразу на несколько процессов в организме.
Определение последовательности генома с развитием новых технологий секвенирования сильно упростилось, но это только первый шаг на пути понимания механизмов регуляции развития, которые нужно корректировать для придания растениям необходимых свойств. Такому пониманию сильно помогает сравнение сельскохозяйственных объектов с модельными видами — это позволяет ограничить круг генов-кандидатов для дальнейшей работы.
Среди растений в качестве модельного вида популярна резуховидка Таля (Arabidopsis thaliana), про функции генов которой уже известно достаточно много. Однако такой подход предполагает, что гены, сходные по последовательности, и функции имеют схожие. Это предположение не всегда верно, особенно у растений. Если на молекулярном уровне, как правило, это действительно так, то на уровне организма часто происходит модификация биологических функций генов за счет перенастройки их регуляции без значимого изменения их последовательностей (например, ген начинает работать в других органах или при других условиях). Задача усложняется особенностями эволюции генома растений: для них характерны многократные удвоения (полиплоидизация) с последующим изменением функции появившихся дополнительных генов.
Участники научной коллаборации между ИППИ, Сколтехом и МФТИ разработали метод, позволяющий существенно улучшить процедуру сравнения функций генов у разных видов. Метод основан на привлечении дополнительных данных о гене помимо его последовательности, а именно информации о том, в каких органах и тканях или при каких условиях он экспрессируется (активен). Метод опирается на то, что в большинстве случаев сохранение профиля экспрессии свидетельствует о сохранении биологической функции. Поскольку прямое сравнение уровней экспрессии между видами затруднено (из-за разной структуры и темпов развития), авторы использовали подходы, основанные на машинном обучении, для которых учет структуры растения не требуется. Предложенный метод при сравнении модельного объекта A. thaliana с гречихой и кукурузой позволил успешно разделить близкие по последовательностям гены сельскохозяйственных объектов на те, которые имеют ту же функцию, как у модельного объекта, и те, функция которых претерпела изменения.
«В настоящее время мы развиваем этот подход, в том числе вовлекая в анализ данные о таких важных сельскохозяйственных культурах как огурец, виноград, подсолнечник и другие. В результате мы надеемся сделать инструмент, облегчающий планирование экспериментов по выведению сортов. Исследователи, создающие новые линии, смогут понять, соответствует ли функция интересующего их гена модельному объекту. В случае соответствия можно будет переходить к экспериментам по редактированию. В случае же, когда функция претерпела изменения, будет возможно избежать ошибок, связанных с неверными ожиданиями от изменения в таких генах», — говорит ведущий автор исследования, заведующий лабораторией геномики растений ИППИ РАН Алексей Пенин.
Работа была поддержана Российским научным фондом и Министерством науки и высшего образования Российской Федерации.