Нейросети помогут специалистам различать очень близкие виды насекомых
Многие встречающиеся в природе виды насекомых выглядят настолько похоже, в том числе при близком рассмотрении, что даже опытному специалисту с трудом удается различить их. Недавно российские ученые применили новейшую технологию на основе машинного обучения, позволившую точно определить очень близкие виды. Оказывается, цифровые технологии способны справиться с этой задачей и тем самым упростить работу энтомологов, что важно не только для фундаментальной науки, но и для разработки эффективных способов борьбы с вредителями.
На сегодняшний день науке известно около миллиона видов насекомых. Это больше, чем найдено видов всех других животных, растений и микроорганизмов вместе взятых. Несмотря на ежедневный кропотливый труд энтомологов, описана лишь часть видов насекомых, обитающих на планете, а многие из некогда обнаруженных еще не встроены в общую систему научной классификации.
Часто бывает, что известных признаков просто недостаточно, чтобы отличить похожие виды, и ученым приходится искать различия в малейших деталях строения. Это требует использования дорогого оборудования, например, не только высококлассной оптической, но и сканирующей электронной микроскопии. Такого рода исследования занимают массу времени специалистов и требуют значительных денежных затрат. К тому же все равно существует риск ошибки, которая может повлечь за собой, например, неправильный подбор пестицидов против насекомого-вредителя, а значит, и потерю урожая.
«На примере растительноядных клопов-слепняков из хозяйственно значимого рода Adelphocoris мы пробовали автоматизировать процесс точного определения насекомых с помощью компьютерного зрения. Для этого нам надо было научить компьютер распознавать виды так, как это делает специалист-энтомолог, или еще лучше. Это процесс трудоемкий, но возможный благодаря оцифровке обширных научных коллекций. Анализируя множество фотографий экземпляров, которые ранее правильно определили люди, компьютер учится распознавать виды, и после некоторой тренировки делает это быстрее и точнее, чем человек», — рассказывает руководитель проекта по гранту РНФ Алексей Солодовников, кандидат биологических наук, старший научный сотрудник Зоологического института РАН.
Так, коллектив российских ученых из Зоологического института РАН (Санкт-Петербург) предложил определять насекомых с помощью нейронных сетей на основе машинного обучения. Ранее метод не использовался в энтомологии с такой точностью, но специалистам удалось доказать, что он работает без больших погрешностей в идентификации. Ученые в шутку назвали этот способ «третьим глазом систематика».
Исследование проводили на тысячах экземпляров Adelphocoris из уникальной коллекции Зоологического института. В природе существует более 48 видов этих насекомых, 18 из которых обитают в России и наносят вред бобовым культурам. Обычно, чтобы определить представителя рода Adelphocoris, внешнего вида насекомого недостаточно, и энтомологи, в том числе соавторы статьи Федор Константинов и Владимир Нейморовец, исследуют строение половых органов самцов, которые еще надо специальным образом препарировать. Этот трудоемкий процесс, поэтому исследователи решили проверить, можно ли с помощью машинного обучения определять этих насекомых только по внешнему виду и тем самым заметно ускорить работу.
Исследование включало четыре этапа на основе анализа цифровых фотографий клопов: сначала ученые проверили способность нейронных сетей различать все виды Adelphocoris друг от друга, а затем — сам род Adelphocoris от других похожих на него родов, на следующем, третьем этапе — распознавать самцов и самок внутри этого рода, и, наконец, на четвертом этапе необходимо было проверить, насколько обученные только на коллекционных экземплярах модели могут распознавать изображения представителей группы, найденные в Интернете.
«Обученные нами модели не позволяют достаточно точно идентифицировать изображения Adelphocoris, полученные в живой природе, однако, сузив условия наших экспериментов, четко определив правила съемки, включая ракурс, мы достигли отличных результатов. Кроме того, мы хотели получить более интерпретируемую картину. Для этого мы генерировали теплокарты изображений, подаваемых на вход итоговым моделям. Теплокарты подтвердили, что классификация видов Adelphocoris основывается на ряде важных частей тела насекомого. Таким образом, с помощью машинного обучения мы смогли извлекать набор присущих Adelphocoris паттернов и принимать решение, к какому из заранее определенных на этапе обучения видов относится тот или иной экземпляр», — комментирует Александр Попков, специалист по нейронным сетям в команде энтомологов и самый молодой участник проекта, недавно защитивший магистерскую диссертацию.
Современные достижения в области машинного обучения помогут биологам практически безошибочно определять очень похожие виды насекомых по внешнему виду как в целях познания биологического разнообразия планеты, так и для практических разработок, важных для сельского хозяйства. В планы ученых входит довести до автоматизма анализ данных, чтобы в разы ускорить определение с высочайшей точностью.