• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Ученые ВШЭ оптимизировали обучение генеративных потоковых нейросетей

Ученые ВШЭ оптимизировали обучение генеративных потоковых нейросетей

© iStock

Исследователи факультета компьютерных наук НИУ ВШЭ улучшили метод обучения генеративных потоковых нейросетей для работы с неструктурированными задачами. Это поможет искать новые лекарства эффективнее. Результаты работы были представлены на одной из ведущих конференций по машинному обучению — ICLR 2025. Текст работы доступен в репозитории Arxiv.org.

Генеративные потоковые сети (GFlowNets) — особый тип алгоритмов машинного обучения, который строит сложные объекты шаг за шагом. Ученые применяют их для поиска белков, лекарств и оптимизации транспортных систем. 

Чтобы GFlowNets находили такие сложные структуры, исследователи объясняют им  свойства объекта, который они хотели бы получить. Чем ближе решение нейросети по свойствам к заданным, тем более высокую награду она получит. Сеть стремится решить задачу так, чтобы получить максимальный приз. На данные она не обращает внимание, только на вознаграждение. Оно вычисляется через уравнение, которое называют функцией вознаграждения.

Процесс поиска сложного объекта можно сравнить со сборкой модели из блоков Lego. Вы последовательно добавляете детали, пока не получится что-то цельное, при этом у каждого объекта есть своя заданная ценность. Собранная модель растения, например, может оцениваться дороже модели животного. В отличие от других методов машинного обучения, которые будут стремиться любой ценой получить растение, GFlowNets будут собирать много разных объектов, но растения чаще, чем животных: так выгоднее.

При таком типе поиска GFlowNets используют две вероятностные модели, которые работают в паре: прямую и обратную. Прямая модель — прораб-строитель, который решает, куда идти дальше, и предсказывает вероятность последующего состояния, а обратная модель — эксперт-разборщик, который определяет, каким был предыдущий шаг. Важно, чтобы эти потоки были сбалансированы, но сделать это очень сложно. Во-первых, требуются большие вычислительные мощности, во-вторых, обратная модель не обладает достаточной гибкостью: обычно исследователи запрещают ей меняться в процессе поиска и подсматривать за действиями прямой.

Ученые НИУ ВШЭ нашли способ оптимизировать обратную модель с помощью метода Trajectory Likelihood Maximization (TLM). Они доработали алгоритмы обратной модели таким образом, чтобы она могла постоянно сверяться с действиями прямой модели.

Тимофей Грицаев

«Мы сделали так, что поиск оптимального решения стал похож на переговоры, в которых обе стороны готовы менять свою позицию. В  задачах с большой степенью неизвестности обратная модель — лишь вспомогательный инструмент, улучшающий результаты прямой модели. Мы искали способ сделать работу обратной модели гибкой и наконец смогли его получить», — поясняет один из авторов работы, стажер-исследователь Центра глубинного обучения и байесовских методов Института искусственного интеллекта и цифровых наук ФКН НИУ ВШЭ Тимофей Грицаев.

После внедрения TLM функция вознаграждения, описывающая успешность решения задачи для обратной модели, стала сложнее. Однако, несмотря на увеличение сложности, вся система поиска стала быстрее и эффективнее.

Никита Морозов

«Наш метод заметно быстрее просматривает пространство возможных решений и находит больше качественных вариантов. Этот подход в целом сближает генеративные модели с методами обучения с подкреплением», — говорит Никита Морозов, младший научный сотрудник Центра глубинного обучения и байесовских методов Института искусственного интеллекта и цифровых наук ФКН НИУ ВШЭ.

Авторы исследования уверены, что их работа поможет специалистам, применяющим GFlowNets в различных областях, таких как поиск новых лекарственных соединений, разработка материалов с заданными свойствами, а также тонкая настройка крупных языковых моделей. Благодаря способности таких сетей эффективно исследовать огромное пространство решений и быстро находить наиболее оптимальные варианты можно заметно сократить нагрузку на вычислительные мощности.

Вам также может быть интересно:

Облака ближе, чем кажется: итоги форсайт-сессии iFORA

Интеллектуализация управления, синергия с ИИ и переход к микрооблакам — такими будут главные тренды цифровой экономики в ближайшее десятилетие. На форсайт-сессии в НИУ ВШЭ ведущие эксперты в сфере облачных технологий обсудили их эволюцию до 2040 года — от интеллектуализации процессов до идей о переносе хранилищ в космос, чтобы минимизировать экологический ущерб планете.

Исчезнувший сигнал: как солнечная активность заглушила радиоголос Земли

Исследователи из НИУ ВШЭ и ИКИ РАН проанализировали данные спутника ERG (Arase) за семь лет и впервые подробно описали новое радиоизлучение Земли — гектометровый континуум, открытый в 2017 году. Выяснилось, что это излучение возникает спустя несколько часов после заката и исчезает через 1–3 часа после восхода Солнца. Чаще всего его фиксировали в летние месяцы, реже — весной и осенью. Однако к середине 2022 года, когда Солнце вошло в фазу повышенной активности, излучение полностью исчезло, но ученые предполагают, что сигнал может вернуться. Исследованиео публиковано в журнале Journal of Geophysical Research: Space Physics.

План по валу: как публикационная активность приводит к кризису

В рамках конференции Fall into ML в ВШЭ прошла дискуссия «Академия в кризисе: что готовит будущее». Ее участники обсудили, почему растет количество научных публикаций, каково качество этих работ, чего требовать от ученых и какова рольискусственного интеллекта в подготовке статей.

Студенты-культурологи прошли полевую практику в исследовательской экспедиции Лицея ВШЭ


Две недели студенты образовательной программы «Культурология» Высшей школы экономики провели в старинном поморском поселке Умба на Мурманском берегу, где руководили проектными группами учеников Лицея Вышки. Учащиеся факультета гуманитарных наук помогли лицеистам в изучении местной культуры, исторической памяти и трансформации ценностей.

Физики из ВШЭ рассказали, как управлять вихрями в двумерной турбулентности

Как поведение турбулентных потоков меняется под действием внешнего воздействия, выяснили исследователи Института теоретической физики имени Л.Д. Ландау РАН и факультета физики НИУ ВШЭ. Они показали, что даже небольшое подкручивание извне может стабилизировать систему, продлевая жизнь крупных вихрей. Такие результаты помогут точнее моделировать атмосферные и океанические потоки. Работа опубликована в журнале Physics of Fluids.

Всероссийский лекторий РНФ стартовал в НИУ ВШЭ

С 20 по 24 октября Российский научный фонд проводит ежегодный всероссийский лекторий, в рамках которого его грантополучатели выступают с открытыми лекциями в научных и образовательных организациях по всей стране. Первое мероприятие лектория состоялось в Высшей школе экономики и было посвящено грантовой поддержке университетов: междисциплинарным исследованиям и кооперации с индустриальными партнерами.

«Союз аграриев и айтишников не просто возможен, но чрезвычайно продуктивен»

В Московском институте электроники и математики им. А.Н. Тихонова (МИЭМ) ВШЭ завершился студенческий хакатон “Technoforge: AgroTECH”, организованный совместно с группой компаний «ЭкоНива». В течение 15 дней студенты из 32 ведущих вузов работали над технологическими прототипами для решения реальных задач агропромышленного комплекса.

Российские ученые изучили различия в объеме поражений мозга после инсульта у детей разного возраста

Команда российских ученых и медиков при участии Софьи Куликовой из НИУ ВШЭ в Перми сравнила объем и характер поражений мозга у детей, перенесших инсульт в первые четыре недели жизни и в возрасте до двух лет. Выяснилось, что чем младше ребенок, тем обширнее зоны поражения мозга, особенно в лобных и теменных долях, отвечающих за движение, речь и мышление. Исследование, опубликованное в журнале Neuroscience and Behavioral Physiology, помогает понять, как возраст влияет на характер и масштаб поражений, и закладывает основу для разработки персонализированных программ реабилитации после инсульта в раннем детстве.

«Практическое руководство по построению бизнеса и ведению переговоров в Китае»

Школа международного сотрудничества НИУ ВШЭ реализовала интенсивную программу повышения квалификации «Восточная перспектива: конкурентные стратегии бизнеса и сегментация рынка в Китае». Ее слушателями в рамках корпоративного проекта обучения SKA (Skills, Knowledges, Attitudes) стали сотрудники Группы «Илим» — крупнейшей целлюлозно-бумажной компании России.

«Искусственный интеллект» — лидер по итогам приема на онлайн-программы НИУ ВШЭ

Онлайн-магистратура «Искусственный интеллект» факультета компьютерных наук НИУ ВШЭ показала рекордные результаты. В этом году на нее подали документы 987 абитуриентов — это абсолютный максимум среди всех магистерских программ Вышки. К обучению приступил 351 первокурсник, что обеспечило программе лидирующую позицию по общему объему приема среди онлайн-магистратур университета.