DeepMind создала универсальных ИИ-агентов в неограниченной игре

DeepMind создала универсальных ИИ-агентов в неограниченной игре

Ученые из британской лаборатории DeepMind создали обширную игровую среду XLand для обучения универсальных агентов искусственного интеллекта. Они могут выполнять задачи, которые им никогда не встречались.

Reinforcement learning typically trains & tests agents on the same game. New work shows how our team trains generally capable agents on huge game spaces, resulting in agents that generalise to held-out test games, & learn behaviours like experimentation https://t.co/fQ9UrOFkMb 1/ pic.twitter.com/UAPX5VgMmO— DeepMind (@DeepMind) July 27, 2021

Вместо того, чтобы обучать агентов ограниченному количеству задач, команда исследователей определила целую вселенную ситуаций, которые могут быть сгенерированы процедурно.

Вселенная XLand включает ряд многопользовательских трехмерных игр. В ее пределах агенты провели 700 000 уникальных сессий в 4000 миров. Каждый агент в последнем поколении прошел 200 млрд шагов обучения в результате выполнения 3,4 млн уникальных задач.

В итоге разработчики получили алгоритм, способный успешно решать широкий спектр задач — от простого поиска объектов до сложных игр, таких как прятки или захват флага, которые не встречались во время обучения, сообщили ученые.

«В настоящее время наши агенты могут участвовать во всех процедурно созданных оценочных задачах, за исключением нескольких ситуаций, решить которые не смог даже человек», — говорится в исследовании.

По словам ученых, агенты демонстрируют общее эвристическое поведение, которое широко применимо ко многим задачам.

«Этот новый подход знаменует собой важный шаг на пути к созданию более универсальных агентов, способных быстро адаптироваться в постоянно меняющейся среде», — добавили они.

Напомним, в июне исследователи из DeepMind заявили, что для достижения общего искусственного интеллекта достаточно обучения с подкреплением.

В июле специалисты ИИ-лаборатории собрали и опубликовали самую полную базу данных белковых структур человека, созданную нейронной сетью AlphaFold.

Source