DeepMind разработала универсальную архитектуру для создания искусственного интеллекта

DeepMind разработала универсальную архитектуру для создания искусственного интеллекта

Специалисты лаборатории DeepMind создали универсальную архитектуру Perceiver IO для обработки всех типов входных и выходных данных.

To tackle all the challenges we meet while solving intelligence, we need tools that are as adaptable as possible. Announcing the paper & code for Perceiver IO, an architecture that handles a wide range of data and tasks, all while scaling gracefully: https://t.co/9UU9b6276q 1/4 pic.twitter.com/PO9JSHt7yL— DeepMind (@DeepMind) August 3, 2021

В ее основе — оригинальная модель Perceiver, представленная в июне 2021 года. Она обрабатывает изображения, аудио, видео и их комбинации, однако ограничивается задачами с простыми выходными данными, такими как классификация.

Для решения этой проблемы исследователи создали более общую версию архитектуры — Perceiver IO. Она может выдавать широкий спектр выходных данных из разнообразия входящей информации, что делает ее применимой к таким областям, как обработка естественного языка, компьютерное зрение и мультимодальное понимание.

Perceiver и Perceiver IO построены на архитектуре трансформеров, которые хорошо работают для входных данных, содержащих нескольких тысяч элементов. Однако, по словам исследователей, изображения, аудио и видео могут содержать миллионы таких элементов.

«С помощью оригинального Perceiver мы решили главную проблему универсальной архитектуры: масштабирование трансформеров на очень большие входные данные без введения допущений, специфичных для предметной области», — говорится в блоге.

Исследователи также считают, что Perceiver IO может достичь беспрецедентного уровня универсальности.

Они опубликовали исходный код архитектуры на GitHub и надеются, что это поможет исследователям и практикам разрабатывать приложения без необходимости тратить ресурсы на создание индивидуальных решений с использованием специализированных систем.

Напомним, в конце июля DeepMind представила обширную игровую среду XLand для обучения универсальных агентов искусственного интеллекта.

В июле специалисты ИИ-лаборатории собрали и опубликовали самую полную базу данных белковых структур человека, созданную нейронной сетью AlphaFold.

В июне ученые из DeepMind заявили, что для достижения общего искусственного интеллекта достаточно обучения с подкреплением.

Source