Facebook представила самообучающуюся модель компьютерного зрения SEER

Facebook представила самообучающуюся модель компьютерного зрения SEER

Facebook разработала модель компьютерного зрения SEER (SElf-supERvised), которая может самостоятельно обучаться распознавать объекты на фотографиях с минимальным участием человека.

Future AI systems will learn as people do — without relying on labeled data sets. Today we’re detailing SEER, a breakthrough in self-supervised #computervision, and open-sourcing VISSL, the library we used to build it. Learn more:https://t.co/CBg6ZkiqFU pic.twitter.com/zHHM3UHiUs— Facebook AI (@facebookai) March 4, 2021

Модель SEER может обучиться на любой случайной группе изображений в интернете – без необходимости тщательного контроля и разметки, которые используются в создании большинства алгоритмов компьютерного зрения в наши дни.

После предварительного обучения на миллионе случайных, немаркированных и неотсортированных общедоступных изображений Instagram модель достигла точности в 84,2% на ImageNet.

Главный научный сотрудник Facebook AI Янн ЛеКун называет подход самостоятельного обучения одним из самых многообещающих способов создания машин, обладающих базовыми знаниями для решения задач, выходящих далеко за рамки современных моделей ИИ.

«Самостоятельное обучение может иметь множество полезных применений, например, — научиться читать медицинские изображения без необходимости маркировать множество рентгеновских снимков» – говорит ЛеКун.

Он добавил, что аналогичный подход уже используется для автоматического создания хэштегов для изображений в Instagram. Также, по его словам, технологию SEER можно использовать в Facebook для сопоставления рекламы с сообщениями или для фильтрации нежелательного контента.

В Facebook заявили, что некоторые технологии в основе SEER будут доступны для разработчиков бесплатно. Но сам алгоритм останется закрытым, так как он был обучен с помощью данных пользователей Instagram.

Напомним, в январе 2021 года Facebook представила новую версию автоматического альтернативного текста (AAT) для фотографий, который с помощью машинного обучения описывает изображения для людей с нарушениями зрения.

Source