Команда Google DeepMind представила обновлённую версию игрового искусственного интеллекта SIMA. В отличие от предыдущей модели, работавшей с простыми указаниями, SIMA 2 теперь функционирует как интерактивный помощник. Совместная работа с моделями Gemini позволила агенту не только понимать команды, но и анализировать задачи, поддерживать диалог и самостоятельно развивать навыки.
Ключевым усовершенствованием стала развитая логика. Если SIMA владела базовыми операциями, такими как движение в сторону или активация меню, то SIMA 2 умеет решать комплексные цели. Благодаря Gemini ИИ распознаёт скрытые намерения, составляет многошаговые планы и разъясняет свои действия в режиме реального времени. Создатели подчёркивают, что взаимодействие с агентом напоминает совместную работу.
Связка с Gemini также повысила адаптивность системы. SIMA 2 демонстрирует лучшие результаты в незнакомых игровых средах. Среди тестовых проектов — симулятор ASKA и модификация Minecraft под названием MineDojo. Согласно исследованиям DeepMind, эффективность агента по большинству параметров сравнялась с возможностями человека.
Для проверки пределов функциональности ИИ объединили с проектом Genie 3, создающим трёхмерные миры по текстовым описаниям. В незнакомых условиях, сгенерированных Genie 3, SIMA 2 успешно декодировала команды и выполняла осмысленные действия для их реализации.
Важной инновацией стал механизм автономного обучения. После стартовой подготовки на человеческих примерах агент переходит к саморазвитию: анализирует результаты пробных действий, получает оценки от Gemini и корректирует стратегии без участия людей.
Разработчики отмечают сохраняющиеся сложности. ИИ пока испытывает трудности со стратегическим планированием в многоуровневых квестах, имеет ограниченную оперативную память и недостаточно точно управляет устройствами ввода. Детальный отчёт о проекте планируется опубликовать в ближайшее время.

