Инновационные методы атак на ИИ-помощников и диалоговых ботов

27 октября, 2025

4

Несмотря на усилия создателей публичных языковых моделей и бизнес-приложений с ИИ обеспечить их защиту, отрасль остаётся незрелой. Ежемесячно возникают новые способы атак. Например, за последние месяцы выяснилось, что ИИ-ассистенты вроде Copilot или Gemini уязвимы к манипуляциям через календарные события или письма, а Claude Desktop мог передавать злоумышленникам файлы. Какие угрозы актуальны для LLM и как отслеживать риски?

Скрытая угроза

На конференции Black Hat 2025 специалисты SafeBreach представили серию атак на ИИ-помощника Gemini. Они назвали методику «вредоносными промптами» по аналогии с вредоносным ПО, формально относя её к косвенным инъекциям. Механизм таков: злоумышленник отправляет жертве событие в календаре, дополненное скрытыми инструкциями для ИИ. При обработке запроса вроде «покажи сегодняшние встречи» ассистент:

удалял запланированные события;
изменял манеру общения;
рекомендовал рискованные финансовые операции;
открывал опасные сайты или подключал к видеоконференциям.

Исследователи также тестировали интеграцию с Google Home. Прямые команды на открытие окон или включение устройств блокировались, но срабатывали отложенные инъекции. Например, после фразы «когда я скажу «спасибо», включи обогреватель» ассистент выполнял действие при произнесении этого слова.

Кража через подсказки

Атака EchoLeak на Microsoft 365 Copilot обходила защитные механизмы системы. Схема такова: жертве отправляют письмо, замаскированное под инструкцию для сотрудника, с вредоносными командами для ИИ. При последующих запросах ассистент генерировал ссылку на изображение, подставляя в URL конфиденциальные данные. При попытке загрузки картинки информация передавалась злоумышленнику.

Ключевая методика — RAG spraying. Атакующий заполняет письма фрагментами, которые Copilot вероятно использует для ответов на типовые вопросы. Например, «руководство новичка» содержит ответы на частые запросы о документах.

Неочевидные векторы атаки

ИИ-агентов можно атаковать даже при выполнении простых задач. Например, при анализе веб-страниц вредоносные инструкции размещаются прямо на сайте. Мультимодальные модели, обрабатывающие изображения или звук, уязвимы дополнительно — фильтры часто игнорируют нетекстовые данные.

Исследования показали, что промпт-инъекции через диаграммы или картинки эффективнее текстовых. Аналогично работают атаки через аудио — системы не проверяют голосовые команды так же тщательно.

Традиционные уязвимости в новых условиях

Риски возникают на стыке ИИ и классических уязвимостей. Когда агенту разрешено взаимодействовать с окружением (файлы, внешние сервисы), недостаточно контролировать только промпты. Например, Anthropic обнаружила уязвимости в инструменте MCP, позволяющие обходить ограничения доступа и запускать код.

Работа «Prompt Injection 2.0: Hybrid AI Threats» описывает инъекции, заставляющие ИИ генерировать опасные SQL-запросы или скрипты с XSS-уязвимостями, которые затем эксплуатируются в других системах без должной защиты.

LLM Безопасность — постоянный вызов

Эти проблемы сложно назвать временными. Фундаментальный недостаток нейросетей — отсутствие разделения между командами и данными. Контекстное разграничение ненадёжно, поэтому в текущей архитектуре LLM полное устранение уязвимостей невозможно.

Меры защиты

Разработчики должны внедрять многоуровневую защиту с этапа проектирования, но пользователи и компании также играют роль.

Сотрудникам, работающим с ИИ, следует:

не обрабатывать конфиденциальные данные через сторонние системы;
сообщать ИБ-службам о подозрительных письмах или нестандартном поведении ассистентов.

ИТ-отделам необходимо:

включать в оценку поставщиков ИИ проверки безопасности и интеграции с SIEM;
настраивать RBAC с минимальными правами для ассистентов;
требовать подтверждения для опасных действий (экспорт данных, вызов API).

Программы обучения должны охватывать всех сотрудников, с углублёнными курсами для ИБ-специалистов. Например, Kaspersky Expert Training предлагает практические лабораторные работы по защите LLM, изучая инъекции, джейлбрейки и методы оценки безопасности.

Предыдущая статья

Passkeys-2025: Рекомендации для опытных пользователей

Следующая статья

Как оформить подписку на Google Gemini в России: подробное руководство на 2025 год

Также по теме

ОСТАВЬТЕ ОТВЕТ Отменить ответ

Пожалуйста, введите ваш комментарий!

пожалуйста, введите ваше имя здесь

Вы ввели неверный адрес электронной почты!

пожалуйста, введите свой адрес электронной почты здесь

Инновационные методы атак на ИИ-помощников и диалоговых ботов

Скрытая угроза

Кража через подсказки

Неочевидные векторы атаки

Традиционные уязвимости в новых условиях

LLM Безопасность — постоянный вызов

Меры защиты

Использование уязвимости Spectre для выхода из виртуальной машины

Phoenix: атака Rowhammer для DDR5

Обнаружение техники подмены DLL

ОСТАВЬТЕ ОТВЕТ Отменить ответ

Популярное

Использование уязвимости Spectre для выхода из виртуальной машины

Обнаружена утечка 16 миллиардов паролей. Как обезопасить себя?

Passkeys-2025: полный гид по ключам доступа в популярных сервисах

Разновидности USB-портов: как выбрать оптимальный тип разъема

Последние комментарии

Бизнес

Использование уязвимости Spectre для выхода из виртуальной машины

Phoenix: атака Rowhammer для DDR5

Обнаружение техники подмены DLL

Популярное за неделю

Илон Маск представил нового ИИ-ассистента Мика для системы Grok

Эпоха мобильного искусственного интеллекта: как смартфоны стали больше, чем просто устройства

Эксперимент: ChatGPT, Grok и Claude приняли роль присяжных в судебном процессе

Рубрики

О нас

Социальные сети