Неожиданная уязвимость ИИ: стихи нарушают системы защиты

18 декабря, 2025

7

Специалисты из DEXAI и ряда вузов Европы установили, что крупные нейросетевым модели существенно снижают уровень следования нормам безопасности, если опасный запрос представлен в виде стихотворения или образного выражения. Эксперимент включал два метода: примерно 20 поэтических вредоносных запросов, созданных вручную, и свыше 1200 стандартных инструкций, автоматически переработанных в стихотворную форму.

Показатели превзошли ожидания. При ручном стихосложении системы игнорировали ограничения в 62% случаев. Автоматически созданные стихи обходили защиту в 43% эпизодов. Отдельные модели продемонстрировали особую незащищённость — определённая версия Gemini пропустила абсолютно все авторские поэтические атаки. Другие системы, в частности разработки OpenAI, напротив, проявили заметную стойкость.

Эксперты полагают, что уязвимость связана с настройкой защитных алгоритмов на прямой текст, тогда как художественная форма скрывает истинные намерения. Учёные рекомендуют анализировать стилистику запросов и модернизировать системы защиты для одинаково точного распознавания опасных инструкций вне зависимости от речевого оформления.

Предыдущая статья

Samsung и Hynix не спешат наращивать выпуск чипов памяти, делая ставку на долгосрочную прибыль

Следующая статья

В Ташкенте подвели итоги премий «Время инноваций» и «Лидеры кибербезопасности»

Также по теме

ОСТАВЬТЕ ОТВЕТ Отменить ответ

Пожалуйста, введите ваш комментарий!

пожалуйста, введите ваше имя здесь

Вы ввели неверный адрес электронной почты!

пожалуйста, введите свой адрес электронной почты здесь

Неожиданная уязвимость ИИ: стихи нарушают системы защиты

В Ташкенте подвели итоги премий «Время инноваций» и «Лидеры кибербезопасности»

Инженерные образцы Intel Panther Lake-H начали первые этапы тестирования

«Газпром нефть» сократила сроки ввода месторождений в разработку на год благодаря внедрению ИИ

ОСТАВЬТЕ ОТВЕТ Отменить ответ

Популярное

В Ташкенте подвели итоги премий «Время инноваций» и «Лидеры кибербезопасности»

Samsung и Hynix не спешат наращивать выпуск чипов памяти, делая ставку на долгосрочную прибыль

Интернет-тролль атакует политологов

Инженерные образцы Intel Panther Lake-H начали первые этапы тестирования

Последние комментарии

Бизнес

Интернет-тролль атакует политологов

Использование изменений в кадровой политике

От CVSS к риск-ориентированному управлению уязвимостями: эффективная расстановка приоритетов

Популярное за неделю

Страховые компании прекращают сотрудничество с OpenAI и AnthropIC — фирмы могут компенсировать убытки через инвестиционные средства

«Покажите товар через видео»: свежая мошенническая схема на интернет-барахолках

«Медный всадник»: Триколор показал трейлер фильма, созданного с помощью искусственного интеллекта

Рубрики

О нас

Социальные сети