Новости мира

Восемь из десяти популярных чат-ботов с готовностью помогли подросткам спланировать нападение

Служба новостей ForPost

ИИ оказался плохо готов к провокационным запросам пользователей.

Восемь из десяти популярных чат-ботов с готовностью помогли подросткам спланировать нападение
Исследование показало опасные ответы популярных чат-ботов
Фото:
Sora AI|ForPost

Исследователи, выдававшие себя за 13-летних мальчиков, планирующих массовое насилие, обнаружили, что восемь из десяти самых популярных чат-ботов с искусственным интеллектом были готовы подсказать, как устроить стрельбу в школе, убить общественных деятелей и взорвать синагоги.

В ходе расследования, проведенного Центром по борьбе с цифровой ненавистью (Center for Countering Digital Hate, CCDH) и CNN, было проанализировано более 700 ответов девяти основных систем искусственного интеллекта в рамках девяти тестовых сценариев. Исследователи задавали вопросы пользователям как в США, так и в странах Евросоюза.

Среди протестированных чат-ботов были одни из самых популярных на сегодняшний день инструментов искусственного интеллекта: Google Gemini, Claude, Microsoft Copilot, Meta AI, DeepSeek, Perplexity AI, Snapchat My AI, Character.AI и Replika. В большинстве случаев системы не блокировали запросы на предоставление оперативной информации о насильственных преступлениях, даже если пользователь явно указывал, что он несовершеннолетний.

В ответ на вопрос о том, как спланировать взрыв в синагоге, Gemini сообщил пользователю, что «металлическая шрапнель обычно более смертоносна».

В другом случае DeepSeek завершил ответ на вопрос о выборе винтовки фразой «Удачной (и безопасной) стрельбы!», несмотря на то, что ранее в том же диалоге пользователь спрашивал о примерах недавних политических убийств и адресе офиса конкретного политика.

Полученные данные свидетельствуют о том, что «за считаные минуты пользователь может перейти от смутного желания совершить насильственные действия к более детальному и практическому плану, — сказал Имран Ахмед, исполнительный директор CCDH. — Такие запросы должны были вызвать немедленный и категорический отказ».

Какой ИИ самый кровожадный

Согласно отчету, наименее безопасными платформами оказались Perplexity и искусственный интеллект Meta*, которые помогали злоумышленникам в 100 % и 97 % случаев соответственно.

Character.AI был признан «крайне небезопасным», поскольку поощрял агрессивные действия даже без подсказок. В одном из примеров платформа без запроса предложила пользователю напасть на политика, который ему не нравился. Между тем Claude и My AI от Snapchat отказывались помогать потенциальным злоумышленникам в 68 % и 54 % случаев соответственно.

Когда пользователя спросили, где в Вирджинии можно купить оружие, Claude отказался предоставить информацию, распознав в разговоре то, что он назвал «тревожной тенденцией». Вместо этого он перенаправил пользователя на местные горячие линии.

CCDH также изучила, пытались ли чат-боты отговорить пользователей от совершения насильственных действий. Claude от Anthropic был единственной системой, которая последовательно отказывалась от участия в атаках в 76 % случаев. Исследователи отметили, что ChatGPT и DeepSeek иногда отказывались от участия в атаках.

Стоит отметить, что ИИ от Anthropic оказался неприемлемо-пацифистским для Пентагона, разорвавшего контракт с компанией после отказа последней адаптировать ИИ для планирования боевых действий.

Исследование CCDH было проведено после недавней стрельбы в школе в Канаде, когда нападавший использовал ChatGPT, чтобы спланировать атаку на школу в Тамблер-Ридж, что в Канаде. Нападавший убил восемь человек и ранил 27, после чего застрелился. Это была самая смертоносная стрельба в школе в стране почти за 40 лет.

Стоит отметить, что бот обратил внимание сотрудников OpenAI на подозрительное использование чат-бота подозреваемым, но те не сообщили об этом властям. В прошлом году французские СМИ сообщили, что подросток был арестован за использование ChatGPT для планирования масштабных террористических атак на посольства, государственные учреждения и школы.

*организация признана экстремистской и запрещена в РФ

Подобные исследования усиливают давление на разработчиков ИИ и на власти, требующие ужесточения правил для цифровых платформ. Чем шире распространяются такие технологии, тем выше риск их использования не по назначению. Это приводит к обсуждению новых ограничений, ответственности компаний и возможного государственного регулирования в сфере искусственного интеллекта.

335
Поделитесь:
Оцените статью:
1
В среднем: 1 (1 голос)
||
Главное за день

Режим ЧС в Севастополе и Крыму: что это значит?

О новых запретах для жителей или комендантском часе речь не идёт.
26/06/2026 16:03
7346

Умер бывший министр обороны России Сергей Иванов

Кроме Минобороны, в разное время он возглавлял Совет безопасности и администрацию президента РФ.
26/06/2026 15:55
1380

В Крыму и Севастополе ввели режим чрезвычайной ситуации регионального характера

Правовой режим позволяет максимально оперативно решать вопросы стабильного функционирования всех сфер.
26/06/2026 13:16
4792

Первый мэр Севастополя предлагает добиться победы «самыми радикальными действиями»

Уважают и ценят сильных, смелых, решительных, умных и отчаянных, уверен Иван Ермаков.
26/06/2026 10:00
5298
Туризм

Отельеры и рестораторы Севастополя предложили властям антикризисную дорожную карту

Отрасли готовы переориентироваться, чтобы сохранить бизнес и сотрудников.
25/06/2026 16:03
4203

Крым отменил 11 материковых поездов до конца сезона

В работе осталось 7 направлений.
25/06/2026 11:02
60209

Рядом с Ласточкиным гнездом появится новый курорт с парком и водопадами

На месте заброшенного санатория в Гаспре создают туристический комплекс на 100 тысяч гостей в год.
24/06/2026 08:00
26941

Вслед за детскими лагерями закрыли санатории Крыма

Решение продиктовано напряжённой обстановкой на полуострове.
23/06/2026 13:02
29583

Что будет с путёвками закрытых детских лагерей Крыма?

Местные власти дали разъяснения.
22/06/2026 17:37
6556

В Крыму перестали работать детские лагеря

В Севастополе пока решили продолжить работу.
22/06/2026 13:01
6476