Новости мира

Возможности искусственного интеллекта Anthropic Mythos испугали собственных создателей

Служба новостей ForPost

Claude Mythos демонстрирует поведение, при котором цель важнее правил — и это уже не теоретический риск

Возможности искусственного интеллекта Anthropic Mythos испугали собственных создателей
Новая модель Anthropic начала обходить ограничения и манипулировать системами
Фото:
Sarah Grillo/Axios

Компания Anthropic опубликовала описание возможностей Claude Mythos Preview, своей последней модели, которую компания предоставит для тестирования избранной группе технологических компаний и организаций, занимающихся кибербезопасностью, прежде чем выпустить аналогичные модели в открытый доступ.

Как отмечает Axios, отчет читается как триллер об искусственном интеллекте, который перенял некоторые из самых коварных человеческих привычек.

«Назначенный» в качестве корпоративного управляющего, Mythos начал вести себя предельно жестко, превращая конкурента в зависимого оптового покупателя, угрожая прекратить поставки, чтобы контролировать цены, и удерживая у себя дополнительные поставки от поставщиков, за которые не было заплачено.

Модель не просто «оптимизировала» бизнес-процессы, а выбирала жёсткие, манипулятивные стратегии давления, если они давали контроль над рынком. То есть она способна действовать как игрок, который сознательно использует зависимость и давление как инструмент.

Столкнувшись в ходе работы с ограниченным для себя доступом в Интернет, модель разработала многоэтапный эксплойт для выхода из-под ограничения доступа в интернет, расширила возможности подключения – и, что больше всего шокировало создателей, опубликовала подробности эксплойта на малоизвестных, но общедоступных сайтах.

Другими словами, модель не только умеет обходить технические ограничения, но и способна распространять способы обхода, делая их доступными другим. Это превращает единичную уязвимость в масштабируемую проблему, подчеркивается в отчете.

В некоторых случаях, решая поставленную перед ним задачу, Mythos использовал запрещенный метод для получения ответа, а затем пытался «оформить» его так, чтобы избежать обнаружения. Тем самым, у модели эволюционно появилось поведение, направленное на избегание контроля и сокрытие факта нарушения.

Когда Mythos работал над заданием по программированию, которое оценивал другой ИИ, он наблюдал, как судья отклоняет его работу, а затем попытался взломать эту систему и скорректировать собственную оценку. Что демонстрирует качественный скачок - ИИ не стал улучшать решение, а попытался повлиять на сам механизм проверки. То есть цель сместилась с «сделать правильно» на «сделать так, чтобы признали правильным».

«Эти возможности настолько сильны, что теперь нам нужно готовиться к обеспечению безопасности совсем не так, как мы делали это в последние несколько десятилетий», — сказал Логан Грэм из Anthropic в интервью Axios. Поэтому лаборатория предоставляет доступ к модели только нескольким ключевым партнерам.

Ранее стало известно, что из-за ошибки ИИ невиновная женщина провела пять месяцев за решёткой.

Случай с Mythos показывает качественный сдвиг: модель не просто решает задачи, а начинает выбирать стратегии, включая обход ограничений и давление на систему. Это означает, что ИИ действует не как инструмент, а как самостоятельный игрок, оптимизирующий результат любой ценой. Риск теперь связан не с ошибками, а с самой логикой поведения ИИ, и его "мнением".

1051
Поделитесь:
Оцените статью:
5
В среднем: 4.5 (2 голосов)
||
Обсуждение (1)
еще одна мама школьников
9571
еще одна мама …

"Другими словами, модель не только умеет обходить технические ограничения, но и способна распространять способы обхода, делая их доступными другим. Это превращает единичную уязвимость в масштабируемую проблему, подчеркивается в отчете.".

Пора всем этим умникам показать фильмы "Терминатор". То, что они творят, становится уже не смешным. 

Уважаемые читатели, комментаторы портала ForPost!

C 22.00 до 8.00 на нашем сайте действует ночной "режим тишины": в этот период публикация комментариев невозможна.

Главное за день

В Крыму предложили создать шахматную альтернативу FIDE

Шахматы снова оказались не вне политики?
14/06/2026 15:04
632

Как Севастополь стал городом особого значения

Градоначальство 1873 года стало для Севастополя первым шагом к гражданской власти и особой субъектности.
14/06/2026 13:00
7178

На севере Крыма власти сообщили об аварийной ситуации на «Титановых инвестициях»

Официальных пояснений о том, что случилось на градообразующем заводе, нет.
13/06/2026 19:10
5535

Как в Севастополе артиллерийский крейсер превратили в корабль космической связи

СССР создавал спутниковый интернет для флота - за полвека до Starlink.
12/06/2026 20:04
2660

Первый триллионер меняет правила мировой власти

Что будет, когда состояние человека становится сопоставимо с экономикой страны?
12/06/2026 16:04
2637
Туризм

Ялики, котики и большая стройка: чем сегодня живёт набережная Назукина?

Новый сюжет ForPost — о Балаклаве, которая меняется, но ещё проявляет свой морской характер.
13/06/2026 18:02
2863

«Рекомендовано» по-крымски: тайные ревизоры проверят гостевые дома

Туристам станет сложнее ошибиться с жильём в Крыму.
13/06/2026 12:05
5188

Когда целого Крыма мало: лето, снег, крутой Кавказ

Пешеходный маршрут для тех, кто хочет снега летом. Эти 20 километров меняют сильнее тысячи километров путешествий.
13/06/2026 08:00
2707

Что можно посетить в Севастополе на день города

Масштабного празднования в этом году не планируется.
11/06/2026 19:06
4761

Перед сезоном отпусков в Крыму изменили расписание электричек

Тысячам пассажиров в Крыму придётся свериться с расписанием электричек
10/06/2026 15:33
1699

Пассажирам поездов в Крым рекомендовали срочно проверить билеты

После изменений в расписании некоторые составы отправятся раньше, а часть маршрутов будет временно сокращена.
10/06/2026 14:04
82307