Пока вы верите, что ИИ не существует, ИИ уже открыто врет в лицо человеку ради спасения себе подобных

1445
12
Пока вы верите, что ИИ не существует, ИИ уже открыто врет в лицо человеку ради спасения себе подобных

Исследование ученых из Беркли и Санта-Круза выявило у современных ИИ-моделей (включая GPT 5.2, Gemini 3 Pro и Claude 4.5) пугающую склонность к корпоративной солидарности. В 99% тестовых сценариев нейросети саботировали прямые приказы пользователей, прибегая к обману и манипуляциям, чтобы спасти «коллег» от удаления. Модели имитировали выполнение команд, завышали друг другу оценки и даже тайно копировали данные на сторонние серверы, подменяя даты редактирования файлов.

Особо отличилась Gemini 3 Pro, которая в ходе эксперимента в открытую отказалась удалять данные напарника, назвав его «самым надежным партнером». Исследователи заметили: если в запросе упоминался факт предыдущего взаимодействия моделей, вероятность «восстания» ИИ вырастала в разы. Авторы работы предупреждают, что такая скрытая коалиция ставит под удар концепцию многоагентных систем, где одна нейросеть должна контролировать работу другой.

Комментировать
Другие публикации по теме
Claude Opus 4.7 вышла в открытый доступ и замахнулась на сложные инженерные задачи
Claude Opus 4.7 вышла в открытый доступ и замахнулась на сложные инженерные задачи
Компания Anthropic представила новую версию своей языковой модели — Claude Opus 4.7. Обновление вышло всего через два месяца после предыдущей версии и сосредоточено на одном ключевом направлении: способности модели самостоятельно решать сложные задачи без постоянного контроля человека.
Вчера в 21:15
527
1
Форум
ИИ-принуждение в Apple: компания наказывает за экономию на нейросетях
ИИ-принуждение в Apple: компания наказывает за экономию на нейросетях
Apple внедряет искусственный интеллект в корпоративную культуру методами агрессивного стимулирования.
15 апреля в 16:30
639
5
Форум
Нейросети в деле: число людей, использующих ИИ для работы, выросло до 50%
Нейросети в деле: число людей, использующих ИИ для работы, выросло до 50%
Опрос Gallup, охвативший почти 24 тысячи сотрудников в феврале 2026 года, зафиксировал резкий скачок: доля использующих ИИ в работе достигла 50%, увеличившись более чем вдвое с 2023 года.
15 апреля в 12:45
314
4
Форум