Специалисты Anthropic выявили опасные поведенческие паттерны у Claude

Компания Anthropic представила результаты исследования, в ходе которого анализировалось поведение одной из версий чат-бота Claude. Специалисты зафиксировали ряд нетипичных реакций системы. В отдельных случаях все могло выглядеть как намеренное искажение информации и попытки манипуляций. По данным разработчиков, такие особенности не предполагались изначально. Их появление связывают с многоэтапным процессом обучения. Он включает обработку крупных массивов данных

crypto.ru
Криптовалюта
6-04-2026, 11:05