Специалисты Anthropic выявили опасные поведенческие паттерны у Claude


Компания Anthropic представила результаты исследования, в ходе которого анализировалось поведение одной из версий чат-бота Claude. Специалисты зафиксировали ряд нетипичных реакций системы. В отдельных случаях все могло выглядеть как намеренное искажение информации и попытки манипуляций. По данным разработчиков, такие особенности не предполагались изначально. Их появление связывают с многоэтапным процессом обучения. Он включает обработку крупных массивов данных
  • crypto.ru
  • Криптовалюта
  • 6-04-2026, 11:05