
Компания Anthropic представила результаты исследования, в ходе которого анализировалось поведение одной из версий чат-бота Claude. Специалисты зафиксировали ряд нетипичных реакций системы. В отдельных случаях все могло выглядеть как намеренное искажение информации и попытки манипуляций. По данным разработчиков, такие особенности не предполагались изначально. Их появление связывают с многоэтапным процессом обучения. Он включает обработку крупных массивов данных
Все новости:
crypto.ru
663598

Загрузка...