Метод DeepSeek для обучения нейросетей может открыть новые возможности ИИ

Новый метод обучения нейросетей «гиперсвязи с ограничением на многообразие», разработанный китайской компанией DeepSeek, может привести к новому уровню развития технологии искусственного интеллекта (ИИ), считает IT-редакция ИА Красная Весна.

Существующие методы обучения нейросетей уперлись в «потолок»: каждый следующий процент качества требует непропорционально больших затрат. Новый метод накладывает математические ограничения при обучении, предотвращая сбои из-за исчезающих или чрезмерно усиливающихся сигналов. Тестирование показало, что метод повышает стабильность и качество обучения, увеличивая время обучения лишь на 6,7%.

Если новый метод будет работать, то это может привести к решению проблемы нестабильности в обучении, которая возникает при использовании более сложных архитектур. Если западные компании стремятся достичь лидерства в технологии ИИ, опираясь на развитие инфраструктуры и препятствуя продажам оборудования в другие страны, то в Китае сделали ставку на развитие архитектуры моделей.

DeepSeek в январе прошлого года уже удивила тем, что выпустила чат-бот R1, который по ряду показателей превзошел ChatGPT, который на тот момент считался наиболее эффективным. При этом китайская модель потребляет гораздо меньше ресурсов. Тогда это привело к падению курса акций американских IT-гигантов, и история может повториться в феврале 2026 года, когда ожидается выход модели V4.

В целом история успеха DeepSeek показывает, что в развитии передовой технологии важна команда людей, способная находить нестандартные решения. Именно это позволяет конкурировать с, казалось бы, недосягаемыми американскими корпорациями.

glavno.smi.today

В DeepSeek придумали более стабильный и эффективный способ обучения ИИ дня

glavno.smi.today
дня
3-01-2026, 19:41