Метод DeepSeek для обучения нейросетей может открыть новые возможности ИИ
Новый метод обучения нейросетей «гиперсвязи с ограничением на многообразие», разработанный китайской компанией DeepSeek, может привести к новому уровню развития технологии искусственного интеллекта (ИИ), считает IT-редакция ИА Красная Весна.
Существующие методы обучения нейросетей уперлись в «потолок»: каждый следующий процент качества требует непропорционально больших затрат. Новый метод накладывает математические ограничения при обучении, предотвращая сбои из-за исчезающих или чрезмерно усиливающихся сигналов. Тестирование показало, что метод повышает стабильность и качество обучения, увеличивая время обучения лишь на 6,7%.
Если новый метод будет работать, то это может привести к решению проблемы нестабильности в обучении, которая возникает при использовании более сложных архитектур. Если западные компании стремятся достичь лидерства в технологии ИИ, опираясь на развитие инфраструктуры и препятствуя продажам оборудования в другие страны, то в Китае сделали ставку на развитие архитектуры моделей.
DeepSeek в январе прошлого года уже удивила тем, что выпустила чат-бот R1, который по ряду показателей превзошел ChatGPT, который на тот момент считался наиболее эффективным. При этом китайская модель потребляет гораздо меньше ресурсов. Тогда это привело к падению курса акций американских IT-гигантов, и история может повториться в феврале 2026 года, когда ожидается выход модели V4.
В целом история успеха DeepSeek показывает, что в развитии передовой технологии важна команда людей, способная находить нестандартные решения. Именно это позволяет конкурировать с, казалось бы, недосягаемыми американскими корпорациями.
glavno.smi.today
- В DeepSeek придумали более стабильный и эффективный способ обучения ИИ дня
- России нужно присмотреться к уникальному закону Южной Кореи об ИИ дня
- Успех китайских нейросетей показал, что талант разработчиков важнее чипов дня
- На что рассчитывает OpenAI, не собираясь получать прибыль от ИИ? дня
- Смартфон сделает бессмысленным построение гигафабрик для ИИ? дня
- дня
- 3-01-2026, 19:41