Google сжал память ИИ в 6 раз без потери точности
Специалисты из Google Research представили широкой публике свою новую разработку под названием TurboQuant. Речь идет об алгоритме сжатия, который не требует предварительного обучения и способен квантовать кэш-память KV у крупных языковых моделей вплоть до 3 бит без какого-либо ущерба для точности. Примечательно, что тестирование проводилось на видеокартах Nvidia H100, и результаты оказались весьма впечатляющими. Четырехбитная
- Nvidia ускорила ИИ в 5 раз: BlueField-4 STX устраняет узкое место GPU СМИ России
- Nvidia анонсировала космический ИИ-модуль мощнее H100 в 25 раз СМИ России
- Google Maps обновил навигацию впервые за 10 лет: что изменилось СМИ России
- Android 17 закроет USB4 и Thunderbolt от взлома через память СМИ России
- Verizon начал раздавать Google Pixel 10a бесплатно, но Pixel 10 Pro XL по акции выглядит выгоднее СМИ России
- СМИ России
- 25-03-2026, 16:28