Опубликовано 01 октября 2025, 07:57
1 мин.

NVIDIA заменила дорогой HBM на GDDR7 в Rubin CPX ради удешевления ИИ

Хитро, Хуанг. Очень хитро
NVIDIA представила новый ускоритель Rubin CPX (Content Phase aXcelerator), созданный для обработки длинного контекста при работе больших языковых моделей.
NVIDIA заменила дорогой HBM на GDDR7 в Rubin CPX ради удешевления ИИ

В отличие от классических «датацентровых» GPU с HBM, новинка оснащена 128 ГБ памяти GDDR7, что снижает стоимость и энергопотребление.

HBM3E и HBM4 обеспечивают огромную пропускную способность, но дороги в производстве, требуют сложной упаковки (CoWoS) и ограничивают выпуск.

GDDR7 же дешевле, доступнее и проще в интеграции, а для задач обработки контекста (миллионы токенов за раз) высокая пропускная способность не так критична.

Rubin CPX способен выдавать до 30 NVFP4 петафлопс вычислительной мощности, оснащён аппаратным ускорением attention-механизмов и поддерживает кодирование/декодирование видео.

Он будет использоваться вместе с GPU Rubin и CPU Vera в системах Vera Rubin NVL144 CPX, обеспечивающих до 8 экзафлопс мощности и 100 ТБ памяти в стойке.

Первые такие платформы ожидаются к концу 2026 года, а среди клиентов уже заявлены Cursor, Runway и Magic.