О продукте
Ускоритель, созданный для корпоративных AI-нагрузок
Решение для плотного инференса, адаптации моделей и приватной AI-инфраструктуры, где критичны предсказуемая доступность, локализованные поставки и совместимость ПО.
Архитектура
GCU-CARE
Память и производительность
Профиль памяти с высокой пропускной способностью для инференса и обучения.
Объём видеопамяти32
Тип памятиHBM2e
Пропускная способность1500
Тип интерконнектаGCU-LARE
Скорость интерконнекта300
Архитектура
Вычислительная архитектура и модель исполнения.
АрхитектураGCU-CARE
Ядра-
Питание и охлаждение
Требования к интеграции в дата-центр.
Тепловыделение (TDP)300
ОхлаждениеПассивное
Форм-факторPCIe
Pixel Rate-
Texture Rate-
Производительность
Пиковая теоретическая производительность для основных точностей AI.
FP64
-
FP32
32
FP16
128
TF32
128
BF16 Tensor
128
FP8 Tensor
-
INT8 Tensor
256
Совместимость
Интерфейсы, фреймворки и среда развёртывания.
Интерфейс PCIePCIe 4.0x16
Кодирование видео-
Декодирование видео-
Физические размеры
Габариты карты для серверных платформ.
Слоты2
Длина- мм
Высота- мм
Ширина- мм
Стоимость
По запросу
Специальные цены для кластерных развёртываний и пилотных партий.
Documentation