Chaitex
Chaitex / Чайтекс
О продукте

Ускоритель, созданный для корпоративных AI-нагрузок

Решение для плотного инференса, адаптации моделей и приватной AI-инфраструктуры, где критичны предсказуемая доступность, локализованные поставки и совместимость ПО.

Архитектура
GPGPU/XCORE

Память и производительность

Профиль памяти с высокой пропускной способностью для инференса и обучения.

Объём видеопамяти128
Тип памятиHBM3e
Пропускная способность1200
Тип интерконнектаMetaXLink
Скорость интерконнекта896

Архитектура

Вычислительная архитектура и модель исполнения.

АрхитектураGPGPU/XCORE
Ядра-

Питание и охлаждение

Требования к интеграции в дата-центр.

Тепловыделение (TDP)850
ОхлаждениеПассивное
Форм-факторOAM
Pixel Rate-
Texture Rate-

Производительность

Пиковая теоретическая производительность для основных точностей AI.

FP32
60
FP16
480
TF32
240
BF16 Tensor
480
FP8 Tensor
-
INT8 Tensor
960

Совместимость

Интерфейсы, фреймворки и среда развёртывания.

Интерфейс PCIePCIe 5.0x16
Кодирование видео-
Декодирование видео-

Физические размеры

Габариты карты для серверных платформ.

Слоты-
Длина- мм
Высота- мм
Ширина- мм
Стоимость
По запросу
Специальные цены для кластерных развёртываний и пилотных партий.
Product information

О товаре

MetaX C-588 - это флагманский ускоритель вычислений, который представляет собой стратегически выверенный ответ на современные вызовы в сфере искусственного интеллекта.

В то время как большинство производителей графических ускорителей соревнуются в наращивании терафлопс, компания MetaX сделала ставку на другой, не менее важный для современного AI ресурс - память. Их флагманский ускоритель C-588 является воплощением этой философии, предлагая рекордные 128 ГБ сверхбыстрой HBM3e на одной плате. Это не просто техническое решение, а стратегический ход, позволяющий кардинально упростить инфраструктуру для инференса больших языковых моделей. Благодаря такому объёму памяти исчезает необходимость в сложном и медленном распределении одной модели на несколько карт, что снижает задержки и упрощает масштабирование сервисов.

С точки зрения «чистой» вычислительной мощности карта занимает нишу между NVIDIA A100 и H100, что делает её идеальным выбором для задач, где важен объём данных, а не пиковые вычисления. Для объединения нескольких ускорителей в единый пул используется собственный интерконнект MetaXLink, обеспечивающий высокую скорость обмена данными. Карта выполнена в энергоэффективном форм-факторе OAM 2.0 с пассивным охлаждением и потреблением в 850 Вт, что требует соответствующего серверного шасси. Таким образом, MetaX C-588 - это не столько конкурент в гонке гигафлопс, сколько специализированный и высокоэффективный инструмент для бизнеса, которому необходимо разворачивать сложные нейросети с минимальными затратами на инфраструктуру.

Сдвиг фокуса с FLOPS на память - это не только вопрос скорости, но и вопрос экономики эксплуатации. Распределённый инференс, когда одна модель размазывается по нескольким картам, требует сложнейшего софта для синхронизации данных между GPU. Что неминуемо порождает огромные накладные расходы:

· задержки на передачу данных по шине (NVLink/NVSwitch);

· необходимость балансировки нагрузки;

· синхронизации состояний (KV-cache) между узлами.

В итоге, чтобы получить результат от двух карт, часто требуется дополнительные усилия и ресурсы. Карта с 128 ГБ памяти, такая как MetaX C-588, убирает эту проблему в зародыше. Она позволяет реализовать простую и эффективную архитектуру 1 карта = 1 инстанс, что радикально снижает требования к квалификации инженеров поддержки и упрощает масштабирование сервисов.

Три года рынок GPU для AI двигался по логике больше TFLOPS - больше денег.

H100, MI300X, Blackwell - каждый новый чип обещал удвоить пиковую производительность. Но практика развернула приоритеты.

Для инференса, а это уже более 50% расходов на AI в Китае - критична не пиковая скорость вычислений, а объём памяти.

Модель 70B параметров в FP16 весит ~140 ГБ. В GPTQ-4bit ~35 ГБ. Но нужно ещё место под KV-cache, батчи, системный оверхед.

На 80-гигабайтном H100 это превращается в головную боль: либо агрессивная квантизация с потерей качества, либо распределённый вывод с ростом латентности.

128 ГБ меняют уравнение. Модель до 120B параметров (в квантованном формате) размещается на одной карте.

Один GPU = один инстанс + минимум латентности + минимум сложностей. Именно этот набор предлагает MetaX C-588 (曦云 C588).