Chaitex
Chaitex / Чайтекс
О продукте

Ускоритель, созданный для корпоративных AI-нагрузок

Решение для плотного инференса, адаптации моделей и приватной AI-инфраструктуры, где критичны предсказуемая доступность, локализованные поставки и совместимость ПО.

Архитектура
XPU‑R

Память и производительность

Профиль памяти с высокой пропускной способностью для инференса и обучения.

Объём видеопамяти32
Тип памятиGDDR6
Пропускная способность512
Тип интерконнекта-
Скорость интерконнекта64

Архитектура

Вычислительная архитектура и модель исполнения.

АрхитектураXPU‑R
Ядра-

Питание и охлаждение

Требования к интеграции в дата-центр.

Тепловыделение (TDP)130
ОхлаждениеПассивное
Форм-факторPCIe
Pixel Rate-
Texture Rate-

Производительность

Пиковая теоретическая производительность для основных точностей AI.

FP64
-
FP32
32
FP16
128
TF32
-
BF16 Tensor
-
FP8 Tensor
-
INT8 Tensor
256

Совместимость

Интерфейсы, фреймворки и среда развёртывания.

Интерфейс PCIePCIe 4.0x16
Кодирование видео30x1080p25fps
Декодирование видео140x1080p30fps

Физические размеры

Габариты карты для серверных платформ.

Слоты2
Длина- мм
Высота- мм
Ширина- мм
Стоимость
По запросу
Специальные цены для кластерных развёртываний и пилотных партий.
Product information

О товаре

Baidu Kunlun RG800 32GB PCIe представляет собой сбалансированное решение среднего класса (mid-range) от дочерней компании Baidu, разработанное специально для эпохи массового внедрения искусственного интеллекта. В отличие от универсальных GPU, эта карта на базе архитектуры XPU-P третьего поколения сфокусирована на задачах инференса и компьютерного зрения, где критически важны высокая пропускная способность памяти и энергоэффективность.

Благодаря использованию быстрой памяти HBM2e объёмом 32 ГБ и умеренному тепловыделению (TDP ~150 - 200 Вт), ускоритель позволяет эффективно обрабатывать большие языковые модели до 32 млрд параметров без необходимости в сложном жидкостном охлаждении, что делает его оптимальным выбором как для дата-центров, так и для edge вычислений.

Ключевым архитектурным преимуществом RG800 является физическое разделение вычислительных блоков (GEMM) и коммуникационных модулей, работающих параллельно, что обеспечивает пиковую эффективность в матричных операциях до 40% выше предыдущего поколения. Высокая пропускная способность памяти (~1.0–1.2 ТБ/с) устраняет бутылочное горлышко при работе с трансформерными моделями и длинными контекстами, а поддержка асинхронного выполнения операций (compute + data movement overlap) гарантирует масштабируемость свыше 90% в кластерных конфигурациях. Хотя карта использует стандартный интерфейс PCIe Gen4 x16 без прямого аналога NVLink, её производительности достаточно для большинства сценариев логического вывода, особенно учитывая преимущество по объёму видеопамяти перед конкурентами вроде NVIDIA A10.

Однако выбор этого решения сопряжён с учётом программной экосистемы. Ускоритель глубоко интегрирован в стек PaddlePaddle/Kunlun SDK, что даёт максимальную производительность пользователям этой платформы, но требует адаптации моделей из более популярных фреймворков (PyTorch/TensorFlow). Кроме того, статус производителя в санкционном списке Entity List US 1260H усложняет логистику поставок. Тем не менее, для российских компаний, нацеленных на локальный деплой нейросетевых сервисов и готовых к миграции на PaddlePaddle, Kunlun RG800 предлагает уникальное сочетание объёма памяти, производительности и энергоэффективности, становясь стратегическим активом для построения суверенной AI-инфраструктуры.