ВидеокартыПредзаказ

Baidu Kunlun RG800 32Гб

Baidu Kunlun RG800 (Kunlun II) - серийный AI ускоритель второго поколения на 7-нм техпроцессе, обеспечивающий производительность в 2–3 раза выше предыдущего поколения Kunlun I.

Карта оснащена 32 ГБ GDDR6 (512 ГБ/с) и обеспечивает 128 TFLOPS FP16, 256 TOPS INT8 при TDP 130 Вт.

Глубоко интегрирован с фреймворком PaddlePaddle и применяется в инфраструктуре Baidu: поисковый движок, Apollo (автономные автомобили), ERNIE Bot.

Встроенный видеодекодер поддерживает 140 потоков 1080p. XPU-Link обеспечивает P2P-соединение карт.

Ориентирован на ранжирование поиска, NLP-задачи, алгоритмы беспилотных автомобилей и промышленную модернизацию.

О продукте

Ускоритель, созданный для корпоративных AI-нагрузок

Решение для плотного инференса, адаптации моделей и приватной AI-инфраструктуры, где критичны предсказуемая доступность, локализованные поставки и совместимость ПО.

Архитектура

XPU‑R

Память и производительность

Профиль памяти с высокой пропускной способностью для инференса и обучения.

Объём видеопамяти32

Тип памятиGDDR6

Пропускная способность512

Тип интерконнекта-

Скорость интерконнекта64

Архитектура

Вычислительная архитектура и модель исполнения.

АрхитектураXPU‑R

Ядра-

Питание и охлаждение

Требования к интеграции в дата-центр.

Тепловыделение (TDP)130

ОхлаждениеПассивное

Форм-факторPCIe

Pixel Rate-

Texture Rate-

Производительность

Пиковая теоретическая производительность для основных точностей AI.

FP64

FP32

FP16

128

TF32

BF16 Tensor

FP8 Tensor

INT8 Tensor

256

Совместимость

Интерфейсы, фреймворки и среда развёртывания.

Интерфейс PCIePCIe 4.0x16

Кодирование видео30x1080p25fps

Декодирование видео140x1080p30fps

Физические размеры

Габариты карты для серверных платформ.

Слоты2

Длина- мм

Высота- мм

Ширина- мм

Стоимость

По запросу

Специальные цены для кластерных развёртываний и пилотных партий.

Product information

О товаре

Baidu Kunlun RG800 32GB PCIe представляет собой сбалансированное решение среднего класса (mid-range) от дочерней компании Baidu, разработанное специально для эпохи массового внедрения искусственного интеллекта. В отличие от универсальных GPU, эта карта на базе архитектуры XPU-P третьего поколения сфокусирована на задачах инференса и компьютерного зрения, где критически важны высокая пропускная способность памяти и энергоэффективность.

Благодаря использованию быстрой памяти HBM2e объёмом 32 ГБ и умеренному тепловыделению (TDP ~150 - 200 Вт), ускоритель позволяет эффективно обрабатывать большие языковые модели до 32 млрд параметров без необходимости в сложном жидкостном охлаждении, что делает его оптимальным выбором как для дата-центров, так и для edge вычислений.

Ключевым архитектурным преимуществом RG800 является физическое разделение вычислительных блоков (GEMM) и коммуникационных модулей, работающих параллельно, что обеспечивает пиковую эффективность в матричных операциях до 40% выше предыдущего поколения. Высокая пропускная способность памяти (~1.0–1.2 ТБ/с) устраняет бутылочное горлышко при работе с трансформерными моделями и длинными контекстами, а поддержка асинхронного выполнения операций (compute + data movement overlap) гарантирует масштабируемость свыше 90% в кластерных конфигурациях. Хотя карта использует стандартный интерфейс PCIe Gen4 x16 без прямого аналога NVLink, её производительности достаточно для большинства сценариев логического вывода, особенно учитывая преимущество по объёму видеопамяти перед конкурентами вроде NVIDIA A10.

Однако выбор этого решения сопряжён с учётом программной экосистемы. Ускоритель глубоко интегрирован в стек PaddlePaddle/Kunlun SDK, что даёт максимальную производительность пользователям этой платформы, но требует адаптации моделей из более популярных фреймворков (PyTorch/TensorFlow). Кроме того, статус производителя в санкционном списке Entity List US 1260H усложняет логистику поставок. Тем не менее, для российских компаний, нацеленных на локальный деплой нейросетевых сервисов и готовых к миграции на PaddlePaddle, Kunlun RG800 предлагает уникальное сочетание объёма памяти, производительности и энергоэффективности, становясь стратегическим активом для построения суверенной AI-инфраструктуры.