Chaitex
Chaitex / Чайтекс
О продукте

Ускоритель, созданный для корпоративных AI-нагрузок

Решение для плотного инференса, адаптации моделей и приватной AI-инфраструктуры, где критичны предсказуемая доступность, локализованные поставки и совместимость ПО.

Архитектура
CoreX 

Память и производительность

Профиль памяти с высокой пропускной способностью для инференса и обучения.

Объём видеопамяти64
Тип памятиHBM2e
Пропускная способность420
Тип интерконнектаInter-chip Interconnect
Скорость интерконнекта200-400

Архитектура

Вычислительная архитектура и модель исполнения.

АрхитектураCoreX 
Ядра-

Питание и охлаждение

Требования к интеграции в дата-центр.

Тепловыделение (TDP)350
ОхлаждениеПассивное
Форм-факторPCIe
Pixel Rate-
Texture Rate-

Производительность

Пиковая теоретическая производительность для основных точностей AI.

FP64
-
FP32
48
FP16
192
TF32
-
BF16 Tensor
192
FP8 Tensor
-
INT8 Tensor
384

Совместимость

Интерфейсы, фреймворки и среда развёртывания.

Интерфейс PCIePCIe 4.0x16
Кодирование видео-
Декодирование видео-

Физические размеры

Габариты карты для серверных платформ.

Слоты2
Длина312 мм
Высота111 мм
Ширина39 мм
Стоимость
По запросу
Специальные цены для кластерных развёртываний и пилотных партий.
Product information

О товаре

Графический ускоритель Iluvatar Tianshu Zhixin Tiangai Bi-V150 64 Gb (китайское название - 天垓150) представляет собой второе поколение GPGPU-карт, разработанных шанхайской компанией Iluvatar CoreX (天数智芯). Появление ускорителя Iluvatar Tianshu Zhixin Tiangai Bi-V150 знаменует собой важный этап в развитии китайской индустрии искусственного интеллекта. Разработанный компанией Iluvatar CoreX, этот продукт является вторым поколением в линейке «Тяньгуай» и представляет собой полностью суверенный программно-аппаратный стек. В условиях глобальной конкуренции и технологического противостояния создание собственной GPGPU архитектуры, не копирующей западные аналоги, позволяет не только снизить зависимость от импорта, но и заложить фундамент для будущих инноваций внутри страны. Карта ориентирована на удовлетворение растущего внутреннего спроса на вычислительные мощности, необходимые для обучения и развертывания сложных нейросетей.

С инженерной точки зрения Bi-V150 представляет собой сбалансированное решение. Использование 7-нм технологического процесса и 64 ГБ сверхбыстрой памяти HBM2e, объединённых в упаковке 2.5D CoWoS, обеспечивает необходимый «запас прочности» для работы с современными большими языковыми моделями (LLM). Ключевой особенностью архитектуры является технология разделения нагрузки (Prefill/Decoding Disaggregation), которая интеллектуально распределяет вычислительные задачи, значительно повышая эффективность использования ресурсов при инференсе. Это позволяет извлекать максимум производительности из установленного «железа», минимизируя простои.

На программном уровне приоритетом для разработчиков стала бесшовная интеграция в существующую инфраструктуру. Поддержка ведущих фреймворков, таких как PyTorch и TensorFlow, а также заявленная совместимость с CUDA-кодом позволяют клиентам мигрировать на новое оборудование с минимальными затратами на адаптацию софта. Таким образом, Bi-V150 позиционируется как оптимальный инструмент для задач, где критически важен объём памяти для обработки гигантских массивов данных, предлагая конкурентоспособную альтернативу более дорогим зарубежным решениям в нише инференса и дообучения крупных моделей.