Ускоритель, созданный для корпоративных AI-нагрузок
Решение для плотного инференса, адаптации моделей и приватной AI-инфраструктуры, где критичны предсказуемая доступность, локализованные поставки и совместимость ПО.
Память и производительность
Профиль памяти с высокой пропускной способностью для инференса и обучения.
Архитектура
Вычислительная архитектура и модель исполнения.
Питание и охлаждение
Требования к интеграции в дата-центр.
Производительность
Пиковая теоретическая производительность для основных точностей AI.
Совместимость
Интерфейсы, фреймворки и среда развёртывания.
Физические размеры
Габариты карты для серверных платформ.
О товаре
Графический ускоритель Iluvatar Tianshu Zhixin Tiangai Bi-V150 64 Gb (китайское название - 天垓150) представляет собой второе поколение GPGPU-карт, разработанных шанхайской компанией Iluvatar CoreX (天数智芯). Появление ускорителя Iluvatar Tianshu Zhixin Tiangai Bi-V150 знаменует собой важный этап в развитии китайской индустрии искусственного интеллекта. Разработанный компанией Iluvatar CoreX, этот продукт является вторым поколением в линейке «Тяньгуай» и представляет собой полностью суверенный программно-аппаратный стек. В условиях глобальной конкуренции и технологического противостояния создание собственной GPGPU архитектуры, не копирующей западные аналоги, позволяет не только снизить зависимость от импорта, но и заложить фундамент для будущих инноваций внутри страны. Карта ориентирована на удовлетворение растущего внутреннего спроса на вычислительные мощности, необходимые для обучения и развертывания сложных нейросетей.
С инженерной точки зрения Bi-V150 представляет собой сбалансированное решение. Использование 7-нм технологического процесса и 64 ГБ сверхбыстрой памяти HBM2e, объединённых в упаковке 2.5D CoWoS, обеспечивает необходимый «запас прочности» для работы с современными большими языковыми моделями (LLM). Ключевой особенностью архитектуры является технология разделения нагрузки (Prefill/Decoding Disaggregation), которая интеллектуально распределяет вычислительные задачи, значительно повышая эффективность использования ресурсов при инференсе. Это позволяет извлекать максимум производительности из установленного «железа», минимизируя простои.
На программном уровне приоритетом для разработчиков стала бесшовная интеграция в существующую инфраструктуру. Поддержка ведущих фреймворков, таких как PyTorch и TensorFlow, а также заявленная совместимость с CUDA-кодом позволяют клиентам мигрировать на новое оборудование с минимальными затратами на адаптацию софта. Таким образом, Bi-V150 позиционируется как оптимальный инструмент для задач, где критически важен объём памяти для обработки гигантских массивов данных, предлагая конкурентоспособную альтернативу более дорогим зарубежным решениям в нише инференса и дообучения крупных моделей.