ChaiTex
ChaiTex / ЧайтексКитайские GPU Технологии
Назад к Видеокарты
YH002 Мезонинный Модуль 96ГБ 1

YH002 Мезонинный Модуль 96ГБ

Cпециализированный AI-чип нового поколения, спроектированный как основа для облачных вычислений и работы с крупными языковыми моделями (LLM). Это не просто ускоритель, а полноценная архитектурная платформа, где упор сделан на эффективность матричных операций, масштабируемость и гибкость под кастомные AI-нагрузки. В основе лежит гибридный подход к ISA: используется RISC-V (base) с векторным расширением RVV, дополненный кастомными матричными инструкциями и собственной виртуальной архитектурой команд (VISA). Это даёт ключевое преимущество — возможность тонкой настройки под конкретные модели и алгоритмы, в отличие от фиксированных ISA в традиционных GPU. С точки зрения вычислений чип построен по TPU-подобной архитектуре: внутри реализованы двойные systolic array-матрицы, оптимизированные под плотные линейные алгебраические операции, характерные для LLM и deep learning. Дополняет это высокопроизводительный 4D DMA-движок, который решает одну из главных проблем современных ускорителей — узкое место при перемещении данных. В результате достигается высокая эффективность как в compute, так и в data movement. Отдельный акцент сделан на оптимизации под большие модели, в частности под архитектуры уровня DeepSeek. Поддерживается формат Blocked FP8 — это позволяет существенно снизить требования к памяти и повысить throughput без критичной потери точности, что особенно важно при инференсе и обучении больших моделей. Для масштабирования используется собственный интерконнект ELink. Он позиционируется как альтернатива NVIDIA NVLink и ориентирован на построение крупных кластеров с поддержкой In-Network Computing. Это означает, что часть вычислений может выполняться прямо на уровне сети, снижая latency и разгружая сами чипы. В целом, это специализированный AI-чип для датацентров, заточенный под: крупные языковые модели (LLM), распределённое обучение, высоконагруженный inference, построение масштабируемых AI-кластеров. Ключевая идея — уйти от универсальности GPU в сторону глубокой вертикальной оптимизации под AI-нагрузки, где важны не только FLOPS, но и эффективность работы с памятью, сетью и кастомными форматами данных."

Видеопамять
96
FP32
128
TDP
-
Интерфейс
PCIe 5.0x16
Предзаказ
Статус продукта

Характеристики памяти

Видеопамять
96
Тип видеопамяти
HBM3e
Пропускная способность
1200
Интерфейс
PCIe 5.0x16
Тип интерконнекта
YHLink
Скорость интерконнекта
1200

Производительность вычислений

FP64 VectorINT4 TOPS 2048
FP32 Vector128
FP16 Vector-
TF32 Tensor-
FP/BF16 Tensor512
FP8 Tensor1024
INT8 Tensor1024

Графика и тепловыделение

Pixel Rate (GPixels/s)
-
Texture Rate (GTexels/s)
-
TDP
-
Тип охлаждения
Пассивное
Форм-фактор
Mezzanine Module
Кодирование видео
-
Декодирование видео
-

Физические размеры

Слоты
-
Длина
- мм
Высота
- мм
Ширина
- мм

Архитектура

Архитектура
TPU Архитектура
Ядра
-
Стоимость
По запросу