ChaiTex
ChaiTex / ЧайтексКитайские GPU Технологии
Назад к Видеокарты
YH001 PCIe Карта Ускоритель 48ГБ 1

YH001 PCIe Карта Ускоритель 48ГБ

Специализированный AI-чип нового поколения, спроектированный как основа для облачных вычислений и работы с крупными языковыми моделями (LLM). Это не просто ускоритель, а полноценная архитектурная платформа, где упор сделан на эффективность матричных операций, масштабируемость и гибкость под кастомные AI-нагрузки. В основе лежит гибридный подход к ISA: используется RISC-V (base) с векторным расширением RVV, дополненный кастомными матричными инструкциями и собственной виртуальной архитектурой команд (VISA). Это даёт ключевое преимущество — возможность тонкой настройки под конкретные модели и алгоритмы, в отличие от фиксированных ISA в традиционных GPU. С точки зрения вычислений чип построен по TPU-подобной архитектуре: внутри реализованы двойные systolic array-матрицы, оптимизированные под плотные линейные алгебраические операции, характерные для LLM и deep learning. Дополняет это высокопроизводительный 4D DMA-движок, который решает одну из главных проблем современных ускорителей — узкое место при перемещении данных. В результате достигается высокая эффективность как в compute, так и в data movement. Отдельный акцент сделан на оптимизации под большие модели, в частности под архитектуры уровня DeepSeek. Поддерживается формат Blocked FP8 — это позволяет существенно снизить требования к памяти и повысить throughput без критичной потери точности, что особенно важно при инференсе и обучении больших моделей. Для масштабирования используется собственный интерконнект YHLink. Он позиционируется как альтернатива NVIDIA NVLink и ориентирован на построение крупных кластеров с поддержкой In-Network Computing. Это означает, что часть вычислений может выполняться прямо на уровне сети, снижая latency и разгружая сами чипы. В целом, это специализированный AI-чип для датацентров, заточенный под: крупные языковые модели (LLM), распределённое обучение, высоконагруженный inference, построение масштабируемых AI-кластеров. Ключевая идея — уйти от универсальности GPU в сторону глубокой вертикальной оптимизации под AI-нагрузки, где важны не только FLOPS, но и эффективность работы с памятью, сетью и кастомными форматами данных."

Видеопамять
48
FP32
64
TDP
-
Интерфейс
PCIe 5.0x16
Предзаказ
Статус продукта

Характеристики памяти

Видеопамять
48
Тип видеопамяти
HBM3e
Пропускная способность
1000
Интерфейс
PCIe 5.0x16
Тип интерконнекта
YHLink
Скорость интерконнекта
600

Производительность вычислений

FP64 VectorINT4 TOPS 1024
FP32 Vector64
FP16 Vector-
TF32 Tensor-
FP/BF16 Tensor256
FP8 Tensor512
INT8 Tensor512

Графика и тепловыделение

Pixel Rate (GPixels/s)
-
Texture Rate (GTexels/s)
-
TDP
-
Тип охлаждения
Пассивное
Форм-фактор
PCIe Card
Кодирование видео
-
Декодирование видео
-

Архитектура

Архитектура
TPU Архитектура
Ядра
-
Стоимость
По запросу