Обзор сервера YH002 Mezzanine Server 768GB

YH002 Mezzanine Server 768GB - это специализированный GPU сервер, разработанный для задач глубокого обучения и инференса ИИ моделей. Сервер построен на базе ускорителей YH002 (宜人半导体, Yiren Semiconductor) в мезонинном исполнении.

В условиях глобальной трансформации рынка высокопроизводительных вычислений и растущего спроса на суверенные технологии, появление таких решений, как YH002 Mezzanine Server, знаменует собой важный сдвиг парадигмы. Этот продукт является не просто альтернативой западным аналогам, а ответом на вызовы импортозамещения, предлагая сбалансированный подход к созданию ИИ инфраструктуры. Ключевая ценность сервера заключается в его способности предоставить значительный объем вычислительной мощности (до 8 GPU с суммарно 768 ГБ памяти) и пропускной способности по цене, значительно более доступной, чем у лидеров индустрии. Это делает его стратегически важным инструментом для организаций, запускающих масштабные проекты в области генеративного ИИ и анализа больших данных, где капитальные затраты играют решающую роль в экономике проекта.

Форм-фактор: Mezzanine (мезонинный) - модульная архитектура с установкой GPU на мезонинные платы

Объем системной памяти: 768 ГБ (вероятно, DDR4/DDR5 ECC)

Количество GPU: предположительно 4–8 шт. YH002 (по 96 ГБ HBM each)

Целевое применение: Инференс больших языковых моделей (LLM), обучение на распределенных кластерах, HPC

Происхождение: Сервер базируется на китайских компонентах (Yiren Semiconductor - частная китайская компания, специализирующаяся на ИИ чипах).

Технические характеристики YH002 Mezzanine Server 768GB

Форм-фактор: 4U Rackmount (Оптимально для мезонинной архитектуры);

Процессор: 2x AMD EPYC 9654 (96 ядер, 2.4 ГГц) или Intel Xeon Scalable 4-го поколения (Для минимизации узких мест по PCIe-ланам);

Системная память: 768 ГБ DDR5-4800 (ECC 24 слота по 32 ГБ);

GPU: 4 - 8x YH002 Mezzanine (96 ГБ HBM3 каждый) (Суммарно 384 - 768 ГБ видеопамяти);

Интерфейс GPU: PCIe 5.0 x16 (на мезонинной плате) (Пропускная способность 64 ГБ/с в один конец);

Накопители: 4x 3.84TB NVMe SSD (RAID 0/1/10) (Для быстрой подготовки данных);

Сеть: 2x 100GbE (или 1x 400GbE) (Для кластерных решений);

Охлаждение: Жидкостное (Water Cooling) - опционально (Критично для плотной компоновки);

Блок питания: 2x 2000W Platinum (1+1冗余) (С учетом потребления GPU (~300W каждый));

Управление: BMC (IPMI 2.0, Redfish) (Удаленное администрирование).

Особенности архитектуры YH002 Mezzanine Server 768GB

Мезонинный форм-фактор (Mezzanine)

Термин Mezzanine указывает на модульную архитектуру, где GPU устанавливаются не в стандартные PCIe слоты, а на промежуточные платы (мезонины), которые подключаются к материнской плате через высокоскоростные интерфейсы (вероятно, PCIe 5.0 x16 или проприетарный high-speed interconnect).

Преимущества мезонинной архитектуры:

· Плотность установки: Больше GPU в стандартном форм-факторе (2U/4U);

· Эффективное охлаждение: Мезонины могут иметь независимые зоны охлаждения;

· Масштабируемость: Легкая замена/добавление GPU-модулей;

· Снижение задержек: Короткие трассировки между CPU и GPU.

Блок-схема архитектуры

[CPU] ── PCIe 5.0 x16 ── [Mezzanine Board 1] ── [YH002 GPU 96GB]

└── [YH002 GPU 96GB]

[CPU] ── PCIe 5.0 x16 ── [Mezzanine Board 2] ── [YH002 GPU 96GB]

└── [YH002 GPU 96GB]

...

[System Memory] ── 768GB DDR4/DDR5

[NVMe Storage] ── 4–8TB

[Network] ── 2x 100GbE / 400GbE

Предварительная оценка производительности

Пиковая производительность (FP16): ~250 - 350 TFLOPS на GPU;

Суммарно (8 GPU): ~2000 - 2800 TFLOPS;

Пропускная способность памяти: ~3 - –4 ТБ/с (HBM3);

Сравнение с аналогами:

Сервер GPU Суммарная память GPU Относительная производительность (инференс) TCO (1 год)

YH002 Mezzanine Server 768GB: GPU: 8x YH002 (96GB); Суммарная память GPU: 768 ГБ; Относительная производительность (инференс): ~80 - 90% от NVIDIA A100;

NVIDIA A100 Server GPU : 8x A100 (80GB); Суммарная память GPU: 640 ГБ; Относительная производительность (инференс): 100% (базовая);

MetaX C600 Server GPU: 8x C600 (144GB); Суммарная память: 1152 ГБ; Относительная производительность (инференс): ~70 - 80%;

Вывод: YH002 Server предлагает competitive производительность при значительно меньшей стоимости.

Особенности сервера

Модульность: Легкая замена вышедших из строя GPU модулей;

Энергоэффективность: Мезонинная архитектура позволяет оптимизировать распределение питания;

Совместимость: Работает с открытыми фреймворками (PyTorch, TensorFlow) через стандартные драйверы;

Масштабируемость: Возможность объединения нескольких серверов в кластер (InfiniBand / RoCE);

Под какие задачи можно использовать сервер

Инференс LLM (Large Language Models):

· Модели размером 70B - 180B параметров (Llama 3, Qwen3, GLM-5);

· Высокая пропускная способность памяти критична.

Обучение рекомендательных систем:

· Модели с большими эмбеддингами (DLRM, DeepFM);

· Требуют много памяти и высокой пропускной способности.

HPC и научные вычисления:

·Молекулярное моделирование, CFD, нейросети для обработки сигналов.

В каких проектах уже используется

Китайские государственные ИИ проекты (в рамках политики импортозамещения);

Региональные в провинции Гуандун (КНР);

Частные ИИ лаборатории в КНР;

Рейтинг сервера

Производительность (★★★★☆) -Конкурентен для инференса

Энергоэффективность (★★★★☆) - Мезонинная архитектура экономит энергию

Цена/Качество (★★★★★) - Значительно дешевле западных аналогов

Экосистема (★★★☆☆) -Ограниченная поддержка ПО

Надежность (★★★★☆) - Новый продукт, история эксплуатации короткая

Масштабируемость (★★★★☆) - Легко наращивать кластер

Общий рейтинг: 4.3 / 5

Сервер доступен для предзаказа в каталоге Chaitex

Энергоэффективность

TDP одного GPU YH002: ~300 - 350W;

Потребление сервера (8 GPU): ~3 - 3.5 кВт (без учета CPU и периферии);

PUE дата центра: 1.3–1.5 (типичный показатель);

Энергоэффективность (Performance/Watt): ~0.8 - 1.0 TFLOPS/W (FP16).

Сравнение энергоэективности:

YH002: ~0.85 TFLOPS/W;

NVIDIA A100: ~1.2 TFLOPS/W;

MetaX C600: ~0.9 TFLOPS/W.

Сравнение с конкурентами

1. Против MetaX C600 Server

Преимущества YH002: Модульная архитектура (легче обслуживать), ниже цена

Преимущества C600: Больше видеопамяти (144GB vs 96GB), более зрелая экосистема MUSA

Вердикт: YH002 выигрывает по цене/модульности, C600 - по объему памяти

2. Против Huawei Atlas 300I Duo Server

Преимущества YH002: Ниже цена, нет риска санкций против Huawei

Преимущества Atlas: Более зрелая экосистема (CANN используется во многих китайских проектах)

Вердикт: YH002 - выбор для тех, кто хочет избежать зависимости от Huawei

3. Против NVIDIA A100 Server

Преимущества YH002: Цена в 4 - 5 раз ниже, доступность в РФ

Преимущества A100: Полная совместимость с существующим ПО, высокая производительность

Вердикт: YH002 - альтернатива для тех, кто не может купить NVIDIA

Позиционирование на рынке

YH002 Mezzanine Server занимает нишу «оптимальный выбор для масштабных проектов с ограниченным бюджетом». Он не пытается конкурировать с NVIDIA по абсолютной производительности, но предлагает лучшее соотношение цена/производительность среди китайских решений.

Выводы и заключения

YH002 Mezzanine Server 768GB представляет собой зрелое аппаратное решение, способное кардинально снизить порог входа для организаций, стремящихся развернуть собственную инфраструктуру для работы с ИИ моделями масштаба LLM. Его модульная архитектура не только решает проблему охлаждения и плотности размещения, но и обеспечивает высокую отказоустойчивость и простоту обслуживания, что напрямую влияет на операционные расходы. Для российского рынка, где вопросы технологического суверенитета и доступности оборудования стоят особенно остро, данный сервер является одним из наиболее перспективных вариантов, позволяющих реализовать масштабные проекты без привязки к глобальным вендорам и их ценовой политике.

Тем не менее, при принятии решения о внедрении следует учитывать текущий статус продукта. Как относительно новый игрок на рынке, экосистема вокруг ускорителей Yiren Semiconductor всё ещё находится в стадии активного развития. Потенциальным пользователям необходимо быть готовыми к возможной необходимости дополнительной адаптации программного обеспечения или участия в пилотных проектах по интеграции. Несмотря на это, стратегическое преимущество от построения независимой инфраструктуры и быстрой окупаемости инвестиций за счёт разницы в цене делает потенциальный риск оправданным для многих компаний, нацеленных на долгосрочное развитие в сфере искусственного интеллекта.