Lenovo WenTian WA5480 G3 server review with MetaX C500 GPU 512GB VRAM

Lenovo WenTian WA5480 G3 - это флагманский 4U GPU сервер линейки WenTian от подразделения Lenovo China Infrastructure. Платформа ориентирована на AI обучение, AI инференс, научные вычисления и визуализацию. Серия WA5480 - флагман для GPU вычислений с поддержкой до 8 двухслотовых PCIe ускорителей.

Конфигурация с MetaX C500: сервер укомплектован 8 ускорителями MetaX C500 с HBM2e 64 GB каждый, системная память 512 GB DDR5, два процессора Intel Xeon Platinum 8558 (48 ядер, 96 потоков каждый). Общая конфигурация GPU памяти - 512 GB VRAM.

Позиционируется как решение для AI инференса и обучения средних моделей в условиях, когда западное оборудование недоступно или экономически нецелесообразно.

Технические характеристики Lenovo WenTian WA5480 G3 с GPU MetaX C500 512GB VRAM

Характеристики платформы Lenovo WA5480 G3

Параметр: Lenovo WA5480 G3;

CPU: 2 × Intel Xeon Platinum 8558 (48C/96T);

Частота CPU: До 3.4 ГГц;

Системная память: 512 GB DDR5-4800 (8 × 64 GB);

Слоты GPU: 8 × PCIe 4.0 x16 (dual-width);

Накопители: 8 × 3.5" + 8 × 2.5" (SAS/SATA/NVMe);

Сеть: 1 GbE × 4 (базовая), опционально 10/25/100/200/400 GbE;

Блоки питания: 4 × 2700 Вт (N+1 избыточность);

Форм-фактор: 4U (448 × 175 × 850 мм);

Вес: ~55 кг (без GPU).

Характеристики GPU MetaX C500

Параметр: MetaX C500;

Архитектура: Собственная GPU IP (MetaX);

Техпроцесс: 7 нм;

Память VRAM: 64 GB HBM2e;

Интерконнект: MetaXLink;

Поддержка precision: FP32, FP16, BF16, INT8;

Софтверный стек: MXMACA (CUDA совместимый);

Интерфейс: PCIe 4.0 x16;

TDP (оценка): 250 - 300 Вт.

Полная конфигурация 512 GB

GPU: 8 × MetaX C500 (64 GB);

Общая VRAM: 512 GB;

CPU: 2 × Intel Xeon Platinum 8558;

Оперативная память: 512 GB DDR5;

SSD загрузочный: 2 × 960 GB NVMe;

Хранилище данных: 3 × 8 TB SAS (пример);

Суммарный TDP GPU: ~2 000 - 2 400 Вт;

Суммарная мощность сервера: ~3 500 - 4 000 Вт.

Особенности архитектуры сервера Lenovo WenTian WA5480 G3 с GPU MetaX C500 512GB VRAM

Архитектура платформы

Форм-фактор: 4U монтаж в стойку (448 × 175 × 850 мм). Сервер занимает 4 юнита в стойке.

Прямое подключение CPU-GPU. Ключевая архитектурная особенность: каждый процессор Intel Xeon напрямую соединён с 4 GPU через выделенные PCIe линии без промежуточного PCIe Switch. Обеспечивает низкую латентность и стабильную пропускную способность.

Модульная конструкция, три функциональные зоны:

· передняя зона (8 × 3,5" + 8 × 2,5");

· центральная зона (процессоры и память);

· задняя зона (8 слотов GPU).

Архитектура охлаждения

Раздельная воздушная система охлаждения:

· Воздух поступает через переднюю панель, проходит через стену вентиляторов;

· Поток разделяется: к CPU/памяти и напрямую к GPU зоне;

· Охлаждение рассчитано на 8 GPU с общим TDP до 2 400 Вт;

· Поддержка охлаждения 2 × CPU до 350 Вт TDP каждый.

GPU ускорители MetaX C500

MetaX - китайский разработчик GPU, основан в 2020 году: Архитектура MetaX - полностью независимая, не копия AMD/NVIDIA; MXMACA - софтверный стек, совместимый с CUDA; MetaXLink - межGPU интерконнект; HBM2e 64 GB на карту, подходит для LLM до 13B параметров в FP16; Мульти-точность: FP32, FP16, BF16, INT8.

Предварительная оценка производительности

· Инференс LLM (7B - 70B). 512 GB VRAM позволяет размещать модели до 70B параметров (в 4-bit квантования) полностью в памяти сервера - снижает latency по сравнению с multi-GPU inference;

· Обучение / fine-tuning. Поддержка MXMACA + PyTorch. Модели до 13B параметров помещаются на одну карту, модели 30B - 70B - распределяются на 2 - 4 карты;

· Батчевая обработка. 8 GPU позволяют обрабатывать большие батчи;

· Визуализация и рендеринг. 8 × 64 GB HBM2e пригодятся для графических задач.

· Пиковая FP16 производительность. C500 генерирует ~15 TFLOPS FP32 (оценка на основе архитектурно схожих решений). По сравнению с A100 (19.5 TFLOPS FP32) или H100 (67 TFLOPS FP32) разрыв значимый;

· Пропускная способность памяти. ~1.8 TB/s (HBM2e) против 2.0 TB/s у A100 и 3.35 TB/s у H100;

· Зрелость софта. MXMACA растёт, но до уровня CUDA много ещё не хватает.

Оценка производительности относительно NVIDIA A100:

· FP32: ~75–80%;

· FP16 (inference): ~70 - 75%;

· Память (ёмкость): 64 GB против 80 GB - 80%;

· Пропускная способность памяти: ~85 - 90%;

· Energy efficiency: ~85 - 90%.

Особенности сервера Lenovo WenTian WA5480 G3 с GPU MetaX C500 512GB VRAM

Гибкость конфигурации, WA5480 G3 совместим не только с MetaX, но и с NVIDIA (A100/H100/L40S/RTX), AMD, Intel. Платформа полностью открыта - защита инвестиций;

4 × 2700 Вт блоки питания с N+1 избыточностью. Резервирование критично при 8 GPU с TDP 250 - 350 Вт каждый;

До 16 накопителей: 8 × 3.5" + 8 × 2.5" слотов обеспечивают необходимый storage bandwidth для AI training;

Сертификаты: ISO, CE, CCC (NAPL).

Под какие задачи можно использовать сервер

Инференс LLM 7B - 70B - Прямое размещение на одной или нескольких картах. 512 GB VRAM достаточно для 70B модели с квантованием;

Обучение / Fine-tuning - PyTorch + MXMACA. Модели до 13B (одна карта), 30B–70B (2–4 карты);

HPC (научные расчёты) - OpenMP + CUDA через MXMACA. Прямое подключение снижает latency;

Графика / визуализация - OpenGL/Vulkan. 512 GB VRAM позволяет работать с большими сценами;

Data preprocessing - CPU + GPU pipelining. 96 ядер CPU параллельно с GPU;

GPU-кластер (8 карт) - MetaXLink. Масштабирование на уровне сервера;

Рендеринг - Blender, другие. Большой объём памяти минимизирует OOM.

Информация о проведённых тестированиях

· 2023 (август): MetaX C500 прошёл адаптацию с ChatGLM2-6B - тысячепараметрическая LLM прошла инференс и fine-tuning на C500.

· 2023 (август): Адаптация с Future Speed - компанией из экосистемы GPU инференса.

· MetaX подтверждает совместимость: C500 сертифицирован для работы с 2-ядерными и 4-ядерными серверными платформами, включая Lenovo, Inspur, H3C.

В каких проектах уже используется

Китайский рынок:

· Китайские AI-датацентры. Lenovo + китайские GPU (MetaX, Moore Threads) внедряются в региональные AI computing platforms как альтернатива NVIDIA.

· Системные интеграторы: Lenovo тесно сотрудничает с MetaX для сертификации совместимости WA5480/C500.

Российский / международный рынок

· Поставки конфигураций WA5480 G3 + MetaX C500 512 GB через ChaiTex для enterprise клиентов в России и СНГ.

· Использование в департаментах data science и AI research.

Статус сертификации

· Lenovo сертифицировала комбинацию WA5480 + MetaX C500 на уровне совместимости (compatibility certified).

· Intel Platform Validation подтверждён для платформы Sapphire Rapids.

Рейтинг сервера Lenovo WenTian WA5480 G3 с GPU MetaX C500 512GB VRAM

Аппаратная надёжность (★★★★☆) - Lenovo уровень enterprise качества, но платформа относительно новая;

Производительность GPU (★★★☆☆) - C500 = ~75–80% A100 по FP32, но память на уровне;

Производительность CPU (★★★★☆) - Intel Xeon Platinum 8558 - 48 ядер, отличный выбор;

Экосистема софта (★★★☆☆) - MXMACA растёт, но до CUDA и ROCm далеко;

Энергоэффективность (★★★★☆) - Хороший perf/Watt для inference, но не рекордный;

Стоимость (TTV) (★★★★☆) - Значительно дешевле A100/H100 сервера при 80% производительности;

Надёжность поставщика (★★★★★) - Lenovo + MetaX (IPO декабрь 2025) - обе публичные компании;

Масштабируемость (★★★★☆) - 8 карт в сервере, MetaXLink для кластеризации;

Гибкость (GPU-agnostic) (★★★★☆) - Платформа поддерживает NVIDIA/AMD/Intel/китайские GPU;

Документация / поддержка (★★★☆☆) - Lenovo docs + MetaX docs, но количество русскоязычных материалов ограничено.

Итоговый рейтинг: 4/5

Сервер доступен для предзаказа в каталоге Chaitex

Хороший enterprise сервер для AI инференса и обучения средних моделей. Основные плюсы - гибкость платформы (CPU/GPU agnostic), надёжный бренд Lenovo, достаточная для большинства задач производительность. Минусы - софтовая экосистема MXMACA всё ещё догоняет CUDA.

Энергоэффективность

Мощность компонентов

2 × Intel Xeon Platinum 8558 - 2 × 260 Вт = 520 Вт;

8 × MetaX C500 (оценка) - 8 × 275 Вт = 2 200 Вт;

Системная память (512 GB DDR5) ~25 Вт;

Накопители + вентиляторы ~50 Вт;

Суммарная мощность в load ~2 800 - 3 200 Вт;

Пиковая мощность (Transient) ~3 500 - 4 000 Вт

Блоки питания

· 4 × 2700 Вт Platinum = 10 800 Вт суммарно;

· При load 3 000 Вт: нагрузка на PSU = ~28%;

· При пике 4 000 Вт: нагрузка = ~37%;

· Избыточность обеспечивает margin для transient loads и N+1 redundancy.

Оценка энергоэффективности

PUE (оценка для сервера) - 1.15 - 1.20;

Perf/Watt - FP32 (оценка) ~4.5 TFLOPS/kW;

Perf/Watt - Inference INT8 (оценка) ~18–20 TOPS/kW;

Класс энергоэффективности - Platinum PSU (>94% на 50% load).

Выводы и заключения

Бренд Lenovo. Global enterprise вендор с репутацией, сервисной сетью и запасными частями. Это не startup - софтверная и аппаратная поддержка гарантированы.

Гибкость платформы. WA5480 G3 поддерживает любые PCIe ускорители. Сегодня MetaX, завтра - NVIDIA, AMD или следующее поколение китайских GPU. Инвестиции защищены.

Объёмный GPU-памяти. 512 GB VRAM позволяет инферировать даже 70B модели без распределённых вычислений - экономит на latency.

N+1 power redundancy. 4 × 2700 Вт - запас по мощности для пиковых transient loads и резервирование.

Цена. Существенно ниже аналогичной конфигурации с A100/H100, особенно учитывая серый рынок и премии за NVIDIA в 2025–2026.

Для кого этот сервер

· Enterprise AI-отделы, строящие AI-инфраструктуру с ограниченным бюджетом;

· Интеграторы, ищущие готовую сертифицированную платформу;

· Government / regulated industries, где импортозамещение - критичное требование;

· AI-стартапы, начинающие с inference и планирующие горизонтально масштабироваться.

Рекомендуется для: inference production (LLM, computer vision), fine-tuning (7B–30B моделей), HPC batch jobs, GPU кластер среднего масштаба (1 - 10 серверов).

! обучения foundation models 175B+ с нуля (лучше кластер с NVLink), real-time low-latency inference с жёсткими latency SLA (оптимизируйте сначала на одной карте).

Lenovo WenTian WA5480 G3 с GPU MetaX C500 и 512 GB VRAM - это современное решение для задач искусственного интеллекта и научных вычислений, ориентированное на корпоративный сегмент и рынок с ограниченным доступом к западным технологиям. Сервер выделяется гибкостью конфигурации: он поддерживает не только китайские ускорители MetaX, но и GPU от NVIDIA, AMD и Intel, что обеспечивает защиту инвестиций и возможность модернизации. Ключевым преимуществом является огромный объём видеопамяти - 512 GB VRAM, что позволяет запускать инференс и fine-tuning даже для крупных языковых моделей (до 70B параметров) без необходимости распределённых вычислений, минимизируя задержки и упрощая инфраструктуру.

Аппаратная надёжность Lenovo, резервирование блоков питания и сертификация платформы подтверждают её готовность к эксплуатации в enterprise среде.

Для большинства задач AI инференса, обучения средних моделей, HPC и визуализации сервер WA5480 G3 представляет собой сбалансированное и экономически выгодное решение, особенно в условиях импортозамещения и ограниченного бюджета. Его рекомендуется использовать в enterprise AI отделах, государственных структурах, интеграторах и стартапах, которым важна гибкость, надёжность и поддержка на российском рынке.

Обзор сервера Lenovo WenTian WA5480 G3 с GPU MetaX C500 512GB VRAM