Lenovo WenTian WA5480 G3 с GPU MetaX C500 512GB VRAM - гибкое и масштабируемое решение
May 25, 2026
Lenovo WenTian WA5480 G3 - это флагманский 4U GPU-сервер линейки WenTian от подразделения Lenovo China Infrastructure. Платформа ориентирована на AI-обучение, AI-инференс, научные вычисления и визуализацию. Серия WA5480 - флагман для GPU-вычислений с поддержкой до 8 двухслотовых PCIe-ускорителей.
Конфигурация с MetaX C500: сервер укомплектован 8 ускорителями MetaX C500 с HBM2e 64 GB каждый, системная память 512 GB DDR5, два процессора Intel Xeon Platinum 8558 (48 ядер, 96 потоков каждый). Общая конфигурация GPU-памяти - 512 GB VRAM.
Позиционируется как решение для AI-инференса и обучения средних моделей в условиях, когда западное оборудование недоступно или экономически нецелесообразно.
Технические характеристики Lenovo WenTian WA5480 G3 с GPU MetaX C500 512GB VRAM
Характеристики платформы Lenovo WA5480 G3
Параметр: Lenovo WA5480 G3;
CPU: 2 × Intel Xeon Platinum 8558 (48C/96T);
Частота CPU: До 3.4 ГГц;
Системная память: 512 GB DDR5-4800 (8 × 64 GB);
Слоты GPU: 8 × PCIe 4.0 x16 (dual-width);
Накопители: 8 × 3.5" + 8 × 2.5" (SAS/SATA/NVMe);
Сеть: 1 GbE × 4 (базовая), опционально 10/25/100/200/400 GbE;
Блоки питания: 4 × 2700 Вт (N+1 избыточность);
Форм-фактор: 4U (448 × 175 × 850 мм);
Вес: ~55 кг (без GPU).
Характеристики GPU MetaX C500
Параметр: MetaX C500;
Архитектура: Собственная GPU IP (MetaX);
Техпроцесс: 7 нм;
Память VRAM: 64 GB HBM2e;
Интерконнект: MetaXLink;
Поддержка precision: FP32, FP16, BF16, INT8;
Софтверный стек: MXMACA (CUDA-совместимый);
Интерфейс: PCIe 4.0 x16;
TDP (оценка): 250 - 300 Вт.
Полная конфигурация 512 GB
GPU: 8 × MetaX C500 (64 GB);
Общая VRAM: 512 GB;
CPU: 2 × Intel Xeon Platinum 8558;
Оперативная память: 512 GB DDR5;
SSD загрузочный: 2 × 960 GB NVMe;
Хранилище данных: 3 × 8 TB SAS (пример);
Суммарный TDP GPU: ~2 000–2 400 Вт;
Суммарная мощность сервера: ~3 500–4 000 Вт.
Особенности архитектуры сервера Lenovo WenTian WA5480 G3 с GPU MetaX C500 512GB VRAM
Архитектура платформы
Форм-фактор: 4U rack-mount (448 × 175 × 850 мм). Сервер занимает 4 юнита в стойке.
Прямое подключение CPU-GPU. Ключевая архитектурная особенность: каждый процессор Intel Xeon напрямую соединён с 4 GPU через выделенные PCIe-линии без промежуточного PCIe Switch. Обеспечивает низкую латентность и стабильную пропускную способность.
Модульная конструкция, три функциональные зоны:
· передняя зона (8 × 3,5" + 8 × 2,5");
· центральная зона (процессоры и память);
· задняя зона (8 слотов GPU).
Архитектура охлаждения
Раздельная воздушная система охлаждения:
· Воздух поступает через переднюю панель, проходит через стену вентиляторов;
· Поток разделяется: к CPU/памяти и напрямую к GPU-зоне;
· Охлаждение рассчитано на 8 GPU с общим TDP до 2 400 Вт;
· Поддержка охлаждения 2 × CPU до 350 Вт TDP каждый.
GPU-ускорители MetaX C500
MetaX - китайский разработчик GPU, основан в 2020 году: Архитектура MetaX - полностью независимая, не копия AMD/NVIDIA; MXMACA - софтверный стек, совместимый с CUDA; MetaXLink - меж-GPU интерконнект; HBM2e 64 GB на карту, подходит для LLM до 13B параметров в FP16; Мульти-точность: FP32, FP16, BF16, INT8.
Предварительная оценка производительности
· Инференс LLM (7B - 70B). 512 GB VRAM позволяет размещать модели до 70B параметров (в 4-bit квантования) полностью в памяти сервера - снижает latency по сравнению с multi-GPU inference;
· Обучение / fine-tuning. Поддержка MXMACA + PyTorch. Модели до 13B параметров помещаются на одну карту, модели 30B - 70B - распределяются на 2 - 4 карты;
· Батчевая обработка. 8 GPU позволяют обрабатывать большие батчи;
· Визуализация и рендеринг. 8 × 64 GB HBM2e пригодятся для графических задач.
· Пиковая FP16 производительность. C500 генерирует ~15 TFLOPS FP32 (оценка на основе архитектурно схожих решений). По сравнению с A100 (19.5 TFLOPS FP32) или H100 (67 TFLOPS FP32) разрыв значимый;
· Пропускная способность памяти. ~1.8 TB/s (HBM2e) против 2.0 TB/s у A100 и 3.35 TB/s у H100;
· Зрелость софта. MXMACA растёт, но до уровня CUDA много ещё не хватает.
Оценка производительности относительно NVIDIA A100:
· FP32: ~75–80%;
· FP16 (inference): ~70 - 75%;
· Память (ёмкость): 64 GB против 80 GB - 80%;
· Пропускная способность памяти: ~85 - 90%;
· Energy efficiency: ~85 - 90%.
Особенности сервера Lenovo WenTian WA5480 G3 с GPU MetaX C500 512GB VRAM
Гибкость конфигурации, WA5480 G3 совместим не только с MetaX, но и с NVIDIA (A100/H100/L40S/RTX), AMD, Intel. Платформа полностью открыта - защита инвестиций;
4 × 2700 Вт блоки питания с N+1 избыточностью. Резервирование критично при 8 GPU с TDP 250 - 350 Вт каждый;
До 16 накопителей: 8 × 3.5" + 8 × 2.5" слотов обеспечивают необходимый storage bandwidth для AI training;
Сертификаты: ISO, CE, CCC (NAPL).
Под какие задачи можно использовать сервер
Инференс LLM 7B - 70B - Прямое размещение на одной или нескольких картах. 512 GB VRAM достаточно для 70B модели с квантованием;
Обучение / Fine-tuning - PyTorch + MXMACA. Модели до 13B (одна карта), 30B–70B (2–4 карты).
HPC (научные расчёты) - OpenMP + CUDA через MXMACA. Прямое подключение снижает latency
Графика / визуализация - OpenGL/Vulkan. 512 GB VRAM позволяет работать с большими сценами.
Data preprocessing - CPU + GPU pipelining. 96 ядер CPU параллельно с GPU
GPU-кластер (8 карт) - MetaXLink. Масштабирование на уровне сервера.
Рендеринг - Blender, другие. Большой объём памяти минимизирует OOM.
Информация о проведённых тестированиях
· 2023 (август): MetaX C500 прошёл адаптацию с ChatGLM2-6B - тысячепараметрическая LLM прошла инференс и fine-tuning на C500.
· 2023 (август): Адаптация с Future Speed - компанией из экосистемы GPU-инференса.
· MetaX подтверждает совместимость: C500 сертифицирован для работы с 2-ядерными и 4-ядерными серверными платформами, включая Lenovo, Inspur, H3C.
В каких проектах уже используется
Китайский рынок:
· Китайские AI-датацентры. Lenovo + китайские GPU (MetaX, Moore Threads) внедряются в региональные AI computing platforms как альтернатива NVIDIA.
· Системные интеграторы: Lenovo тесно сотрудничает с MetaX для сертификации совместимости WA5480/C500.
Российский / международный рынок
· Поставки конфигураций WA5480 G3 + MetaX C500 512 GB через ChaiTex для enterprise-клиентов в России и СНГ.
· Использование в департаментах data science и AI research.
Статус сертификации
· Lenovo сертифицировала комбинацию WA5480 + MetaX C500 на уровне совместимости (compatibility certified).
· Intel Platform Validation подтверждён для платформы Sapphire Rapids.
Рейтинг сервера Lenovo WenTian WA5480 G3 с GPU MetaX C500 512GB VRAM
Аппаратная надёжность (★★★★☆) - Lenovo уровень enterprise-качества, но платформа относительно новая;
Производительность GPU (★★★☆☆) - C500 = ~75–80% A100 по FP32, но память на уровне;
Производительность CPU (★★★★☆) - Intel Xeon Platinum 8558 - 48 ядер, отличный выбор;
Экосистема софта (★★★☆☆) - MXMACA растёт, но до CUDA и ROCm далеко;
Энергоэффективность (★★★★☆) - Хороший perf/Watt для inference, но не рекордный;
Стоимость (TTV) (★★★★☆) - Значительно дешевле A100/H100 сервера при 80% производительности;
Надёжность поставщика (★★★★★) - Lenovo + MetaX (IPO декабрь 2025) - обе публичные компании;
Масштабируемость (★★★★☆) - 8 карт в сервере, MetaXLink для кластеризации;
Гибкость (GPU-agnostic) (★★★★☆) - Платформа поддерживает NVIDIA/AMD/Intel/китайские GPU;
Документация / поддержка (★★★☆☆) - Lenovo docs + MetaX docs, но количество русскоязычных материалов ограничено.
Итоговый рейтинг: 4/5
Хороший enterprise-сервер для AI-инференса и обучения средних моделей. Основные плюсы - гибкость платформы (CPU/GPU-agnostic), надёжный бренд Lenovo, достаточная для большинства задач производительность. Минусы - софтовая экосистема MXMACA всё ещё догоняет CUDA.
Энергоэффективность
Мощность компонентов
2 × Intel Xeon Platinum 8558 - 2 × 260 Вт = 520 Вт;
8 × MetaX C500 (оценка) - 8 × 275 Вт = 2 200 Вт;
Системная память (512 GB DDR5) ~25 Вт;
Накопители + вентиляторы ~50 Вт;
Суммарная мощность в load ~2 800 - 3 200 Вт;
Пиковая мощность (Transient) ~3 500 - 4 000 Вт
Блоки питания
· 4 × 2700 Вт Platinum = 10 800 Вт суммарно;
· При load 3 000 Вт: нагрузка на PSU = ~28%;
· При пике 4 000 Вт: нагрузка = ~37%;
· Избыточность обеспечивает margin для transient loads и N+1 redundancy.
Оценка энергоэффективности
PUE (оценка для сервера) - 1.15 - 1.20;
Perf/Watt - FP32 (оценка) ~4.5 TFLOPS/kW;
Perf/Watt - Inference INT8 (оценка) ~18–20 TOPS/kW;
Класс энергоэффективности - Platinum PSU (>94% на 50% load).
Выводы и заключения
Бренд Lenovo. Global enterprise-вендор с репутацией, сервисной сетью и запасными частями. Это не startup - софтверная и аппаратная поддержка гарантированы.
Гибкость платформы. WA5480 G3 поддерживает любые PCIe-ускорители. Сегодня MetaX, завтра - NVIDIA, AMD или следующее поколение китайских GPU. Инвестиции защищены.
Объёмный GPU-памяти. 512 GB VRAM позволяет инферировать даже 70B модели без распределённых вычислений - экономит на latency.
N+1 power redundancy. 4 × 2700 Вт — запас по мощности для пиковых transient loads и резервирование.
Цена. Существенно ниже аналогичной конфигурации с A100/H100, особенно учитывая серый рынок и премии за NVIDIA в 2025–2026.
Для кого этот сервер
· Enterprise AI-отделы, строящие AI-инфраструктуру с ограниченным бюджетом;
· Интеграторы, ищущие готовую сертифицированную платформу;
· Government / regulated industries, где импортозамещение - критичное требование;
· AI-стартапы, начинающие с inference и планирующие горизонтально масштабироваться.
Рекомендуется для: inference production (LLM, computer vision), fine-tuning (7B–30B моделей), HPC batch jobs, GPU-кластер среднего масштаба (1 - 10 серверов).
! обучения foundation models 175B+ с нуля (лучше кластер с NVLink), real-time low-latency inference с жёсткими latency-SLA (оптимизируйте сначала на одной карте).
Lenovo WenTian WA5480 G3 с GPU MetaX C500 и 512 GB VRAM - это современное решение для задач искусственного интеллекта и научных вычислений, ориентированное на корпоративный сегмент и рынок с ограниченным доступом к западным технологиям. Сервер выделяется гибкостью конфигурации: он поддерживает не только китайские ускорители MetaX, но и GPU от NVIDIA, AMD и Intel, что обеспечивает защиту инвестиций и возможность модернизации. Ключевым преимуществом является огромный объём видеопамяти - 512 GB VRAM, что позволяет запускать инференс и fine-tuning даже для крупных языковых моделей (до 70B параметров) без необходимости распределённых вычислений, минимизируя задержки и упрощая инфраструктуру. Аппаратная надёжность Lenovo, резервирование блоков питания и сертификация платформы подтверждают её готовность к эксплуатации в enterprise-среде.
Для большинства задач AI-инференса, обучения средних моделей, HPC и визуализации сервер WA5480 G3 представляет собой сбалансированное и экономически выгодное решение, особенно в условиях импортозамещения и ограниченного бюджета. Его рекомендуется использовать в enterprise AI-отделах, государственных структурах, интеграторах и стартапах, которым важна гибкость, надёжность и поддержка на российском рынке.
