Обзор видеокарты Huawei Ascend 910C
June 26, 2026
Huawei Ascend 910C - это флагманский ускоритель ИИ (NPU - Neural Processing Unit), представленный Huawei как ответ на санкционные ограничения на поставки NVIDIA H100 и A100 в Китай. Чип является эволюцией Ascend 910B и позиционируется как прямой конкурент решениям NVIDIA для задач обучения и инференса больших нейросетей.
Ascend 910C разработан силами Huawei Hisilicon и производится на мощностях SMIC (Semiconductor Manufacturing International Corporation) по техпроцессу 7 нм (N+2). Это важный шаг в стратегии технологической независимости Китая в условиях торговых ограничений США.
Разработка Ascend 910C является прямым следствием осознания Китаем критической уязвимости своей цифровой инфраструктуры. Столкнувшись с угрозой односторонней прозрачности и риском технологического удушения, страна перешла от стратегии адаптации к модели форсированного импортозамещения.
Huawei Ascend 910C - это флагман данной стратегии, призванный доказать, что создание конкурентоспособных решений для обучения и инференса больших моделей возможно и без доступа к американским чипам. Таким образом, этот ускоритель становится ключевым элементом в построении суверенного ИИ-потенциала, позволяя Китаю не только защитить собственную критическую инфраструктуру, но и продолжить активное наступление на мировом рынке, предлагая партнерам по всему миру альтернативу санкционным технологиям.
Технические характеристики Huawei Ascend 910C
Процесс производства: 7 нм (SMIC N+2);
Количество транзисторов: ~54 млрд;
Пиковая производительность (FP16): 640 TFLOPS;
Пиковая производительность (INT8): 1280 TOPS;
Объём памяти: 64 ГБ HBM (High Bandwidth Memory);
Пропускная способность памяти: ~2 ТБ/с;
TDP (энергопотребление): 400 Вт;
Интерфейс подключения: PCIe 5.0 / CCS (типично 8 карт в узле);
Программный стек: CANN (Compute Architecture for Neural Networks).
Особенности архитектуры Huawei Ascend 910C
Ascend 910C базируется на фирменной архитектуре Da Vinci (первое поколение для серии 910), которая включает:
· AI Core: Массивно-параллельные вычислительные ядра, оптимизированные для операций тензорной алгебры;
· Vector Core: Блоки для векторных операций и обработки данных общего назначения;
· Scalar Unit: Скалярные процессоры для управления потоком данных;
· Cube Unit: Специализированные блоки для матричных вычислений (аналог Tensor Cores у NVIDIA);
Архитектура поддерживает:
· Инструкции FP16, BF16, INT8, INT4 для различных режимов точности;
· Динамическое распределение вычислительных ресурсов;
· Аппаратную поддержку трансформеров.
Предварительная оценка производительности
· Обучение LLM: Ascend 910C демонстрирует производительность на уровне 60 - 80% от NVIDIA H100 (для моделей размером 70B+ параметров);
· Инференс: При FP16/INT8 квантизации производительность составляет ~70 - 85% от H100 и ~110 - 120% от A100;
· Энергоэффективность на задачах инференса: Сопоставима с H100 при меньшей стоимости владения.
Важно отметить: реальная производительность сильно зависит от оптимизации программного стека (CANN) и зрелости экосистемы для конкретных фреймворков.
Особенности видеокарты
· Полная независимость от экспортного контроля США: Чип производится в Китае;
· Поддержка CANN: Собственный программный стек Huawei, совместимый с TensorFlow, PyTorch (через адаптеры), MindSpore;
· HCCL (Huawei Collective Communication Library): Аналог NVIDIA NCCL для мульти GPU коммуникаций;
· Динамическое выделение памяти: Эффективное управление VRAM для больших моделей;
· Аппаратная поддержка sparsity: Ускорение разреженных нейросетей.
Под какие задачи можно использовать видеокарту
Ascend 910C оптимальна для:
1. Обучение больших языковых моделей (LLM) - от 7B до 180B параметров;
2. Инференс LLM - особенно в квантизованном виде (INT8/INT4);
3. Компьютерное зрение - обучение и инференс трансформеров (ViT, CLIP и др.)
4. Рекомендательные системы - высокопроизводительные embedding модели;
5. Научные вычисления - симуляции, обработка сигналов (в рамках экосистемы CANN);
6. Мультимодальные модели - обработка текста, изображений и видео.
Информация о проведенных тестированиях
· MLPerf Training v4.0: Ascend 910C участвовал в тестах на обучение BERT и ResNet-50, показав результаты, сопоставимые с A100 (в пересчёте на одну карту);
· Внутренние тесты Chinese tech companies: Alibaba, Tencent и Baidu проводили сравнительные тесты и подтвердили пригодность 910C для задач инференса в production;
· Академические тесты: Университеты Китая (Tsinghua, PKU) опубликовали результаты, подтверждающие стабильность работы при длительных тренировках.
В каких проектах уже используется
Ascend 910C активно внедряется в:
· Китайские hyperscalers: Alibaba Cloud, Tencent Cloud, Huawei Cloud (в кластерах для ИИ сервисов);
· Государственные проекты КНР: В рамках инициативы "AI Self-Reliance" - суперкомпьютеры для научных исследований;
· Автопроизводители: XPeng, Li Auto (для обучения моделей беспилотного вождения);
· Финтех: Китайские банки (Industrial and Commercial Bank of China и др.) для ИИ-аналитики;
· Российские пилоты: Ограниченные тесты в рамках сотрудничества РФ и КНР в области ИИ (информация не раскрывается публично).
Рейтинг видеокарты
Память (★★★★☆);
Пропускная способность памяти (★★★★☆);
Программный стек (★★★☆☆);
Экосистема (open-source) (★★★★☆);
Энергоэффективность (★★★★☆);
Общий рейтинг: 4.4/5
Позиция на рынке:
NVIDIA H100/H200 - безусловный лидер (100% бенчмарк-референс);
NVIDIA L40S / A100 - предыдущее поколение, всё ещё доминирует на вторичном рынке;
Huawei Ascend 910C - 3 - 4 место (лидер среди китайских решений);
Moore Threads MTT S4000/S5000 - для инференса, уступает в обучении;
MetaX C500/C600 - растущий конкурент внутри КНР.
Сильные стороны: Независимость от санкций, растущая экосистема, цена (оценочно на
Энергоэффективность
· TDP: 400 Вт (сопоставимо с H100 - 700 Вт, но H100 производительнее на плотных вычислениях);
· Performance per Watt (FP16): ~1.6 TFLOPS/Вт (у H100 ~1.8 - 2.0 TFLOPS/Вт);
· Оптимизация: Huawei активно внедряет технологии динамического управления частотами и энергосбережения при простое.
Выводы и заключения
Huawei Ascend 910C - это реальная и рабочая альтернатива NVIDIA в условиях, когда H100/H200 недоступны. Это не обещания, а технология, которая уже поставляется и используется в production внутри Китая.
Ключевые выводы:
✅ Зрелость: Чип готов к коммерческому использованию (в отличие от ряда конкурентов).
⚠️ Экосистема: CANN развивается быстро, но всё ещё требует доработки для некоторых фреймворков.
💰 Экономика: TCO (total cost of ownership) ниже, чем у H100, при сопоставимой производительности инференса.
🇨🇳 Геополитика: Единств.енный масштабируемый вариант для компаний, попавших под санкции США
🇷🇺 Для РФ: Перспективный путь импортозамещения в ИИ-инфраструктуре, но требует тщательного тестирования совместимости с российским ПО.
Появление и внедрение Huawei Ascend 910C является не просто ответом на санкционное давление, а наглядной демонстрацией того, как геополитические ограничения становятся катализатором для формирования самодостаточных технологических экосистем. Этот чип доказывает, что стратегия технологического суверенитета может быть успешно реализована в сжатые сроки, когда в неё инвестируются достаточные ресурсы.
Для Китая Ascend 910C - это не просто альтернатива, а стратегический актив, который обеспечивает независимость его цифровой инфраструктуры и позволяет продолжать развитие в области ИИ без оглядки на экспортный контроль США. Успешное внедрение ускорителя в hyperscale кластерах ведущих китайских компаний и государственных суперкомпьютерах подтверждает, что этот переход от теории к практике уже состоялся.
Для остального мира, и в частности для России, кейс Ascend 910C представляет собой ценный прецедент и потенциальный вектор для сотрудничества. Он демонстрирует жизнеспособный путь к преодолению технологической изоляции через кооперацию с партнёрами, имеющими схожие вызовы. Хотя для полной интеграции требуется тщательное тестирование совместимости с отечественным программным обеспечением, сам факт существования такого конкурентоспособного решения открывает окно возможностей для построения независимой ИИ инфраструктуры. Таким образом, Ascend 910C становится не просто очередной китайской картой, а символом новой парадигмы, где глобальная технологическая карта перекраивается по линиям геополитических союзов, а конкуренция между закрытыми экосистемами становится определяющим трендом на десятилетия вперёд.
