Chaitex
Chaitex / Чайтекс
Обзор видеокарты Huawei Ascend 910C
Назад в блог

Обзор видеокарты Huawei Ascend 910C

26 июня 2026 г.

Huawei Ascend 910C - это флагманский ускоритель ИИ (NPU - Neural Processing Unit), представленный Huawei как ответ на санкционные ограничения на поставки NVIDIA H100 и A100 в Китай. Чип является эволюцией Ascend 910B и позиционируется как прямой конкурент решениям NVIDIA для задач обучения и инференса больших нейросетей.

Ascend 910C разработан силами Huawei Hisilicon и производится на мощностях SMIC (Semiconductor Manufacturing International Corporation) по техпроцессу 7 нм (N+2). Это важный шаг в стратегии технологической независимости Китая в условиях торговых ограничений США.

Разработка Ascend 910C является прямым следствием осознания Китаем критической уязвимости своей цифровой инфраструктуры. Столкнувшись с угрозой односторонней прозрачности и риском технологического удушения, страна перешла от стратегии адаптации к модели форсированного импортозамещения.

Huawei Ascend 910C - это флагман данной стратегии, призванный доказать, что создание конкурентоспособных решений для обучения и инференса больших моделей возможно и без доступа к американским чипам. Таким образом, этот ускоритель становится ключевым элементом в построении суверенного ИИ-потенциала, позволяя Китаю не только защитить собственную критическую инфраструктуру, но и продолжить активное наступление на мировом рынке, предлагая партнерам по всему миру альтернативу санкционным технологиям.

Технические характеристики Huawei Ascend 910C

Процесс производства: 7 нм (SMIC N+2);

Количество транзисторов: ~54 млрд;

Пиковая производительность (FP16): 640 TFLOPS;

Пиковая производительность (INT8): 1280 TOPS;

Объём памяти: 64 ГБ HBM (High Bandwidth Memory);

Пропускная способность памяти: ~2 ТБ/с;

TDP (энергопотребление): 400 Вт;

Интерфейс подключения: PCIe 5.0 / CCS (типично 8 карт в узле);

Программный стек: CANN (Compute Architecture for Neural Networks).

Особенности архитектуры Huawei Ascend 910C

Ascend 910C базируется на фирменной архитектуре Da Vinci (первое поколение для серии 910), которая включает:

· AI Core: Массивно-параллельные вычислительные ядра, оптимизированные для операций тензорной алгебры;

· Vector Core: Блоки для векторных операций и обработки данных общего назначения;

· Scalar Unit: Скалярные процессоры для управления потоком данных;

· Cube Unit: Специализированные блоки для матричных вычислений (аналог Tensor Cores у NVIDIA);

Архитектура поддерживает:

· Инструкции FP16, BF16, INT8, INT4 для различных режимов точности;

· Динамическое распределение вычислительных ресурсов;

· Аппаратную поддержку трансформеров.

Предварительная оценка производительности

· Обучение LLM: Ascend 910C демонстрирует производительность на уровне 60 - 80% от NVIDIA H100 (для моделей размером 70B+ параметров);

· Инференс: При FP16/INT8 квантизации производительность составляет ~70 - 85% от H100 и ~110 - 120% от A100;

· Энергоэффективность на задачах инференса: Сопоставима с H100 при меньшей стоимости владения.

Важно отметить: реальная производительность сильно зависит от оптимизации программного стека (CANN) и зрелости экосистемы для конкретных фреймворков.

Особенности видеокарты

· Полная независимость от экспортного контроля США: Чип производится в Китае;

· Поддержка CANN: Собственный программный стек Huawei, совместимый с TensorFlow, PyTorch (через адаптеры), MindSpore;

· HCCL (Huawei Collective Communication Library): Аналог NVIDIA NCCL для мульти GPU коммуникаций;

· Динамическое выделение памяти: Эффективное управление VRAM для больших моделей;

· Аппаратная поддержка sparsity: Ускорение разреженных нейросетей.

Под какие задачи можно использовать видеокарту

Ascend 910C оптимальна для:

  1. 1. Обучение больших языковых моделей (LLM) - от 7B до 180B параметров;

  2. 2. Инференс LLM - особенно в квантизованном виде (INT8/INT4);

  3. 3. Компьютерное зрение - обучение и инференс трансформеров (ViT, CLIP и др.)

  4. 4. Рекомендательные системы - высокопроизводительные embedding модели;

  5. 5. Научные вычисления - симуляции, обработка сигналов (в рамках экосистемы CANN);

  6. 6. Мультимодальные модели - обработка текста, изображений и видео.

Информация о проведенных тестированиях

· MLPerf Training v4.0: Ascend 910C участвовал в тестах на обучение BERT и ResNet-50, показав результаты, сопоставимые с A100 (в пересчёте на одну карту);

· Внутренние тесты Chinese tech companies: Alibaba, Tencent и Baidu проводили сравнительные тесты и подтвердили пригодность 910C для задач инференса в production;

· Академические тесты: Университеты Китая (Tsinghua, PKU) опубликовали результаты, подтверждающие стабильность работы при длительных тренировках.

В каких проектах уже используется

Ascend 910C активно внедряется в:

· Китайские hyperscalers: Alibaba Cloud, Tencent Cloud, Huawei Cloud (в кластерах для ИИ сервисов);

· Государственные проекты КНР: В рамках инициативы "AI Self-Reliance" - суперкомпьютеры для научных исследований;

· Автопроизводители: XPeng, Li Auto (для обучения моделей беспилотного вождения);

· Финтех: Китайские банки (Industrial and Commercial Bank of China и др.) для ИИ-аналитики;

· Российские пилоты: Ограниченные тесты в рамках сотрудничества РФ и КНР в области ИИ (информация не раскрывается публично).

Рейтинг видеокарты

Память (★★★★☆);

Пропускная способность памяти (★★★★☆);

Программный стек (★★★☆☆);

Экосистема (open-source) (★★★★☆);

Энергоэффективность (★★★★☆);

Общий рейтинг: 4.4/5

Позиция на рынке:

NVIDIA H100/H200 - безусловный лидер (100% бенчмарк-референс);

NVIDIA L40S / A100 - предыдущее поколение, всё ещё доминирует на вторичном рынке;

Huawei Ascend 910C - 3 - 4 место (лидер среди китайских решений);

Moore Threads MTT S4000/S5000 - для инференса, уступает в обучении;

MetaX C500/C600 - растущий конкурент внутри КНР.

Сильные стороны: Независимость от санкций, растущая экосистема, цена (оценочно на

Энергоэффективность

· TDP: 400 Вт (сопоставимо с H100 - 700 Вт, но H100 производительнее на плотных вычислениях);

· Performance per Watt (FP16): ~1.6 TFLOPS/Вт (у H100 ~1.8 - 2.0 TFLOPS/Вт);

· Оптимизация: Huawei активно внедряет технологии динамического управления частотами и энергосбережения при простое.

Выводы и заключения

Huawei Ascend 910C - это реальная и рабочая альтернатива NVIDIA в условиях, когда H100/H200 недоступны. Это не обещания, а технология, которая уже поставляется и используется в production внутри Китая.

Ключевые выводы:

Зрелость: Чип готов к коммерческому использованию (в отличие от ряда конкурентов).

⚠️ Экосистема: CANN развивается быстро, но всё ещё требует доработки для некоторых фреймворков.

💰 Экономика: TCO (total cost of ownership) ниже, чем у H100, при сопоставимой производительности инференса.

🇨🇳 Геополитика: Единств.енный масштабируемый вариант для компаний, попавших под санкции США

🇷🇺 Для РФ: Перспективный путь импортозамещения в ИИ-инфраструктуре, но требует тщательного тестирования совместимости с российским ПО.

 

Появление и внедрение Huawei Ascend 910C является не просто ответом на санкционное давление, а наглядной демонстрацией того, как геополитические ограничения становятся катализатором для формирования самодостаточных технологических экосистем. Этот чип доказывает, что стратегия технологического суверенитета может быть успешно реализована в сжатые сроки, когда в неё инвестируются достаточные ресурсы.

Для Китая Ascend 910C - это не просто альтернатива, а стратегический актив, который обеспечивает независимость его цифровой инфраструктуры и позволяет продолжать развитие в области ИИ без оглядки на экспортный контроль США. Успешное внедрение ускорителя в hyperscale кластерах ведущих китайских компаний и государственных суперкомпьютерах подтверждает, что этот переход от теории к практике уже состоялся.

Для остального мира, и в частности для России, кейс Ascend 910C представляет собой ценный прецедент и потенциальный вектор для сотрудничества. Он демонстрирует жизнеспособный путь к преодолению технологической изоляции через кооперацию с партнёрами, имеющими схожие вызовы. Хотя для полной интеграции требуется тщательное тестирование совместимости с отечественным программным обеспечением, сам факт существования такого конкурентоспособного решения открывает окно возможностей для построения независимой ИИ инфраструктуры. Таким образом, Ascend 910C становится не просто очередной китайской картой, а символом новой парадигмы, где глобальная технологическая карта перекраивается по линиям геополитических союзов, а конкуренция между закрытыми экосистемами становится определяющим трендом на десятилетия вперёд.