Alibaba, DeepSeek и эпоха де-CUDAфикации

Апрель 2026 стал точкой невозврата для мирового рынка AI-ускорителей. Две новости, пришедшие из Китая за одну неделю, изменили расклад сил: Alibaba задеплоила дата-центр с 10 000 собственных чипов, а DeepSeek подтвердил запуск V4 на процессорах Huawei вместо NVIDIA. Параллельно Конгресс США одобрил закон о встраивании трекеров в чипы - и контрабанда GPU превратилась в уголовные дела на миллиарды долларов.

Alibaba: 10 000 чипов Чжэньу - и больше никакой зависимости

11 апреля 2026 года Alibaba официально запустила дата-центр, полностью построенный на 10 000 собственных AI-ускорителей архитектуры Чжэньу (Zhenwu). Это не прототип и не пилот - это production-инфраструктура, рассчитанная на тренировку и инференс языковых моделей масштаба GPT-4 и выше.

Масштаб решения впечатляет.

Основная проблема при масштабировании AI-кластера - не сырая производительность одного чипа, а задержки межпроцессорного обмена. Когда переходишь от нескольких сотен GPU к десяти тысячам, упираешься в стену латентности. Alibaba, судя по всему, использовала проприетарный высокоскоростной интерконнект - аналог NVIDIA NVLink - чтобы 10 000 чипов работали как единая система, а не как изолированные кластеры.

Архитектура Чжэньу оптимизирована под операции матричного умножения, которые составляют основу вычислений в Transformer-моделях. Это domain-specific архитектура (DSA): отказавшись от универсальности GPU, Alibaba максимизирует площадь кристалла под тензорные ядра. Несмотря на то что домашние чипы производятся на техпроцессе 7 нм (SMIC) против 4 нм у NVIDIA (TSMC), за счёт архитектурной специализации часть разницы компенсируется.

Но главная битва - не в «железках», а в софте. Если у чипов нет зрелого компилятора и фреймворка для разработчиков - это дорогое железо для украшения. Alibaba делает ставку на внутреннюю экосистему, способную заменить PyTorch и CUDA без переписывания всего бэкенда на низкоуровневом ассемблере.

С точки зрения термодинамики размещение 10 000 чипов в одном объекте - задача нетривиальная. На 7 нм техпроцессе энергопотребление выше, чем у NVIDIA на 4 нм, а значит - тепловыделение больше. Alibaba, по всей видимости, реализовала жидкостное охлаждение на уровне чипа (liquid-to-chip), иначе эффективная производительность кластера была бы значительно ниже номинальной.

Это важный момент: объявленные 10 000 чипов - это не ванильная метрика. Реальная полезная мощность зависит от того, насколько хорошо решена тепловая задача.

Отдельного внимания заслуживает программный слой. Alibaba интегрировала «Чжэньу» в свою облачную платформу Alibaba Cloud - предприятия-клиенты смогут заказывать AI-вычисления на этих чипах через стандартный API, без необходимости разбираться в архитектурных нюансах. Это принципиально отличается от ситуации, когда чип лежит на складе и ждёт, пока кто-то напишет под него драйвер.

Оценка: Alibaba выбрала не производительность, а суверенитет. Каждый чип Чжэньу - это иммунитет к экспортным спискам Минторга США. Когда контроль становится аппаратным, это решение выглядит всё более дальновидным.

DeepSeek V4: триллион-параметров на Huawei Ascend

Вторая сенсация недели - подтверждение того, о чём индустрия говорила полгода. Основатель DeepSeek Лян Вэньфэн (Liang Wenfeng) подтвердил внутренний график: V4 выйдет во второй половине апреля 2026 года.

Модель - мультимодальная, с контекстным окном в миллионы токенов, количеством параметров в триллионном диапазоне, с Apache 2.0 лицензией. Но самое важное - не спецификации, а «железо». DeepSeek V4 будет работать на чипах Huawei Ascend, а не на NVIDIA, как все предыдущие модели компании.

До сих пор V3 и R1 использовали NVIDIA H800. Переход на Huawei Ascend - это не только техническое, но и политическое решение. По данным Reuters и The Information, китайские власти «рекомендовали» DeepSeek перейти на отечественные чипы. Компания отказала NVIDIA и AMD в раннем доступе к V4, предоставив Huawei и Cambricon дополнительное время для оптимизации софта под архитектуру модели.

Эффект домино уже виден. Alibaba, ByteDance и Tencent разместили предзаказы на сотни тысяч чипов нового поколения - именно для развёртывания V4 через свои облачные сервисы.

Результат: цены на AI-чипы выросли примерно на 20% за месяц. Не NVIDIA подорожала - Huawei Ascend подорожала. Это инверсия рынка.

При этом DeepSeek уже продемонстрировал, что может конкурировать с западными моделями при меньших затратах. R1 стоил около $6 млн на тренировку - против ~$100 млн для GPT-4. Если V4 сохранит эту эффективность на Huawei "железе", это станет серьёзным аргументом в пользу всего китайского GPU-стека.

Важный нюанс: R2, планируемый преемник R1, задерживается - как раз из-за сложностей адаптации под Ascend. Это показывает, что переход не безболезненный. Huawei Ascend пока уступает NVIDIA по зрелости софстека: количество поддерживаемых операторов PyTorch меньше, отладка сложнее, документация менее полная. Но Alibaba, ByteDance и Tencent заказывают сотни тысяч чипов именно для V4 - индустрия уже не ждёт «идеальной» совместимости, а инвестирует в текущее поколение и ускоряет доработку. Это классический паттерн «forced adoption»: массовое использование ускоряет зрелость экосистемы быстрее, чем лабораторные тесты.

Huawei, со своей стороны, активно наращивает производство. По данным Digital in Asia, суммарный выпуск линейки Ascend может достичь 1,6 млн. кристаллов в 2026 году. Чипы производятся SMIC на улучшенном 7 нм процессе - не TSMC 4 нм, но достаточно для inference-нагрузок, которые становятся основным рынком по мере перехода от обучения моделей к их промышленному развёртыванию.

Chip Security Act и конец эпохи контроля через бумагу

Пока Китай строит собственный стек, США переходят к радикальному усилению контроля. 26 марта 2026 года Конгресс одобрил Chip Security Act для голосования в полном составе Палаты представителей. Суть закона: встраивание GPS-трекеров и систем защиты от вскрытия (tamper-detection) прямо в кристалл высокопроизводительных AI-чипов.

Это фундаментальный сдвиг. Ранее экспортный контроль опирался на бумажные сертификаты конечного пользователя - и система трещала по швам.

Масштаб серового рынка поражает:

• Super Micro - сооснователь и два топ-менеджера арестованы 19 марта 2026. Обвинение: перенаправление серверов с чипами NVIDIA в Китай через Тайвань и Малайзию на $2,5 млрд. Использовались поддельные документы и муляжи для прохождения аудитов.

• GPU Partnership - 22–25 марта арестованы три человека (гражданин Гонконга и двое граждан США). Заказали 750 серверов на $170 млн, подписав ложные сертификаты.

• Sharetronic Data Technology - шэньчжэньская компания раскрыла холдинг серверов с запрещёнными чипами NVIDIA на $92 млн перед властями Пекина. Акции обвалились на 20% за день.

• Флоридская схема - компания получила перевод в $4 млн для закупки и экспорта чипов NVIDIA китайским фирмам.

Это не отдельные случаи - это системная инфраструктура. От января 2026 года Минюст США раскрыл множество подобных схем. Всё это подтверждает: спрос на AI-ускорители в Китай настолько высок, что контрабанда стала организованной индустрией.

61% мировых токенов: масштаб китайского AI-спроса

По данным Китайского национального управления по данным (National Data Administration), опубликованным на Китайском форуме развития в марте 2026 года:

Ежедневное потребление AI-токенов в Китае = 140 триллионов. В начале 2024 года было 100 миллиардов. Рост - в 1400 раз за два года.

На OpenRouter, крупнейшей мировой агрегирующей платформе API моделей, китайские модели заняли 61% от общего потребления токенов среди топ-10. На неделе 16 - 22 февраля 2026 года китайские модели обработали 5,16 трлн токенов против 2,7 трлн у американских. Четыре из пяти самых используемых моделей в мире - китайские.

При этом китайские модели работают в 4 - 6 раз дешевле американских аналогов. DeepSeek API - $0,028 за миллион токенов, что примерно в 180 раз дешевле эквивалентного тарифа GPT.

Этот масштаб спроса - фундаментальная причина, почему Alibaba строит дата-центры с 10 000 собственных чипов, а DeepSeek переходит на Huawei. Когда твоя страна потребляет 61% мировых AI-токенов, зависимость от иностранного «железа» - это не просто риск, а национальная уязвимость.

Что это значит для рынка

Для индустрии: мировой AI-стек разделяется на два экосистема.

Первое - NVIDIA + CUDA + западные облачные провайдеры.

Второе - Huawei Ascend / Alibaba Zhenwu / домашние архитектуры + китайские облачные платформы + DeepSeek/Qwen как модельный слой.

Это не временное явление - это структурный раскол, который будет только углубляться. Вслед за Alibaba и DeepSeek аналогичную логику «суверенного AI» будут применять и другие страны.

Для российского рынка: компании, которые закупают китайские GPU-серверы сегодня, оказываются в выигрышной позиции. Они получают доступ к экосистеме, которая растёт быстрее западной - и при этом не зависит от американских экспортных ограничений. DeepSeek на Huawei Ascend, Alibaba на «Чжэньу», 140 триллионов токенов в день - это не «запасной вариант для отрезанных от NVIDIA», это параллельная реальность, которая уже обгоняет оригинал по масштабу.

Для российских предприятий это означает: модели DeepSeek V4, запущенные на Huawei Ascend или китайских GPU от MetaX, Moore Threads, Iluvatar, будут совместимы со стеком, на котором работает 61% мировых AI-токенов. Не нужно «подстраиваться» под альтернативную экосистему - российские решения войдут в мейнстрим китайского AI, который уже стал глобальным.