AI-based inference is changing the architecture, market, and geopolitics of chips

Весна стала точкой перегиба для полупроводниковой индустрии. Не очередная война за тренировочные кластеры о нет, на этот раз тектонический сдвиг произошёл в другом месте. AI-инференс, то есть вывод моделей в продакшене, впервые обогнал тренировку по объёму вычислений и, что важнее, по спросу на аппаратное обеспечение. Следствия - от возвращения CPU в центр архитектуры до расхождения траекторий китайских GPU-вендоров и новых рекордов контрабанды - разворачиваются одновременно.

CPU возвращается, super level для серверного процессора

GlobalFoundries, один из крупнейших контрактных производителей чипов, в мае 2026 года официально объявила о наступлении суперцикла на рынке серверных CPU. Причиной становится взрывной спрос на AI-инференс и агентные приложения (AI Agents).

Архитектурная логика проста, в эпоху тренировки соотношение GPU к CPU в сервере составляло 8:1. Процессор был обслуживающим персоналом для видеокарт. При инференсе пропорция сдвигается к 4:1 или даже 2:1. А в сценариях AI-агентов, где система непрерывно координирует множество моделей, обрабатывает контекст и принимает решения, CPU может оказаться в пропорции 1:1 с GPU.

AMD отреагировала мгновенно: на отчётной конференции в мае компания удвоила прогноз совокупного адресного рынка серверных CPU к 2030 году - с $60 млрд. до $120 млрд. Акции Intel за 2026 год выросли почти в два раза: собственные фабрики (IDM-модель) дают Intel преимущество в скорости наращивания выпуска по сравнению с конкурентами, зависящими от TSMC.

Рынок AI-вычислений перестаёт быть монополией GPU. Инфраструктурные инвестиции теперь распределяются между GPU, CPU и памятью - и это меняет правила игры для всех участников.

"Шесть драконов" Chinese GPU

Совокупная рыночная капитализация шести ведущих китайских GPU-компаний - Cambricon (寒武纪), Hygon (海光信息), MuXi (沐曦), Moore Threads (摩尔线程), Iluvatar (天数智芯) и Biren (壁仞科技) - превысила ¥2 трлн ($280 млрд.). Но за этой цифрой скрывается резко расходящаяся реальность.

Cambricon - лидер по прибыли, Q1 2026: выручка ¥2,885 млрд (+160% г/г.), чистая прибыль ¥1,01 млрд. (+185%). Почти половина от всей прибыли за 2025 год заработана за один квартал. Но есть тревожный сигнал: запасы на балансе около ¥4,5 млрд. (1,6 квартала выручки), плюс списание обесценения запасов на ¥246 млн, что это стратегическая закупка или затоваривание - покажут следующие кварталы.

Moore Threads - первая квартальная прибыль в истории. Q1 2026: выручка ¥738 млн. (+155%), чистая прибыль ¥29,4 млн. Но без учёта разовых доходов (扣非) компания всё ещё убыточна. Ключевой драйвер - карта S5000 (80 ГБ), адаптированная под DeepSeek V4 в Day-0 режиме. Контракт на кластер KUAE ($95,5 млн.) продолжает генерировать выручку.

MuXi - рост есть, но убыток сохраняется. Q1 2026: выручка ¥562 млн. (+75%), чистый убыток ¥99 млн. (сокращён с ¥233 млн годом ранее). IPO на STAR Market в декабре 2025 принёс ¥4 млрд., но путь к рентабельности ещё впереди.

Iluvatar и Biren (торгуются в Гонконге) отчитались о росте выручки, но остаются в глубоком минусе. Рынок, однако, оценивает их по потенциалу, а не по текущей прибыли.

Китайский GPU-сектор прошёл точку не возврата - несколько компаний уже генерируют положительный денежный поток. Но "шесть драконов" - это не однородная сила, а спектр от зрелости до стартапа. И расстояние между первым и последним будет только расти.

Huawei Atlas 950 SuperPoD, системный ответ на санкции

На MWC Barcelona 2026 Huawei представила Atlas 950 SuperPoD - сверхузел нового поколения, построенный на чипах Ascend 950DT и межсоединении Lingqu 2.0 (灵衢).

Цифры говорят сами за себя:

8 192 карты Ascend 950DT (в 20+ раз больше, чем у предшественника - Ascend 384);
8 EFLOPS FP8 / 16 EFLOPS FP4;
1 152 ТБ объединённой памяти с единым адресным пространством;
16 ПБ/с полосы межсоединения (в 62 раза больше, чем у NVIDIA NVL144);
На базе Atlas 950 SuperCluster: 524 288 карт, FP4突破1 ZFLOPS.

Ключевая инновация не в чипе, а в системе. Lingqu 2.0 - полностью оптический протокол межсоединения с задержкой 200 нс на прыжок (в 10 раз ниже, чем Lingqu 1.0). Huawei уже открыла спецификации Lingqu (600+ страниц), позволяя сторонним производителям разрабатывать совместимое оборудование.

Ещё одна критическая технология - единое адресное пространство памяти: все 8 192 карты адресуют общую память напрямую, без сериализации трансфера десериализации. Это устраняет главное “бутылочное горлышко” при обучении и инференсе крупномасштабных моделей.

Huawei буквально реализует новую стратегию: компенсируя отставание в литографии системной архитектурой. Atlas 950 выходит на рынок Китая в Q4 2026.

H3C UniPoD S80000, мультивендорный сверхузел

На NAVIGATE 2026 (8 мая, Пекин) H3C представила линейку сверхузлов UniPoD S80000 - для моделей с триллионом+ параметров. Ключевое отличие от Huawei, мультивендорная архитектура. UniPoD S80000 поддерживает GPU нескольких производителей, включая китайские вендоры. Это важно для заказчиков, которые не хотят привязываться к одной экосистеме.

H3C заявляет о решении проблемы утилизации GPU: по данным Cast AI, до 95% закупленных AI-GPU в корпоративных кластерах простаивают. UniPoD S80000 обещает полностековую оптимизацию - от сети до оркестрации для повышения реальной утилизации оборудования.

Контрабанда, санкции и реальная цена NVIDIA в Китае

Сервер NVIDIA B300 (8×GPU) в Китае стоит ¥7 млн. ($1 млн). В США тот же сервер - $550 тыс. разница почти двукратная. Причина не только в санкциях - канал поставок сузился после ареста сооснователя Supermicro.

Дело Supermicro (май 2026): сооснователь Supermicro Wally Liaw арестован по обвинению в организации контрабанды серверов с NVIDIA H200 в Китай и Россию через тайскую компанию OBON примерный объём - $2,5 млрд. Схема включала создание фиктивных компаний в Юго-Восточной Азии, подмену серийных номеров (феном, «сдували феном» этикетки и переклеивали) и использование связей с тайскими государственными структурами.

Параллельно - Jensen Huang в интервью Congress заявил: "Китай не должен получить самые передовые GPU".

И подтверждение от Secretary of Commerce: H200 разрешён к экспорту в Китай, но ни один китайский заказчик его не купил.

Санкции не остановили проникновение чипов - они сделали его дороже и криминальнее. А цена вопроса для конечного заказчика в Китае выросла вдвое.

Vera Rubin, летом тест, осенью - партия

NVIDIA подтвердила график: Vera Rubin - пробный выпуск в июне, первые поставки ключевым клиентам в июле, серийный выпуск во втором полугодии 2026. Но TrendForce снизил прогноз доли Rubin в 2026 году с 29% до 22% из-за проблем с поставками HBM4 и ограничением мощностей TSMC по 3 нм.

Это означает: окно для китайских вендоров остаётся открытым ещё как минимум до конца 2026 года. Пока Rubin не вышел на полную мощность, инференсные решения на китайских чипах сохраняют ценовое преимущество.

Что это значит для российского рынка

1. Инференс - окно возможностей. Сдвиг от тренировки к инференсу снижает требования к однородным кластерам на H100/B200. Для инференса можно использовать гетерогенные системы - китайские GPU + отечественные CPU.

2. Huawei и H3C показывают путь. Atlas 950 SuperPoD и UniPoD S80000 - это не просто «китайские аналоги NVIDIA». Это системные продукты нового типа, где конкурентное преимущество создаётся архитектурой межсоединения, а не только мощностью чипа. Для российского рынка, где санкции ограничивают доступ к топовым GPU, системная оптимизация - стратегический ответ.

3. Контрабанда - это риск, а не решение. Дело Supermicro показывает, что серые каналы поставок закрываются. Легальные китайские GPU, поставляемые через партнёрства единственный устойчивый путь для российского enterprise.

4. CPU-суперцикл - козырь для импортозамещения. Рост спроса на серверные CPU при инференсе означает, что отечественные процессоры (Байкал, Эльбрус) получают реальную роль в AI-инфраструктуре - не как замена GPU, а как обязательный компонент системы. Это размывает монополию GPU-вендоров и открывает пространство для гибридных решений.

5. Расхождение китайских вендоров - фильтр для партнёров. Не все «шесть драконов» дотянут до зрелости. Для российского заказчика критически важно выбирать тех, кто уже вышел на прибыль (Moore Threads, Cambricon) или имеет прочную стратегическую поддержку (Huawei), а не тех, кто ещё сжигает кэш.

Вопросы и ответы

В: Означает ли возвращение CPU, что GPU станет менее важен для AI?

О: Нет. GPU остаётся незаменимым для параллельных вычислений - матричного умножения, генерации токенов. Речь о другом: архитектура AI-инференса требует сбалансированной системы, где CPU отвечает за координацию, логику и память, а GPU - за вычисления. Спрос на GPU не снижается - но он перестаёт быть единственным драйвером закупок.

В: Могут ли российские компании использовать Huawei Atlas 950 SuperPoD?

О: Технически - да, Atlas 950 будет доступен на китайском рынке с Q4 2026. Юридически - это зависит от структуры поставки и соблюдения экспортного контроля КНР.

AI-вывод меняет архитектуру, рынок и геополитику чипов