Светлая и темная сторона одной архитектуры

На фоне стремительного развития технологий искусственного интеллекта возник острый дефицит памяти, а эпоха AI-агентов неожиданно привела к нехватке CPU. В этом материале мы разбираем, как эти изменения влияют на российский рынок и чего ожидать в ближайшем будущем.

Мир делится на CUDA и суверенный стек

За три года NVIDIA потеряла в Китае 40 процентных пунктов - от доминирующих 95% до 55% рынка. Сам Дженсен Хуанг признал это публично:

"Мы потеряли Китай - от 95% до нуля".

По данным IDC, в 2025 году NVIDIA поставила в Китай 2,2 млн. AI-ускорителей, но это уже 55% рынка, а не монополия.

Причина кроется не только в экспортных ограничения США. Пекин с начала 2026 года официально не одобрил импорт H200, китайские таможенники получили указание блокировать поставки. Китай имеет значительную мотивацию для продвижения собственной полупроводниковой промышленности. Китайские компании, которые ещё в 2023 году рассматривали китайские чипы как “крайний вариант”, теперь предпочитают их по стратегическим соображениям.

Результат ожидаемый, мир разделился на две экосистемы:

• Глобальный CUDA-стандарт: NVIDIA, AMD, Intel, с единой программной платформой;

• Китайский суверенный стек: Huawei CANN, Moore Threads MUSA, Iluvatar, MXMACA - десятки совместимых, но не взаимозаменяемых платформ.

Этот раскол сказывается на весь мировой рынок GPU. Страны, которые не могут или не хотят зависеть от NVIDIA, а их становится всё больше, получают реальную альтернативу. Китайские чипы активно экспортируются: в первые два месяца 2026 года экспорт интегральных схем из Китая вырос на 72,6% - до $43,3 млрд, при среднем росте экспорта 21,8%. При этом объём поставок вырос лишь на 14% - то есть средняя цена выросла на 52%. Китай продаёт не дешёвые микросхемы, а дорогие AI-ускорители.

Этот тектонический сдвиг на рынке - не просто статистика. Он напрямую влияет на то, как развиваются технологии и кто задаёт тон в индустрии.

Яркий пример - история Moore Threads. Компания, которая ещё недавно воспринималась как нишевый стартап, сегодня становится полноценным коммерческим вендором и одним из символов новой эры.

Moore Threads скачок от стартапа к коммерческому вендору

Главный событие уходящего апреля, отчётность Moore Threads (摩尔线程, тикер 688795.SH). Компания, вышедшая на IPO в декабре 2025 года, отчитала первый прибыльный квартал в своей истории.

Ключевые показатели завершенного Q1 2026:

• Выручка: ¥738 млн. ($101,5 млн), рост +155%;

• Чистая прибыль: ¥29,36 млн.;

• Годовой отчёт 2025: выручка ¥1,505 млрд. (рост +243%); валовая прибыль ¥987 млн. (рост +218%);

• R&D расходы за 2025: ¥1,305 млрд. (86,7% от общей выручки);

• Накоплено 2014 патентных заявок, из которых 1743 - на изобретения;

• Маржинальность около 69% (второе полугодие 2025).

Флагманский продукт - MTT S5000 на архитектуре «Pinghu» (平湖). Карта достигает 1000 TFLOPS (dense) с поддержкой FP8 - FP64, с аппаратным ускорением Transformer и MoE. По заверенениям компании S5000 уже массово поставляется и спрос превышает предложение.

В марте Moore Threads подписала контракт на ¥660 млн. для поставки в кластер «KUAE» (夸娥) - тренировочного кластера уровня 10 000 карт для обучения триллионных параметров моделей. Следующим шагом компания видит построение новой архитектуры «Huagang» (花港) для кластеров уровня 100 000 карт.

MetaX (曦云) также сообщил о своем прогрессе: C600 построен полностью на китайском техпроцессе с существенным приростом производительности и новым HBM-контроллером ожидается в первом полугодии 2026.

Китайский рынок AI-чипов, по прогнозу Frost & Sullivan, вырастет с ¥142,5 млрд. в 2024 году до ¥1,3 трлн. к 2029 - CAGR 54%.

Однако вычислительная мощность - это только половина дела. История успеха любого чипмейкера сегодня пишется не только на кремнии, но и в микросхемах памяти. Как только инженеры научились создавать сверхмощные GPU, индустрия столкнулась с новой, не менее острой проблемой.

GPU есть, а памяти нет

Проблема, о которой говорили с 2024 года, стала реальностью: мировой рынок памяти вошёл в фазу острого дефицита, и главный виновник AI.

• SK Hynix отчиталась о рекордной прибыли за Q1 2026 - и предупредила рынок, что дефицит чипов может сохраняться до 2030 года;

• Цены на DRAM удвоились с начала 2025 года; HBM поглощает уже 23% всех плафонных пластин DRAM;

• Samsung и SK Hynix подписали с OpenAI соглашение о поставке 900 000 пластин DRAM в месяц для проекта Stargate;

• IDC прогнозирует падение поставок смартфонов на 12,9% и ПК на 11,3% в 2026 году - производители памяти переключаются на более прибыльный HBM-сегмент.

HBM (High Bandwidth Memory) - ключевой компонент AI-ускорителей, каждый GPU нового поколения требует всё больше памяти:

· NVIDIA B200 - 192GB HBM;

· GB200 NVL72 - 13.5 TB на стойку.

Потребление HBM растёт экспоненциально, а производственные мощности линейно.

Для рынка серверных решений это означает следующее стоимость GPU-кластера определяется не только ценой чипов, но и доступностью памяти. Вендоры, которые контролируют цепочку поставок памяти - Huawei с собственными HBM-разработками, Moore Threads с китайскими HBM-контроллерами получают дополнительное конкурентное преимущество.

Пытаясь утолить GPU голод, индустрия наткнулась на новую стену. Пока все силы были брошены на гонку за терафлопсами и HBM-памятью, незаметно назрел другой, не менее острый дефицит. Эпоха, когда балом правили графические ускорители, породила неожиданного аутсайдера - и теперь уже центральные процессоры становятся главным узким местом.

Эпоха AI-агентов меняет баланс

Вот это поворот: в эпоху, когда все говорят о GPU, дефицитным становится CPU.

Логика проста, но контринтуитивна. AI-агенты главный тренд 2026 года выполняют огромный объём вычислений: маршрутизация задач, управление памятью, координация между моделями. Эти операции выполняются на CPU, а не на GPU. С ростом числа AI-агентов потребность в CPU резко выросла.

Дополнительный фактор: мировые мощности 2 - 3nm литографии перегружены - TSMC и Samsung приоритизируют производство GPU-кристаллов, ущемляя производство CPU. Результат вполне ожидаемый: CPU дефицитны, цены растут, очереди удлиняются.

NVIDIA отреагировала на событие весьма оперативно - выпустила процессор Vera, первый CPU за много лет. Arm пошла ещё дальше компания анонсировала собственный проект разработки CPU-чипов, заключив партнёрства с Meta и OpenAI. Глава Arm Рене Хаас открыто заявил:

В эпоху AI CPU выполняют ключевые вычислительные задачи.

Для российского рынка это очередной важный сигнал: строить AI-инфраструктуру нужно не только с прицелом на GPU, но и с запасом CPU-мощностей - особенно если речь идёт о развёртывании агентных систем.

Полупроводники преодолели $1 трлн Goldman Sachs говорит о мультилетнем суперцикле

По данным Omdia, мировая полупроводниковая отрасль впервые в истории превысила отметку в $1 трлн. годовой выручки. Рост сконцентрирован в сегментах AI-ускорителей и высокопропускной памяти (HBM) - потребительская электроника растёт скромно.

Goldman Sachs прогнозирует, что AI-компании вложат более $500 млрд. в инфраструктуру в 2026 году. Корзина акций инфраструктурных компаний, отслеживаемая Goldman Sachs Research, принесла 44% доходности с начала года - против 9% у широкого рынка. Аналитики банка описывают текущую ситуацию как мультилетний AI-суперцикл.

TSMC - главный бенефициар: Goldman Sachs прогнозирует рост выручки тайваньского гиганта на 30% в 2026 году. Компания запустила производство по 2нм техпроцессу. TrendForce прогнозирует рост выручки литейных производств на 24,8% - но мощности ограничены, а геополитические риски (Тайвань, экспортные ограничения) остаются фоном для всего рынка.

В России инвестиции в дата центры за период с апреля 2025 по апрель 2026 года достигли 53,5 млрд. рублей (данные TAdviser AI Day 2026). Спрос на вычислительные мощности растёт быстрее, чем инфраструктура успевает строиться - и каждый из описанных выше дефицитов усугубляет ситуацию.

Глобальные тренды - от дефицита памяти и процессоров до миллиардных инвестиций - сходятся в одной точке. И для российского рынка эта точка становится настоящим испытанием на прочность, но вместе с тем открывает и уникальные возможности.

Как эти события влияют на российский рынок

1. Раскол на две экосистемы - это шанс для российского рынка. Пока мир делится на CUDA и Sovereign Stack, российские заказчики могут выбирать. Китайский стек уже коммерчески зрелый: Moore Threads прибыльна, Huawei CANN открыт, экосистема развивается. Для российских компаний это означает: можно строить AI-инфраструктуру, не завися от NVIDIA легально, с поддержкой и гарантиями.
2. Экспортный рост китайских чипов - 72,6% меняет мировую карту. Китай больше не только потребитель AI-оборудования, но и экспортёр. Для России это расширяет каналы поставок и снижает риски монополии.
3. Дефицит памяти - скрытый риск для любых GPU-проектов. Цены на DRAM удвоились, HBM поглощает 23% мирового производства. Планировать GPU-кластеры нужно с учётом доступности памяти - вендоры с контролируемой цепочкой поставок (Huawei Ascend, Moore Threads с китайским HBM) получают преимущество.
4. CPU-дефицит - фактор, который недооценивают. Эпоха AI-агентов создаёт новый тип нагрузки, где CPU становится bottleneck. Российские компании, планирующие развёртывание агентных систем, должны закладывать CPU-мощности в проект с самого начала.
5. $500 млрд. инвестиций Goldman Sachs - для российского рынка это и угроза, и возможность. Львиная доля инвестиций идёт гиперростоверам. Для компаний вне этого круга доступ к инфраструктуре становится критическим фактором. Именно поэтому решения, позволяющие строить собственные AI-кластеры на альтернативном оборудовании, приобретают стратегическое значение.

Мировая индустрия искусственного интеллекта столкнулась с парадоксальной ситуацией: на фоне бурного роста вычислительных мощностей и появления всё более совершенных GPU-ускорителей, главным сдерживающим фактором становятся не сами процессоры, а сопутствующие компоненты. Острая нехватка HBM-памяти, поглощающей всё большие объёмы производственных мощностей, и неожиданный дефицит CPU, вызванный переходом к AI-агентам, превращают создание инфраструктуры из технологической задачи в логистическую. Для российского рынка это означает, что стоимость и сроки реализации проектов теперь зависят не только от доступности самих GPU, но и от способности выстроить надёжные цепочки поставок памяти и центральных процессоров, что в текущих условиях требует особого стратегического планирования.

Уход от монополии NVIDIA и формирование двух несовместимых миров - глобального CUDA-стандарта и китайского суверенного стека диаметрально меняет правила игры. Для России это не просто вызов, связанный с санкциями, а стратегическая возможность. Зрелость китайских платформ (например, коммерческий успех Moore Threads) и их готовность к экспорту позволяют диверсифицировать закупки, снизить риски технологической зависимости и строить инфраструктуру на альтернативном оборудовании. Это шанс для отечественных заказчиков получить юридически чистую, поддерживаемую и гарантированную платформу для развития AI, не оглядываясь на ограничения западных вендоров.

Полупроводниковая отрасль переживает инвестиционный бум: по прогнозам, в 2026 году в инфраструктуру будет вложено более $500 млрд., а спрос на вычислительные мощности в России уже превышает темпы строительства дата-центров. Однако этот суперцикл усугубляет глобальный дефицит, так как производственные мощности литейных заводов, особенно по передовым техпроцессам (2 - 3 нм), ограничены. В результате возникает опасный разрыв: с одной стороны, есть колоссальный спрос и инвестиции, а с другой - физическая нехватка чипов и компонентов. Для российских компаний это сигнал о том, что доступ к инфраструктуре становится критическим фактором конкурентоспособности, а решения, позволяющие строить собственные AI-кластеры на альтернативном оборудовании, приобретают стратегическое значение для выживания и развития.

Вопросы и ответы

В: Если мир раскололся на CUDA и Sovereign Stack, насколько зрел китайский стек для enterprise-нагрузок в России?

О: Зрелость быстро растёт. Moore Threads обеспечивает Day 0 адаптацию крупнейших LLM, Huawei открыла CANN, поддерживает Qwen 3.5, MiniMax M2.5, GLM-5 из коробки. Главный вызов остаётся в локальной поддержке - но именно этим и занимаются компании-интеграторы, работающие с китайскими вендорами в России. Ключевой аргумент: 10 000-картовый кластер Moore Threads для обучения триллионных параметров моделей - это уже не «подходит для инференса», а полноценное enterprise-решение.

В: Китайские чипы дорожают - экспорт вырос на 72,6% в деньгах при росте объёма всего на 14%. Не становятся ли китайские чипы дороже NVIDIA?

О: Цифры говорят не о росте цен на конкретные модели, а о сдвиге продуктового микса. Китай экспортирует всё больше дорогих AI-ускорителей (Huawei Atlas, Moore Threads S5000) вместо дешёвых микроконтроллеров. Средняя цена выросла на 52% именно потому, что доля высокомаржинальных AI-чипов в экспорте растёт. Для российских заказчиков это хороший знак: китайские вендоры продают не «дешёвую замену», а полноценные решения с рыночной ценообразованием.