Искусственный дефицит GPU - реальные проблемы AI

Мы привыкли думать, что главная проблема AI-индустрии - дефицит GPU. При колоссальных инвестициях в оборудование выясняется, что значительная часть вычислительных мощностей попросту простаивает. А в Китае тем временем начинают зарабатывать. Давайте разберёмся, что происходит.

95% GPU простаивают. Это не опечатка

В конце апреля платформа оптимизации облачных затрат Cast AI опубликовала отчёт, который сложно назвать иначе, чем диагнозом индустрии. Согласно их данным, предприятия, которые в панике скупали GPU из-за «страха упустить» (FOMO), фактически используют лишь 5% вычислительных мощностей своих кластеров.

Если кратко компании платят миллионы за оборудование, которое простаивает в режиме ожидания.

The Information сообщает, что xAI Илона Маска, оператор Grok - располагает примерно 550 000 GPU от NVIDIA (H100 и H200). Кластер Colossus в Мемфисе построен с бешеной скоростью, 19 дней от запуска до первой фазы. NVIDIA назвала это «процессом, который обычно занимает четыре года». Но реальная утилизация MFU (Model FLOPs Utilization) составляет 11%.

Для сравнения, Google, которые годами вкладывались в оптимизацию программного стека, 46% соответственно. Всё ещё далеко от теоретического максимума, но хотя бы в разы эффективнее.

Президент xAI Майкл Николлс в внутренней записке признал, что 11% - «досадно низкий показатель». Компания поставила цель - достичь 50% в ближайшие месяцы.

Модели работают импульсно: во время инференса GPU загружены, в фазе обработки данных - простаивают. Но главная причина поведенческая: из-за дефицита все боятся отдать ресурсы и предпочитают «придержать» железо. Получается порочный круг: чем дороже GPU, тем больше их простаивает.

В то время как индустрия пытается решить проблему низкой утилизации, финансовые отчёты лидеров рынка рисуют картину тотальной, всепоглощающей гонки вооружений. Масштабы инвестиций настолько велики, что вопрос «хватит ли нам GPU?» сменился вопросом «а что мы будем делать со всем этим железом, когда оно приедет?».

Этот парадокс становится очевиден, если взглянуть на финансовые показатели.

Alphabet за год поднимает ставку до $190 млрд

В конце апреля Alphabet отчитался за первый квартал 2026 года. Чистая прибыль выросла на 81%, облачное подразделение Google Cloud удвоило объём отложенных заказов - до $200 млрд. Финансовый директор поднял прогноз по капитальным затратам на 2026 год до $180 - 190 млрд. (против ранее озвученных $175 млрд.). И предупредил что в 2027-м capex будет «значительно выше».

Это не один Alphabet. Американских техногиганты такие как Google, Amazon, Microsoft, - совокупно планируют потратить на AI-инфраструктуру $725 млрд. в 2026 году. Банк Америки прогнозирует, что к 2027-му отрасль выйдет на $1 трллн. годовых капзатрат.

AI-гонка вооружений перешла в фазу, где побеждает не тот, у кого лучше модель, а тот, у кого больше железа. Или, точнее, тот, кто умеет это железо эффективно использовать - как мы увидели выше, это совсем не одно и то же.

На фоне этого безудержного роста затрат и гонки за «железом» на Западе, где эффективность использования ресурсов всё ещё далека от идеала, на мировой арене появляется новый, прагматичный игрок. Пока американские гиганты соревнуются в объёмах капитальных вложений, в Китае демонстрируют иной подход - умение зарабатывать и расти даже в условиях ограничений.

Яркий пример - компания Moore Threads, которую называют «первым акционерным обществом GPU в Китае».

В Китае зарабатывают

В день «день длинного отчёта» компания Moore Threads (摩尔线程), которую называют «первым акционерным обществом GPU в Китае», опубликовала годовой отчёт и данные за первый квартал 2026 года.

Цифры впечатляют:

· Выручка за 2025 год: 1,505 млрд. юаней (+243%);

· Выручка Q1 2026: 738 млн. юаней (+155%);

· Чистая прибыль Q1 2026: 29,36 млн юаней (первый прибыльный квартал в истории компании, против убытка в 112 млн. годом ранее).

Компания основана в 2020 году бывшим вице-президентом NVIDIA и гендиректором NVIDIA China Чжан Цзяньчжи. За шесть лет - от нуля до $450 млн. рыночной капитализации (на момент публикации отчёта - 324,1 млрд. юаней).

Но честно говоря, картина не безоблачная. Операционный денежный поток за 2025 год составил минус 2,956 млрд. юаней. Предоплата поставщикам выросла до 2,36 млрд, запасы - до 2,195 млрд. Топ-5 клиентов дают 91% выручки. Это классическая история роста: продажи растут, но деньги утекают в предоплату и запасы.

Тем не менее, Moore Threads уже развернула десятки тысяч карт в кластерах. Компания первой адаптировала DeepSeek V4 под свой стек MUSA. И архитектура «Хуаган» пятого поколения обещает десятикратный прирост эффективности.

Параллельно, Jingjia Micro (景嘉微) заявила о разработке нового высокопроизводительного GPU общего назначения с поддержкой рендеринга и AI, а Jingjia Micro за три года превысила 1 млрд. юаней.

Qualcomm заходит в AI

29 апреля Qualcomm отчитался за второй квартал 2026 финансового года: выручка составила $10,6 млрд, небольшое снижение на 3%. Но главное - не в текущих цифрах, а в анонсе.

CEO Кристиано Амон объявил, что Qualcomm в 2027 году выпустит свой первый сверхмасштабный ASIC для AI-инфраструктуры и это начнёт приносить «существенный доход».

Qualcomm традиционно силён в мобильных чипах и автомобильных решениях (рост автомобильного направления - на 59%). Выход в сегмент серверных AI-чипов станет заявкой на роль нового игрока в гонке.

Пока это не конкурент NVIDIA H100, но добавляет ещё одного игрока - наряду с Google TPU, Amazon Trainium, Microsoft Maia и китайскими производителями.

Попытки Qualcomm и других гигантов вклиниться в этот и без того тесный рынок - яркое свидетельство того, что битва за «железо» достигла своего апогея. Когда на кону стоят триллионы долларов, конкуренция неизбежно выходит за рамки рыночной борьбы и перемещается в плоскость государственного регулирования. Гонка вооружений в AI достигла той точки, после которой в дело вступает большая политика. Именно это и произошло в конце апреля.

Следующий уровень ограничений

В Конгресс США был внесен законопроект MATCH ACT (Maintaining American Technological Hegemony through Coordinated Hardware-controls) - «Многосторонний координационный акт о контроле за аппаратным обеспечением». Двадцать второго апреля комитет по иностранным делам Палаты представителей его одобрил.

Если раньше США ограничивали продажу чипов в Китай, теперь фокус смещается на оборудование для производства чипов. Главная цель - запрет на экспорт в Китай иммерсионных DUV-фотолитографических систем ASML, а также - расширение санкций против SMIC, YMTC, CXMT и Hua Hong.

Последняя версия была незначительно смягчена, но ядро ограничений на DUV сохранено.

Одновременно Китай усилил контроль за экспортом редкоземельных материалов. Результат - двойное давление на ASML: с одной стороны теряет крупнейший рынок сбыта, с другой - рискует потерять доступ к ключевым материалам.

Для мировой индустрии эра «глобальной полупроводниковой цепочки» заканчивается. На смену приходят две параллельные экосистемы: западная (NVIDIA/AMD/Intel + TSMC/ASML) и китайская (Moore Threads/MetaX/Huawei + SMIC).

Для России, наблюдающей за этим глобальным противостоянием со стороны, уроки происходящего становятся предельно ясными. Попытка играть по правилам Запада, где триллионные бюджеты тратятся на гонку «железа» с эффективностью в 11%, - это путь к гарантированному технологическому и финансовому отставанию. В то же как китайский опыт показывает, что даже в условиях тотальных санкций и изоляции можно построить жизнеспособную, быстрорастущую индустрию, ориентированную на внутренний спрос и суверенитет.

Следовательно, ключевой вопрос для России заключается не в том, чтобы скопировать западную модель с её избыточными тратами, и даже не в том, чтобы просто повторить китайский путь «догоняющего развития». Задача состоит в том, чтобы, опираясь на эти два полярных примера, выработать собственную, прагматичную стратегию развития AI-инфраструктуры, где главным критерием успеха будет не количество закупленных GPU, а эффективность их реального использования и способность создавать замкнутые технологические цепочки внутри страны.

Выводы для российского рынка

1. Парадокс простаивающих GPU - окно для российских компаний. Если западные гиперскейлеры тратят миллиарды на оборудование, которое простаивает на 95%, у российских предприятий есть шанс выстроить более эффективную модель. Не гнаться за объёмами, а оптимизировать утилизацию. Аренда вместо покупки, платформы управления ресурсами (вроде АРКА) вместо ручного provisioning.

2. Китайские GPU доказывают жизнеспособность. Moore Threads вышла в прибыль - это не теоретический прорыв, а коммерческий факт. Для российских заказчиков, которые опасались «сырости» китайских решений, это сигнал: экосистема созревает. Быстрее, чем ожидали скептики.

3. MATCH ACT ускоряет раскол - и это выгодно России. Каждый новый уровень ограничений делает китайскую GPU-экосистему самостоятельнее. И параллельно - доступнее для рынков, куда западные производители не могут или не хотят поставлять. Россия оказывается в ситуации, когда китайская альтернатива перестаёт быть «запасным вариантом» и становится основным путём.

4. Гонка capex в $1 трлн. создаёт инфляцию спроса. Когда Alphabet тратит $190 млрд. в год, а отрасль выходит на триллион - цены на GPU и комплектующие остаются высокими. Для российских компаний это означает: работать с прямыми китайскими поставщиками (минуя западные цепочки) - не просто опция, а экономическая необходимость.

Вопросы и ответы

В: Насколько реальна цифра «95% GPU простаивают»? Не преувеличение ли это?

О: Данные Cast AI охватывают предприятия, использующие их платформу оптимизации - а это компании, которые уже осознали проблему и начали с ней работать. Реальная картина по рынку в целом может быть даже хуже. Цифра 11% MFU у xAI (550 000 GPU) подтверждает: проблема системная, а не точечная. Даже Meta и Google, которые годами оптимизируют свои стеки, достигли лишь 43 - 46%.

В: Стоит ли российским компаниям переходить на китайские GPU прямо сейчас, или лучше подождать следующего поколения?

О: Зависит от задач. Для инференса LLM-моделей - текущее поколение Moore Threads S5000 и MetaX C500/C600 уже работоспособно и коммерчески доступно. Для тренировки крупных моделей с нуля - программный стек ещё догоняет NVIDIA CUDA. Разумная стратегия: начинать с инференса и fine-tuning на китайских GPU сейчас, параллельно отслеживать выход следующего поколения (Moore Threads «Хуаган», MetaX C600+), и масштабировать по мере зрелости экосистемы.