Технологический триумвират, битва архитектур за будущее искусственного интеллекта

За последние 72 часа на рынке AI-инфраструктуры произошло сразу три события, каждое из которых по отдельности заслуживало бы громких заголовков. Однако именно их совокупность рисует картину стремительной трансформации всей индустрии: Google впервые разделил архитектуру своих TPU на отдельные чипы для обучения и инференса, AMD отчитался о рекордном росте и обозначил амбиции на «сотни миллиардов» к 2027 году, а Huawei на фоне ажиотажного спроса после релиза DeepSeek V4 ускоряет развёртывание нового поколения супернод. На этом фоне даже нишевые игроки, такие как Moore Threads, впервые выходят в прибыль, подтверждая тезис, что гонка за умы искусственного интеллекта вступает в новую фазу, где правила переписываются буквально на глазах. Давайте разберёмся, подробнее что произошло.

Google представил 8-е поколение TPU

В конце апреля Google Cloud Next 2026 компания анонсировала сразу два чипа: TPU 8t (специально для обучения моделей) и TPU 8i (специально для инференса). Это первый случай в истории TPU, когда Google отказался от универсальной архитектуры в пользу узкой специализации.

Логика Google понятна рынок AI сместился от «обучаем всё подряд» к «инференс на продакшене». По данным CICC (中国国际金融有限公司), Google впервые также начнёт продавать TPU как физическое оборудование напрямую клиентам, а не только через Google Cloud. Это стратегический поворот, Google становится прямым конкурентом NVIDIA и AMD на рынке AI-акселераторов, а не только облачным провайдером.

AMD отчитался за Q1 2026, рынок взлетел на 16%

5 мая AMD опубликовал квартальные результаты, которые превзошли все даже скромные ожидания:

· Выручка: $10,3 млрд. (+38% г/г);

· Дата-центр: $5,8 млрд. (+57% г/г);

· Прогноз Q2: $11,2 млрд. (консенсус $10,5 млрд);

· Акции: +16% на постмаркете.

AMD заявил о «высочайшей уверенности» в достижении цели «сотни миллиардов долларов» на рынке AI дата-центров к 2027 году. На фоне этого китайские акции AI-чипов взлетели: Haiguang Information (海光信息) - лимит-up 20%, Cambricon (寒武纪) - рост более 10%.

Отдельно стоит отметить, что AMD и Intel поднимают цены на CPU. Потребительские чипы дорожают на 5 - 10%, серверные на 10 - 20%. По данным CITIC Securities, дефицит может продлиться до 2027 года.

Стратегический поворот Google к специализированным чипам и рекордные показатели AMD отражают общую тенденцию рынка: переход от универсальных решений к узкоспециализированным AI-ускорителям. Именно в этом контексте взрывной рост спроса на решения от Huawei выглядит закономерным шагом крупнейших технологических игроков.

Заказы на Huawei Atlas 350 с Ascend 950PR посыпались

На Huawei China Partner Conference 2026 (конец апреля) компания представила ускорительную карту Atlas 350 на базе нового процессора Ascend 950PR. По сравнению с предыдущим поколением, 950PR обеспечивает почти 3х-кратный прирост производительности на операциях низкой точности (FP4/FP8) и поддерживает полный спектр вычислений - от обучения до инференса.

Huawei уже развернула более 500 коммерческих «супернод» Ascend 384 (по 384 чипа Ascend 910C каждая). Следующее поколение Ascend 950 super-node уже на подходе.

После релиза V4 (24 апреля) ByteDance, Tencent и Alibaba обратились к Huawei за дополнительными партиями чипов 950PR. По данным The Information, речь идёт о заказах на сотни тысяч процессоров. Huawei планирует выпустить около 600 000 чипов Ascend 910C в 2026 году и нарастить общую выручку от AI-чипов до $12 млрд. на 60% больше, чем в 2025-м.

Успех Huawei и лавинообразный рост заказов на её чипы свидетельствуют о зрелости китайской экосистемы AI-ускорителей. Менее крупные, но амбициозные игроки также начинают пожинать плоды своих многолетних инвестиций. Яркий пример - Moore Threads, которая после череды убыточных лет наконец зафиксировала чистую прибыль.

Moore Threads первый раз за всю историю вышел в прибыль

Ещё один знаковый milestone, Moore Threads (摩尔线程) впервые заработал прибыль в Q1 2026. Выручка - ¥738 млн. (+155% г/г), чистая прибыль - ¥29,36 млн. Годом ранее компания была в убытке.

Драйвер становится контракт на ¥660 млн. на кластер KUAE (10 000 GPU, полное обучение триллионных моделей) и коммерческое развёртывание флагманского чипа MTT S5000 на архитектуре Pinghu (1000 TFLOPS, поддержка FP8 - FP64).

Впрочем, по итогам 2025 года все четверо «маленьких драконов» китайского GPU (Moore Threads, MetaX, Iluvatar CoreX, Biren Technology) остаются в убытке. R&D-расходы Moore Threads составили ¥1,305 млрд. примерно 86,7% выручки. Коммерциализация идёт, но инвестировать в софт приходится столько же, сколько в железо.

Выход Moore Threads на прибыль - яркий, но лишь один из симптомов фундаментальных сдвигов в отрасли. Если взглянуть на картину шире, можно выделить три главных тренда, которые объясняют, почему это стало возможным именно сейчас.

Три тренда, которые стоит запомнить

Тренд 1: Эпоха специализированных чипов.

Google разделил TPU на обучение и инференс. Huawei делает Ascend 950PR для инференса и 950DT для обучения. Это конец эпохи «один чип на все задачи» - рынок фрагментируется по сценариям использования.

Тренд 2: DeepSeek V4 как катализатор.

Один релиз модели спровоцировал волну заказов на сотни тысяч чипов. DeepSeek доказал: в эпоху инференса модель может быть драйвером спроса на железо так же сильно, как раньше были только облачные гиганты.

Тренд 3: Китайские GPU-стартапы проходят точку безубыточности.

Moore Threads - первый, но не последний. Cambricon (寒武纪) уже вышла в прибыль в 2025 году. Остальные сокращают убытки. Это значит, что экосистема переходит от «инвестируем в R&D на перспективу» к «можем продавать и зарабатывать».

Эти три ключевых тренда формируют совершенно новую реальность на мировом рынке AI-ускорителей, и их влияние уже ощутимо для российских компаний. Сочетание растущей доступности, обостряющейся ценовой конкуренции и быстрого развития программного обеспечения создаёт для России уникальное «окно возможностей».

Как это влияет на российский рынок

Доступность китайских AI-чипов растёт — и это главная новость для России. Три фактора работают в пользу российских покупателей:

1. Китайские производители наращивают объёмы. Huawei планирует 600 000 Ascend 910C + новые заказы на 950PR. Moore Threads масштабирует S5000. Когда предложения становится больше, появляются реальные коммерческие предложения, а не только «запишитесь в лист ожидания».
2. Ценовая конкуренция усиливается. Google выходит на рынок TPU-железа напрямую. AMD теснит NVIDIA в дата-центре. NVIDIA теряет 100% рынка в Китае. Эта конкуренция на верхнем уровне сегмента давит цены вниз по всей цепочке - включая альтернативные чипы, которые конкурируют за тех, кому NVIDIA недоступна.
3. Экосистема софта догоняет железо. DeepSeek V4 работает на Ascend. Moore Threads поддерживает Transformer и MoE на уровне железа. Для российских компаний, которые сомневались в зрелости китайского софта, появляются аргументы ЗА.

Однако глобальный дефицит CPU (AMD/Intel поднимают цены, дефицит до 2027 года) означает, что стоимость серверной инфраструктуры в целом будет расти. Даже если GPU-карта стоит дешевле NVIDIA, сервер под неё - дороже. Это нужно учитывать при расчёте TCO.

Российским предприятиям стоит ускорить пилотные проекты на китайских GPU сейчас - пока объёмы растут, а производители готовы к гибким условиям. Окно «раннего покупателя» закрывается быстрее, чем кажется.

Рынок AI-инфраструктуры переживает фундаментальную трансформацию: на смену универсальным чипам приходят узкоспециализированные решения, что наглядно демонстрируют новые TPU от Google и ускорители Huawei. Этот сдвиг сопровождается беспрецедентным ростом спроса, который уже невозможно удовлетворить только за счёт традиционных лидеров. В результате на авансцену выходят новые игроки, в первую очередь из Китая, чьи экосистемы GPU и AI-чипов стремительно коммерциализируются и достигают зрелости.

Ключевыми драйверами изменений стали фрагментация рынка по сценариям использования, появление новых моделей катализаторов спроса и выход китайских стартапов на прибыльность. Эти тренды не только меняют расстановку сил среди производителей, но и напрямую влияют на доступность и стоимость технологий для конечных пользователей. Для российских компаний это открывает уникальное “окно возможностей”, позволяя получить доступ к передовым вычислительным мощностям в условиях дефицита и высоких цен на западные решения.

Однако при планировании внедрения новых технологий важно учитывать и обратную сторону: глобальный дефицит центральных процессоров и рост цен на серверную инфраструктуру могут нивелировать часть выгоды от удешевления GPU-ускорителей. Поэтому сейчас для российских предприятий наступает решающий момент: пилотные проекты с китайскими чипами необходимо запускать как можно скорее, чтобы воспользоваться периодом растущего предложения и гибких условий, пока “окно возможностей” не закрылось.

Вопросы и ответы

В: Google продаёт TPU напрямую - значит ли это, что российские компании могут их купить?

О: На данный момент - нет. Google подпадает под те же американские экспортные ограничения, что и NVIDIA. Прямая продажа TPU ориентирована на западных и азиатских (не-санкционных) клиентов. Для России китайские GPU-альтернативы остаются наиболее реалистичным путём.

В: Moore Threads вышел в прибыль - можно ли считать его надёжным поставщиком?

О: Первая прибыль, очень важный milestone, но не гарантия стабильности. R&D-расходы по-прежнему составляют 87% выручки, а годовой итог 2025 - убыток в ¥1 млрд. Компания движется в правильном направлении, но российским интеграторам стоит закладывать риски зрелости софта и поддержки при масштабных развёртываниях.