Ускорение китайских GPU
22 июня 2026 г.
Три события, которые раньше казались отдельными точками, сложились в одну тенденцию: китайская экосистема GPU перешла из фазы собираем железо в фазу конкурируем по скорости разработки. Для российского рынка - где китайские GPU уже основной альтернативный канал поставок что означает рост доступности, зрелости стека и … новые вызовы.
В условиях глобальных изменений на рынке технологий и искусственного интеллекта, китайские компании Moore Threads и Biren Tech делают смелый шаг вперед, завершив Day-0 адаптацию модели Zhipu AI GLM-5.2. Это событие не только подчеркивает их технические возможности, но и свидетельствует о зрелости экосистемы, которая теперь способна конкурировать с западными аналогами. В условиях, когда доступ к современным графическим процессорам NVIDIA для китайских компаний ограничен, такая адаптация становится ключевым фактором для успешного внедрения ИИ решений. Day-0 адаптация, как стандарт, позволяет компаниям быстро интегрировать новые модели и минимизировать время на их внедрение в производственные процессы.
Финансовые показатели Moore Threads за первый квартал 2026 года подтверждают их статус как одного из лидеров на рынке: выручка достигла 7,38 млрд юаней, что на 243% больше по сравнению с прошлым годом. Это не только демонстрирует рост компании, но и создает уверенность в стабильности и надежности их решений для клиентов. В то же время, Enflame Technology, получив одобрение на IPO, планирует привлечь 60 млрд юаней, что позволит ускорить разработку новых поколений AI-чипов. Эти финансовые вливания создают новые возможности для российских компаний, которые могут воспользоваться более доступными и конкурентоспособными решениями в области GPU, особенно в условиях роста цен на аренду NVIDIA B200.
Moore Threads и Biren Tech: Day-0 адаптация GLM-5.2 + Q1-финансы
Два крупнейших китайских GPU вендора - Moore Threads (摩尔线程) и Biren Tech (壁仞科技) одновременно объявили о завершении Day-0 адаптации флагманской модели Zhipu AI GLM-5.2. Это не случайность: в Китае Day-0 стал конкурентным оружием.
Технически важно
• GLM-5.2 - новое поколение от Zhipu (годовая выручка ~6 млрд юаней в 2025, IPO в Гонконге - март 2026). Контекстное окно заметно шире GLM-5.1, что нагружает стадию prefill.
• Moore Threads MTT S5000 (80 GB HBM3): для GLM-5.1 уже была реализована оптимизация prefill и P/D-разделения. Для 5.2 увеличили пропускную способность на длинных последовательностях.
• MUSA SDK + MUSIFY (автотранслятор CUDA в MUSA) позволяет переносить open-source модели без ручной переписи ядер.
• Biren Tech Biren 166 Series - конкурирующая архитектура, тоже прошла Day-0. Это гонка: два лидера “четырёх драконов” демонстрируют зрелость стека одновременно.
Это про маркетинг
• NVIDIA H100/H200 для Китая недоступен с 2023 года. Любая крупная open-source модель выходит под CUDA. Чтобы китайский GPU был востребован адаптация должна быть быстрее, чем заказчик разочаруется.
• Когда два вендора показывают Day-0 на одной модели - это тренд, не исключение. MUSA и BRUCLE экосистемы достигли скорости интеграции, сравнимой с CUDA. Не по абсолютной производительности ядра, а по времени вывода в production.
• 19 июня Moore Threads публикует отчётность Q1 2026: выручка 7,38 млрд юаней (рост 243% год к году), в экосистеме MUSA 450 000+ разработчиков. Это уже не стартап - это масштаб, при котором Day-0 становится операционной нормой, а не единицей для PR.
Enflame CloudBlazer: IPO на STAR Market и 60 млрд юаней
15 июня Enflame Technology (燧原科技) получила одобрение IPO на Шанхайской бирже STAR Market. Ожидаемый сбор: 60 млрд юаней (~8,3 млрд USD). Средства пойдут на:
• 5-е поколение AI-чипов (CloudBlazer);
• 6-е поколение AI-чипов;
• Программы по software-hardware co-design.
Enflame входит в “четырёх маленьких драконов” китайской GPU индустрии (Moore Threads, MetaX, Birentech, Enflame).
Почему это сигнал для рынка:
• 2026 год стал годом IPO китайских GPU вендоров. Moore Threads вышел на STAR Market в октябре 2025 (688795SH). Enflame следует за ним. MetaX и Birentech готовят заявки.
• Публичное финансирование означает ускорение R&D: 60 млрд юаней это примерно 2 - 3 года capex на архитектуру и ПО. Для сравнения: NVIDIA тратит на R&D примерно $8 - 10 млрд в год. Enflame пока на порядок меньше, но приращение капитала линейно коррелирует со скоростью выхода новых архитектур.
• Enflame ожидает, что выручка за 1H 2026 превысит весь 2025 год. Это подтверждает спрос со стороны hyperscaler и облачных провайдеров Китая.
• Для российского покупателя: IPO вендоры проходят строгий аудит раскрытия (регламент CSRC). Это повышает прозрачность продуктовой дорожки и снижает риск “чёрного ящика” при закупках.
NVIDIA B200: цены на аренду удвоятся, заказы отложены на Q2 2027
18 июня, буквально на следующий день, пришёл ответ из Кремниевой долины: Baseten (AI inference платформа) на мероприятии Altimeter сообщила, что стоимость аренды GPU B200 вырастет вдвое, начиная с октября 2026. Новые заказы отодвинуты на второй квартал 2027.
Контекст:
• B200 - следующее поколение после H200. Производство ограничено дефицитом CoWoS упаковки от TSMC. NVIDIA приоритизирует hyperscaler (Microsoft, Google, Amazon, Meta), а вторичный рынок облачной аренды остаётся без объёмов.
• Рост цен на аренду B200 создаёт новую ценовую планку для GPU as a Service. Если аренда B200 в USA вырастет до $7 - 9/час (оценка), альтернативные GPU (в том числе китайские) становятся конкурентоспособными при стоимости аренды $2 - 4/час на сопоставимом inference ворклоаде.
• Для России эффект усиливается: российские компании и без того не могут закупать H100/B200 напрямую. Высокие цены на аренду через посредников делают китайские GPU кластеры экономически оптимальным выбором для LLM inference.
EU санкции, 47 сущностей под новые ограничения
В тот же день, когда Enflame получил одобрение IPO, Евросоюз ввёл новый пакет санкций против России: 34 человека и 47 юридических лиц. Среди ограничений ужесточение контроля за технологиями и оборудованием двойного назначения, включая микроэлектронику.
Что это значит практически:
• Транзит GPU через третьи страны (включая бывшие республики Средней Азии, ОАЭ, Турцию) под усиленным мониторингом. ЕС блокирует не просто прямые поставки, но и серые схемы через прокладки.
• Китайские GPU не попадают под прямой американский EAR (если произведены в Китае без американского IP), но маршрут поставки усложняется. Требуются более жёсткие нагрузки на логистику.
• С другой стороны: ужесточение западных санкций лишь ускоряет импортозамещение в России. Китайские GPU становятся не альтернативой, а «основным каналом» для enterprise AI инфраструктуры.
Как это повлияет на российский рынок
1. Экосистемная зрелость. Day-0 адаптация GLM-5.2 сразу двумя вендорами (Moore Threads и Biren Tech) - это не PR, это тренд. Китайские GPU поддерживают современные open-source LLM с теми же сроками интеграции, что NVIDIA. Для российских интеграторов (банки, министерства, telecom) это снижает привязку к поставщику и TCO.
2. Масштаб экосистемы подтверждён. Q1 2026 Moore Threads: 7,38 млрд юаней выручки, 450 000+ разработчиков. Это означает, что MUSA SDK имеет достаточную критическую массу для оперативной адаптации новых моделей без зависимости от NVIDIA.
3. Финансирование равно масштаб. IPO Enflame и уже состоявшийся выход Moore Threads на STAR Market означают, что китайские GPU вендоры получают публичные инвестиции для ускорения дорожных карт. Ожидать новые архитектуры каждые 12 - 18 месяцев.
4. Ценовое окно для российского рынка. Подорожание аренды B200 делает китайские GPU кластеры конкурентоспособными не только из-за санкций, но и чисто экономически примерно на 40 - 60% дешевле в TCO на inference.
5. Риски логистики. EU санкции 15 июня и ужесточение BIS контроля усложняют транзит. Требуется горизонт закупок 3 - 6 месяцев и надёжные партнёрские цепочки поставок с опытом кросс-бордерных поставок.
6. АРКА как платформа-агностик. Рост числа китайских GPU вендоров усиливает потребность в унифицированной платформе. Локализованная версия MoArk АРКА - поддерживает 7+ вендоров GPU и позволяет запускать inference, fine-tuning и pipeline без привязки к конкретному железу. При растущей фрагментации GPU-рынка это становится критически важным.
Выводы и заключения
Совокупность событий, от синхронной Day-0 адаптации модели GLM-5.2 вендорами Moore Threads и Biren Tech до успешного IPO Enflame Technology и впечатляющего квартального отчёта Moore Threads - окончательно формирует новый отраслевой ландшафт. Китайская индустрия графических процессоров совершила качественный скачок, перейдя от простого копирования и сборки железа к прямому соперничеству в скорости вывода инноваций на рынок. Это уже не отдельные успехи отдельных компаний, а системный сдвиг, при котором скорость программно-аппаратной интеграции становится главным конкурентным преимуществом, сопоставимым по значимости с чистой производительностью чипов. Для глобального рынка это сигнал о появлении новой силы, а для России - подтверждение того, что альтернативный технологический стек достиг необходимой зрелости для поддержки критически важных нагрузок.
Для российского рынка, где китайские GPU де-факто стали основным каналом поставок, этот переход открывает окно стратегических возможностей, но одновременно ставит перед бизнесом и государством новые вызовы. Рост доступности и зрелости стека снижает зависимость от западных вендоров и общую стоимость владения инфраструктурой (TCO), однако требует пересмотра подходов к планированию. Усложнение логистики из-за ужесточения западных санкций диктует необходимость формирования долгосрочных партнёрств и создания запасов оборудования. В этих условиях ключевым фактором успеха становится внедрение универсальных платформ-агностиков, подобных АРКА, которые позволяют абстрагироваться от конкретного производителя «железа» и обеспечить гибкость в условиях растущей фрагментации рынка. Таким образом, задача импортозамещения трансформируется: теперь это не просто поиск замены, а построение суверенной, масштабируемой и адаптивной AI экосистемы, способной быстро впитывать инновации, исходящие уже не с Запада, а с Востока.
Вопросы и ответы
В: Day-0 адаптация — это реальная производительность или маркетинг?
О: Реальная, но с оговоркой. Day-0 означает, что модель запускается и выдаёт корректные результаты с первого дня - пропускная способность и задержка оптимизируются в течение недель. Но когда два вендора (Moore Threads и Biren Tech) одновременно показывают Day-0 на одной модели, это уже не PR - это конкурентный стандарт отрасли.
В: Почему IPO Enflame важнее, чем выход Moore Threads полгода назад?
О: Потому что Moore Threads первым открыл дверь. Enflame подтверждает, что рынок капитала считает GPU сектор Китая устойчивым инвестиционным направлением. Когда один вендор выходит на IPO - это исключение. Когда два – это уже тренд. Ожидайте, что MetaX и Birentech последуют в 2026 - 2027 годах.
