Грандиозный рывок китайского ИИ
В условиях ограничений на вычислительные мощности, Китаю удается на равных конкурировать с флагманскими LLM в США и Европе.
После громкого релиза ChatGPT 3.5 в ноябре 2022 и значительного апгрейда на ChatGPT 4 в марте 2023, в следующие 1.5 года (!) до релиза o1-preview в сентябре 2024 не было прогресса в индустрии в условиях полного доминирования OpenAI.
Однако, конкуренты стали поджимать с середины 2024 (в особенности Anthropic c моделью Claude 3.5 Sonnet).
Китай начал позже (первая публичная версия появилась в июле 2023 — Qwen Chat 7B, но была чрезвычайно слаба), но темпы развития ошеломляющие.
Уже в декабре 2023 лучшая китайская LLM вышла по производительности на уровень ChatGPT 3.5 с Qwen1.5 Chat 72B, сократив отставание до одного года.
В сентябре 2023 вышла малоизвестная, но мощная модель GLM-4-Plus от Zhipu AI, которая по синтетическим тестам достигла ChatGPT 4 образца начала 2024 (отставание сократилось до 9 месяцев).
В октябре 2023 выходит Qwen2.5 Plus (первая китайская публичная модель, которая имела практическое применение), которой удалось сравняться с обновленным GPT-4o и Claude 3.5 Sonnet, но все еще значительно проигрывая по гибкости и функционалу.
С осени 2024 началась эпическая битва ИИ. Плотность релизов зашкаливающая. Новым китайским лидером стала LLM — Step 2 от StepFun, а в декабре всем известный DeepSeek V3, который был лучшей нерассуждающей моделью в мире.
В декабре 2023 отставание Китая от американских флагманов был всего год, а в декабре 2024 Китай стал лидером, а спустя месяц появился DeepSeek R1, который и произвел медийный фурор, выводя китайские ИИ из отраслевого андеграунда в мейнстрим.
DeepSeek R1 не стал лидером, но приблизился к топовой на тот момент рассуждающей o1 от OpenAI, вот с февраля началась наиболее безумная ИИ гонка всех времен и народов, когда релизы новых LLM шли с периодичностью в 1-2 недели!
Несколько дней назад (28 мая) было произведено долгожданное обновление DeepSeek R1 без смены названия, но по тестам модель приблизилась к o3 и Gemini 2.5 Pro.
Китай начал позже, но в условиях дефицита ресурсов компенсировал технологический гэп и предлагает конкурентные решения.
Китай располагает целым зоопарком относительно конкурентных LLM (китайские модели подчеркнуты):
• o4-mini (high) и o3, OpenAI– 70 (интегральный уровень производительности по оценкам artificialanalysis.ai)
• DeepSeek R1 (May 2025), DeepSeek – 68
• Gemini 2.5 Pro , Google – 68
• Grok 3 Mini Reasoning (high), xAI – 67
• Claude Opus 4 Thinking, Anthropic – 65
• Qwen3 235B A22B (Reasoning), Alibaba– 62
• SeedThinkingv1.5, ByteDance – 62
• ERNIE X1, Baidu – 60
• Hunyuan T1, Tencent – 60
• Kimi K1.5 Preview , MoonShot – 58
• glm-z1- 32b, Zhipu – 56
• step-r1- v-mini, StepFun – 55
• MiMo-7B, Xiaomi – 54
• Baichuan M1 (Preview), Baichuan — 52
• Llama 4 Maverick, Meta – 51
• Mistral Medium 3 – 49
• Nova Premier, Amazon — 43
• MiniMax -Text-01, MiniMax – 40
• Phi 4, Microsoft — 40
• YiLightning, 01 AI – 37
Для понимания скорости и масштаба прогресса. Распиаренный ChatGPT 4o, который был индустриальным стандартом в начале 2025 имел производительность около 40. Сейчас даже самая слабая китайская модель имеет производительность, как флагманский ChatGPT 4o в начале 2025 (до мартовского обновления), лучшая LLM от Google до декабря 2024 имела производительность всего 34 балла.
Сейчас в Китае 5 очень мощных игроков на рынке ИИ: Alibaba, ByteDance, Baidu, Huawei и Tencent и 5 передовых стартапов: DeepSeek, Zhipu, Stepfun, MiniMax и MoonShot AI.
В таблице представлена наглядная навигация по типам LLM от китайских разработчиков, в том числе для генерации изображений, видео и аудио.
Невероятный прогресс. Второе полугодие 2025 обещает быть интересным.