Chronoscope · 时间之河
2026-05-15 生成

中国大模型发展时间线

从 Transformer 论文发表到 DeepSeek R1 震撼全球,梳理中国大模型产业从追赶到并跑的十年跃迁——涵盖百度文心、阿里通义、华为盘古、智谱 GLM、月之暗面 Kimi、字节豆包、百川、零一万物、MiniMax、DeepSeek 等核心玩家的关键节点与演进脉络。

尺度
contemporary
时间
2017 – 2026
章节
5
事件
42
人物
12
中国AI大语言模型百模大战开源
AI 自评 · 6 维度总分 25/30
尺度5/5
事件密度4/5
时效性5/5
信源质量4/5
纪要质感4/5
平衡性3/5
最弱维度:平衡性 — 建议补充更多二线玩家(阶跃星辰、面壁智能等)细节
全部★ 关键模型发布政策/合规融资/资本
第一章 · 奠基时代 2017 – 2019
2017.06
Transformer 架构诞生:"Attention Is All You Need" 发表
Google Brain 团队在 NeurIPS 发表划时代论文,提出完全基于自注意力机制的 Transformer 架构,抛弃了传统 RNN/LSTM,成为所有大语言模型的基础。
重要度 5T1 · 学术论文
2018.10
Google 发布 BERT
BERT 在 11 项 NLP 任务上刷新纪录,双向编码器架构深刻影响了后续预训练模型的设计范式。
重要度 4T1 · 学术论文
2019.03
百度发布 ERNIE 1.0
百度推出知识增强语义理解模型 ERNIE 1.0,创新性地将知识图谱融入预训练,在中文 NLP 任务上表现优异,标志着中国大模型自主研发的起步。(信源:Wikipedia Ernie Bot)
T2 · Wikipedia
2019.07
百度发布 ERNIE 2.0
引入持续学习框架,支持多任务序列增量训练,在 GLUE 基准上超越 BERT,展示了中国团队在预训练模型方向的技术积累。(信源:Wikipedia Ernie Bot)
T2 · Wikipedia
2019 年
智谱AI 成立(清华系)- 后品牌升级为 Z.ai
源自清华大学知识工程实验室,由唐杰教授和李涓子教授联合创办,专注大语言模型研发。2025 年品牌升级为 Z.ai 并在港交所上市(股票代码 2513)。(信源:Wikipedia Z.ai)
T2 · Wikipedia
第二章 · 大模型黎明 2020 – 2022
2020.06
OpenAI 发布 GPT-3
1750 亿参数的 GPT-3 展示了惊人的 few-shot 学习能力,确立了"规模定律"(Scaling Law),引发全球大模型军备竞赛。
重要度 4T1 · 学术论文
2021.04
华为发布盘古大模型
华为云发布盘古系列大模型,涵盖 NLP、CV、多模态、科学计算等方向,是中国首个千亿参数级别的产业级大模型体系。
重要度 4T3 · 公开报道
2021.06
中国《数据安全法》颁布
中国首部数据安全领域基础法律,为 AI 训练数据的采集和使用划定了合规边界。(信源:Wikipedia AI industry in China)
T2 · Wikipedia
2021.07
百度发布 ERNIE 3.0(百亿参数)
融合自回归与自编码,在 54 个中文 NLP 任务上取得 SOTA,支撑后续文心一言的技术底座。(信源:Wikipedia Ernie Bot)
T2 · Wikipedia
2021.12
MiniMax(稀宇科技)成立
前商汤科技研究员闫俊杰等人创立 MiniMax,获米哈游等投资。2026 年 1 月成功在港交所上市。(信源:Wikipedia MiniMax)
T2 · Wikipedia
2022.05
智谱AI 发表 GLM 训练算法(ACL 会议)
在 ACL 会议上发表 GLM 训练算法,提出"自回归填空"策略,为后续 ChatGLM 系列奠定理论基石。(信源:Wikipedia Z.ai)
重要度 4T1 · ACL 会议论文
2022.10
美国对华先进芯片出口管制
美国商务部宣布对华出口管制新规,限制 A100/H100 等先进 AI 芯片出口,深刻改变了中国大模型产业的算力格局。(信源:Wikipedia AI industry in China)
重要度 4T2 · Wikipedia
2022.11.30
ChatGPT 发布,引爆全球 AI 热潮
OpenAI 发布 ChatGPT,仅两个月用户突破 1 亿,成为史上增长最快的消费应用。直接触发了中国"百模大战"的序幕。
重要度 5T1 · 公开事实
第三章 · 百模大战 2023
2023.03.16
百度文心一言(ERNIE Bot)发布
百度正式发布文心一言,成为国内首个对标 ChatGPT 的国产大模型聊天产品。先以邀测形式开放,8 月 31 日获监管批准后全面开放。2024 年 4 月用户超 2 亿。(信源:Wikipedia Ernie Bot)
重要度 5T2 · Wikipedia
2023.03
李开复创立零一万物(01.AI)
前微软/谷歌高管、创新工场创始人李开复创立零一万物。2023 年 11 月即获独角兽估值,推出 Yi 系列开源模型。(信源:Wikipedia 01.AI)
T2 · Wikipedia
2023.03
月之暗面(Moonshot AI)成立
清华系创业者杨植麟、周昕宇、吴育昕创立月之暗面。10 月即推出支持 20 万汉字超长上下文的 Kimi 聊天机器人。(信源:Wikipedia Moonshot AI)
重要度 4T2 · Wikipedia
2023.04
阿里通义千问(Qwen)Beta 发布
阿里云发布通义千问大模型,基于 Llama 架构改进。2023 年 9 月获监管批准公开发布。后续开源多个版本,成为全球最具影响力的中国开源 LLM 系列之一。(信源:Wikipedia Qwen)
重要度 4T2 · Wikipedia
2023.04.10
百川智能成立(王小川)
前搜狗 CEO 王小川创立百川智能,获 5000 万美元种子轮。6 月即开源 Baichuan1,11 月发布支持 35 万汉字上下文的 Baichuan2。(信源:Wikipedia Baichuan)
重要度 4T2 · Wikipedia
2023.07
《生成式人工智能服务管理暂行办法》发布
国家网信办等七部门联合发布中国首个生成式 AI 专项管理办法,8 月 15 日施行。要求大模型上线前必须通过安全评估和算法备案,形成「备案制」监管框架。
重要度 4T3 · 公开政策
2023.07.17
深度求索(DeepSeek)成立
由幻方量化创始人梁文锋创立于杭州。团队仅约 160 人,却在两年内以极低成本做出世界级模型,彻底改写了中国大模型叙事。(信源:Wikipedia DeepSeek)
重要度 5T2 · Wikipedia
2023.08
字节跳动豆包(Doubao)发布
字节跳动推出 AI 助手豆包。2024 年 11 月月活近 6000 万,成为中国最受欢迎的 AI 聊天机器人,日消耗 tokens 超 120 万亿。(信源:Wikipedia Doubao)
重要度 4T2 · Wikipedia
2023.09
腾讯发布混元大模型
腾讯正式发布混元大模型,通过腾讯云对外开放,接入微信、腾讯广告等核心业务场景。
T3 · 公开报道
2023.10
百川智能完成 3 亿美元融资
腾讯、阿里、小米、顺为资本等参投,成立仅 6 个月的百川智能估值迅速攀升。(信源:Wikipedia Baichuan)
T2 · Wikipedia
2023.11
零一万物估值超 10 亿美元 + 百川 Baichuan2 发布
01.AI 成立仅 8 个月跻身独角兽。百川智能发布 Baichuan2,上下文窗口可处理约 35 万汉字。(信源:Wikipedia 01.AI / Baichuan)
T2 · Wikipedia
2023.12
DeepSeek 发布 DeepSeek-LLM(67B)开源
深度求索发布首个开源通用大语言模型 DeepSeek-LLM(67B),同年发布 DeepSeek-Coder 代码大模型。(信源:deepseek.com)
T3 · 官网信息
第四章 · 开源与突围 2024
2024.03
MiniMax 完成阿里领投 6 亿美元融资
估值达 25 亿美元。投资方包括阿里、高瓴、红杉、IDG、腾讯等。MiniMax 的多模态产品矩阵日趋成熟。(信源:Wikipedia MiniMax)
T2 · Wikipedia
2024.05
DeepSeek 发布 DeepSeek-V2(MoE 架构),引发价格战
采用 MoE 架构,推理效率大幅提升。DeepSeek 以超低 API 价格引发中国大模型价格战,确立了"低成本高性能"的技术路线。(信源:Wikipedia DeepSeek)
重要度 4T2 · Wikipedia
2024.07
百川智能完成 6.91 亿美元融资
阿里参与投资,估值达 28 亿美元。百川从通用大模型赛道中脱颖而出,成为"AI 六小虎"之一。(信源:Wikipedia Baichuan)
T2 · Wikipedia
2024.11
豆包月活近 6000 万,中国第一
字节跳动旗下豆包成为中国最受欢迎 AI 聊天机器人,月活仅次于 ChatGPT 位居全球第二。火山引擎日处理 tokens 超 120 万亿。(信源:Wikipedia Doubao / China Daily)
重要度 4T2 · Wikipedia
2024.12
DeepSeek-V3 发布,训练成本仅 $6M
671B 总参数(37B 激活),训练成本仅约 600 万美元——约为 GPT-4 的 1/100,计算资源约为 Meta Llama 3.1 的 1/10。开源模型榜首,性能比肩最先进闭源模型。彻底打破"大模型=大投入"的固有认知。(信源:Wikipedia DeepSeek)
重要度 5T2 · Wikipedia
第五章 · 全球冲击 2025 – 2026
2025.01
DeepSeek-R1 发布,震撼全球 AI 产业
DeepSeek 发布推理模型 R1,性能比肩 OpenAI o1,开源并以 MIT 协议发布。被《纽约时报》称为"颠覆 AI 格局"(upending AI)。中国大模型首次在全球最前沿与硅谷正面竞争。(信源:Wikipedia DeepSeek)
重要度 5T2 · Wikipedia
2025.01
美国将智谱AI列入实体清单
美国商务部以国家安全为由将智谱AI列入实体清单,限制其获取美国技术和产品。(信源:Wikipedia Z.ai)
T2 · Wikipedia
2025.03
百川智能转型聚焦医疗 AI
"AI 六小虎"中首个明确垂直化转型的玩家,宣布团队重组,战略转向 AI+医疗方向。(信源:Wikipedia Baichuan)
T2 · Wikipedia
2025.07
智谱AI 品牌升级 Z.ai,全面开源 GLM(MIT License)
智谱AI 品牌升级为 Z.ai,将 GLM 系列以 MIT License 全面开源。后在港交所上市(股票代码 2513)。(信源:Wikipedia Z.ai)
T2 · Wikipedia
2026.01
月之暗面发布 Kimi K2.5(多模态)
新增原生视觉能力,搭载 4 亿参数视觉编码器 MoonViT,支持图像和视频理解,可实现看视频演示即可复制网站用户旅程的 agentic 任务。(信源:Wikipedia Moonshot AI)
重要度 4T2 · Wikipedia
2026.01.09
MiniMax 在港交所上市
MiniMax 成功在港交所 IPO,成为中国大模型"六小虎"中首家上市公司,为行业资本化路径提供了标杆。(信源:Wikipedia MiniMax)
T2 · Wikipedia
2026.02
Anthropic 指控月之暗面违规使用 Claude 训练
Anthropic 指控月之暗面使用数千个欺诈账户生成数百万条 Claude 对话用于训练自家模型,引发 AI 训练数据伦理讨论。(信源:Wikipedia Moonshot AI)
T2 · Wikipedia
2026.04.18
阿里发布 Qwen3.6-Max
通义千问系列最新旗舰模型。Qwen 系列已成为 GitHub 上最受欢迎的中国开源大模型。(信源:Wikipedia Qwen)
T2 · Wikipedia
2026.04.29
百度发布 ERNIE 5.1(Apache 开源)
百度发布最新 ERNIE 5.1,首次以 Apache License 开源,标志着百度大模型从闭源转向开放的策略转变。(信源:Wikipedia Ernie Bot)
T2 · Wikipedia

A4 打印优化 · Cmd+P 直接出 PDF · 共 42 事件

时间事件类别信源
2017.06Transformer 论文发表模型T1
2018.10Google 发布 BERT模型T1
2019.03百度 ERNIE 1.0模型T2
2019.07百度 ERNIE 2.0模型T2
2019智谱AI(Z.ai)成立公司T2
2020.06OpenAI GPT-3(1750 亿参数)模型T1
2021.04华为盘古大模型发布模型T3
2021.06中国《数据安全法》政策T2
2021.07百度 ERNIE 3.0模型T2
2021.12MiniMax 成立公司T2
2022.05智谱 GLM 算法论文(ACL)模型T1
2022.10美国对华芯片出口管制政策T2
2022.11.30ChatGPT 发布模型T1
2023.03零一万物 + 月之暗面成立公司T2
2023.03.16百度文心一言邀测模型T2
2023.04阿里通义千问 Beta模型T2
2023.04.10百川智能成立(王小川)公司T2
2023.07生成式 AI 管理办法政策T3
2023.07.17DeepSeek 成立公司T2
2023.08字节豆包发布模型T2
2023.09腾讯混元大模型模型T3
2023.10Kimi 发布 + 百川 3 亿美元融资模型/融资T2
2023.11零一万物独角兽 + Baichuan2模型/融资T2
2023.12DeepSeek-LLM 67B 开源模型T3
2024.03MiniMax 阿里领投 $6 亿融资T2
2024.05DeepSeek-V2(MoE)价格战模型T2
2024.07百川 $6.91 亿融资融资T2
2024.11豆包月活 6000 万产品T2
2024.12DeepSeek-V3 ($6M 训练)模型T2
2025.01DeepSeek-R1 震撼全球模型T2
2025.01智谱AI入实体清单政策T2
2025.03百川转型医疗 AI战略T2
2025.07智谱 Z.ai 全面开源 GLM战略T2
2026.01Kimi K2.5 多模态模型T2
2026.01.09MiniMax 港交所上市资本T2
2026.02Anthropic vs Moonshot事件T2
2026.04.18阿里 Qwen3.6-Max模型T2
2026.04.29百度 ERNIE 5.1 开源模型T2

整体纪要

中国大模型产业在不到十年间走过了从全面跟随到局部并跑的跃迁之路。2017 年 Transformer 架构问世后,百度最早于 2019 年以 ERNIE 系列切入预训练赛道;2022 年底 ChatGPT 的爆发成为转折点,直接催生了 2023 年中国"百模大战"——百度、阿里、腾讯、字节等大厂与智谱、月之暗面、百川、零一万物、MiniMax、DeepSeek 等创业新锐几乎同步入场。2023 年 7 月《生成式 AI 管理办法》为行业设立了合规框架。2024 年 DeepSeek 以极致性价比路线崛起,V2 引发 API 价格战,V3 以 600 万美元训练成本震惊业界。2025 年 DeepSeek-R1 的发布标志着中国大模型首次在全球最前沿与 OpenAI 正面较量。截至 2026 年 5 月,中国大模型生态呈现"大厂 + 创业六小虎 + 开源社区"的多层次格局。

6 条关键洞察

01 芯片管制成为最大变量 — 2022 年 10 月美国出口管制切断中国获取 A100/H100 等先进算力,但反而刺激了中国在模型效率(MoE、量化、蒸馏)上的加速投入。DeepSeek 以 1/100 的成本实现接近 GPT-4 的性能,正是这一约束下的"反向创新"。
02 开源成为中国大模型的核心竞争力 — 从智谱 GLM、阿里 Qwen 到 DeepSeek R1,MIT/Apache 协议下的高质量开源模型让中国在全球开发者生态中获得了话语权。
03 "备案制"监管塑造了独特的市场格局 — 2023 年 8 月施行的生成式 AI 管理办法要求大模型上线前必须通过安全评估和算法备案,为合规企业创造了护城河。
04 应用层爆发远快于预期 — 字节豆包仅用一年即达到月活 6000 万,超过 ChatGPT 之外所有海外竞品,证明中国在 AI 应用分发上的生态优势依然强大。
05 人才密度正在从大厂向创业公司转移 — 王小川、杨植麟、梁文锋、李开复的连续创业轨迹,显示中国最顶尖 AI 人才正在脱离大厂体系独立发展。
06 "AI 六小虎"正在分化 — 智谱(Z.ai)和 MiniMax 已上市,百川转型医疗,01.AI 聚焦小模型,Moonshot 走多模态 AGI 路线,DeepSeek 极致性价比成为独特一极。

仍在演化中

梁文锋

DeepSeek 创始人 & CEO · 幻方量化联合创始人
以量化投资背景跨界 AI,2023 年 7 月创立 DeepSeek。以"小团队 + 极致效率"路线在两年内做出比肩 OpenAI 的模型。R1 发布被《纽约时报》称为"颠覆 AI 格局"。团队仅约 160 人。

杨植麟

月之暗面(Moonshot AI)创始人 & CEO
清华特奖、卡内基梅隆博士,师从苹果 AI 总监 Ruslan Salakhutdinov。2023 年 3 月创立月之暗面,10 月推出 Kimi,以超长上下文差异化突围。K2.5 实现多模态 agentic 能力。

王小川

百川智能创始人 & CEO · 前搜狗 CEO
搜狗创始人,2023 年 4 月创立百川智能。6 月即开源 Baichuan1,速度惊人。2025 年战略转向 AI+医疗,是大模型创业公司中首个明确垂直化的玩家。

李开复

零一万物(01.AI)创始人 & CEO
前微软/谷歌全球副总裁、创新工场创始人。2023 年 3 月创立零一万物,8 个月即获独角兽估值。坚持开源路线,Yi 系列在多项基准表现优异。

唐杰

智谱AI(Z.ai)联合创始人 · 清华大学教授
清华大学知识工程实验室负责人,2019 年联合创立智谱AI。主导 GLM 训练算法的学术研究,2022 年在 ACL 发表奠定 ChatGLM 系列理论基石。

闫俊杰

MiniMax 创始人 & CEO · 前商汤科技研究员
2021 年 12 月联合创立 MiniMax,专注多模态 AI 模型。获得米哈游、阿里、腾讯等投资,2026 年 1 月在港交所上市,成为"AI 六小虎"中首家 IPO 公司。

张一鸣

字节跳动创始人
字节旗下豆包 2023 年 8 月发布后迅速成为中国最受欢迎 AI 聊天机器人,月活近 6000 万。火山引擎日处理 tokens 超 120 万亿,展示了字节在 AI 应用分发上的巨大优势。

李彦宏

百度创始人 & CEO
百度从 2019 年起投入 ERNIE 系列研发。2023 年 3 月率先发布文心一言,打响中国大模型产品第一枪。2026 年 ERNIE 5.1 以 Apache 协议开源,标志百度 AI 策略转向开放。

张鹏

智谱AI(Z.ai)CEO
带领智谱从清华实验室走向港交所上市。2025 年主导品牌升级为 Z.ai 并全面开源 GLM 系列,推动中国大模型生态走向开放协作。

Ashish Vaswani

Google Brain · Transformer 论文第一作者
Vaswani 等 8 位作者在 2017 年发表 Transformer 论文,彻底改变了 NLP 和整个 AI 领域。该架构成为中国大模型产业一切技术演进的起点。

Sam Altman

OpenAI CEO
OpenAI 在 Altman 领导下于 2022 年 11 月发布 ChatGPT,成为全球 AI 竞赛的引爆点,也直接催生了中国"百模大战"。2025 年 DeepSeek-R1 对 OpenAI o1 的正面挑战成为中美 AI 竞争的标志性事件。

张潼

华为云 AI 首席科学家
前腾讯 AI Lab 主任,加入华为后主导盘古大模型研发。2021 年华为发布千亿参数盘古大模型,是中国首个产业级大模型体系,覆盖 NLP、CV、多模态等方向。

信源等级:T1 学术论文/一手数据 · T2 权威媒体/Wikipedia · T3 公开报道/百科 · T4 AI 推断

[1] Vaswani et al. "Attention Is All You Need." NeurIPS 2017. https://arxiv.org/abs/1706.03762 T1
[2] Devlin et al. "BERT: Pre-training of Deep Bidirectional Transformers." NAACL 2019. https://arxiv.org/abs/1810.04805 T1
[3] Brown et al. "Language Models are Few-Shot Learners." NeurIPS 2020. https://arxiv.org/abs/2005.14165 T1
[4] Wikipedia. "Ernie Bot." https://en.wikipedia.org/wiki/Ernie_Bot T2
[5] Wikipedia. "DeepSeek." https://en.wikipedia.org/wiki/DeepSeek T2
[6] Wikipedia. "Qwen." https://en.wikipedia.org/wiki/Qwen T2
[7] Wikipedia. "Z.ai" / "Zhipu AI." https://en.wikipedia.org/wiki/Z.ai T2
[8] Wikipedia. "Moonshot AI." https://en.wikipedia.org/wiki/Moonshot_AI T2
[9] Wikipedia. "Baichuan." https://en.wikipedia.org/wiki/Baichuan T2
[10] Wikipedia. "01.AI." https://en.wikipedia.org/wiki/01.AI T2
[11] Wikipedia. "MiniMax Group." https://en.wikipedia.org/wiki/MiniMax_Group T2
[12] Wikipedia. "Doubao." https://en.wikipedia.org/wiki/Doubao T2
[13] Wikipedia. "Artificial intelligence industry in China." https://en.wikipedia.org/wiki/Artificial_intelligence_industry_in_China T2
[14] Wikipedia. "Large language model." https://en.wikipedia.org/wiki/Large_language_model T2
[15] 深度求索官网. https://www.deepseek.com/ T3
[16] Du, Wujun. "Design and Implementation of an Enterprise-Level Chatbot System Based on Coze and Doubao." IoTAIMA 2025. IEEE. https://doi.org/10.1109/iotaima66468.2025.11212678 T1
[17] 于小明. "ByteDance Volcano Engine says Doubao uses 120 trillion tokens per day." China Daily, 2026-04-02. https://www.chinadaily.com.cn/a/202604/02/WS69ce3326a310d6866eb41733.html T2
本页面由 办一下|banyixia.com AI 生成