炒股看研报!谷歌与微软推理流量对比,AI规模优势尽显?

AI世纪 2025-06-19
大模型 2025-06-19

炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

今天巴克莱一篇对比谷歌和微软在推理流量上token消耗的对比,非常有意思,甚至有些出乎投资者意料外的内容。“免费”带来需求暴增,而且推理成本比预期的低不少。

1.AI推理规模的绝对领先

在1Q25共推理≈634万亿(634T),而约100T;到2025年4月,月度推理量已升至480T,较一年前的9.7T激增50倍,显示在AI推理流量上具备6倍于Azure/的规模优势。

2.增长驱动力——免费AI产品而非付费订阅

推理量暴涨主要来自的等免费场景;用户基数约为的5–6倍,免费增速(50×)远超付费大模型收入增速(3–4×),凸显先以用户与数据壁垒为先、后续再寻求变现。

3.成本冲击被高估:推理花费仅占搜索收入≈1%

按.5费率估算,1Q25推理成本约7.5亿美元,仅占搜索收入的≈1%(占COGS+Opex1.6%);即便token按4倍速度继续攀升,也仍低于搜索核心基础设施成本(≈18%收入),缓解市场对利润率下滑的担忧。

4.资本开支结构:训练为主,推理仅用≈10%

计算CAPEX中约90%仍投向训练与新模型,推理对应的芯片CAPEX在1Q25仅6.2%(≈6亿美元)。若按480T月度run-rate估算,2Q25推理CAPEX也仅升至≈14%,显示资金仍主要押注长期模型演进。

5.硬件效率:≈27万颗TPUv6即可支撑现有推理

采用50/50Pro与Flash模型、15%假设,仅用≈(ASP≈4,500美元)即可覆盖1Q25推理负荷,体现自研加速器在功耗与成本端的优势。

6.未来催化:Astra、、Veo等代理式应用

尚未全面放量的通用AI助手()、浏览器代理()和视频生成模型(Veo)预计将进一步推高token基数,已提前把 CAPEX提升到总CAPEX的>50%,为2026年后AI需求埋下增量弹性。

GPT