炒股看研报！谷歌与微软推理流量对比，AI规模优势尽显？

AI世纪 2025-06-19

2025-06-19

炒股就看金麒麟分析师研报，权威，专业，及时，全面，助您挖掘潜力主题机会！

今天巴克莱一篇对比谷歌和微软在推理流量上token消耗的对比，非常有意思，甚至有些出乎投资者意料外的内容。“免费”带来需求暴增，而且推理成本比预期的低不少。

1.AI推理规模的绝对领先

在1Q25共推理≈634万亿（634T），而约100T；到2025年4月，月度推理量已升至480T，较一年前的9.7T激增50倍，显示在AI推理流量上具备6倍于Azure/的规模优势。

2.增长驱动力——免费AI产品而非付费订阅

推理量暴涨主要来自的等免费场景；用户基数约为的5–6倍，免费增速（50×）远超付费大模型收入增速（3–4×），凸显先以用户与数据壁垒为先、后续再寻求变现。

3.成本冲击被高估：推理花费仅占搜索收入≈1%

按.5费率估算，1Q25推理成本约7.5亿美元，仅占搜索收入的≈1%（占COGS+Opex1.6%）；即便token按4倍速度继续攀升，也仍低于搜索核心基础设施成本（≈18%收入），缓解市场对利润率下滑的担忧。

4.资本开支结构：训练为主，推理仅用≈10%

计算CAPEX中约90%仍投向训练与新模型，推理对应的芯片CAPEX在1Q25仅6.2%（≈6亿美元）。若按480T月度run-rate估算，2Q25推理CAPEX也仅升至≈14%，显示资金仍主要押注长期模型演进。

5.硬件效率：≈27万颗TPUv6即可支撑现有推理

采用50/50Pro与Flash模型、15%假设，仅用≈（ASP≈4,500美元）即可覆盖1Q25推理负荷，体现自研加速器在功耗与成本端的优势。

6.未来催化：Astra、、Veo等代理式应用

尚未全面放量的通用AI助手（）、浏览器代理（）和视频生成模型（Veo）预计将进一步推高token基数，已提前把 CAPEX提升到总CAPEX的>50%，为2026年后AI需求埋下增量弹性。

GPT