GPT-4.5性能不及预期，OpenAI面临领先地位不保的危机

AI世纪 2025-03-05

2025-03-05

GPT-4.5被认为是“华而不实”，其性能不值如此高的价格。如果不能尽快推出一个性能显著提升的模型，关于其领先地位正在削弱的质疑声将会越来越大。

凭借GPT系列模型引领AI浪潮的，近日推出的GPT-4.5却遭遇滑铁卢。

这款被寄予厚望的新模型不仅性能不及预期，价格更是高得惊人。业界普遍认为，正面临前所未有的压力，如果不能尽快推出具有突破性的GPT-5，其领先地位恐将不保。

高价低能，自降预期

AI大模型竞赛愈发白热化，上周推出了GPT-4.5（Orion）大模型。

然而，与以往不同的是，此次刻意降低了市场对这款新模型的期望。 CEO Sam 在社交平台X上表示，GPT-4.5是一个“巨大、昂贵的模型”，并且“不会在基准测试中取得压倒性优势”。

自身的评估也显示，GPT-4.5在多项指标上不仅落后于最新发布的 3.7 ，甚至不如自家数月前推出的推理模型。

更令人咋舌的是，GPT-4.5的定价高达每百万输入 75美元，每百万输出 150美元，是GPT-4o的30倍， 3.7 的10倍以上。

尽管GPT-4.5在对话的真实性和幽默感方面有所提升，可能更适用于语音交互，但其整体性能显然未能达到最初的预期。The 指出，这可能是预训练收益递减的证据。

开发者们对GPT-4.5的反响普遍冷淡。AI领域的知名评论家Gary 直言GPT-4.5是“”（毫无价值的东西）。Ars 援引一位匿名专家的话称，GPT-4.5“华而不实”，其性能不值如此高的价格。

即使在引以为傲的“情感智能”方面，GPT-4.5也未能赢得广泛认可。许多用户在社交平台上调侃，GPT-4.5 虽然情商高，但在工作上却不那么擅长，他们需要的是一个聪明的模型，而不是一个能理解他们感受的模型。

更令人担忧的是，GPT-4.5仍然存在幻觉和错误。据MIT 报道，自己也承认，GPT-4.5在一个关键测试中仍然有37%的概率会“编造事实”。

先发优势消退

如果不能尽快推出一个性能显著提升的模型，关于其领先地位正在削弱的质疑声将会越来越大。

此前，美国著名TMT投资人Gavin Baker在一篇推文中表示，AI产业格局的变革正在加速，的先发优势消退，微软也选择后撤一步。

Gavin在推文中指出：

当在2022年11月横空出世时，通过激进押注 Law，在生成式AI领域建立了长达7个季度的统治地位。但这一优势窗口正在关闭：的、xAI的Grok-3，以及的最新模型，均已达到与GPT-4相近的技术水平。

就连创始人也指出，未来的领先优势将更加狭窄；微软CEO纳德拉基本上表示，他们在模型能力方面领先的独特时期即将结束。

面对GPT-4.5的困境，业界将目光投向了的下一代模型GPT-5，以及其o3推理模型。然而，在发布新技术方面一向有“预告”的习惯，实际发布时间往往滞后。

距离宣布o3的性能评估已经过去了两个多月，但Sam 最近表示，o3不会像o1那样作为一个独立的模型发布。

尽管Gavin仍看好，但他预计，未来数据成为竞争核心，无法获得独特、有价值数据的前沿模型是历史上贬值最快的资产。

在AI大模型竞争日益激烈的当下，单纯依靠预训练已经难以建立长期优势。能否凭借GPT-5重回巅峰，将取决于其在数据获取、推理能力以及技术创新方面的突破。

OpenAI