GPT-4.5性能不及预期,OpenAI面临领先地位不保的危机

AI世纪 2025-03-05
大模型 2025-03-05

GPT-4.5被认为是“华而不实”,其性能不值如此高的价格。如果不能尽快推出一个性能显著提升的模型,关于其领先地位正在削弱的质疑声将会越来越大。

凭借GPT系列模型引领AI浪潮的,近日推出的GPT-4.5却遭遇滑铁卢。

这款被寄予厚望的新模型不仅性能不及预期,价格更是高得惊人。业界普遍认为,正面临前所未有的压力,如果不能尽快推出具有突破性的GPT-5,其领先地位恐将不保。

高价低能,自降预期

AI大模型竞赛愈发白热化,上周推出了GPT-4.5(Orion)大模型。

然而,与以往不同的是,此次刻意降低了市场对这款新模型的期望。 CEO Sam 在社交平台X上表示,GPT-4.5是一个“巨大、昂贵的模型”,并且“不会在基准测试中取得压倒性优势”。

自身的评估也显示,GPT-4.5在多项指标上不仅落后于最新发布的 3.7 ,甚至不如自家数月前推出的推理模型。

更令人咋舌的是,GPT-4.5的定价高达每百万输入 75美元,每百万输出 150美元,是GPT-4o的30倍, 3.7 的10倍以上。

尽管GPT-4.5在对话的真实性和幽默感方面有所提升,可能更适用于语音交互,但其整体性能显然未能达到最初的预期。The 指出,这可能是预训练收益递减的证据。

开发者们对GPT-4.5的反响普遍冷淡。AI领域的知名评论家Gary 直言GPT-4.5是“”(毫无价值的东西)。Ars 援引一位匿名专家的话称,GPT-4.5“华而不实”,其性能不值如此高的价格。

即使在引以为傲的“情感智能”方面,GPT-4.5也未能赢得广泛认可。许多用户在社交平台上调侃,GPT-4.5 虽然情商高,但在工作上却不那么擅长,他们需要的是一个聪明的模型,而不是一个能理解他们感受的模型。

更令人担忧的是,GPT-4.5仍然存在幻觉和错误。据MIT 报道,自己也承认,GPT-4.5在一个关键测试中仍然有37%的概率会“编造事实”。

先发优势消退

如果不能尽快推出一个性能显著提升的模型,关于其领先地位正在削弱的质疑声将会越来越大。

此前,美国著名TMT投资人Gavin Baker在一篇推文中表示,AI产业格局的变革正在加速,的先发优势消退,微软也选择后撤一步。

Gavin在推文中指出:

当在2022年11月横空出世时,通过激进押注 Law,在生成式AI领域建立了长达7个季度的统治地位。但这一优势窗口正在关闭:的、xAI的Grok-3,以及的最新模型,均已达到与GPT-4相近的技术水平。

就连创始人也指出,未来的领先优势将更加狭窄;微软CEO纳德拉基本上表示,他们在模型能力方面领先的独特时期即将结束。

面对GPT-4.5的困境,业界将目光投向了的下一代模型GPT-5,以及其o3推理模型。然而,在发布新技术方面一向有“预告”的习惯,实际发布时间往往滞后。

距离宣布o3的性能评估已经过去了两个多月,但Sam 最近表示,o3不会像o1那样作为一个独立的模型发布。

尽管Gavin仍看好,但他预计,未来数据成为竞争核心,无法获得独特、有价值数据的前沿模型是历史上贬值最快的资产。

在AI大模型竞争日益激烈的当下,单纯依靠预训练已经难以建立长期优势。能否凭借GPT-5重回巅峰,将取决于其在数据获取、推理能力以及技术创新方面的突破。