Anthropic发布Claude 3.7 Sonnet混合推理模型,同时洽谈35亿美元融资
2月25日,的最强劲敌、美国AI大模型初创公司发布了首个混合推理模型 3.7 。与其他模型相比, 3.7 最特别之处在于集合了大语言模型和推理模型于一身,用户可以选择让模型实时快速作答,也可以选择让其进行更深入的思考。
在发布新模型的同时,据华尔街日报日前报道,正在洽谈一轮35亿美元的融资,这一规模远远超出最初计划融资20亿美元的预期。据了解,投资者对表达了高涨的兴趣,在谈判过程中提高了融资规模。若新一轮融资完成,最新的估值将达到615亿美元,是此前180亿美元估值的近4倍。
发布市场上唯一的“混合”模型
认为,就像人类不会有两个不同的大脑来分别处理可以立即回答的问题和需要思考的问题一样,推理只是前沿模型应具备的能力之一,应与其他能力顺畅融合,而不是一个完全独立的模型。
因此, 3.7 将最先进的大型语言模型的功能与推理模型的功能相结合。虽然大语言模型通常生成文本并理解语言模式,但推理模型是一种特定类型的大语言模型,可以将复杂问题分解为几个步骤,显示其得出解决方案的“思路链”。 3.7 兼具“推理模式”与“传统模式”,既可以思考复杂问题,也可以实时生成答案。
值得注意的是,这是市场上唯一的“混合”模型,也被称为迄今为止“最智能”的人工智能模型。具体而言, 3.7 将提供两种思考模式——“标准”和“扩展”。用户可以选择希望采用哪种思考模式。“标准思考”是无需进行复杂的推理过程,就能立刻提供答案;“扩展思维”则需提供复杂的推理过程,会展示详细的推理思维链。
在标准模式下, 3.7 是 3.5 的升级版。在扩展思考模式下,它会在回答前进行自我反思,从而提高了它在数学、物理、指令执行、编码以及许多其他任务上的表现。
除此以外, 3.7 具有卓越的编码能力。测试数据显示, 3.7 在编写代码能力方面大幅度超过了-R1、的o1、o3模型等。还推出了代理编码工具 Code,可以搜索和读取代码、编辑文件、编写和运行测试、提交和推送代码到以及使用命令行工具。
新一轮融资规模远超预期
在让开源逐渐深入人心的同时,以、等为代表的闭源模型社区也不甘落后。值得注意的是,在对于走闭源路线已不那么笃定的背景下,正逐渐变成闭源社区中的“扛大旗者”。
在今年春节引发海外广泛关注期间,的联合创始人Dario 还发表了一篇长文,系统阐述对于的看法。他表示,的训练成本远没有人们说的那么低,“600万美元模型”的说法忽略了许多关键背景。更准确的说法应该是以更低的成本生成出一个接近7—10个月前美国模型水平的产品。言外之意是,闭源模型仍然处于领先的位置。
他还同时表示,大模型还处在扩展曲线的早期阶段,只要有一个强大的预训练模型作为基础,几家公司都能开发出这类模型。“我们正处在一个有趣的‘交叉点’,暂时出现了多家公司都能生产出优秀推理模型的情况。但随着各公司在这些模型上继续向上攀升扩展曲线,这种情况很快就会消失。”Dario 表示。
事实上,当横空出世后,外界普遍认为这将对构成直接的冲击,因为如果闭源模型不能够证明自己大幅领先于开源模型,那么支撑其继续走闭源路线的基础便不复存在。今日发布新模型,无疑也是在“秀肌肉”,向外界展现其在技术方面的领先性。
在新模型推出之际,据外媒报道,即将完成一轮35亿美元融资,估值达615亿美元,是此前180亿美元估值的近4倍。本轮融资的投资者包括风险投资公司 、 和 。此外,总部位于阿布扎比的MGX投资公司也在与商谈参与投资事宜。
35亿美元的融资规模,已大幅超越其最初的20亿美元融资计划。这从侧面表明尽管的崛起带来了冲击,但投资者仍对这样的闭源模型公司抱有信心。
校对:王朝全