往日回顾:OpenAI 凌晨 1 点正式发布最强模型 o1 开启新时代

AI世纪 2025-05-08
大模型 2025-05-08

大家好,我是小乐。

今天凌晨1点,终于正式发布了传说中的“草莓”模型——o1。大语言模型还能向上突破, 再次证明了自己的实力。

北京时间 9 月 13 日午夜, 正式公开一系列全新 AI 大模型,旨在专门解决难题。这是一个重大突破,新模型可以实现复杂推理,一个通用模型解决比此前的科学、代码和数学模型能做到的更难的问题, 发布最强模型 o1 !打破 AI 瓶颈开启新时代。

这次发布包括两个版本:

o1-,这是一个深度思考优化模型,

o1-mini,主要面向开发者的更具成本效益的模型。

除了名字不一样,功能、推理、性能等方面与之前泄漏的内容基本一致,o1的推理模式很特殊,在回答用户问题之前会进入拟人化思考模式,将问题分解成更小的步骤逐一解决,生成一个较长的内部思维链,回答的内容也更加准确。

o1主要技术特点介绍

拟人化的推理模式是o1的主打功能之一,与传统模型不同,它在回答问题之前会进行深入的思考,生成一个较长的内部思维链。这种思维链的产生使得 o1 能够更好地理解问题的本质,分析问题的各个方面,从而给出更准确和合理的答案。

使用学习到的评分函数重新排序 1000 个样本时,解决率更是高达 93%。这样的成绩使 o1 在该考试中的得分能够跻身美国前 500 名学生的行列,超过了美国数学奥林匹克的入选分数线。

在 PhD - Level (GPQA )的测试中,o1 也展现出了优异的性能,超过了人类专家的表现。为了进行这项测试,研究人员招募了具有博士学位的专家来回答 GPQA - 问题,结果发现 o1 的表现更为准确。

评估

为了突出相对于 GPT-4o 的推理性能改进, 在一系列不同的人类考试和机器学习基准测试中测试了 o1 模型。实验结果表明,在绝大多数推理任务中,o1 的表现明显优于 GPT-4o。

o1 在具有挑战性的推理基准上比 GPT-4o 有了很大的改进。

o1 在广泛的基准测试上比 GPT-4o 有所改进,包括 54/57 MMLU 子类别,图示出了 7 个以供说明。

在速度层面, 比较了 GPT-4o、o1-mini 和 o1- 对一个单词推理问题的回答。结果显示,GPT-4o 回答不正确,而 o1-mini 和 o1- 均回答正确,并且 o1-mini 得出答案的速度快了大约 3-5 倍。

o1系列分包含三款模型, o1、 o1-和 o1-mini。这两款模型从今天开始对用户开放使用:

o1:高级推理模型,暂不对外开放。

o1-:这个版本更注重深度推理处理,每周可以使用30次。

o1-mini:这个版本更高效、划算,适用于编码任务,每周可以使用50次。

如何使用 o1?

Plus 和 Team(个人付费版与团队版)用户马上就可以在该公司的聊天机器人产品 中开始使用 o1 模型了。你可以手动选取使用 o1- 或 o1-mini。不过,用户的使用量有限。

目前,每位用户每周仅能给 o1- 发送 30 条消息,给 o1-mini 发送 50 条消息。

是的,很少!不过 表示正在努力提升用户的可使用次数,并让 能自动针对给定提示词选择使用合适的模型。

附:国内使用地址

️国内直连(非套壳)

️已支持-4 | GPT-4o | o1-|o1-mini

️官方限制次数,我们系统集成了200多个官方Plus号支持自由切换账号,

️我们系统优势:支持自由切换账号、不限次数使用

目前的功能:支持GPTs、语音实时聊天功能、联网功能、上传文件、数据分析、AI画图、上传图片自动识别功能等 。这些功能都是3.5不能具备的 !有GPT-4o模型,就连刚上线的“草莓”模型——o1。也支持!

客户好评

客户购买后的好评:稳定,便宜,好用,续费,正版官方号,4.0不限次数,有售后 。

购买这个账号有售后,可以承诺大家如果是套壳不是官方号,可以全额退款,另外系统稳定,不用担心中途封号或者用不了,老客户续费率基本可以达到99%以上

购买这个账号,一直有售后,不用担心中途封号或者用不了