往日回顾：OpenAI 凌晨 1 点正式发布最强模型 o1 开启新时代

AI世纪 2025-05-08

2025-05-08

大家好，我是小乐。

今天凌晨1点，终于正式发布了传说中的“草莓”模型——o1。大语言模型还能向上突破，再次证明了自己的实力。

北京时间 9 月 13 日午夜，正式公开一系列全新 AI 大模型，旨在专门解决难题。这是一个重大突破，新模型可以实现复杂推理，一个通用模型解决比此前的科学、代码和数学模型能做到的更难的问题，发布最强模型 o1 ！打破 AI 瓶颈开启新时代。

这次发布包括两个版本：

o1-，这是一个深度思考优化模型，

o1-mini，主要面向开发者的更具成本效益的模型。

除了名字不一样，功能、推理、性能等方面与之前泄漏的内容基本一致，o1的推理模式很特殊，在回答用户问题之前会进入拟人化思考模式，将问题分解成更小的步骤逐一解决，生成一个较长的内部思维链，回答的内容也更加准确。

o1主要技术特点介绍

拟人化的推理模式是o1的主打功能之一，与传统模型不同，它在回答问题之前会进行深入的思考，生成一个较长的内部思维链。这种思维链的产生使得 o1 能够更好地理解问题的本质，分析问题的各个方面，从而给出更准确和合理的答案。

使用学习到的评分函数重新排序 1000 个样本时，解决率更是高达 93%。这样的成绩使 o1 在该考试中的得分能够跻身美国前 500 名学生的行列，超过了美国数学奥林匹克的入选分数线。

在 PhD - Level （GPQA ）的测试中，o1 也展现出了优异的性能，超过了人类专家的表现。为了进行这项测试，研究人员招募了具有博士学位的专家来回答 GPQA - 问题，结果发现 o1 的表现更为准确。

评估

为了突出相对于 GPT-4o 的推理性能改进，在一系列不同的人类考试和机器学习基准测试中测试了 o1 模型。实验结果表明，在绝大多数推理任务中，o1 的表现明显优于 GPT-4o。

o1 在具有挑战性的推理基准上比 GPT-4o 有了很大的改进。

o1 在广泛的基准测试上比 GPT-4o 有所改进，包括 54/57 MMLU 子类别，图示出了 7 个以供说明。

在速度层面，比较了 GPT-4o、o1-mini 和 o1- 对一个单词推理问题的回答。结果显示，GPT-4o 回答不正确，而 o1-mini 和 o1- 均回答正确，并且 o1-mini 得出答案的速度快了大约 3-5 倍。

o1系列分包含三款模型， o1、 o1-和 o1-mini。这两款模型从今天开始对用户开放使用：

o1：高级推理模型，暂不对外开放。

o1-：这个版本更注重深度推理处理，每周可以使用30次。

o1-mini：这个版本更高效、划算，适用于编码任务，每周可以使用50次。

如何使用 o1？

Plus 和 Team（个人付费版与团队版）用户马上就可以在该公司的聊天机器人产品中开始使用 o1 模型了。你可以手动选取使用 o1- 或 o1-mini。不过，用户的使用量有限。

目前，每位用户每周仅能给 o1- 发送 30 条消息，给 o1-mini 发送 50 条消息。

是的，很少！不过表示正在努力提升用户的可使用次数，并让能自动针对给定提示词选择使用合适的模型。

附：国内使用地址

️国内直连（非套壳）

️已支持-4 | GPT-4o | o1-|o1-mini

️官方限制次数，我们系统集成了200多个官方Plus号支持自由切换账号，

️我们系统优势：支持自由切换账号、不限次数使用

目前的功能：支持GPTs、语音实时聊天功能、联网功能、上传文件、数据分析、AI画图、上传图片自动识别功能等。这些功能都是3.5不能具备的！有GPT-4o模型，就连刚上线的“草莓”模型——o1。也支持！

客户好评

客户购买后的好评：稳定，便宜，好用，续费，正版官方号，4.0不限次数，有售后。

购买这个账号有售后，可以承诺大家如果是套壳不是官方号，可以全额退款，另外系统稳定，不用担心中途封号或者用不了，老客户续费率基本可以达到99%以上

购买这个账号，一直有售后，不用担心中途封号或者用不了

OpenAI