OpenAI发布全新推理模型o3和o4-mini，推出编程智能体助力开发者

AI世纪 2025-04-17

2025-04-17

O3模型前期预热

去年12月，对o3推理模型进行了提前介绍。当时突出指出，相较于第一代推理模型o1，o3在处理复杂问题方面表现更为出色。这一信息在业界引发了广泛关注，众多人士翘首以盼o3模型的正式亮相，期待一睹其带来的创新成果。此次预热活动，为后续的正式发布打下了坚实基础。

正式发布亮点

本次正式推出了o3和o4 - mini两种模型。其中，o3模型在能力上表现突出，特别强调了其Agent功能。特别指出，o3是首个能够在思维链中运用图像进行推理的模型。这一创新特性使得它在多模态推理领域取得了显著进展，为行业的发展开辟了新的路径。

AI Agent能力趋势

O系列和R1等推理模型正日益成熟，业界普遍预测，AI Agent通过一条指令即可完成复杂任务的能力将得到显著增强。此次发布揭示了在AI Agent能力建设上的独到规划。目前展示的技术具有鲜明的意念编程特征，可直接从网页截取他人编程画面，通过Codex CLI生成HTML文件并进行修改，充分展示了模型卓越的应用潜力。

现场演示情况

在发布会上，研究员展示了o3模型，该模型利用十年前的一篇论文图片，得出了特定结果，并将其与最新的研究成就进行了对比。此次展示利用了模型内置的记忆功能，这一功能正是几天前才对外宣布的，它允许模型访问用户的全部记忆。观察当前模型的设计，其Agent的能力主要依赖于内部工具的调用。然而，从技术角度来看，若要连接其他工具，并非不可行。

模型评测结果

去年12月已有关于o3模型功能细节的讨论，本次官方发布明确指出，模型在推理成本和实用性方面进行了显著改进，评测结果可能存在变化。直播演示的测试数据显示，o3模型与o4 - mini模型在数学、编程及多模态能力方面均表现出色。这一现象进一步表明，人工智能的发展势头强劲，顶尖模型正不断为用户提供更强大的功能。

未来发展方向

CFO近期表示，计划整合Agent的模型和编程技能，构建一套全新的编程Agent。该Agent能够直接进行软件编程及测试。已有演示案例显示，模型在虚拟机中运用工具进行编程，其方法与流行的Manus相似。相较于过去的“代码自动补全”，今年的模型竞争焦点可能转向“代码自动完成”。

未来几年，AI模型的能力是否会实现显著提升？对此，我们期待在评论区听到您的见解。同时，也请您为本文点赞并转发！

OpenAI

OpenAI发布全新推理模型o3和o4-mini，推出编程智能体助力开发者

Meta新旗舰AI模型Llama 4 Maverick测试成绩遭质疑

对于游戏科技外溢和AI的冲击，腾讯和网易等公司的技术负责人如何看？

机器之心编辑部以后数据分析的活，也被包了

AI月之暗面创始人杨植麟现身上海创新创业青年论坛

OpenAI惊天内幕曝光！高管怒斥遭打压，7100亿AI巨头内外交困｜钛媒体AGI

AI模型可以用于追踪转移性癌症的源头