同行押注Agent，梁文锋求索AGI，DeepSeek R1模型更新及服务情况

AI世纪 2025-06-03

2025-06-03

同行纷纷押注Agent，梁文锋仍保持深度求索AGI的定力。5月28日下午6时，宣布完成R1模型小版本试升级，并邀请用户测试官方网页、APP及小程序功能，API接口和使用方式保持不变。

当日晚10点33分，服务出现5分钟不可用状态，这是最近两个月内少见的服务中断现象。次日，开源R1最新0528版本，这是自1月20日正式推出以来首次更新，但官方未公布外界期待的R2时间表。

R1基于-V3模型能力复现，而R2可能需等待V4研发成功。V3上次升级是在3月24日，V4尚未有明确推出计划。5月29日晚间，发布文章称，此次更新通过后训练提升了模型思维深度与推理能力，尽管工具调用等能力仍有进化空间。

后训练是当前大模型竞赛中的重要阶段，一位投资人表示，国内几家“六小虎”已放弃基座模型预训练，转而加强后训练与微调投入以推动模型应用落地。傅盛感叹大模型领域竞争激烈，周期可能仅3至6个月。

今年以来，国内外科技巨头纷纷押注AI Agent。然而，梁文锋及其团队仍专注于模型本身的研究。腾讯迅速响应R1更新，于5月29日晚间宣布多款产品接入-R1-0528。

测试结果显示，升级后的R1-0528超越阿里Qwen3，在数学与编程能力上接近国际领先水平。新版模型平均每题使用23K ，较旧版12K显著增加。英伟达CEO黄仁勋预测 AI将推动算力需求暴增至少100倍。

此外，蒸馏出-R1-0528-Qwen3-8B，该8B模型在AIME 2024数学测试中表现仅次于-R1-0528，超越Qwen3-8B且准确率与Qwen3-235B相当。强化后训练后，幻觉率降低45%～50%，此前R1因高幻觉率备受批评。

R1-0528上下文长度仍为64K，落后于部分国际领先模型的128K。更大上下文规模有助于提升模型记忆能力，对工具产品化意义重大。

美国科技公司对的看法逐渐分化，英伟达最新财报显示其业绩强劲增长，CEO黄仁勋称赞-R1如般越思考越聪明。 CEO山姆·阿尔特曼则表示不认为找到更高效驱动AI的方法。

承认R1-0528在某些方面仍与和的最新模型存在差距，如工具调用能力。一位投资人预估差距约为2至3个月。整个AI领域的竞争重心已转向Agent，谷歌、微软及均在其近期发布会中重点讨论Agent相关进展。

尽管行业关注焦点转移，仍专注模型本身研究。梁文锋曾强调参与全球科技创新的重要性，认为中国企业不应仅依赖海外技术创新进行商业化，而是要推动技术前沿发展。团队约130人，以年轻技术人员为主，组织架构分为决策中心与执行层。

DeepSeek