DeepSeek-R1发布：AI领域新黑马，开源模型权重与强化学习技术引领未来

AI世纪 2025-01-26

2025-01-26

雷递网乐天 1月26日

正成为AI领域崛起的“黑马”。的横空出世，打破了国内大模型原有格局。

就在本周，正式发布 -R1，并同步开源模型权重。-R1遵循 MIT ，允许用户通过蒸馏技术借助R1训练其他模型。

-R1 上线 API，对用户开放思维链输出，通过设置 model='-' 即可调用。

-R1在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。在数学、代码、自然语言推理等任务上，性能比肩 o1正式版。

-R1在开源-R1-Zero和-R1两个 660B模型的同时，通过 -R1 的输出，蒸馏6个小模型开源给社区，其中 32B 和 70B 模型在多项能力上实现了对标 o1-mini 的效果。

-R1 API 服务定价为每百万输入 1 元（缓存命中）/ 4 元（缓存未命中），每百万输出 16元。

震动美国科技界，不仅是因为其性能上比肩的o1，并完全开源，且以极低的成本实现了这一突破。

知名投资人马克·安德森也表示：“ R1 是我见过的最令人惊叹和印象深刻的突破之一，作为开源项目，这是给世界的一份重要礼物。”

AI科技初创公司Scale AI创始人亚历山大·王（ Wang）称，过去十年来，美国可能一直在人工智能竞赛中领先于中国，但的AI大模型发布可能会“改变一切”。的AI大模型性能大致与美国最好的模型相当。

Wang认为，-R1与GPT-4o和 3.5 相当，训练时计算量减少10倍。-V3展示给外界的教训是：在美国人休息时，中国人在工作，并以更便宜、更快、更强的产品迎头赶上。

“The of tech: they work while rests, and catch up , & 。”

Wang出生于1997年，他于19岁那年从美国麻省理工学院辍学创立公司，如今，Scale AI估值超百亿美元，获得包括Y 、英伟达、AMD风投、亚马逊、Meta等投资，该公司为、谷歌和 Meta等提供训练数据。

的动作让Meta的生成式AI团队陷入恐慌。Meta CEO扎克伯格宣布加速研发 Llama 4，计划投资650亿美元扩建数据中心，并部署130万枚 GPU 以“确保2025年 Meta AI 成为全球领先模型”。

当然，带来的最大震撼在于，如果中国公司能够以更低的成本实现同等或更好的性能，而且这些模型还大都开源，美国公司赖以维持的技术优势和高估值可能会受到挑战。

OpenAI