DeepSeeK V3开源升级,接近Claude3.7水平,正实现Meta目标
24日晚间发布的一则关于模型升级的消息,引发了用户们的广泛关注与期待。此次V3模型的小型版本更新,不仅增强了功能,而且提供免费且无限制的使用,究竟将带来哪些颠覆性的变化?
升级信息发布
24日晚,相关用户群体发布了【通告】,指出V3模型已经进行了小幅度的版本更新。用户可以访问官方网站、应用程序或小程序进行试用,但需注意关闭深度思考功能。同时,API接口的使用方式保持不变。此次更新并非R2版本,最终推出的版本号为V3-0324,属于V3系列的小型更新版本。
最新更新资讯迅速在相关群体间扩散,众人对于新模型展现出浓厚兴趣和期待,均迫不及待地想要率先感受新模型带来的全新体验。
模型能力亮点
V3 - 0324版本升级后非同小可,其性能逼近3.7,且完全免费。对于频繁遭遇封号困扰的用户而言,这无疑是个喜讯。V3模型基于专家混合(MoE)技术,参数量高达671B,每个Token激活达370亿,由多头潜在注意力(MLA)和MoE机制共同支撑,经过14.8万亿Token的训练。
新发布的V3-0324版本在模型参数方面有所增加,参数量达到了685B。尽管Model Card尚未公布,模型基准能力测试也未更新,但这一版本免费且功能强大,已引起广泛关注。
文档重要变动
本次更新不仅涉及训练数据的更新,V3版本的相关文档亦发生了显著变化。先前版本中关于call调用的提示存在调用问题,而现在该问题已得到解决,函数调用功能已得到支持。这一改进有效解决了用户在使用过程中遇到的多项难题,显著增强了模型的实际应用价值。
用户反馈,此优化使得他们在实际操作中体验更为流畅,有效提升了模型性能的发挥,进而增强了工作和学习的效率。
前端生成能力测试
自2024年6月起,国外网友普遍认为,没有任何大型语言模型(LLM)能像3.5版本那样生成高质量的前端代码。近期,有用户对V3-0324版本进行了性能测试,并指出该更新显著增强了前端代码生成能力。在测试中,用户以“此次更新大幅提升了前端代码生成能力,鲸哥成功测试了构建一个电商网站”为关键词。
任务发布后,V3迅速投入创作,不仅实现了产品卡片的动态悬停效果,还适配了移动端的动态响应式布局,且支持直接采购。这一系列动作充分彰显了该新模型在前端生成领域的卓越实力。
开源优势与影响
V3模型因开源且易用而受到青睐,其API费用被广泛认可,官网向C端用户提供免费服务。阿拉文德CEO在接受采访时指出,若封闭式模型未能持续保持领先地位,而开源模型可被个人轻松调整,那么频繁筹集巨额资金的合理性将面临日益增大的风险。
关键开源模型的问世,使得AI领域的巨头企业未来获取巨额融资的难度加大。这些开源模型不仅能够提供与顶级封闭模型相当的高质量输出,而且它们还提供了清晰的推理过程。以V3升级版为例,国外网友指出,这一版本正在实现Meta所承诺的目标。
相关其他消息
今日,另一重大新闻亦值得关注。蚂蚁集团依托国产芯片进行AI模型训练,所用芯片包括阿里巴巴及华为提供的产品,使得开发成本降幅达到20%。此举不仅彰显了国内芯片在AI领域的巨大潜力,同时也为行业发展带来了新的视角。
AI技术持续进步,新创意和突破层出不穷,未来将为我们带来哪些新的惊喜?
业界普遍关注V3模型最新升级是否能在人工智能领域引发新一波热潮。欢迎各位在评论区发表看法,同时请记得点赞并转发本篇文章。