蚂蚁集团发布最新AI成果:无需高端GPU,计算成本降低20%,创新技术引领行业变革
算力霸主英伟达
英伟达凭借其高性能芯片在AI模型训练市场持续保持领先地位,形成了“算力优势”。其H100、H800等系列芯片成为众多AI模型的首选配置。这一优势使得英伟达在市场上拥有显著的影响力,并带来了丰厚的利润。与此同时,其他企业在高端算力方面对英伟达的依赖程度相当高。
众多科技企业在AI模型的大规模训练过程中,普遍选择了英伟达的芯片。这一选用模式使得英伟达的市场份额持续增长,同时也加强了它在算力领域的领先地位。
Ling团队惊艳成果
Ling团队的研究成果在蚂蚁集团领域备受瞩目。他们在模型预训练阶段,采用了配置较低的硬件设施,显著减少了计算成本。原本高达1万亿Token的训练费用,从635万元降至508万元,降幅接近20%。特别值得一提的是,经过优化,该模型的表现与采用英伟达高性能芯片的模型相当。
该研究揭示,即便舍弃昂贵的英伟达高端芯片,亦能达成高品质的AI模型训练目标。这一发现对AI领域在成本管控及硬件选择方面,引发了新的思维路径。
蚂蚁集团官方回应
3月24日,蚂蚁集团就相关事件作出官方声明。集团指出,他们正持续优化芯片技术。这一举措旨在减少人工智能应用的成本。目前,相关改进已取得明显成效。面向未来,集团计划分阶段对外披露其研究成果。
蚂蚁集团展现了其开放性特质,采用开源战略,旨在让更多企业享受到这项技术的益处,进而促进人工智能行业的全面发展。此举同时也体现了其在技术研发领域的坚定信念。
技术成果论文发表
Ling团队是蚂蚁集团的一部分。他们成功发表了一篇技术性论文。这篇论文的标题是《每一步计算都至关重要:无需高端GPU,即可实现3000亿参数混合专家LING大模型的扩展》。该论文已经在arXiv预印本平台上发布。其研究成果的公布引起了业界的广泛关注。
研究者与企业通过查阅相关文献,能够掌握技术的详尽信息。此方法对于促进技术交流与进步,发挥了关键作用。
模型训练实验数据
Ling-Plus模型在五种不同的硬件配置中进行预训练,覆盖了9万亿Token。实验表明,该模型即便在性能较低的设备上,也能实现高效训练。此外,该模型拥有约300亿参数的混合专家结构。有趣的是,与其他同等规模的模型相比,它在性能上并无明显差距。
Ling团队的技术数据充分展示了其实用性,并显示出显著效果。这一成果为企业选择低成本硬件进行模型训练提供了坚实的保障。
行业竞争与未来趋势
蚂蚁集团发布的百灵系列混合专家模型,标志着其正式踏入人工智能领域的竞技行列。在此之前,已有企业通过低成本策略培育出表现卓越的模型,从而加剧了市场竞争。目前,蚂蚁集团正致力于探索一种无需依赖高端GPU的模型训练新方法。
Tom所熟知的硬件媒体指出,该事件或许标志着中国减少对西方技术依赖的关键转变。彭博的分析师亦认同,此次展示凸显了中国在人工智能领域的迅猛进步和本土企业在该领域的自给自足能力。针对蚂蚁集团在AI训练技术上的突破,公众的看法如何?敬请点赞、转发,并留下您的见解。