国产GPU助力蚂蚁集团发布重大消息,技术突破引领行业新趋势

AI世纪 2025-03-25
算力 2025-03-25

蚂蚁模型突破

蚂蚁集团近期发布了两种MoE大型语言模型,一种是百灵的轻量版,另一种是增强版。轻量版模型参数总数为168亿,其中27.5亿为激活参数;增强版模型则包括2900亿的基座参数和288亿的激活参数。这两款模型均位于行业前沿,展现了蚂蚁集团在大规模模型研发领域的卓越实力。

该集团发表的论文详尽阐述了其创新的研究技术。该技术旨在在资源受限的条件下,加快人工智能的研发速度并拓宽其应用领域。这一成就不仅体现了该集团技术的领先地位,还为人工智能在众多领域的应用提供了更加便捷和高效的开发手段。

低设备训练成就

实验结果显示,蚂蚁集团开发的3000亿参数MoE大模型,即便在搭载国产GPU的基础设备上,也能实现高效训练。该模型的表现能力与采用英伟达芯片的同等规模稠密模型及MoE模型相当。这一重大突破,为我国在芯片资源有限的情况下推动大模型发展,带来了新的动力。

gpu100%满了怎么办_GPU_gpu是显存吗

在此阶段,蚂蚁集团借助算法革新与工程改良,有效提升了英伟达H800的性能表现。该成果在国产GPU上的应用,为大型模型的训练开辟了新的途径,并显著减少了对外部硬件的依赖。

技术论文发布

蚂蚁集团的Ling研究团队的研究论文已成功发布在预印版平台Arxiv上。该论文的标题为《每个FLOP都至关重要:实现3000亿参数混合专家LING大模型的扩展,无需高端GPU》。论文中对研究方法进行了详尽阐述,并展示了所取得的成果。

研究成果公布后,全球科研人员得以审阅及交流相关成果。此举亦吸引众多研究机构投身该领域研究。同时,该举措有助于扩大大型模型的应用领域,并促进技术成果向实际生产力的转化。

国产芯片契机

蚂蚁集团的技术成果一旦得到验证并普及应用,有望展示出成本更低、性能更优的国产芯片替代选项,这将有助于减少对英伟达芯片的依赖。此突破亦将为我国芯片产业创造新的增长点。

国泰君安证券的研究报告指出,AI芯片主要分为通用型、半定制型和定制型ASIC。尽管定制型ASIC在规模化生产上具有优势,但其前期投入成本较高,研发周期较长,同时存在技术难题。与此同时,国内通用型GPU制造商正积极拓展业务领域,为大模型训练提供了更广阔的发展机遇。

算力厂商IPO动态

自2024年8月起,我国AI算力行业企业活跃度显著提升。26日,燧原科技,该领域内的领先企业,开启了首次公开募股的辅导工作;紧接着,11日,壁仞科技,作为GPGPU领域的佼佼者,也步入了辅导流程。若这些企业顺利实现上市,A股市场可供投资者选择的AI算力企业数量将大幅增长。

近期,多家算力企业纷纷踏上上市征程。这一趋势反映出AI算力领域的兴盛景象,以及企业对规模扩张的迫切需求。此举对行业整体进步起到了示范效应,同时也为投资者提供了更多投资机会。

创始团队背景

对创始团队组成进行剖析,揭示出众多国内AI算力公司背后拥有丰富底蕴。以沐曦股份为例,其创始成员来自AMD,其中陈维良作为创始人,曾执掌AMD全球GPGPU设计部门。同时,公司两位CTO亦曾是AMD的首席科学家。

摩尔线程的创始成员来自英伟达,其中张建中曾担任英伟达全球副总裁等职务。该团队凭借在业界的丰富经验和持续积累,为我国AI算力领域贡献了独特的理念和技术优势。

蚂蚁集团在大型模型技术领域取得显著进展,同时,国内众多AI算力公司纷纷登陆资本市场。这一系列事件表明,我国AI产业正迈向新的成长阶段。这些技术突破和商业活动,可能对AI市场的未来竞争态势产生何种影响?

GPU