富士康发布自研AI大模型FoxBrain,120块英伟达H100耗时4周完成
富士康这厂子,给苹果手机干活的,最近弄了个AI大东西,号称是它们家的第一款繁体中文AI大语言模型。这东西能干数据分析、决策帮衬、写材料、数学题解题,还能编代码。听起来挺厉害,但比那个蒸馏模型差点火候,不过也快追上国际前沿了。
历时四周研发
栗永徽,这位富士康鸿海研究院人工智能研究所的掌门人,透露说他们搞了个大动作,搞了120块英伟达H100显卡,整整花了一个月的时间来训练这个模型。别看它性能差点意思,数学和逻辑推理这块儿还是有两把刷子的。等到了三月中旬的英伟达技术大会,咱们就能听到更多内幕了。
数学能力强
这货用的是Meta放出来的Llama 3.1架构,数学技能那叫一个牛。富士康自己都说,虽然比不上那种蒸馏模型,但已经很接近国际顶尖水平了。他们打算通过优化训练手段,不瞎搞增加计算能力,来把成本给压下来。
联手英伟达
富士康跟英伟达联手搞了个新东西,那英伟达给它来了个超级计算机-1,还给它出谋划策。这俩货以前也干过这事,去年还搞了个“人工智能工厂”,搞自动驾驶技术。这次一合作,富士康的模型训练就顺畅多了。
计划开源
富士康说,这东西一开始是自家用的,不过他们打算往后放出来给大家玩儿,跟业界的小伙伴们一起搞事情。他们想用这东西给制造业和供应链管理来点新花样。放出来让大家玩儿,就能吸引更多人加入,一块儿把AI技术往前推。
成为智慧应用新引擎
富士康打算用这个AI小能手,把智能制造、电动车智能、城市智能这三大平台的数据分析速度给提一提。他们心里想着,要是这个模型真能当个智慧升级的强力马达,那公司运营效益肯定能水涨船高。眼看着电子制造这块儿利润有点掉链子,富士康正忙不迭地往人工智能和电动车这些新领域里钻。
撬动产业升级
富士康这波操作,明显是下了血本,要在行业里深耕细作,AI技术这块儿也得搞起来。别看这AI模型比那些顶尖货差点意思,可它跟制造业、供应链这些产业的需求超级搭。富士康这“轻量化训练+场景化落地”的路子,说不定能给那些传统大鳄转型提供个参考。往后看,这些垂直模型要是能往开源生态里钻,AI跟实体经济的结合估计要玩出花儿了。
这富士康的AI大模型,真能给产业升级来个翻身仗不?来评论区聊聊,点个赞,扩散一下!