Meta发布开源大模型Llama 4:首次采用混合专家架构,AI领域再创新高
重磅推出
4月5日,周六,美国科技巨头Meta发布了一项新举措,推出了最新开源人工智能模型Llama 4。此消息在科技界迅速引发了广泛关注。众多行业专家对这款新模型寄予厚望,期待它能引领行业变革。据预测,该模型有望在人工智能领域掀起创新热潮。
版本情况
Llama 4分为Scout版和其他一个版本。Scout版包含170亿个活跃参数,并整合了16个专家模型,整体参数量累计至1090亿。其他版本亦拥有170亿活跃参数,但专家模型增至128个,总参数量进一步上升至4000亿。参数设置各有不同,导致两个版本在处理不同任务时,其性能可能显现出差异。
多模态特性
Meta公司强调,Llama 4是一款多功能的大型模型。该模型具备处理和融合文本、视频、图像及音频等多样化数据格式的能力。此外,它还实现了在这些不同数据格式间的内容转换。这一特性显著扩大了其应用领域。比如,它能将视频内容转换为文字报告,亦或将文字描述转换为图像。因此,它极大地扩展了人工智能技术的应用边界。
创新架构
Llama 4系列模型引入了混合专家架构。该架构技术先进,显著提升了模型在训练及响应用户查询时的效率。架构将模型细分为多个执行特定任务的子模型,各子模型负责各自功能,协同工作以增强整体性能。此策略有效提升了任务处理的准确性与速度。
其他训练模型
Meta公司推出了Scout等多个版本,并不断研发性能更佳的新模型。这些模型被认为是全球最顶尖的大模型之一,在“新模型领域”中发挥着引领作用。它们通过使用“大量未标记的文本、图像和视频数据”进行训练,旨在增强“广泛的视觉理解能力”。面向未来,这些模型有望为人工智能领域带来更为显著的进展。
应用与获取
Meta公司公布消息,宣布其人工智能产品Meta AI在全球范围内已更新至Llama 4版本。然而,这一版本的多模态功能目前仅限于美国地区,且仅支持英语。用户可从Meta官方网站及其合作伙伴站点下载Scout及该模型,同时一些平台也提供了获取途径。该策略有利于吸引更多开发者参与,进而促进技术的广泛普及与不断进步。
开发背后
知情人士透露,Llama 3的发布计划已延后至一年之后。原因在于,该模型在技术层面未能满足Meta的期望,特别是在推理和数学运算能力上存在不足。另外,Meta对模型在模拟人类语音对话方面的表现持有疑虑。
投资与压力
今年,Meta公司计划投入650亿美元以强化其在人工智能领域的布局。与此同时,投资者群体正对大型科技公司施加压力,期望看到投资的具体成效。在此背景下,Meta发布了Llama 4模型,此举可能旨在向投资者展示其投资的实际成果。
官方表态
周六,Meta首席执行官扎克伯格发布声明,指出公司正专注于开发全球顶尖的人工智能技术。他表示,公司计划推广这些技术的开源,以促进其广泛的应用。扎克伯格曾指出,开源的人工智能技术将促进行业的发展。目前,随着Llama 4的问世,这一目标正逐步变为现实。Chris Cox担任Meta公司首席产品官,此前他在讲话中指出,Llama 4的发布有望显著增强人工智能体的性能,并赋予其更高级别的推理与执行功能。
Meta公司新推出的Llama 4模型受到业界的广泛关注,人们对其在人工智能领域的领先地位抱有高度期待。我们期待在评论区看到您的见解。同时,请记得为这篇文章点赞和转发。