Meta发布开源大模型Llama 4：首次采用混合专家架构，AI领域再创新高

AI世纪 2025-04-06

2025-04-06

重磅推出

4月5日，周六，美国科技巨头Meta发布了一项新举措，推出了最新开源人工智能模型Llama 4。此消息在科技界迅速引发了广泛关注。众多行业专家对这款新模型寄予厚望，期待它能引领行业变革。据预测，该模型有望在人工智能领域掀起创新热潮。

版本情况

Llama 4分为Scout版和其他一个版本。Scout版包含170亿个活跃参数，并整合了16个专家模型，整体参数量累计至1090亿。其他版本亦拥有170亿活跃参数，但专家模型增至128个，总参数量进一步上升至4000亿。参数设置各有不同，导致两个版本在处理不同任务时，其性能可能显现出差异。

多模态特性

Meta公司强调，Llama 4是一款多功能的大型模型。该模型具备处理和融合文本、视频、图像及音频等多样化数据格式的能力。此外，它还实现了在这些不同数据格式间的内容转换。这一特性显著扩大了其应用领域。比如，它能将视频内容转换为文字报告，亦或将文字描述转换为图像。因此，它极大地扩展了人工智能技术的应用边界。

创新架构

Llama 4系列模型引入了混合专家架构。该架构技术先进，显著提升了模型在训练及响应用户查询时的效率。架构将模型细分为多个执行特定任务的子模型，各子模型负责各自功能，协同工作以增强整体性能。此策略有效提升了任务处理的准确性与速度。

其他训练模型

Meta公司推出了Scout等多个版本，并不断研发性能更佳的新模型。这些模型被认为是全球最顶尖的大模型之一，在“新模型领域”中发挥着引领作用。它们通过使用“大量未标记的文本、图像和视频数据”进行训练，旨在增强“广泛的视觉理解能力”。面向未来，这些模型有望为人工智能领域带来更为显著的进展。

应用与获取

Meta公司公布消息，宣布其人工智能产品Meta AI在全球范围内已更新至Llama 4版本。然而，这一版本的多模态功能目前仅限于美国地区，且仅支持英语。用户可从Meta官方网站及其合作伙伴站点下载Scout及该模型，同时一些平台也提供了获取途径。该策略有利于吸引更多开发者参与，进而促进技术的广泛普及与不断进步。

开发背后

知情人士透露，Llama 3的发布计划已延后至一年之后。原因在于，该模型在技术层面未能满足Meta的期望，特别是在推理和数学运算能力上存在不足。另外，Meta对模型在模拟人类语音对话方面的表现持有疑虑。

投资与压力

今年，Meta公司计划投入650亿美元以强化其在人工智能领域的布局。与此同时，投资者群体正对大型科技公司施加压力，期望看到投资的具体成效。在此背景下，Meta发布了Llama 4模型，此举可能旨在向投资者展示其投资的实际成果。

官方表态

周六，Meta首席执行官扎克伯格发布声明，指出公司正专注于开发全球顶尖的人工智能技术。他表示，公司计划推广这些技术的开源，以促进其广泛的应用。扎克伯格曾指出，开源的人工智能技术将促进行业的发展。目前，随着Llama 4的问世，这一目标正逐步变为现实。Chris Cox担任Meta公司首席产品官，此前他在讲话中指出，Llama 4的发布有望显著增强人工智能体的性能，并赋予其更高级别的推理与执行功能。

Meta公司新推出的Llama 4模型受到业界的广泛关注，人们对其在人工智能领域的领先地位抱有高度期待。我们期待在评论区看到您的见解。同时，请记得为这篇文章点赞和转发。

Llama

Meta发布开源大模型Llama 4：首次采用混合专家架构，AI领域再创新高

Meta新旗舰AI模型Llama 4 Maverick测试成绩遭质疑

对于游戏科技外溢和AI的冲击，腾讯和网易等公司的技术负责人如何看？

机器之心编辑部以后数据分析的活，也被包了

AI月之暗面创始人杨植麟现身上海创新创业青年论坛

OpenAI惊天内幕曝光！高管怒斥遭打压，7100亿AI巨头内外交困｜钛媒体AGI

AI模型可以用于追踪转移性癌症的源头