高通推出 Snapdragon 8 Elite,算力租赁价格平稳,多品牌将推出搭载设备

AI世纪 2024-10-28
大模型 2024-10-28

▌算力:算力租赁价格平稳,高通推出 8 Elite

高通本周在毛伊岛举行的年度 峰会上表示,包括华硕、荣耀、iQOO、、OPPO、、三星、Vivo、小米等在内的领先制造商和智能手机品牌准备在未来几周内推出搭载 8 Elite 的设备。该 CPU 采用高通的第二代定制高通 Oryon CPU,旨在无缝处理多模态 AI 的复杂性,同时优先考虑隐私。高通公司产品营销高级总监 Cisco Chen 发言总结如下:

1) NPU 的性能是上一代的 12 倍。Oryon CPU 的性能是其三倍。 GPU 的性能是其三倍。器件在片上系统设计中嵌入了 40 多个组件,客户可以在最终设计中混合和匹配他们想要的功能。

2) Oryon 的 Prime 内核是一种全新的微架构,效率比上一代高 46%。运行频率为 4.32GHz。能比过去更快地获取数据,使内核能够更快地执行下一条指令。除了两个 Prime 核心之外,还有六个性能核心。

3) 该平台首次采用了行业技术,例如最新的 图形处理单元 (GPU) 和增强的 NPU,所有这些都提供了改变游戏规则的性能改进。

4) 还针对应用内体验、多任务处理、生成式 AI、视频渲染和流媒体以及游戏进行了优化。将以更高的帧速率提供更流畅的游戏体验,并将游戏时间延长至 2.5 小时,电池效率提高 40%,GPU 性能提高 40%。它支持 的 Chaos 系统,在设备上实时运行游戏物理模拟。

5) 新的 AI 引擎将利用 Oryon CPU 执行延迟关键型 AI 任务。 NPU 在加速器之间具有更高的吞吐量,可实现更快的推理性能。

▌AI应用: 推出升级版 3.5 以及新模型 3.5 Haiku

推出了升级版的 3.5 以及一款新模型 3.5 Haiku。其中,升级版 3.5 的各项能力全面胜过之前版本,其中代码能力提升显著。 3.5 Haiku 的性能则与之前最大模型 3 Opus 的性能相当,同时在成本和速度上与上一代 Haiku 相近。最新版本的 3.5 能够根据用户指令移动光标、点击相应位置以及通过虚拟键盘输入信息,模仿人类与计算机的交互方式。

在公测中,引入一项突破性的新功能:计算机使用能力。从今天起,开发者可以通过API,指导像人类一样使用计算机了。 3.5 是首个在公测中提供此功能的模型。当然,这项功能仍处于实验阶段,使用起来还有些笨拙,可能出错。而选择提前发布此功能,也是为了获得开发者反馈,将之快速改进。在 测试中,它在仅基于屏幕截图的任务类别中得分为14.9%,明显超越了排名第二的AI系统(7.8%)。当允许更多操作步骤来完成任务时,得分提高到了22.0%。这表明模型与环境的多次交互,能够优化任务性能。虽然这一结果比之前有了大幅提升,但仍然远低于人类72.36%的表现。这也暗示了, 3.5 未来还有很大的改进空间。

3.5 Haiku 是 最快的模型的下一代。与 3 Haiku 的成本相同,速度相似, 3.5 Haiku 在每项技能上都有改进,并且在许多智能基准测试上甚至超过了 上一代最大的模型 —— 3 Opus。 3.5 Haiku 在编码任务上尤其强大。例如,它在 SWE-bench 上的得分为 40.6%,超过了使用公开可用的 SOTA 模型的许多智能体 —— 包括原始的 3.5 和 GPT-4o。凭借低延迟、改进的指令遵循和更准确的工具使用, 3.5 Haiku 非常适合面向用户的产品、专门的 sub-agent 任务以及从大量数据(如购买历史、定价或库存记录)中生成个性化体验。

3.5 Haiku 将于本月晚些时候通过 的第一方 API、 , 和谷歌云的 AI 提供 —— 最初作为仅限文本的模型,随后将支持图像输入。

▌AI融资动向:/驯鹿AI分别获4亿美元/6000万元人民币融资

本期AI初创公司的融资中,/驯鹿AI分别获4亿美元/6000万元人民币融资。已经将芯片互连速度提高到,的版本也在路上。它有光子计算单元,有光学芯片封装和传输技术,能够系统化提升整个AI计算集群的计算力,计算效率,并降低功耗。声称其产品有能力支持万亿级参数的大语言模型训练,并有望帮助AI实验室们探索通用人工智能。驯鹿AI采用多模型协作技术,根据任务类型和难度智能选择最佳模型。此技术确保任务的精准与高效完成。在功能方面,驯鹿AI的客服系统不仅覆盖了售前、售中、售后的全流程,还能够主动进行客户开发,通过对企业业务流程的深入分析,定制专属的AI模型。在简单易用的基础上,驯鹿AI能够在一个月内完成机器人的部署。

▌投资建议

人工智能需求促使高速光模块需求量剧增,光芯片供应小于需求,目前缺口较大。在此情况下,涨价潮、投资潮一齐涌现。近期,美国网通及光通信芯片大厂宣布全产品线将于2025年1月1日起涨价;广东、无锡、英伟达、中际旭创等有关部门、国资、大厂等各方先后宣布投资或支持光芯片发展。我们认为AI需求高涨,继续看好AI软硬件机会。

建议关注以AI为核心的龙头厂商科大讯飞(.SZ)、有望迎来需求爆发的AI应用金桥信息(.SH)、高速通信连接器业务或显著受益于 GB200 放量的鼎通科技(.SH)。

1)AI 底层技术迭代速度不及预期。2)政策监管及版权风险。3)AI 应用落地效果不及预期。4)推荐公司业绩不及预期风险。

算力动态:算力租赁价格平稳,高通推出 8 Elite

1.1

数据跟踪:算力租赁价格平稳

本周恒源云13核+128G价格环比上周上涨5.88%。具体来看,显卡配置为A100-40G中,腾讯云16核+96G价格为28.64元/时,阿里云12核+94GiB价格为31.58元/时;显卡配置为A100-80G中,恒源云13核+128G价格为9.00元/时;阿里云16核+价格为34.74元/时;显卡配置为A800-80G中,恒源云16+256G价格为9.00元/时。

1.2

产业动态:高通推出 8 Elite,处理速度显

著提升

高通本周在毛伊岛举行的年度 峰会上表示,包括华硕、荣耀、iQOO、、OPPO、、三星、Vivo、小米等在内的领先制造商和智能手机品牌准备在未来几周内推出搭载 8 Elite 的设备。该 CPU 采用高通的第二代定制高通 Oryon CPU,旨在无缝处理多模态 AI 的复杂性,同时优先考虑隐私。高通公司产品营销高级总监 Cisco Chen 发言总结如下:

1) NPU 的性能是上一代的 12 倍。Oryon CPU 的性能是其三倍。 GPU 的性能是其三倍。器件在片上系统设计中嵌入了 40 多个组件,客户可以在最终设计中混合和匹配他们想要的功能。

2) Oryon 的 Prime 内核是一种全新的微架构,效率比上一代高 46%。运行频率为 4.32GHz。能比过去更快地获取数据,使内核能够更快地执行下一条指令。除了两个 Prime 核心之外,还有六个性能核心。

3)该平台首次采用了行业技术,例如最新的 图形处理单元 (GPU) 和增强的 NPU,所有这些都提供了改变游戏规则的性能改进。

4) 还针对应用内体验、多任务处理、生成式 AI、视频渲染和流媒体以及游戏进行了优化。将以更高的帧速率提供更流畅的游戏体验,并将游戏时间延长至 2.5 小时,电池效率提高 40%,GPU 性能提高 40%。它支持 的 Chaos 系统,在设备上实时运行游戏物理模拟。

5)新的 AI 引擎将利用 Oryon CPU 执行延迟关键型 AI 任务。 NPU 在加速器之间具有更高的吞吐量,可实现更快的推理性能。

AI应用动态:Kimi搜索访问量环比+32.36% , 推出升级版 3.5

2.1

流量跟踪:搜索访问量环比+7.23%

本期(2024.10.21-2024.10.25)AI相关网站流量数据:访问量前三位分别为(844.5M)、Bing(404.1M)和Canva(176.6M);访问量环比增速前三位分别为(7.23%)、(3.49%)和.AI(2.37%);平均停留时长前三位分别为(00:12:26)、.AI(00:12:16)和Deepl(00:08:58);平均停留时长环比增速前三位分别为Kimi(1.61%)、.AI(0.68%)和(0.40%)。

2.2

产业动态: 推出升级版 3.5 以

及新模型 3.5 Haiku

推出了升级版的 3.5 以及一款新模型 3.5 Haiku。其中,升级版 3.5 的各项能力全面胜过之前版本,其中代码能力提升显著。 3.5 Haiku 的性能则与之前最大模型 3 Opus 的性能相当,同时在成本和速度上与上一代 Haiku 相近。最新版本的 3.5 能够根据用户指令移动光标、点击相应位置以及通过虚拟键盘输入信息,模仿人类与计算机的交互方式。

在公测中,引入一项突破性的新功能:计算机使用能力。从今天起,开发者可以通过API,指导像人类一样使用计算机了。 3.5 是首个在公测中提供此功能的模型。当然,这项功能仍处于实验阶段,使用起来还有些笨拙,可能出错。而选择提前发布此功能,也是为了获得开发者反馈,将之快速改进。在测试中,它在仅基于屏幕截图的任务类别中得分为14.9%,明显超越了排名第二的AI系统(7.8%)。当允许更多操作步骤来完成任务时,得分提高到了22.0%。这表明模型与环境的多次交互,能够优化任务性能。虽然这一结果比之前有了大幅提升,但仍然远低于人类72.36%的表现。这也暗示了, 3.5 未来还有很大的改进空间。

其次就是在界面中,如何决定让AI全局重写还是局部更改,目前的策略是,如果想要局部更改,就可以通过类似划词的方式进行;而右下角的所有功能,则是倾向于全局重写。

在各项行业基准测试中,升级版 3.5 性能得到了全方位提升。特别是,智能体编码、工具使用任务中取得显著突破。

1)在编码能力方面,它在SWE-bench 测试中,性能从33.4%大幅提升至49.0%。这超越了所有公开可用的模型——包括 o1-等推理模型和专为智能体编码设计的专门系统。

2)在TAU-bench(一项评估智能体工具使用能力的基准测试)中, 3.5 也表现出色:在零售领域的得分从62.6%提高到69.2%,在更具挑战性的航空领域则从36.0%跃升至46.0%。

3)推理测试基准GPQA()上,新版 3.5 大幅超越GPT-4o。

4)在视觉QA、数学推理、文档视觉问答、图表问答、科学表格基准测试中, 3.5 性能成为业界新标杆。

值得一提的是,新版 3.5 性能突破同时,仍保持了与前代模型相同的价格和运行速度。一些早期测试用户的反馈,进一步印证了升级后 3.5 ,在AI驱动编码领域实现“质”的飞跃。

1):在任务测试中,发现 3.5 在不增加延迟的前提下,推理能力显著提升(各用例最高提升10%),使其成为驱动复杂软件开发流程的理想选择

2):将新版 3.5 应用于自主AI评估,在编码、规划和问题解决等方面,相较前代模型均取得了实质性进步

3)The :在使用该模型自动化网络工作流程时发现, 3.5 的表现超越了他们此前测试过的所有模型。

3.5 Haiku 是 最快的模型的下一代。与 3 Haiku 的成本相同,速度相似, 3.5 Haiku 在每项技能上都有改进,并且在许多智能基准测试上甚至超过了 上一代最大的模型 —— 3 Opus。 3.5 Haiku 在编码任务上尤其强大。例如,它在 SWE-bench 上的得分为 40.6%,超过了使用公开可用的 SOTA 模型的许多智能体 —— 包括原始的 3.5 和 GPT-4o。凭借低延迟、改进的指令遵循和更准确的工具使用, 3.5 Haiku 非常适合面向用户的产品、专门的 sub-agent 任务以及从大量数据(如购买历史、定价或库存记录)中生成个性化体验。

3.5 Haiku 将于本月晚些时候通过 的第一方 API、 , 和谷歌云的 AI 提供 —— 最初作为仅限文本的模型,随后将支持图像输入。

AI融资动向:/驯鹿AI分别获4亿美元/6000万元人民币融资

本期AI初创公司的融资中,/驯鹿AI分别获4亿美元/6000万元人民币融资。已经将芯片互连速度提高到,的版本也在路上。它有光子计算单元,有光学芯片封装和传输技术,能够系统化提升整个AI计算集群的计算力,计算效率,并降低功耗。声称其产品有能力支持万亿级参数的大语言模型训练,并有望帮助AI实验室们探索通用人工智能。驯鹿AI采用多模型协作技术,根据任务类型和难度智能选择最佳模型。此技术确保任务的精准与高效完成。在功能方面,驯鹿AI的客服系统不仅覆盖了售前、售中、售后的全流程,还能够主动进行客户开发,通过对企业业务流程的深入分析,定制专属的AI模型。在简单易用的基础上,驯鹿AI能够在一个月内完成机器人的部署。

行情复盘

本周,AI算力指数/AI应用指数/万得全A/中证红利日涨幅最大值分别为4.13%/2.84%/1.31%/0.65%,日跌幅最大值分别为-2.13%/-1.22%/-0.76%/-0.65%。AI算力指数内部,云创数据以+35.77%录得本周最大涨幅,天玑科技以-11.11%录得本周最大跌幅。AI应用指数内部,鸿博股份以+38.03%录得本周最大涨幅,苏州科达以-8.50%录得本周最大跌幅。

投资建议

AI需求高涨近期持续被验证。人工智能需求促使高速光模块需求量剧增,光芯片供应小于需求,目前缺口较大。在此情况下,涨价潮、投资潮一齐涌现。近期,美国网通及光通信芯片大厂宣布全产品线将于2025年1月1日起涨价;广东、无锡、英伟达、中际旭创等有关部门、国资、大厂等各方先后宣布投资或支持光芯片发展。我们认为AI需求高涨,继续看好AI软硬件机会。

建议关注以AI为核心的龙头厂商科大讯飞(.SZ)、有望迎来需求爆发的AI应用金桥信息(.SH)、高速通信连接器业务或显著受益于 GB200 放量的鼎通科技(.SH)。

1)AI 底层技术迭代速度不及预期。2)政策监管及版权风险。3)AI 应用落地效果不及预期。4)推荐公司业绩不及预期风险。

证券研究报告:《高通推出移动CPU,发布升级版大模型—计算机行业周报》