中国AI推理新趋势:老一代内存与芯片的创新应用与市场影响

AI世纪 2025-03-08
存储 2025-03-08

使用老一代内存进行AI推理:如果在中国越来越多地使用更少的芯片和使用旧芯片来运行,那么AVLLM可能并不像描述的那样是硬件密集型产业。相反,创造力和独创性使内存使用效率方面的更多创新成为可能,而不是强行提高访问内存带宽。虽然中国的主要云提供商使用H20芯片来支持,但大多数企业正在使用旧式的显卡(便足够)、CPU(AMD传统的7000系列CPU)、图形DRAM()和最小的NAND闪存(256GB )。

这对内存股有影响,这些股票之所以受到青睐,是因为投资者认为:

1.为了产出这些人工智能模型,公司需要购买非常大量的这些芯片

2.拥有更强大的HBM以实现性能,从而……

3.限制DRAM供应,在没有替代品的情况下提高定价。

HBM_hbm存储芯片国产龙头_hbm核科技

降低硬件壁垒。 V3在设计时考虑了效率和可扩展性,针对不同的模型变体和部署场景,可提供灵活的硬件要求。的DRAM/HBM要求因预期使用情况而异。对于基本推论,具有16-32GB图形DRAM的系统就足够了,但训练至少需要32-128GB DRAM和高端GPU。基于云的解决方案通过预先配置的实例提供灵活性,以实现最佳性能。是有效运行所需的最低和建议硬件规格的详细细分。

HBM_hbm存储芯片国产龙头_hbm核科技

而人工智能继续以更低的成本构建:随着软件驱动效率的提高,人工智能需要的硬件将越来越少。是开源的,因此任何人都可以检查他们的算法在不太先进的芯片上是否足够快。上个月,斯坦福大学和华盛顿大学创建了一个人工智能推理模型(S1),成本不到50美元,但与尖端的和相当,许多其他学术机构和公司都使用了推向市场的蒸馏技术(在不牺牲性能的情况下,将大型AI模型压缩为更小、更高效的版本)。人工智能的最终用户对价格敏感(如果要与人类劳动力竞争,人工智能需要相对便宜)

正在进一步利用软件的力量,寻找利用手头可用硬件的解决方法。的最新开发成果----已经成功在 H800上实现了的BF16矩阵乘法,大约是行业标准评级的八倍。此外,凭借高效的内存利用率,可实现高达/s的内存带宽,几乎是H800理论峰值的两倍。

这里重要的一点是,所有这一切都可以仅通过代码实现,而不是硬件增强或更多的HBM。简而言之,通过将数据分解为更小的部分以实现更快的处理,仅就可以将内存消耗降低高达40-60%。

hbm存储芯片国产龙头_HBM_hbm核科技

量化的低成本存储器采用率

HBM总潜在市场敏感性分析:如果我们假设企业和其他非超大规模服务提供商将逐渐用工作站和边缘推理取代他们的服务器集群,作为基础设施优化工作的一部分,这意味着HBM总潜在市场与我们的基准情境相比有所下降。

我们根据基准情境及以下额外假设构建敏感性分析:

根据我们大中华区半导体团队对AI半导体市场的预测,我们假设推理通用图形处理器(GPGPU)/专用集成电路(ASIC)的比例将在2024年至2027年逐渐增加。根据预测,2025-27年中国将占全球AI支出的13-14%。

我们假设超大规模云服务商对AI推理服务器的使用保持不变。根据的数据,超大规模云服务商占AI服务器需求的75-80%。我们假设到2027年,中国其余市场的40%(主要是企业和其他服务提供商)将逐步部署边缘推理。

因此,我们预计到2027年,HBM的总使用量将下降8%,而这种情境下的HBM总潜在市场到2027年将达到610亿美元,比我们的基准情境低8%。我们对HBM的基准情境假设:-,(2025年2月20日)

HBM_hbm存储芯片国产龙头_hbm核科技

hbm核科技_hbm存储芯片国产龙头_HBM

HBM_hbm核科技_hbm存储芯片国产龙头

对选股的影响

目前战术性交易:市场展望未来6-9个月(投资者希望先发制人)故事的后半部分,即DRAM价格将在2025年第二季度触底(我们目前还看不到这种迹象)。DRAM现货价格的飙升是受到在美国征收关税之前大量需求前置的拉动,这种情况不太可能持续到2025年第二季度。

在我们的基准情境下,HBM不是2025年EPS大幅上升的推动因素,因为主要供应商在2025年的产能已经售馨(即没有上涨空间),并且标准品DRAM合同价格在2025年第二季度或之前仍将承压,目前定价谈判的能见度有限。

2025年下半年的预期复苏可能会受到预期加征关税(欧盟、中国)带来的增长恐慌的影响,且我们也已指出HBM的供应不再紧张。此外,这已经是市场寄希望于--并且需要验证--智能手机和个人电脑在下半年出现复苏的第三年。

HBM的估值假设HBM在过去几年的竞争状态将持续一段时间,并且是持续的而非周期性的。如果先进人工智能的采用与低廉得多的内存硬件相结合(GDDR6对比HBM),那么这些假设的合理性就会存疑。如果能够以更低的成本打造类似的人工智能,则最终可能会缩短资本支出周期--那问题将不再是2025年HBM收入继续增长的速度,而变成其可能放缓的程度。

HBM