深入研究服务器光相关内容,聊聊CPO基础及产业链参与者

AI世纪 2025-07-25
芯片 2025-07-25

最近开始研究服务器中跟“光”相关的东西,当然研究的深度还远远不够,所以自己研究到哪里就写到哪里。本文的内容参考自UBS的一篇分析,由于内容较多,我们分成两篇文章来写,第一篇主要讲一下CPO的一些基础:、量产面临的挑战、拐点什么时候出现、,第二篇讲CPO产业链的主要参与者。

昨天在星球中放了很多张GB200的图,关于哪些是铜、哪些是光,有兴趣的朋友可以到星球中查看。我们跟其他星球的区别在于我们不止提供行业信息,我们还会有些的内容,这在其他星球应该都比较少。星球中已经上传过很多CPO相关的资料。

光进铜退?

在数据中心网络领域,光纤正逐步取代铜缆,这背后是其在带宽、速度和长距离传输能力上的显著优势。如今,云人工智能的快速发展和旺盛需求,更将加速这一替代进程。未来 3 到 5 年,共封装光学(CPO)技术或许会成为支撑下一代 AI 服务器的关键,相比传统光学技术,它的系统集成能力更强,功耗也更低。

光纤相比铜缆的主要优势体现在多个方面。一是带宽更高,由于利用 “光” 而非 “电” 传输数据,光纤能承载远超铜缆的信息量,它可在更高频率下工作,还能同时传输多个信号且不损失质量,非常适合 800G、1.6T 及以上的高速互联场景。二是数据传输更快,光纤的传输速度约为光速的三分之二,远快于铜缆,这有助于降低数据中心网络的延迟,提升响应速度。三是传输距离更远,光纤的信号衰减极小,单模光纤的传输距离可达 100 公里,而铜缆受自身特性限制,在高速传输时距离通常不足 10 米,这让光纤更适合机架分布广泛的大型数据中心。四是可靠性更好,光纤受温度变化、湿度等环境因素以及电磁干扰(EMI)的影响更小,能在 AI 数据中心等高功率环境中保障数据传输的稳定性和一致性。五是空间效率更优,光纤更细、更轻、更坚固,易于操作,其小巧的外形能以更少的空间为服务器提供更大带宽。

长期以来,铜缆的电传输技术在现有数据中心基础设施中有着成熟的应用记录。行业仍在努力提升铜缆性能,短期内,在 AI 服务器的机架内部传输以及传统数据中心的短距离通信中,铜缆可能仍是主流网络技术。但未来几年,随着生态系统效率的提升和成本的持续优化,光纤在新建数据中心的应用增长将更为显著,使用范围也会更广泛。此外,光纤电缆的使用寿命(30-50 年)也远长于铜缆(5 年)。

在数据中心网络中,光纤的占比已达 60%,且这一比例还在不断上升。

随着对更快数据传输的需求日益增长,凭借上述优势 —— 更高的带宽、更快的传输速度、更远的传输距离、更强的可靠性以及不断下降的成本,光纤在数据中心通信市场的份额持续扩大。我们认为,近年来光纤在数据中心电缆市场的占比约为 60%。根据思科的数据,目前数据中心内服务器机架外部的大多数互联线路已升级为光纤,而机架内部的布线目前仍采用铜缆。

硅光子

硅光子技术能进一步提升传统光纤在速度、功耗方面的性能,并实现更优的集成效果。

随着数据传输带宽大幅提升以支撑云人工智能的发展,传统光纤数据传输在速度、效率和功耗上逐渐面临挑战。传统光收发器的供应链较为分散,涉及众多组件,技术迭代速度也较慢。如今,随着云人工智能的快速增长以及 AI 数据中心对光学器件的需求日益上升,行业正寻求对光传输技术进行革新。集成光子技术,尤其是硅光子技术,正成为数据通信和电信数据传输领域的关键技术。

尽管传统光纤在数据传输中的信号损耗小于铜线,但它也存在自身缺陷。为了实现光传输,光纤需要与波导、激光源、光电二极管 / 光探测器(PD)、光调制器等分立光子组件组装在一起,而这些组件往往由不同材料制成。这种分散的生态系统中,每个组件的生产规模都较小,这是阻碍技术快速迭代以及通过规模化降低成本的主要障碍。

正是出于这些原因,硅光子(SiPh)技术应运而生。硅光子技术是一种将分立的光子组件集成到单个基于绝缘体上硅(SOI)的晶圆衬底上,从而形成光子集成电路(PIC)的技术平台。采用 SOI 衬底的优势在于,它与标准的互补金属氧化物半导体(CMOS)制造工艺兼容,这使得行业能够利用已有的大规模硅晶圆制造产能,加快技术发展速度。同时,硅光子技术还能让逻辑晶圆厂建立起自己的光子集成设计标准。

除了与 CMOS 工艺兼容这一优势外,硅光子技术相比传统光学解决方案,还能提供更高的带宽和更低的功耗。通过将光学组件集成到单个衬底上,这种结构紧凑、体积更小且集成度更高的设计,能让光在波导中传输时的损耗极低,同时显著降低能耗。这一技术有望为数据中心和电信行业带来颠覆性变革。

CPO

共封装光学(CPO)是下一代 AI 服务器的关键技术。作为一种先进的封装技术,它能将基于硅光子的光学组件(即光引擎)直接集成到单个交换机 ASIC/xPU 封装或 AI 加速器中。这一设计让光信号无需通过 PCB 上的铜缆传输,缩短了电信号路径,从而显著提升能效,还能增加带宽密度。

在数据中心,提升计算能力主要有两种方式:“纵向扩展” 和 “横向扩展”。纵向扩展指通过增加计算处理器、内存或存储来提升单台服务器或单个服务器机架的性能;横向扩展则是通过增加服务器数量,将工作负载分配到多个节点上。

目前,数据中心服务器或机架内部的 “纵向扩展” 互联大多依赖铜缆。铜缆技术成熟可靠,适合短距离(1-2 米以内)的数据信号传输。而 CPO 技术尚处于初期阶段,出于更换成本和难度的考虑,它会先应用于 “横向扩展” 互联场景。

全球最大的 OSAT 企业日月光绘制的 CPO 路线图显示了该封装技术的演进路径:每一代技术中,光引擎(OE)与 ASIC 的距离都在不断缩短。目前行业正处于板载光学的商业化阶段,同时持续创新,向 CPO 这下一代技术迈进。

CPO 与传统光纤产品(如四通道小型可插拔(QSFP)或 C 型可插拔(CFP)等可插拔光收发器)有显著区别。可插拔收发器通常插在交换机的前面板上,而非直接封装在交换机的封装基板上,这样出现问题时更易维护。

相比传统光纤,CPO 的优势主要体现在以下方面:

一是减少信号损耗和延迟。CPO 将光引擎集成到 ASIC 封装或中介层上,使 ASIC 与光学器件之间的路径从传统光学的数十厘米缩短到仅几毫米,大幅降低了有意义的信号损耗和延迟。

二是降低功耗。可插拔收发器通常集成基于数字信号处理器(DSP)的重定时器,而 DSP 功耗很高,约占模块总功耗的 25%-30%。由于 CPO 中 ASIC 与光学器件的传输路径极短,基本无需 DSP 执行 “重定时” 功能,部分 DSP 功能(如信号均衡)可由系统 ASIC 集成的 模块完成。这使得 CPO 方案的能耗较传统光模块降低多达 70%。

三是外形更紧凑,扩展性更好。CPO 能节省交换机 ASIC/xPU 封装所需的高密度 PCB 成本,且外形更小巧。相比之下,可插拔收发器需占用交换机前面板大量空间,而 CPO 能突破这一限制,提供更好的扩展性。

除 CPO 外,线性可插拔光学(LPO)是光传输领域的另一种技术路线。通俗来说,LPO 是不含 DSP 的可插拔收发器,其 DSP 功能集成在 ASIC 中,因此功耗低于传统光收发器。不过,由于仍需插在交换机前面板上,LPO 在扩展性上仍存在局限。

光引擎 ——CPO 的核心

CPO 封装中所搭载的光学组件包括光子集成电路(PIC)和电子集成电路(EIC)。这两种集成电路相结合,便构成了光引擎(OE),它被安装在基板上的 ASIC 芯片周围。光引擎的一种常见制造方式是通过晶圆级封装的 “混合键合” 技术,将 EIC 堆叠在 PIC 之上。光引擎是 CPO 概念的核心所在,它是实现硅芯片上电光与光电转换的主要部件,能让系统读取来自光纤电缆的光信号。

光引擎的制造存在多种技术路径,而台积电已研发出自己的 COUPE 技术(紧凑型通用光子引擎)。这是一种通用的光子引擎技术方案,通过混合键合工艺将 PIC 和 EIC 结合,并与主机 ASIC(可能是网络交换机或 AI 加速器 xPU)封装在同一个平台上。

光子集成电路(PIC)

PIC 是一种集成了多个光学组件的部件,每个组件都有特定功能(如波导、调制器、光电二极管等)。由于具备多功能性,PIC 可能由多种不同的材料平台组合制成。例如,硅可用于制造波导和调制器,而硅锗(SiGe)则可用于制作光电二极管。

PIC 通常包含以下组件:

光纤阵列单元(FAU)

光纤阵列单元是与光引擎的 PIC 键合在一起的连接器,其作用是实现光纤电缆与交换机基板的连接。一方面,在接收路径中,FAU 将输入的光信号传入 PIC,由 PIC 将其转换为电信号;另一方面,在从 ASIC 传出信号时,FAU 引导来自外部激光源的光,供调制器将数据编码到光上,同时 FAU 内部的透镜会聚焦光并将其反射到光纤中。

由于 FAU 要与光引擎一同组装在 CPO 结构内,因此它需要采用新型材料,以承受回流焊过程中约 260 摄氏度的高温。

目前有多家 FAU 供应商,其中友达光电(FOCI,3363.TWO)计划向台积电的 COUPE 技术供应其 FAU 技术知识产权。该技术采用特殊材料,能够承受高温环境。

激光源

由于硅本身无法发光,激光源作为核心部件,为 CPO 集成的硅光子芯片提供光功率,保障整个交换系统正常运行;但同时,激光源又十分脆弱,是系统中可靠性较低、经常需要更换的部件。目前,CPO 的激光源设计主要有两种:片上激光和外部激光。考虑到激光源的脆弱性,外部激光源(ELS)已被广泛认为是更可行的选择。

将激光源设计为外置可插拔式,能解决 CPO 系统的一大可靠性难题 —— 由于它没有与交换机和光引擎(OE)封装在一起,一旦出现故障,更换起来十分方便。外部激光源通常插在交换系统的前面板上,其发出的光通过板载光纤传输到光纤阵列单元(FAU),再进入光引擎进行信号调制。此外,激光源在信号传输过程中会产生大量热量,将外部激光源置于前面板,也便于更好地进行热管理,是较为理想的设计。

连续波激光器

在基于硅光子的激光传输中,连续波激光器(CW laser)是首选。这是因为硅光子方案将 “信号调制” 功能与 “光生成” 功能分离,而传统光模块采用的是电吸收调制激光器(EML),这种激光器将两种功能集成在单一芯片上。硅光子结构的优势体现在以下几点:

虽然硅无法生成光,但它在光调制方面性能出色。

连续波激光器可通过调制技术分离出多个通道,这种方式灵活高效,在成本和空间利用上更具优势,能支持 1.6T、3.2T 及更高带宽的需求。相比之下,传统光模块使用的 EML 或垂直腔面发射激光器(VCSEL),要支持更高带宽,就需线性增加激光单元的数量。

除了在高带宽场景下扩展性更好,连续波激光器的成本也低于 EML 激光器。而且,连续波激光器的行业产能充足,供应商数量也多于 EML 激光器,能充分满足需求。

连续波激光器的调制过程在靠近 ASIC 的光引擎上完成,这有助于提升信号完整性,同时降低功耗。

CPO 量产面临哪些挑战?

尽管 CPO 在性能和成本方面优势显著,但行业在量产过程中仍需解决一系列挑战:

首先是封装工艺复杂。CPO 系统需要高度复杂的先进封装技术,如混合键合或 2.5D/3D 封装,还需实现光学耦合的精密集成、严格的测试流程和良率管理,以确保系统可靠性。

其次是硅兼容性问题。业界存在疑问:基于硅的光子集成电路(PIC),尤其是光电二极管(PD),能否在性能上实现足够突破,与采用磷化铟(InP)光电二极管的传统光模块竞争。

再者是耐久性与热管理。由于所有光学组件将紧密封装在交换机 ASIC/xPU 系统内部,组件必须能承受高温并保持稳定性能,这对耐久性和热管理提出了极高要求。

最后是可靠性问题。光引擎(OE)与 ASIC 紧密集成在同一 PCB / 基板上(未来甚至可能集成在中介层上),这意味着生产或运行中只要单个光引擎失效,整个封装(包括高成本的交换机或 xPU 芯片)就可能报废。因此,封装前对光引擎的测试至关重要,直接影响产品良率和可靠性。

超大规模数据中心短期内采用 CPO 面临哪些挑战?

云 AI 领域的持续创新,推动超大规模数据中心()对高性能计算(HPC)网络的高带宽、低延迟传输需求不断提升,同时还要求降低功耗。但超大规模数据中心可能会逐步采用这一新技术,因为它们需要先熟悉 CPO 技术及光学生态系统。

具体而言,超大规模数据中心需确保两点:一是系统可靠性(这需要时间让 CPO 通过云服务提供商验证并积累应用记录);二是互操作性(不同解决方案提供商的 CPO 技术需兼容)。

此外,铜缆技术成熟,在机架内部 800G 甚至 1.6T 的短距离互联中性能表现良好。我们认为,至少在 2025-2026 年,超大规模数据中心仍会继续使用铜缆。

CPO 的应用拐点何时会出现?

交换机有望在 2027-2028 年左右向支持 3.2T 及以上速率的 CPO 技术迁移。CPO 正逐渐成为下一代带宽扩展的关键支撑技术,尤其是当交换机的性能触及传统可插拔光学器件的极限时。从商业化和应用层面来看,有意义的拐点可能出现在 AI 数据中心升级至每端口 3.2T 的阶段,这一时间预计在 2027-2028 年。在 3.2T 速率下,CPO 相比传统光学技术的优势将更为显著,包括信号完整性提升、功耗降低、散热性能改善等。不过,要让 CPO 在 3.2T 时代具备可行性并足够成熟以实现更广泛应用,行业现在就需要开始对 1.6T 解决方案进行试用。博通、英伟达等行业领军企业已纷纷推出自家的 CPO 解决方案,比如博通 2023 年推出的 TH5 ,以及英伟达计划 2025 年推出的 -X。

博通的 TH5 CPO 解决方案将 8 个 6.4T 光引擎集成到 5 ASIC 芯片上,每个光引擎为 64 个通道供能,每个通道的带宽为 100G。该交换机的前面板支持 128 个 400G/s 的连接端口,单颗 5 芯片的总处理带宽可达 51.2T/s。近期,博通又推出了最新的网络解决方案,其中 5 月发布的第三代 CPO 技术实现了 200G / 通道的突破,6 月推出的 6 芯片支持 102.4T/s 的带宽。

英伟达的 -X CPO 解决方案将 18 个 1.6T 光引擎集成到 -X800 ASIC 芯片中,每个光引擎为 8 个通道供能,每个通道的带宽达 200G。该解决方案的前面板支持 144 个 800G/s 的连接端口,4 颗英伟达 -X800 ASIC 芯片的总处理带宽可达 115.2T。

此外,英伟达还推出了 -X 以太网 CPO 解决方案,计划于 2026 年开始出货,该方案将 36 个光引擎集成到交换机 ASIC 芯片上。

现在对 1.6T CPO 解决方案进行试用至关重要,这有助于推动整个生态系统走向成熟:既能提高封装和集成的良率,验证系统的热管理能力,还能建立互操作性标准。尽管 1.6T CPO 解决方案可能不会得到广泛部署,但它是行业在未来几年推动交换机向 CPO 技术全面过渡的重要一步。

xPU 对 CPO 的采用会稍晚一些,但长期来看可能会推动 CPO 实现更大的出货量。

我们预计,xPU 向 CPO 的转型会比交换机稍晚,可能在 2028-2030 年。台积电 2024 年底发布的技术路线图显示,基于中介层集成的 xPU 相关 CPO 仍处于探索阶段。xPU 向 CPO 迁移速度较慢,原因在于其集成复杂度显著更高,且受到热管理方面的限制。GPU 和 AI 加速器的功率密度极高,在这样的热约束环境中集成光引擎,可能会带来散热、光学对准可靠性等方面的风险。由于光学器件对热量极为敏感,xPU 中的 CPO 架构需要同时优化光学器件的热稳定性和冷却系统设计,以确保光学操作的稳定运行。

尽管如此,当基于 xPU 的系统开始集成 CPO 时,其潜在出货量可能会远超交换机,尤其是对于需要高密度互联的纵向扩展 xPU 服务器而言。长期来看,随着 AI 服务器不断发展,在成本、功耗和密度方面实现进一步优化,CPO 有望成为一种日益重要的形态。

行业信息交流

英伟达B系列服务器,国内也可以拿到货,我们可以开始接样品订单了,有兴趣的朋友可以加微信,请备注所在行业:

知识星球

CPO