2023年以来,大模型训练引爆了算力需求的快速增长。随着算力资本开始攀升,市场对于算力是否过剩、AI是否泡沫化的讨论热度逐渐增加。在此背景下,后来居上的Gemini 3模型及其背后的TPU芯片引发了广泛关注和讨论。
TPU芯片集群基于全光交换(OCS)技术,走出了一条独特的规模化路径——不苛求单芯片性能的巅峰,而是通过高效的光互联,将成千上万个计算单元融合为一个“虚拟超级计算机”。
一、OCS:重新定义芯片互联的智能光路调度
算力中心的构成不仅只有芯片,还包括交换机、高速互联、光模块、机柜系统、散热与能耗管理等完整的技术体系。随着算力规模持续膨胀,算力中心的建设也正从“堆叠更多芯片”转向“打造整体算力系统”。
在交换机方面,传统的 OEO(光-电-光)主要实现光信号与电信号的相互转换,但其速度、耗电发热等方面均有较多局限。随着数据量爆炸式增长,传统光电交换OEO的性能瓶颈愈发明显。而OCS(全光交换)则是让信号在光路中直接“直通”,不再反复转换,因此通常速率快、带宽升级灵活,同时OCS还能较好地利用光纤带宽、显著降低能耗,且容易扩展到成千上万的端口。
而TPU Ironwood超级集群,区别于GPU数据中心的关键就是靠OCS把9216颗TPU直接互联成一个统一的大算力系统,相当于把几千颗“芯片小岛”连成了一块“算力大陆”。整个系统能提供42.5 EFLOPS(FP8)的算力和1.77 PB的 HBM 内存,像一台巨型超级计算机一样协同工作。
得益于OCS的全光架构,该网络性能出现了质变:吞吐提升30%,功耗下降40%,流量完成时间缩短10%,故障时间减少到原来的1/50,资本开支降低30%。
总的看来,TPU借助OCS可以把多个模块随时组合成大网络,让数千颗芯片共享带宽和内存,实现真正的大规模协同训练。这也让超大模型可以更高效地调度和扩展。

图1. Ironwood超级集群
下图展示了在 TPU 集群中TPU芯片、OCS交换机与光模块之间的信号传输路径,说明数据是如何在超大规模系统内进行高速互联的。

图2. TPU集群信号传输
二、OCS主流技术方案
OCS最早用于传统电信,如今在AI数据中心因超大带宽和低时延需求而加速普及。当前OCS主要有多种技术路线,各方案在端口规模、插损和切换速度等方面各有特点。
表1. OCS技术路线对比

资料来源:中泰证券
其中,MEMS OCS是最主流的技术,产业链完善,已在海外龙头企业TPU集群中大规模部署,是当前商业化最成熟的方案。
按成本拆分数据,单台MEMS OCS的BOM成本约2-2.5万美元,售价约6万美元,成本主要来自MEMS阵列、光纤阵列、透镜阵列、环形器与光电模组,其中阵列部分占比最高,是决定性能与成本的核心。
三、市场前景与产业机遇
随着OCS在AI大规模集群中的快速落地,产业链正迎来高速增长期。根据QYResearch,全球OCS市场规模已从2020年的7200万美元增长至2024年的3.6亿美元,CAGR高达49.8%;Cignal AI预计,在海外龙头MEMS OCS的带动下,2025年市场规模约4亿美元,并将在2029年突破16亿美元,2025–2029年 CAGR约41%。目前A股相关企业毛利率约34%,行业盈利能力持续提升。
在应用端,以TPU v4p为例,一个包含 4096 颗TPU的集群需配置48台OCS、总端口超过6500个,单一集群的光交换需求即具备可观价值。随着算力建设加速,2026年TPU 出货量有望达到400万颗,为OCS需求提供持续动能。LightCounting预计,2029年全球OCS出货量将突破5万台,全光交换将成为AI数据中心的关键底座。
以TPU集群为代表的新型算力体系正成为当前算力需求的“第二解法”。
回到市场当下的疑虑:算力是否已经过剩?从 TPU 集群的演进中,我们看到的不是需求的停滞,而是行业对算力极限、对算力体系革新的持续探索与不懈追求。
随着算力结构从单一路径向多元化演进,光模块、OCS等底层互连环节的需求呈现同步放量趋势,也带来了更大的产业延展空间。相应领域的布局工具如云计算ETF汇添富(159273)可作为关注方向。
与此同时,算力芯片生态也在从通用GPU向ASIC专用芯片加速分化。随着大模型场景进一步精细化,专用芯片所代表的“第二路径”正在打开更广阔的创新和产业化空间。围绕专用芯片产业链的工具,如科创芯片50ETF(588750)、芯片50ETF(516920),同样值得跟踪。
风险提示:基金有风险,投资需谨慎。投资人应当阅读《基金合同》《招募说明书》《产品资料概要》等法律文件,了解基金的风险收益特征,特别是特有风险,并根据自身投资目的、投资经验、资产状况等判断是否和自身风险承受能力相适应。基金管理人承诺以诚实信用、谨慎尽责的原则管理和运用基金资产,但不保证基金一定盈利或本金不受损失。科创芯片50ETF属于较高风险等级(R4)产品,适合经客户风险承受等级测评后结果为进取型(C4)及以上的投资者。其余基金属于中等风险等级(R3)产品,适合经客户风险承受等级测评后结果为平衡型(C3)及以上的投资者。请投资者关注指数化投资的风险以及集中投资于SHS云计算指数、科创芯片指数、芯片产业指数成分股的持有风险,请关注部分指数成分股权重较大、集中度较高的风险,请关注指数化投资的风险、ETF运作风险、投资特定品种的特有风险等。云计算ETF汇添富投资范围包括港股,会面临因投资环境、投资标的、市场制度以及交易规则等差异带来的特有风险。文中提及个股仅为指数成份股客观展示列举,本文出现信息只作为参考,投资人须对任何自主决定的投资行为负责。本文中的任何观点、分析及预测不构成对阅读者任何形式的投资建议
来源:有连云
重要提示:本文仅代表作者个人观点,并不代表乐居财经立场。 本文著作权,归乐居财经所有。未经允许,任何单位或个人不得在任何公开传播平台上使用本文内容;经允许进行转载或引用时,请注明来源。联系请发邮件至ljcj@leju.com,或点击【联系客服】