来源:内容由半导体行业观察(ID:icbank)原创,作者:李飞,谢谢。
随着人工智能等数据中心新应用的出现,用于数据中心的基于硅光子技术的数据互联市场也在逐渐变热。三月是硅光技术非常热闹的一个月,AMD/Xilinx刚宣布和Ranovus合作发布了一款将Versal ACAP和Ranovus的Odin光通信模组集成在一起的系统,Marvell也同时发布了其400G DR4硅光平台,而GlobalFoundries也发布了其硅光子工艺平台Fotonix。本文将对硅光子技术的前景做一些分析,我们认为在未来硅光子技术会在数据中心中扮演越来越重要的角色,且其技术发展将会向着成本和功耗更低、体积更小的方向演进。
硅光子技术在数据中心中的应用
传统上,基于光的通信主要是用在长距离高速通信中,例如大家熟悉的光纤宽带入户就是这样的长距离高速有线通信的一个重要例子。在数据中心中,常用的数据互联是基于铜电缆的通信。
然而,在最近几年,随着人工智能等应用的兴起,数据中心中也在走向基于光通信的数据互联。这主要的原因在于,人工智能等应用将对于数据互联带宽的需求大大提升了,而常规的铜电缆互联越来越难以满足需求。例如,在人工智能应用中,数据中心常常需要进行大量分布式计算,而分布式计算中,不同服务器之间需要频繁的大量数据交换,数据互联的带宽往往会限制整体任务的性能。这也是大数据时代的一个特点,即算法为了处理海量数据,数据访问的性能和计算性能几乎一样重要,有时候甚至更重要;而随着算法规模越来越大,需要使用多台服务器进行分布式计算的场合也越来越多,因此服务器之间的高速数据互联就成为一个极其重要的核心技术了,而这成为数据中心引入超高带宽基于硅光子的数据互联的主要理由。在几年前,人工智能刚刚兴起时,Nvidia就凭借和Mellanox的合作在机器学习训练中引入基于光互连的InfiniBand从而助力高性能训练,而到了今天类似的超高速光互联已经几乎成为数据中心的标配。
在未来,我们认为大数据和人工智能将继续成为驱动数据中心市场的主要动力。正因为如此,未来数据中心对于基于光的数据互联的需求可望进一步增加,而这也将进一步提升硅光子的市场规模,我们也因此看到了半导体业界的几大巨头都在积极布局相关的硅光子技术。
硅光子技术与CMOS芯片设计
我们认为,硅光子技术目前正在经历一场重要的技术革新,其中的核心技术就是协同封装光子(co-packaged optics,CPO)技术,使用该技术可以把硅光子模块和超大规模CMOS芯片以更紧密的形式封装在一起,从而在成本、功耗和尺寸上都进一步提升数据中心应用中的光互连技术。
CPO技术的主要是指把硅光模块和CMOS芯片用高级封装的形式(例如2.5D或者3D封装)集成在一起。在CPO技术兴起之前,目前的传统技术是把硅光模块和CMOS芯片独立成两个单独模块,然后在PCB板上连到一起。这么做的好处设计较为模块化,CMOS芯片或者硅光模块单独出问题的化都可以单独更换,但是在功耗、尺寸和成本上都较为不利。例如,由于硅光模块的输出是超高速数据,这些数据使用PCB板连接到CMOS芯片上会遇到较大的信号耗损,因此需要恨到的功耗才能支持高数据率。此外,成本上要设计支持超高速信号的PCB也需要较高的开销,而在尺寸上来说分立的硅光模组和CMOS芯片通常集成度更低,这也限制了进一步提升数据中心中的服务器密度。
而CPO就是为了解决这些问题的技术。当使用高级封装技术把硅光模块和CMOS芯片集成到同一个封装内之后,首先硅光模块和CMOS芯片之间的数据连接质量(信号耗损)相比PCB板来说要改善不少,因此能降低功耗;另一方面在大规模量产之后,高级封装也能带来成本上的改善。最后,使用CPO之后,由于都集成在同一个封装内,整体系统的集成度大大提升,尺寸减小,因此也能提升硅光子技术在数据中心应用场景的普及。
目前,众多硅光子领域有投资的巨头都在大力发展CPO技术。如前所述,硅光子技术带来超高速互联是人工智能等分布式高性能计算的核心技术,因此以数据中心为主要市场的公司如Nvidia和AMD都对于CPO有大量布局和投入。Nvidia自从收购Mellanox之后,也进一步强化了其在高性能光互连方面的能力,而在CPO方面Nvidia也公布了其目前的在研技术,即使用CPO技术把GPU和硅光子芯片集成在同一个封装内,以同时支持24路NVLINK,从而实现4.8Tbps的超高速互联。
而在数据中心中与Nvidia直接竞争的AMD则也在大力布局CPO技术,日前公布的和Ranovus的合作我们认为就是AMD对于CPO的重要投资。Ranovus是CPO领域的重要技术创新公司,它和TE Connectivity,IBM和Senko共同研发的CPO技术目前已经实现了把硅光子模块和收发模块以很高的集成度集成在同一块芯片中(而非常规的CPO技术中硅光子模块和收发模块仍然是两块单独的芯片),从而实现了更好的集成度和性能。Ranovus把自己的独特技术称为CPO 2.0,我们也预期AMD通过与Ranovus合作可以进一步提升自己在数据中心光互联领域的能力。
除了主要用于自家高性能计算系统的Nvidia和AMD,Broadcom和Marvell等重要的网络通信提供商也在硅光子和CPO领域有不少投入。Marvell刚刚在OFC大会上发布了其400G DR4硅光芯片,具有很高的集成度,包括收发模块和激光驱动模块,该芯片通过CPO技术和Marvell的Teralynx网络开关集成在一起,实现了超高数据带宽。
硅光技术的工艺平台
在工艺方面,GlobalFoundries是硅光子技术方面的投入程度可能是几家主流代工厂中最积极的。在硅光子技术方面,GlobalFoundries从数年前就开始积极布局,目前能提供先进的硅光子工艺平台,包括各种光波导、相移器、极化器、光二极管等等,除了硅光子工艺之外,GlobalFoundries还提供高级封装选项,帮助客户实现CPO技术。在GlobalFoundries刚刚发布的Fotonix平台中,更是进一步把硅光子和CMOS整合在同一块芯片上,从而能实现更高的性能和集成度。根据GlobalFoundries公布的资料,目前其Fotonix平台的客户包括Broadcom,Marvell,Nvidia,Cisco,Ranovus等硅光子领域的重要厂商,未来前景大有可观。
除了GlobalFoundries之外,Intel也在积极布局硅光子的工艺技术。在高速网络交换芯片市场,Intel正在力推其Tofino方案,其中也包括了自研的硅光子技术和高级封装技术。Intel在这两个领域其实技术积累较为深厚,在六年前,现任Intel CEO Pat Gelsinger(当时还是副总裁)就在力推硅光子技术,并且认为硅光子在未来一定会成为主流技术。凭借Intel在硅光子工艺和封装技术领域的积累,我们认为未来Intel也将会成为该领域的有力竞争者。
总而言之,我们认为在未来,硅光子的主要技术演进将集中在更高集成度,以及和CMOS芯片的封装上面,而先进的硅光子制造工艺以及封装技术将会成为硅光子技术演进的核心技术支撑。