棋子 · 2023年12月06日

[科普]一文读懂PCIe Retimer芯片

本文来自广发证券发展研究中心

文章大纲

  • PCIe Retimer芯片概况

    解决信号衰减问题

    AI服务器是主要应用场景之一

  • PCIe Retimer芯片量价齐升

    量增来源

    2026年市场规模预计

  • PCIe Retimer芯片厂商

    海外厂商

    国内厂商:澜起科技

PCIe Retimer芯片概况

PCIe协议

PCIe协议持续更新换代,每代升级传输速率翻倍。总线是为服务器主板上不同的硬件进行互相数据通信的“道路”,单位时间内数据传输量被称为带宽,即每秒传输的比特数。总线对硬件间数据传输速度起决定性作用,在服务器对计算速度和时延等要求不断提高背景下,计算机总线标准也在不断迭代。目前最主流的总线为PCIe协议(PCI-Express),由Intel在2001年提出,以替代旧的PCI、PCI-X和AGP等总线标准.PCIe协议近年来发展迅速,传输速率基本上实现了每3-4年翻倍增长,并保持良好的向后兼容特性。PCIe协议由PCIe 3.0发展为4.0,传输速率已从8GT/s提升到16GT/s,到PCIe 5.0,传输速率将进一步提升到32GT/s。2022年1月,PCI-SIG协会正式发布了PCIe 6.0标准规范,传输速率再次翻倍,达到64GT/s。行业层面目前主流应用层面仍处于PCIe4.0往PCIe 5.0的升级中。

图表1:PCIe发展历程

image.png

数据来源:TI官网,广发证券发展研究中心

图表2:PCIe带宽升级情况

image.png

数据来源:PCI-SIG 官网,广发证券发展研究中心

PCIe传输速率的大小由通道数Lane决定。一般而言,每个通道lane由两对数据线组成,一对Tx(负责发送),一对Rx(负责接收),每对数据线包含两根差分线。1个连接通道lane称为X1,集4根数据线。依次类推,X2就有2个lane,含8根数据线。X8、X16、X32也如此。通道数决定了端口支持的总带宽,通道的总带宽分为发送数据和接收数据。以PCIe 5.0为例,其标准要求每通道8GB/s的传输速度,即带宽为 8 GB/s 的单通道可以同时发送4 GB/s和接收4GB/s。即对应的PCIe接口芯片和相关芯片的价值量也会与通道数正相关。

解决信号衰减问题—— PCIe Retimer芯片成为未来主流解决方案

随着通信速率逐代提升,信号衰减问题愈发严重。在PCIe标准迭代中,一方面随着应用不断发展推动着PCIe标准迭代更新,速度不断翻倍,另一方面由于服务器的物理尺寸受限于工业标准并没有很大的变化,导致整个链路的插损从PCIe3.0时代的22dB增加到了PCIe4.0时代的28dB,并进一步增长到了PCIe5.0时代的36dB。如何解决PCIe信号链路的插损问题,提高PCIe信号传输距离是业界面临的重要问题。
解决信号衰减问题的方案,主要分为三种:选用更低损失PCB板,使用Redriver芯片,使用Retimer芯片。以下我们将具体分析为什么PCIe Retimer芯片可成为未来主流解决方案。

图3:PCIe3.0与4.0信号衰减模型

image.png

数据来源:TI 官网,广发证券发展研究中心

图4:通过24dB信号衰减后滤波器显示失真

image.png

数据来源:PCI-SIG 官网,广发证券发展研究中心

低损PCB方案:数据传输速率升级加快,升级PCB难以具备性价比。据TI给出的数据可知,PCIe3.0及以前版本,主板PCB多采用FR4材料,该板材能够良好的支撑8Gbps的数据传输速率,但PCIe4.0诞生后,带宽速度增加到16Gbps,此时FR4板材的性能已经不足以满足高速传输,需要更低损耗的PCB板材,但与此同时带来的是成本的高升。而PCIe升级到5.0时代,带宽再次翻倍,达到了32Bbps,对PCB板再次提出了更高的要求。实际上,带宽速度每提升一点,采取更换PCB板的方案下,带来的边际成本会递增,且并不能有效覆盖多连接器应用场景。因此出现了更具性价比的方案,分别为使用信号放大芯片Redriver或信号恢复芯片Retimer。

图5:不同版本PCIe的技术指标与板材选择

image.png

数据来源:TI 官网,广发证券发展研究中心

图6:PCIe 5.0后升级PCB的成本越来越高

image.png

数据来源:AsterLabs,Servethehome,广发证券发展研究中心

Redriver方案:Redriver是一种信号放大器,旨在提升信号的高频部分,以抵消由互连引起的频率相关衰减,通过在Rx端的均衡器补偿线路损耗。从工作原理来看,Redriver通过放大信号来恢复数据,而Retimer则建立一个重新传输信号的新副本。
Retimer方案:Retimer芯片是一种混合信号模拟/数字芯片,其原理是使用内部的时钟恢复电路,重新定时输入信号以消除时钟偏移和抖动,并校正信号的相位和时间偏差(jitter)。它可以延长接口的传输距离并提高信号质量,PCIe Retimer芯片主要解决数据中心、服务器通过PCIe协议在数据高速、远距离传输时,信号时序不齐、损耗大、完整性差等问题。相比于市场其他技术解决方案,现阶段Retimer芯片的解决方案在性能、标准化和生态系统支持等方面具有一定的比较优势。值得一提的Retimer芯片可以灵活地切换PCIe或CXL模式,更符合未来CXL互连趋势。

图7:Redriver的内部构成

image.png

数据来源:PCI-SIG 官网,广发证券发展研究中心

图8:Retimer芯片内部构成

image.png

数据来源:PCI-SIG 官网,广发证券发展研究中心

Retimer成为解决信号衰减最具性价比的方案。总的来说,相比于更换高速PCB板材,在主板上集成一颗Retimer芯片将会大大降低成本;而相对于Redriver芯片而言,Retimer信号恢复能力更强,数据传输距离更远,能够有效的恢复原始数据,并且能够在大体积的服务器中实现远距离的硬件高速通信,有助于实现AI计算领域的大规模数据传输。从PCI-SIG给出的仿真图可以看出,Redriver增强了衰减的信号,并同时放大高频信号。而Retimer则完全的恢复了数据,同时也能看到更多的细节。根据PCI-SIG官网资料显示,双链接器转接卡拓扑结构中,信号可能会产生超过PCIe4.0标准的28dB损耗,但安装Retimer芯片的拓扑结构中,信号恢复的十分出色,细节还原的十分清晰,而安装Redriver的拓扑结构,信号有所恢复,但恢复程度不及Retimer芯片。

图9:Redriver和Retimer增强已衰减信号效果图

image.png

数据来源:PCI-SIG 官网,广发证券发展研究中心

图10:Redriver与Retimer增强衰弱信号的效果差异

image.png

数据来源:PCI-SIG 官网,广发证券发展研究中心

AI 服务器是 Retimer 芯片主要应用场景之一

AI服务器增量渗透提升可大力拉动Retimer芯片需求提升。 由于PCIe Retimer在解决信号衰减上的性能优势,以及一些偏复杂和高端的服务器、企业存储、异构计算和通信系统对信号完整性有较高需求,因此在当前的PCIe 4.0时代,Retimer芯片目前的常见应用场景为NVMe SSD,Riser卡和AI服务器等。同时,PCIe5.0也在持续渗透中,PCIe 5.0可以提供比PCIe 4.0高两倍的带宽,可以实现更快更高效的数据传输。如前文已解释,Retimer芯片技术路径的优势更加明显,Retimer 芯片的需求呈“刚性化”趋势。
因此,我们总结来看,Retimer芯片的需求增加主要来自于:(1)以上几个典型应用场景的需求增加,其中又以AI服务器需求明显增量为主;(2)PCIe5.0升级推动通用服务器朝选用Retimer芯片到开始标配Retimer芯片趋势发展。

图11:PCIe Retimer芯片的典型应用场景

image.png

数据来源:澜起科技官网、广发证券发展研究中心

新发布的 CPU、GPU、SSD、主板等均开始支持 PCIe 5.0。PCIe 协议传输速率的快速提升需要依托于强大的生态系统,平台厂商、芯片厂商、终端设备厂商和测试设备厂商的深入合作,因此生态内各个环节是否支持 PCIe 5.0 是其渗透的关键。观察 PCIe 5.0 的渗透节奏之一就是观察支持 CPU 主芯片平台、SSD 等是否支持PCIe5.0。以服务器 CPU 为例,从 Intel 发布的服务器端第十二代处理器 Alder Lake已开始支持 PCIe5.0,2023 年 Intel 发布的新一代 DDR5 CPU Sapphire Rapids 也同样支持 PCIe5.0。随着支持 PCIe5.0 的主流服务器 CPU 正式上量后,同时随着传输速率从 PCIe4.0 的 16GT/s 到 PCIe5.0 的 32GT/S,再次实现翻倍,Retimer 芯片技术路径的优势更加明显,Retimer 芯片的需求有望更加明确。

PCIe Retimer芯片量价齐升

量增来自于 AI 服务器需求增加 与 PCIe 5.0 渗透率

AI 服务器可配置多达 8 颗 Retimer 芯片。AIGC 大潮催生各种大模型训练需求,相应拉动了 AI 服务器需求。AI 服务器内部,除了 CPU 与 CPU,CPU 与 SSD或 NIC 之间通信,更新增了 GPU 与 CPU,GPU 之间通过总线 PCIe 互联的通信需求,因此需要 Retimer 芯片以保证大规模的数据传输信号的稳定性。根据AsteraLabs,一台 8 卡 GPU 的 AI 服务器需要 8 颗 PCIe 4.0 Retimer 芯片。据Trendforce 数据,2023 年,由于 Microsoft、Meta、百度与字节相继推出基于 AIGC衍生的产品服务而积极加单,预估 2023 年 AI 服务器出货量年增率可望达 15.4%,Trendforce 也上调 2023~2027 年 AI 服务器出货量年复合成长率至 12.2%。本轮AIGC 的产业趋势明确,AI 服务器增量明显,可明显拉动 PCIe Retimer 的需求。

图12:Trendforce上调AI服务器增长率

image.png

数据来源:Trendforce,广发证券发展研究中心

图13:Retimer在AI服务器中的配置数量可达8颗

image.png

数据来源:AsteraLabs 官网,广发证券发展研究中心

通用服务器方面,Retimer芯片长期增长趋势明确。根据AsteraLabs的应用方案来看,Retimer芯片可用在NVMe SSD,NIC,Riser卡等多达8个应用场景,即在某一场景下,增强信号完整性,用以提升性能的“功能性”芯片,并不意味着每一处均要标配,即单服务器用量不等。但是较为明确的装备场景除了上文的AI服务器外,还有Riser卡、NVMe SSD扩展卡等。以及随着PCIe 5.0的渗透提升,通用服务器的主板上还有在距离CPU较远的Endpoint间使用PCIe Retimer芯片,具体如下:
(1)通用服务器:PCIe 5.0速度(32 GT/s)下的信号损耗对于最远的CEM插槽(距离CPU>5英寸)可能过高。一般而言,PCB材料升级过于昂贵,无法解决9英寸以上插槽的覆盖问题。因此对于一些距离CPU较远的硬件,如在图15的AsteraLab的方案中,若距离超过9英寸(22.86cm)则可使用1颗Retimer芯片。
(2)NVMe SSD扩展卡:PCIe Retimer芯片也多用于SSD扩展卡上以提升信号完整性,增加高速信号的有效传输距离。如图16所示,可配2-3颗Retimer芯片。
(3)Riser卡:Riser作用是为了增加计算机机箱内更多的扩展插槽,以便于更多地安装不同类型的硬件设备,例如显卡、SSD和网卡等。部分Riser卡会集成1颗Retimer芯片来扩展PCIe信号的范围,以便将GPU或其他PCIe设备连接到远程计算机或服务器。

图14:AsteraLab的Retimer IC潜在使用场景多达8处

image.png

数据来源:AsteraLabs 官网,广发证券发展研究中心

图15:升级到PCIe 5.0后,Retimer芯片或成刚需

image.png

数据来源:AsteraLabs 官网,广发证券发展研究中心

图16:Retimer在需配置SSD扩展卡情况下的配置情况

image.png

数据来源:AsteraLabs 官网,广发证券发展研究中心

图17:Retimer 5.0芯片集成在NVMe SSD的参考设计

image.png

数据来源:澜起科技产品手册,广发证券发展研究中心

图18:Retimer 5.0芯片集成在NVMe SSD的参考设计

image.png

数据来源:澜起科技产品手册,广发证券发展研究中心

图19:AsteraLabs Riser卡上集成1颗Retimer芯片

image.png

数据来源:AsteraLabs 官网,广发证券发展研究中心

总结来看,一台PCIe4.0通用服务器的Retimer芯片,并不确定,但是到了PCIe 5.0,通用服务器有望至少配置1颗Retimer芯片。我们假设PCIe 5.0渗透后,一台通用服务器配1-2颗Retimer芯片。
PCIe5.0 Retimer芯片价值量是PCIe4.0 Retimer IC的2倍。PCIe 4.0 Retimer芯片价格我们采用德州仪器两款Retimer芯片的均价24美金,PCIe 5.0 Retimer芯片价格采用AsteraLabs的PT5081与PT5161的平均报价,约48.5美元,由于目前5.0 Retimer 芯片仍为新推出产品,价格约是4.0 Retimer芯片的2倍。一方面,随着PCIe5.0持续渗透,Retimer芯片市场空间将更加广阔,另一方面,我们预计PCIe 5.0的价格也会有所下降。

表 1:PCIe4.0/5.0 Retimer 芯片价格

image.png

数据来源:AsteraLabs 官网,TI 官网,广发证券发展研究中心

PCIe Retimer 芯片市场 2026 年 市场规模预计可超 7 亿美金 

由于PCIe Retimer芯片广泛用于服务器领域,我们分别以AI服务器和通用服务器两个维度对Retimer芯片市场空间进行测算,其中通用服务器的用量已考虑SSD扩展卡,Riser卡等情况。在价格方面,考虑到2022年Retimer芯片还大规模出货,单颗Retimer芯片价格仍然较高,我们预计随着Retimer芯片出货量逐年增加,Retimer芯片的ASP将逐年降低。其中2022年PCIe4.0 x16和5.0 x16 Retimer芯片价格分别平均为24和48.5美元,并预计价格有一定程度年降。我们测算逻辑和结果简要展示如下:
(1)AI服务器为Retimer带来增量。根据Tendforce对AI服务器出货量的预测,加上参考AsteraLabs的方案,每台AI服务器配备8颗Retimer芯片,测算得2026年增长至5416.7万美元。
(2)通用服务器为Retimer带来长期增量。基于上文分析,一台PCIe4.0通用服务器的Retimer芯片,并不确定,但是到了PCIe 5.0,通用服务器有望至少配置1颗Retimer芯片。我们假设PCIe 5.0渗透后,一台通用服务器配1-2颗Retimer芯片。并预计平均单服务器使用1-2颗PCIe Retimer x16芯片,预计2026年通用服务器PCIe Retimer芯片市场规模约6.73亿元。整体PCIe Retimer芯片市场空间到2026年约7.27亿元。

表 2:PCIe Retimer 市场空间测算

image.png

资料来源:TI 官网,TrendForce,IDC,AsteraLabs 官网,广发证券发展研究中心

PCIe Retimer芯片厂商

海外厂商:各大厂商陆续推出 PCIe5.0Retimer 芯片

竞争格局偏蓝海,主要被海外厂商占据。目前PCIe Retimer市场主要玩家为服务器数模芯片厂商谱瑞、澜起科技、AsteraLabs、IDT(被瑞萨收购)、以及传统的模拟芯片厂商TI、Microchip也参与其中。谱瑞作为Retimer市场最早的加入者之一,产品通过Intel、AMD等平台的认证,成为全球主要的Retimer供应商之一;AsteraLabs在新思科技的IP授权助力下,成为最先发布PCIe5.0Retimer的公司。
AsteraLabs是全球最先推出并量产PCIe5.0Retimer芯片的厂家。AsteraLabs公司提供的Retimer芯片经过了行业的验证,可以有效克服PCIe4.0和PCIe5.0系统的信号完整性问题。其中AsteraLabs的PCIe4.0 Retimer芯片包括PT4161和PT4080两种规格,PT4161提供X16 PCIe通道,PT4080提供X8 PCIe通道;AsteraLabs的PCIe5.0 Retimer芯片包括PT5081和PT5161两种规格,PT5081提供X8通道而PT5161提供X16通道。据官网介绍,AsteraLabs的Retimer芯片专为高性能服务器、
存储、云计算和工作负债优化系统而构建。根据公司产品介绍,其PCIe5.0 Retimer芯片PT5161L可以满足32GT/s速率情况下,将信号扩展36dB,最大程度减轻材料成本。

谱瑞可量产PCIe4.0Retimer,最新PCIe5.0Retimer芯片已发布。谱瑞目前拥有PCIe3.0,PCIe4.0以及PCIe5.0 remtier芯片的产品线。其中PCIe4.0 Retimer芯片包括PS8925和PS8926两种规格,PS8925提供X4 PCIe通道,PS8926提供X16 PCIe通道;而最新的PCIe5.0 Retimer PS8936是一款双向16通道Retimer芯片,数据传输速率达到32Gbps,具备低延迟,适用于工作站、企业数据中心系统,包括存储和服务器。

图20:AsteraLabs PT5161系列典型应用

image.png

数据来源:AsteraLabs 官网,广发证券发展研究中心

图21:谱瑞PCIe5.0 remtier芯片PS8936结构

image.png

数据来源:Parade 官网,广发证券发展研究中心

Microchip已发布支持PCIe5.0以及CXL2.0的Retimer芯片。Microchip在2020年发布了XpressConnectPCIe 5.0和CXL Retimer系列芯片,包括PM8658和PM8659两款芯片,前者是8通道的,后者则是16通道的。每个芯片可以支持多个x1、x2或x4的链路,并且广泛符合英特尔对BGA封装和PCIe重定时器引脚排列的规范。这些Retimer具有非常低的延迟,可以做到管脚延迟少于10ns,并且可以支持分支到更小的链路宽度。这些Retimer可以用于英特尔PCIe转接板的参考设计中,并且从2021年开始大规模生产,是高速数据传输领域的有效解决方案之一。

图22:Microchip的PCIe5.0 Retimer芯片

image.png

数据来源:Microchip 官网,广发证券发展研究中心

图23:Microchip Retimer芯片应用场景

image.png

数据来源:Microchip 官网,广发证券发展研究中心

澜起科技:大陆唯一能量产  PCIe 4.0 Retimer 的供应商 

澜起PCIeRetimer是目前大陆唯一能量产PCIe 4.0 Retimer芯片的供应商。公司于2018年启动PCIe Retimer相关芯片研发,PCIe4.0 Retimer芯片于2020年完成研发,功耗和传输延时等关键性能指标达到国际先进水平。随着支持PCIe4.0的主流服务器CPU在2021Q2正式上市,公司的PCIe4.0Retimer芯片逐步导入市场,公司也成为全球量产PCIe4.0 Retimer芯片的主要厂商中唯一的本土公司。2021年公司的PCIe4.0 Retimer芯片实现营收1220万元,达到了从0到1的突破。其产品可应用于NVMeSSD、AI服务器、Riser卡等典型应用场景。

图24:澜起PCIe 5.0 Retimer芯片已成功量产

image.png

数据来源:澜起科技官网,广发证券发展研究中心

图25:澜起PCIe 5.0 Retimer芯片结构图

image.png

数据来源:澜起科技官网,广发证券发展研究中心

公司PCIe5.0Retimer芯片于2023年1月成功量产,成为国内首家可提供PCIe5.0 Retimer芯片的厂家。该芯片产品型号为M88RT51632。M88RT51632是一款高性能的16通道PCIe 5.0/CXL 2.0 Retimer芯片,符合PCIe 5.0基本规范,支持PCIe/CXL两种工作模式,支持业界主流封装。这款PCIe5.0 Retimer芯片技术特性如下:在兼容性上,符合PCIe5.0的规范,能够反向兼容PCIe4.0及以下规范;在时钟支持方面,采用标准100MHz参考时钟,支持100MHz参考时钟输出;在可靠性、可用性及可维护性方面,支持Rx裕量测试,支持多项DFX功能,方便调试,提供lane/port错误诊断寄存器。在应用场景方面,主要面对服务器、存储设备、通信设备和硬件加速器。除此之外,公司正积极投入下一代PCIe 6.0 Retimer芯片的研发,以打造更加丰富的产品组合。

表3:澜起科技PCIe Retimer芯片的研发进程

image.png

数据来源:澜起科技年报,2023年1月投资者交流会议,广发证券发展研究中心

资料来源:广发证券发展研究中心

作者:广发证券
文章来源:信号完整性

推荐阅读

更多IC设计干货请关注IC设计专栏。欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。
推荐阅读
关注数
20201
内容数
1307
主要交流IC以及SoC设计流程相关的技术和知识
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息