半导体行业观察 · 6月11日 · 安徽

GDDR7大战:谁将成为下一代显卡霸主?

引言:存储器是人工智能的驱动力。HBM战火还在愈演愈烈,另一边伴随着美光GDDR 7的送样,GDDR 7大战正在悄然打响。

GDDRGraphics Double Data Rate的缩写,全称为双图像倍数据速率它是一种专为图形处理单元(GPU)设计的同步双数据速率动态随机存取存储器(SDRAM)。1998年,三星电子推出了首款16 Mb GDDR内存芯片。自此拉开了GPU和CPU在内存道路上的分道扬镳。起初,显卡内存兼容CPU内存,主要使用DDR内存,然而鉴于图像处理需求逐年攀升,显卡逐渐转向采用专门为图形处理器(GPU)设计GDDR。由于GDDR具有更高的数据传输速率和带宽,在推动GPU的发展过程中起到了很关键的作用。

GDDR技术发展历程

历经二十余年发展,GDDR家族已经迭代至第七代,GDDR家族主要有GDDR、GDDR2、GDDR3、GDDR4、GDDR5 和 GDDR6,以及最新推出的GDDR 7。在此,我们先看下前六代的技术和性能上的情况。

来源:imec

虽然GDDR专为GPU设计,但是最开始的一二代GDDR和GDDR 2并没有比DDR提升很多,因此也没得到GPU厂商的大规模采用。所以GDDR的正式被认可和迭代可以说是从GDDR3开始。

自GDDR3开始,Nvidia和AMD等主要GPU厂商的参与使得GDDR标准得到了大幅提升,得益于制程工艺的不断进步,GDDR3内存的数据传输速率从最初的1GHz一路攀升至2.5GHz,实现了大幅提升,并保持了长达五年的生命周期,为现代图形处理和计算提供了强大的支持。

GDDR4在GDDR3的基础上,进一步提升了数据传输速率和能效。虽然GDDR4在技术上取得了进步,但由于当时NVIDIA和ATI之间对于GDDR 4标准意见相左,且存在激烈的竞争关系,NVIDIA没有采用GDDR 4,这导致其市场占有率相对有限,成本很高,GDDR4很快就被历史所遗忘。

GDDR5大幅提升了带宽和速度,成为2008年后高性能显卡的标配。GDDR5具有更高的时钟频率和数据传输速率,广泛应用于各类图形处理和计算任务中。GDDR5之后,NVIDIA还与美光推出了GDDR5X半代产品,用于NVIDIA高端显卡。

而GDDR6则在数据传输速率和能效方面进一步提升,成为现代高端GPU的主流选择。GDDR6X引入了PAM4(Pulse Amplitude Modulation 4)信号技术,显著提高了数据传输速率。Nvidia在其Ampere架构,如GeForce RTX 3080和RTX 3090,率先采用了GDDR6X内存。

可以看出,从最初的GDDR到最新的GDDR6,GDDR内存经历了多次技术迭代和性能提升。每一代GDDR内存都在数据传输速率、带宽和能效方面不断优化,满足了GPU和图形处理日益增长的需求。如今,它已成为人工智能和大数据应用领域中最受欢迎的内存芯片之一。

GDDR7大战打响

目前,三星、美光和SK海力士均已开始提供GDDR7内存样品,GDDR 7大战即将拉开序幕。

三星和SK海力士打头阵

三星和SK海力士在今年3月份NVIDIA的GTC大会上均宣布了各家GDDR7的相关指标。两家公司都展示了16Gb(2GB)密度的产品,24Gb(3GB)更高版本没有在这一波浪潮中展现。

按照三星的披露,三星GDDR7芯片能够在仅1.1 V的DRAM电压下实现32 Gbps的速度,这超过了JEDEC的GDDR7规范中的1.2 V,这一性能是通过首次应用PAM3信号实现的。再加上三星特有的其他电源管理创新,能源效率提高了20%,将待机功耗降低 50%,从而减少整体功耗。三星还在封装基板方面进行了一些创新,它使用了一种导热性高、热阻低的环氧模塑料 (EMC) 进行 GDDR7 封装,以确保有源元件(IC本身)不会过热,与 GDDR6 芯片相比,热阻降低了70%。这些芯片采用512M x32组合,采用266针FBGA 封装。

而SK海力士表示它将提供速度高达40 Gbps的GDDR7芯片。与其前身GDDR6相比,最新的GDDR7产品提供的最大带宽达到160GB/s,是其上一代产品(GDDR6位80GB/s)的两倍,功耗效率提升了40%,同时,内存密度提升了1.5倍,使得视觉效果也进一步得到增强。独立的四通道的模式,提高了内存并行处理能力,每个通道支持32字节的数据访问。除了四通道模式,GDDR7还支持双通道模式,提供了灵活的配置选项,以适应不同的应用需求和系统架构。

SK海力士GDDR7技术指标

(来源:SK海力士)

SK海力士GDDR7采用与GDDR6相同的板尺寸,大小为12mm x 14mm,这意味着在设计和制造过程中,GDDR7可以直接替换现有的GDDR6模块,而无需对电路板进行重新设计。此外,GDDR7内存还配备了专用的内存实现方案和PCB(印刷电路板)设计,以最大化其性能和效率。

(来源:SK海力士)

SK海力士的16Gb GDDR7 芯片基本已经准备就绪,将在今年晚些时候批量出货。三星的也在出样品的过程中。

虽然尚不清楚谁将成为三星和SK海力士GDDR7内存的首批客户,但是考虑到两家均在NVIDIA GTC2024上进行展示,这也很清楚地表明NVIDIA是其中之一。

姗姗来迟的美光

2024年6月4日,美光宣布开始为下一代GPU提供GDDR7内存样品,它有28GB/s和32Gb/s两种速度。新一代GDDR7采用美光科技的1β (1-beta) DRAM 技术制造,在能效和性能上实现了大幅提升。

图片来源:美光

美光在宣布这一消息时公布了一些诱人的数字。该公司表示,32Gb/s GDDR7提供的内存带宽比GDDR6高出60%,在384位总线上可达到1.5TB/s的内存带宽。这比其前代产品有了显著的飞跃,前代产品在RTX 4090等 GPU上的384位内存总线上最高可达1TB/s。同时,工作电压降低至1.2V,上一代为1.35V,美光表示,其GDDR7的效率比GDDR6 提高了50%,实现节能的方式主要包括分割电压平面、部分设备运行和休眠模式。采用FBGA更薄的封装高度(1.1mm对比1.2mm)和高热导EMC封装,提供65%更好的热阻,这为台式机和笔记本电脑提供了更好的热管理。

美光GDDR6与GDDR7特点比较

美光GDDR7的这些特性提升使其在游戏、生成式AI、高性能计算(HPC)领域前景广阔。也就意味着GDDR7可能与HBM相竞争。如美光所述,在游戏领域,GDDR7预计在每秒帧数(FPS)方面可提升超过30%,特别是在光线追踪和光栅化工作负载下;在生成式AI应用中,GDDR7提供超过1.5 TB/s的高系统带宽,预计可将生成式AI文本到图像生成的响应时间减少多达20%;对于HPC,GDDR7预计能够减少处理时间,实现复杂工作负载(如动画、3D设计、科学仿真和金融建模)的无缝多任务处理。

据美光的公告,其GDDR7内存将于2024年下半年直接从美光以及通过精选的全球渠道分销商和经销商发售。NVIDIA使用美光的内存是板上钉钉了,因为此前美光专门为 Nvidia 制造了GDDR6x,不过在美光GDDR7的公告中也提到了AMD,因此AMD也可能会加入这一行列。

GDDR 7最大的技术变化

2024年3月,JEDEC发布了GDDR7 内存标准规范。JEDEC 是微电子行业标准制定领域的全球领导者。如下图所示,GDDR7的每引脚带宽最高可达48 Gbps,远高于GDDR6和GDDR6X的24 Gbps。在256位总线宽度下,GDDR7的总带宽达到1024 GB/sec,显著高于GDDR6和GDDR6X的768 GB/sec。GDDR7的工作电压为1.2 V,比GDDR6和GDDR6X的1.35 V更低。在信号技术上, GDDR7采用PAM-3信号技术,而GDDR6X采用PAM-4,GDDR6则使用传统的NRZ信号技术。GDDR7的最大密度达到64 Gb,是GDDR6和GDDR6X的两倍。GDDR7采用266 FBGA封装,高于GDDR6和GDDR6X的180 FBGA。

图表展示了GDDR7相对于前几代在带宽、功耗和封装上的显著改进。来源:anandtech

GDDR7最大的技术变化在于内存总线从2位不归零 (NRZ) 编码转换为3位脉冲(-1、0、+1)幅度调制 (PAM3) 编码。PAM3使GDDR7能够在两个周期内传输3位数据,仅这一变化就让数据传输效率提高了50%。随着向PAM3信号的转变,内存行业有了一条新途径来扩展 GDDR 设备的性能并推动图形和各种高性能应用的持续发展。

上图可以很直观的看出NRZ和PAM编码的不同。

来源:三星

之前的GDDR标准使用非归零(NRZ)技术,通过两种信号电平来传输编码为1或0的数据。这种方法在多个GDDR世代中都足够使用,但随着时钟速度和系统复杂性的增加,成为了一大瓶颈。为了解决这一挑战,美光与英伟达推出了采用多级信号技术的创新GDDR6X技术。美光是唯一提供GDDR6X的公司,GDDR6X利用PAM4信号技术,提供了业界领先的>1.1 TB/s带宽。

美光在GDDR6X方面的成功和经验为下一代使用类似信号方法的GDDR奠定了基础。虽然PAM3每周期传输的比特数量低于GDDR6X上的PAM4,但PAM3提供了50%的更高电压裕度,并且编码复杂度更低,这减少了对内存总线更高频率的需求,缓解了由此产生的信号损失。

值得一提的是,GDDR7将能够在PAM-3和NRZ之间切换,具体取决于所承受的负载。当需要极高的性能时,会激活 PAM-3,但对于降低能耗很重要的情况(例如非游戏、桌面使用),则会启用 NRZ 以保持良好的散热效果。

另外一个很大的技术变革是,GDDR 7内存具有4个独立通道,可优化各种工作负载的数据流,因此延迟相对较低。

GDDR 通道架构

(来源:anandtech)

写在最后

三星、SK海力士、美光三大存储巨头均推出了自家的GDDR7内存产品,并展开了激烈的竞争。谁能在这场技术竞赛中脱颖而出,尚需时间验证。然而,这场较量不仅仅关乎市场份额的争夺,更在于谁能在性能、能效和创新应用上实现突破,引领下一代图形内存技术的发展方向。

至于GDDR7的显卡何时问世?考虑到 AMD 和 Nvidia 每两年发布新 GPU 架构的节奏,NVIDIA 和 AMD 预计将在 2024 年下半年推出首款采用 GDDR7 的独立 GPU。最可能的是消费级Blackwell架构产品和AMD的RDNA 4。让我们拭目以待。

推荐阅读
关注数
11168
内容数
1847
最有深度的半导体新媒体,实讯、专业、原创、深度,50万半导体精英关注。专注观察全球半导体最新资讯、技术前沿、发展趋势。
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息