半导体行业观察 · 2021年11月19日

MTK重回高端战场,发布4nm天玑9000

来源:内容由半导体行业观察(ID:icbank)编译自anandtech,谢谢。

联发科过去几年一直被普遍认为是移动SoC供应商的第二选择,因为大多数媒体和消费者的注意力都集中在苹果、高通、三星和海思等公司的旗舰SoC产品上。而事实上,联发科上一次尝试真正的旗舰 SoC 是在几年前的 Helio X20 和 X30 上,之后他们在高端市场上几乎没有取得成功,而是重新专注于中端和“高端”细分市场。

如今,联发科正在寻求改变这一定位。在看到市场上新的成功之后,尤其是看到了 2020 年和 2021 年的梦幻般的景象后,这家台湾供应商决定卷土重来。

数据显示,联发科现在以 40% 的市场份额占据移动SoC第一名的位置,并且公司的 5G SoC 的市场份额增长了 28%,该公司现在还致力于在旗舰 SoC 市场中获得认可和领导地位——这就是新天玑 9000 的用武之地。

Dimensity 9000 是联发科在打造不折不扣的旗舰 SoC 方面的最新努力,在规格方面,设计师倾其所有,给其带来了许多行业第一,例如第一款采用 Cortex-X2 的 Armv9 SoC 、A710 和 A510 的 CPU、新的 Mali-G710 GPU、第一款兼容 LPDDR5X 的 SoC、令人震惊的相机 ISP ,以及业界第一款公开宣布的 TSMC N4 芯片设计。

该芯片的特性和功能列表非常广泛,今天的发布也无疑代表了联发科几代和多年来最大的努力。

我们从工艺节点开始这颗新芯片的介绍,如上所述,联发科这个芯片在多方面可以称得上是业界第一。

首先,天玑9000是全球首款台积电N4芯片。

过去几年,我们一直习惯于苹果或海思成为台积电最新前沿节点的首批客户。后来,随着 HiSilicon因为美国的原因而被台积电切断后,苹果成为台积电新一代工艺节点的明显主要合作伙伴——然而,这里的时机对 A15 来说并不合适,因为 N4 节点还没有准备好。又由于高通目前在其旗舰产品上与三星代工厂联系在一起(虽然并没有取得很大的成功),这给海思曾经的位置留下了空白,而联发科现在正在寻求填补这一空白。

事实上,我认为这将是该公司自 20nm 时代以来第一次真正处于领先节点。

台积电的 N4 节点应该比 N5 节点的微缩更小,从而使密度增加仅有 6%,性能和效率也有类似的个位数改进。台积电已宣布 N4 的风险生产将于 2021 年第 3 季度开始,而天玑 9000 计划于 22 年第 1 季度推出商用设备,该芯片可能是这个工艺节点的主导产品。

关于天玑 9000 有很多要说的,联发科也将其宣传为首款 Armv9 SoC,那就让我们从 CPU 配置和这里使用的各种 IP 开始。

不妥协的 CPU 设置

作为一款基于Armv9的SoC,这意味着联发科正在更新所有 CPU IP,他们采用来自 Arm 的新 Cortex-X2、Cortex-A710 和 Cortex-A510 IP。

在处理器上,天玑 9000 采用 1+3+4 的CPU 设置,自从高通首次在骁龙 855 中采用该设置以来,该设置就在市场上广受欢迎. 在性能核心方面,联发科使用了新的 Cortex-X2 核心,改核心配备了完整的 1MB 二级缓存,时钟频率高达 3.05GHz,这比我们今天在 X1 内核(例如 Snapdragon 888 或 Exynos 2100)上看到的2.86 和 2.9GHz 略高,但那些竞争 SoC 也采用性能一般的三星 5LPE 工艺节点。我们还不知道下一代 Snapdragon 和 Exynos 芯片在时钟方面的确切数字,但我认为它们不太可能超过 3GHz 大关,这让新的天玑 9000 具有可能的频率优势,因此也在 Android SoC 供应商中可能处于单线程性能领先地位。

联发科也表示,当前一代芯片获得比现有 Android 旗舰芯片高35%的性能飞跃,我们假设它将是 Snapdragon 888,但也表示效率提高了 +37%。这意味着联发科 9000 的 X2 内核的峰值绝对功率水平将与我们今天从骁龙 888 中的 X1 内核中看到的相似,这是一个很好的表现,并且这些数字通常与我们对设计之间的 IPC 和工艺节点差异的期望。

联发科确实注意到,更多内存绑定工作负载的性能飞跃远高于更多核心本地工作负载,例如 SPECint2006 增加 35%,而 GeekBench 5 仅比竞争对手增加 10.5%。这通常也符合我们对 Cortex-X2 的理解,指出在任何没有利用 CPU 集群增加缓存的情况下,IPC 改进都很低。

Dimensity 9000 的中型核心是 3 个 Cortex-A710 核心,配备 512KB L2,主频高达 2.85GHz。在这方面,联发科的方法更类似于 Exynos 2100,因为它使用了相当高的频率中核,与高通采用的较低的 2.4GHz 设计点形成对比。

除了中型内核,我们还看到了新的 Cortex-A510 小内核,与我们对 IP 的第一次迭代的预期相比,联发科在这方面的表现截然不同。联发科没有使用 Arm 新的“合并核心”方法,其中 Cortex-A510 复合体可以由共享 SIMD/FP pipeline 和共享 L2 的两个核心组成,联发科完全忽略了 IP 的这一设计方面,而是采用传统的每个复合体仅使用一个核心的路线,因此每个核心都有自己的 SIMD/FP pipeline 和私有 L2 缓存。这里的缓存为 256KB,也相当大,低于 512KB 的最大值。实际上,联发科在这里所做的就是将 A510 内核配置为接近最大性能的设置。虽然我们对核心仍有保留,很高兴看到联发科没有在新设计上吝啬。

天玑9000由于配置强劲的中核,以及配备精良的小核,标榜的多核性能也超越了目前的Android竞争,与苹果在A15上的表现不相上下。

在集群层面,联发科还为DSU配备了8MB的L3——这很可能也是新一代的DSU-110。

在 CPU 方面,天玑 9000 基本上以最佳方式配置——联发科在频率和缓存方面全力以赴,通常很难想象比芯片目前设置的性能更高的配置,在至少在 Arm Cortex CPU IP 的上下文中。

首款 LPDDR5X,大型系统缓存

Dimensity 9000 的另一个世界首创是它是第一款宣布与 LPDDR5X 兼容的芯片。JEDEC在今年7月份才发布了该标准,所以芯片已经支持,意味着联发科正在起草草案,应该完全兼容新标准。虽然宣传完整标准最高支持 8533Mbps,但这里的芯片确实将自身限制在 7500Mbps,因此与当前一代 LPDDR5-6400 解决方案相比,这意味着带宽增加了 17%。尽管如此,直到明年年底我才预料到 LP5X SoC,所以这绝对是一个惊喜。

当然,如果供应商选择使用不同的内存模块,内存控制器仍然完全支持高达 6400Mbps 的 LPDDR5。

Dimensity 9000 是联发科首款采用 6MB 系统缓存的 SoC。联发科在发布会上指出,更大的缓存和带有系统缓存的 SoC 设计绝对是前进的方向,也是未来所有人的目标。

系统级缓存,或者我们喜欢将它们简称为 SLC,能够放大 CPU 以外的 SoC 块的性能,并减少到 DRAM 的内存流量,也对能效有积极的好处。

GPU:Mali G710MP10

在 GPU 方面,联发科天玑 9000 也是第一款部署全新 Mali-G710 GPU 的 SoC。

今年早些时候,当我们谈到 IP 时,我们提到联发科是唯一一家预计将发布具有更大 Mali GPU 实现的 SoC 的供应商,因为海思的问题和三星采用了 AMD RDNA GPU。

Dimensity 9000 上的配置是 10 核。这里我们必须记住,在每核性能方面,一个新的 G710 内核大致相当于两个 G78 内核,因此在尺寸和性能方面,新芯片的 GPU大致可与 Google Tensor G78MP20 GPU 相媲美,加上可能是预期的由于世代 IP 的改进,性能提升了 20%。联发科GOU可能的峰值频率应该在 850MHz 左右(确切的时钟有待确认)。

在性能数据方面,该公司的材料比目前的 Android 旗舰产品高出 35%,而效率提高了 60%。今年的所有旗舰产品在游戏效率方面都相当令人失望,我们看到领先的 Exynos、Tensor 和 Snapdragon 芯片的绝对功率数字达到了 +7.5-9W。联发科指出,他们的效率优势远大于性能飞跃,这也表明他们使用的峰值功率水平低于我们今天看到的水平,这绝对是一个值得欢迎的变化。

该公司还谈到了光线追踪功能,但这这只是一个软件 API 实现而不是硬件,因为 G710 尚不支持此功能。

联发科有一张幻灯片展示了与配备 A15 的 iPhone 13 相比的长期性能,天玑 9000 能够略微超过 iPhone 的性能。我们看到新款 iPhone 的功率大约为 3-3.5W,据报道,在蜂窝网络条件下,由于散热不佳,这些手机的性能甚至更差。

联发科指出,比较是在类似的热预算下进行的,因此希望在这里的比较是有效的。需要注意的是,正如我们在 A15 评论中所写的那样,比较真实世界的游戏(例如 Genshin Impact 进行 GPU 分析)并不是很好,因为游戏总是以不同的内部分辨率或细节级别运行,尤其是在 Android 和 iOS 之间。

话虽如此,联发科 GPU 的效率确实将其定位得非常好,并且可能使其能够有效地与即将推出的 Snapdragon 和 Exynos 芯片竞争,这些芯片仍预计将到达效率较低的工艺节点。

低功率领导力声明

联发科的一个有趣说法是,由于新的 TSMC N4 节点以及 SoC 和平台设计的智能电源管理,他们正在实现低功耗领先地位。

上图为平台总功率对比,不包括显示面板供电。这意味着我们看到了 SoC、DRAM、PMIC、蜂窝 RF 和 Wi-Fi 系统的功率比较——本质上是 SoC 供应商通常响应的“平台”组件,他们将其产品捆绑在一起。

这里值得注意的数字是媒体播放和录制数量,据说天玑 9000 在这方面的功耗比竞争对手低得多。据说游戏功率也较低,但考虑到 GPU 效率和较低的功率要求,这是可以预料的。

我发现最有趣的一个数据点是家庭闲置电量。在硅设计中最难实现的事情之一是以有效的方式不做任何事情,这实际上代表了很大一部分能源消耗并影响设备的基准功率,从而影响您的日常电池寿命。在这里的竞争中获得 -20% 是相当可观的。

APU/NPU AI/ML 升级

除了 CPU 和 GPU外,我们还发现了联发科的新“APU”,或 AI 处理单元,或者更确切地说是 NPU,因为我们现在更普遍地倾向于称之为 NPU。联发科一直是此类 IP 最早的内部实现之一,而天玑 9000 现在实现了此类 IP 的第5代。

联发科承诺,在新一代产品上获得比上一代 Dimensity 1200 高400% 的性能和能效提升,这是一个相当大的进步,但应该与其他性能更高的竞争对手平台相关联。

该公司制作了一张展示 MLPerf 与 Apple A15 对比的幻灯片,指出与 iPhone 芯片相比,公司产品获得 +108% 和 +75% 的电源效率,该公司实际上引用了我们发布的 MLPerf 数据,但是我们将避免使用幻灯片作为比较不是很好,因为应用程序的 iOS 变体没有完全优化,也没有利用 CoreML 加速。

一个更全面的比较是跨 Android 设备的 ETHZ Ai Benchmark,这里的芯片应该利用所有加速器块,包括 CPU、GPU 和 NPU,并且天玑 9000 被宣传击败谷歌 Pixel 6 和 Tensor SoC,最近的表现明显优于竞争对手。联发科在这方面做得更好似乎对 SoC 的 ML 性能很有希望。自然,我们必须看到更详细的基准测试才能更彻底地分析 ML 性能,但似乎联发科在这里开发了一个非常可靠的竞争者。

媒体pipeline 和大型 ISP

转向媒体方面,联发科还l也投入了一切。在视频编码和解码方面,联发科支持当前所有流行的编解码器。目前还没有AV1编码,但该公司表示该芯片是业界第一款支持8K AV1解码的芯片——上一代天玑和竞争对手的SoC目前只能进行4K解码。

显示pipeline 支持 WQHD+ 到 144Hz,或 FHD+ 到 180Hz,具有完全 HDR+ 自适应(10 位),因此该芯片应该为最高分辨率和刷新率的屏幕提供动力。

回到 ISP,联发科声称相机子系统在这一代进行了大规模改造。天玑 9000 具有三重 ISP,具有并发操作能力,芯片能够突破 9 Gigapixels/s。我们不确定这些数字是否与供应商声称的完全一致,但高通的骁龙 888“仅”支持 2.7GPixel/s。有趣的是,联发科表示,与天玑 1200 相比,这只是 2 倍的吞吐量增加。

Imagiq790 ISP 声称是世界上第一个支持 320MP 传感器的公司,联发科声称他们正在与传感器供应商密切合作以实现此类功能。去年,当高通公司宣布推出 Snapdragon 888 时,我们听说过有关 200MP 传感器的消息,而三星在 9 月份宣布了具有此分辨率的 HP1,尽管我们还没有看到配备它的设备。

在三摄操作中,ISP 支持并发 32+32+32MP 传感器操作。我们已经看到这种操作在传感器融合中变得越来越流行,例如计算摄影或多个传感器上的并发视频录制场景。

新的 ISP 还大大提高了其在位深度方面的能力,因为联发科现在将其升级为完整的 18 位流水线。尽管今天的移动图像传感器在其 ADC 位深度方面最多只有 10 位或 12 位,但多重曝光图像堆叠已成为常态,尤其是现在传感器也获得了更先进的 HDR 技术,例如交错 HDR 捕获. 新的更高位深度 ISP 现在能够更好地跨多个帧进行曝光合并,Dimensity 9000 能够在其三个 ISP 上的三个传感器上每秒处理 270 帧(大概是 4K 分辨率)。

这里的原始吞吐量和处理能力将是巨大的,并且是市场上任何其他当前 SoC 所没有的巨大飞跃。

联发科表示,他们也改进了视频pipeline ,能够以内存一致的方式与 APU 紧密交互,绕过通过 DRAM 复制数据的需要,提高性能并降低带宽要求和延迟。据推测,供应商将能够利用该架构利用基于 ML 的图像处理模型即时实现视频录制,这与 Google 在其最近的 Pixel 6 手机和 Google Tensor 芯片上展示的技术基本相同。

升级版 5G 调制解调器

在调制解调器方面,联发科最近的 5G 调制解调器实施取得了很大的成功。新的天玑 9000 调制解调器进一步升级,首次宣传具有高达 300MHz 的 Sub-6 带宽的 3CC 载波聚合,允许高达 7Gbps 的下载速度。

该调制解调器与 3GPP 第 16 版完全兼容,其中一个较大的变化是 UL Tx 切换,它允许在多频段 5G NR 部署中实现更好的上行链路能力和频谱利用。

联发科技指出,与竞争对手的产品相比,其调制解调器具有极高的能效,而天玑 9000 将通过提供先进的节能技术继续支持这一补丁。

尽管调制解调器具有 Sub-6 5G 的所有功能,但它仍然缺少毫米波支持。联发科指出,这只是市场需求和公司当前以客户为中心的结果。目前,美国仍然是唯一一个毫米波真正仍然是关键特性的市场,因为大多数供应商甚至选择不为他们的全球设备变体配备毫米波模块。

该公司承认,由于这一点,我们不太可能看到由 Dimensity 9000 驱动的美国设备,该公司对这种妥协表示满意,因为它试图迎合并专注于为世界其他地区服务的供应商。联发科指出,明年我们将看到针对美国市场的毫米波产品发布,但这些产品首先会出现在中低档阵容中。

最后,在 Wi-Fi 方面,联发科的天玑 9000 平台也自带了自家解决方案,现在支持 Wi-Fi 6E 支持 6GHz 频段,160MHz 信道带宽,以及蓝牙 5.3。GNSS 解决方案现在通过 B1C 信号增加了 BDS-3 连接。

结论和第一印象

联发科凭借天玑 9000 重新进入旗舰 SoC 领域,恰逢市场机遇期。该公司在 2021 年取得了非常成功的市场份额增长,我们甚至看到这转化为市场上更明显的设计胜利的更多曝光,例如 OnePlus Nord 2 系列或小米 11T。

天玑9000在看到了巨大的市场份额增长并能够填补过去华为和海思在市场上的巨大空白后,似乎来得正是时候,因为越来越多的厂商希望能够将他们的最高产品区分开来。终端设备并多样化他们对高通骁龙系列的依赖。

Dimensity 9000 在纸面上和规格上看,必然是 2022 年中极其强大的 SoC。在 CPU 方面,联发科为 SoC 配备了接近最大可能的配置——高频率、大缓存,以及对我们今天来说足够令人惊讶的新 Cortex-A510 内核的完整性能配置。8MB L3 得益于新的 6MB 系统缓存,进一步提高了内存性能,天玑 9000 是目前第一个也是唯一一个支持新 LPDDR5X 的芯片。

在 GPU 方面,该芯片可能是 2022 年唯一配备大型 Mali GPU 的设计。宣传的性能数据不错,但最重要的是电源效率和持续性能。虽然这里的指标仍然有点模糊,但芯片的 N4 工艺节点,同样是同类中的第一个,很可能会将该芯片定位在与 2021 年设备相比的出色位置,如果高通和三星没有重大飞跃在他们即将推出的设计中,天玑 9000 在 2022 年的竞争中也处于非常有利的位置。

联发科的摄像头和 ISP 的飞跃也是巨大的。在过去的几年里,我们真的没有多少由联发科芯片驱动的以摄像头为中心的手机,所以供应商是否能够利用芯片的新摄像头架构还有待观察,但至少高级规格是肯定的值得2022年的旗舰。

该芯片缺乏毫米波可能会限制其在非美国市场和设备上的成功,但多年来我们通常已经习惯了这种情况。

天玑 9000 是联发科多年来最强劲的表现,其规格和分量足以撼动高端市场。我看到它与高通公司明年排队的任何产品竞争,甚至击败它,这是一个非常令人震惊的转变。现在重要的是,联发科是否真正赢得了备受瞩目的旗舰设备设计,从而能够充分合理化对此类 SoC 的投资。幸运的是,我们被告知该芯片已经向客户提供样品,我们预计将在 2022 年第一季度推出商用设备。

在移动 SoC 领域,激动人心的时刻即将到来。

推荐阅读
关注数
11318
内容数
1959
最有深度的半导体新媒体,实讯、专业、原创、深度,50万半导体精英关注。专注观察全球半导体最新资讯、技术前沿、发展趋势。
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息