自第一代iPhone在2007年发布以来,智能手机这个概念横空出世,产业也在过去十五年间经历了梦幻般的发展。这一方面体现在手机外形、应用的革命性转变;另一方面,智能手机芯片性能在过去的这些年里也实现了指数级的增长。
然而,受限于智能手机本身尺寸、重量和电池技术等多个方面的优势,智能手机SoC在通过制造工艺改进和IP改善来提升性能的同时,也促使作为当中关键组成的CPU架构从过去多年的单核高频率、多核、大小核和最近几年的三簇式(大核+中核+小核)设计。在这些改变的背后,主要是为了实现智能手机SoC PPA(Performance、Power、Aera)的平衡。
但在全球领先的芯片设计商联发科看来,智能手机SoC又要变了。
手机芯片CPU,亟待“革新”
在介绍CPU的“革新”之前,,我们先回顾一下智能手机早些年的手机芯片发展历史。
资料显示,为了满足智能手机厂商日益增长的性能需求,智能手机SoC厂商在早期的工作方向之一就是推动手机芯片CPU的频率提升。以联发科为例,公司在2009年发布的首款智能手机解决方案MT6516是使用单核心的设计,其CPU主频为416MHz;到2011年发布的MT6573,其CPU主频则到了650MHz。
后来,为了进一步提高性能,这些SoC厂商推动多核 CPU的发展。这些CPU内核都具有相同的内核,能够处理相同的指令并达到相同的时钟速度,其所有任务,无论大小,也都在这些核心之间处理和分配。
但是,在对智能手机处理器高性能需求与日俱增的同时,用户还希望能够有足够的续航来完成低强度的任务,如发短信,邮件以及听音乐。这就促使了Arm big.LITTLE架构的产生。和传统的多核设计不一样,基于 big.LITTLE 的 CPU 设计具有两个核心“集群”,其中针对不同任务具有不同设计的核心——专为执行要求较高的任务而设计的“高性能”内核,以及处理更常规任务的“节能”内核。
过去十年里,包括联发科在内的智能手机芯片厂商都在遵循这样的设计,他们也从一开始的“大小核”发展到近年来的“大中小核”设计,这在前面有提及。如联发科的前一代旗舰芯片天玑9200就采用了“1+3+4”的八核设计。
到了现在,伴随着AI时代的到来,终端对芯片性能产生了更强的需求。联发科也认为手机芯片也需要继续进化——推动CPU进入“全大核”时代,这也正是他们在新推出的天玑9300上采用了4 个最高频率可达 3.25GHz的Cortex-X4 超大核,以及 4 个主频为 2.0GHz 的 Cortex-A720 大核设计的原因。
联发科技无线通信事业部产品规划总监张耿豪表示,进入先进制程时代,因为漏电电流的增大和无可避免,导致过去芯片上节能的小核在功耗表现上其实并没有比大核好多少。而且这个问题会在后续的发展中越来越严重,这也是促使联发科在天玑9300上砍掉CPU上的“小核”,通过打造更强,更高效地完成任务的“全大核”处理器的重要原因。
在张耿豪看来,全大核架构虽然是一个革新,但也不是完全从零到有。因为另一家手机芯片大厂苹果之前就有相似的概念,其A系列芯片的小核虽然也叫“小”,但事实上它并不小,而是比一些安卓芯片的的大核还要再大一点。
为此,他认为,这是智能手机芯片架构的发展方向。
天玑9300,“全大核”创新出击
事实上,从联发科提供的参数看来,他们的这个“全大核”的创新设计也的确不负众望。
测试数据显示,联发科天玑9300的峰值性能相较上一代提升 40%,其工作速度快、效率高,具有高能效特性,能够在资源拥挤时满足计算需求。其强劲多线程性能,更是可以让终端的多任务处理更加流畅,例如同时进行游戏和视频直播,或是在进行游戏的同时播放视频。例如在重载应用上,天玑9300能够轻松实现双开。
能达成这样的成就,与联发科在这颗芯片的全大核CPU上采用了乱序执行设计有着重要的关系。
对CPU工作原理有了解的读者应该清楚,当前的处理器执行方式有两种,分别是顺序执行和乱序执行。其中,顺序执行的处理器在实际工作中就是按照取指顺序,一条一条的执行。遇到数据相关性就停下等待。这样的设计需要的硬件开销是比较小的,但对于处理器的性能会有一定的限制;在乱序执行中,指令可以不按程序指定的顺序执行,减少阻塞,提升处理器的执行效率,其对外表现的行为还是和顺序执行的处理器一样,但是能效却更好了。
联发科正是通过在天玑9300中全面使用乱序执行(out-of-order)的内核,以实现了增加应用执行的效率、减少卡顿的发生,实现做得快、休息快和更低功耗的目的。据透露,新芯片的功耗同比节省了33%,无论在轻载还是重载应用场景中,都能降低功耗、延长续航时间,这扫除了大家对新设计能否平衡PPA的担忧。
从联发科方面的介绍我们得知,天玑9300的这个全大核设计也并不是一蹴而就的。在过去三年里,联发科不但持之以恒地推动硬件的设计发展,还在软件的设计、系统的设计中去找到一些关键的场景,并优化它。同时,还尽力把所有的应用都聚集在一起,快速地把它执行完毕,快速地深层的“睡”下去,实现高性能低功耗的目标。
如张耿豪所说,这不是一个简单的事情,因为这必须要把端到端、硬件到软件到系统都串在一起。其中很多很深度的事情底层甚至需要跟所有的生态链一起去完成。为此,联发科正在联手上游的合作伙伴谷歌,针对8大核的架构,在安卓AOSP上面调优。
在这些领先设计的加持下,联发科天玑9300的CPU的多核跑分也是名列全茅,超过了其他友商,成为目前的多核性能第一。
AI、GPU和通信,新旗舰全面出击
除了在CPU上创新以外,联发科天玑9300在芯片的AI处理能力上也实现了重磅升级——集成了性能和能效都得到显著提升的全新第七代 APU 处理器——APU 790。据介绍,APU 790 内置了硬件级的生成式 AI 引擎,这也让天玑9300成为业界首款搭载硬件生成式 AI 引擎的智能手机芯片,可实现更加高速且安全的边缘 AI 计算,深度适配 Transformer 模型进行算子加速。
针对大语言模型对内存需求暴增,但手机内存又有限的现状。联发科更是开发了混合精度 INT4 量化技术,结合公司特有的内存硬件压缩技术 NeuroPilot Compression,可以更高效地利用内存带宽,大幅减少AI 大模型对终端内存的占用,支持终端运行 10 亿、70 亿、130 亿、最高可达 330 亿参数的 AI 大语言模型。联发科更是透露,公司已然成为首个在 vivo 旗舰手机端侧落地 70 亿参数 AI 大语言模型的芯片厂商。公司同时还突破行业极限,与 vivo 成功在端侧运行 130 亿参数 AI 大语言模型。
除此以外,APU 790 还支持生成式 AI 模型端侧“技能扩充”技术 NeuroPilot Fusion,可以基于基础大模型持续在端侧进行低秩自适应(LoRA,Low-Rank Adaptation)融合,进而赋予基础大模型更加全面的能力。
为了简化开发者的开发,联发科还凭借其 AI 开发平台 NeuroPilot 构建了丰富的 AI 生态,并支持 Meta LIama 2、百度文心一言大模型、百川智能百川大模型等前沿主流 AI 大模型,完整的工具链助力开发者在端侧快速且高效地部署多模态生成式 AI 应用,为用户提供文字、图像、音乐等终端侧生成式 AI创新体验。
来到手机SoC的另一核心组成GPU方面,联发科在天玑9300中率先采用了Arm新一代旗舰 12 核 GPU Immortalis-G720。与上一代相比,新GPU 峰值性能提升 46%,相同性能下功耗节省 40%,给终端用户带来持久流畅的旗舰移动游戏体验。联发科同时还为天玑 9300 引入了公司第二代硬件光线追踪引擎,支持 60FPS 高流畅度的光线追踪,并带来游戏主机级的全局光照特效。
至于大家关心的通信方面,天玑9300搭载了支持 Sub-6GHz 四载波聚合(4CC-CA)和多制式双卡双通的5G 调制解调器;来到WiFi方面,则支持 Wi-Fi 7,最高理论峰值速率可达 6.5Gbps;天玑 9300 最高还可支持 3 个蓝牙天线,特有双路蓝牙闪连技术,带来超低时延的蓝牙音频体验。
在天玑9300中,联发科还集成了自研的旗舰级 ISP 影像处理器 Imagiq 990,支持 180Hz WQHD和 120Hz 4K 显示的MiraVision 990 移动显示处理器以及为手机数据保驾护航的双安全芯片。
值得一提的是,天玑9300还是全球首个支持 LPDDR5T 9600Mbps 内存,这让其在执行数据处理时,拥有了无与伦比的体验。
写在最后
观察过去多年智能手机芯片旗舰的迭代,无论是哪个供应商,似乎都将集成最新的IP和使用最新的制造工艺当作追逐的目标。这就导致智能手机厂商以“跑分”当作衡量手机旗舰水平的重要标准。
不过,正如张耿豪所说,旗舰手机走了那么多年,是时候抛弃过去的“跑分”思维,而是转向关注未来需要怎样的手机?我们可以创造什么?这才是发展的根本。天玑9300的全大核设计,也是这种思维转变的产物。
“从今年开始,有可能全大核就成为一个新的标准规格,未来就是一个全大核的世代,联发科正在引领这种潮流”张耿豪信心满满地说。
而vivo X100即将在11月13日全球首发搭载天玑9300,或许,我们距离全大核世代的正式到来,仅仅只需要等待最后的几天。