23

半导体行业观察 · 5月16日 · 安徽

从芯片到生态,联发科在端侧生成式AI领域火力全开

随着ChatGPT的横空出世带动的生成式AI繁荣,手机芯片厂商迎来了新的契机。

在移动智能终端过去十几年的发展中,手机厂商们围绕着性能、显示、拍照和充电等一系列功能展开了激烈的竞争。作为这场战役背后的重要“力量”,芯片厂商也针对这些新功能的性能需求,在架构、制程工艺和功耗等领域打了十几个来回的攻防战。

然而正如大家所看到的,过去几年里,随着芯片工艺制程走到了瓶颈期,加上终端创新的乏善可陈,整个行业陷入了持久的拉锯战。不过,随着ChatGPT等生成式AI应用在去年的横空出世,手机行业又找到了新的发力点——生成式AI。

作为智能芯片行业龙头,联发科在日前以“AI予万物”为核心主题举办了一场声势浩大的“天玑开发者大会(MDDC 2024)”,与产业链共同探讨如何将生成式AI更便捷地普及到千行百业。

生成式AI加速普及,芯片肩负重任

对AI而言,过去几年大家关注的一个重点,就是如何落地?在哪里落地?即使在大模型面世以后,这同样困扰着广大开发者。

针对这个问题,联发科技董事、总经理暨营运长陈冠州在MDDC 2024的演讲中指出,在ChatGPT为代表的生成式AI应用问世以后,厂商首先在企业级市场中找到了应用的机会(如微软Copilot就是典型的应用范例),但其创造的市场总值跟消费级应用不可同日而语。于是,行业都在探索生成式AI的消费端新机会,智能手机因为具备体验更好的端侧算力、用户规模大且粘性高、具备完整的应用生态等特征,也理所当然的成为了端侧AI应用的首选。

从行业发展看来,端侧生成式AI也成为智能手机行业既定的下一件大事。

然而,关于什么是生成式AI手机,不同厂商有不同的定义。按照Counterpoint 与联发科技共同发布的《生成式 AI 手机产业白皮书》中所说,生成式AI手机需要具备如下几点特征:支持大模型的本地部署(或通过云端协同的方式执行复杂的生成式AI任务)、具备多模态能力(即可以处理文本、图像、语音等多种形式的内容输入,以生成各种形式的输出)、确保流畅和无缝的用户体验(设备能够以自然而直观的交互方式,快速响应用户的请求)。

此外,生成式AI手机还需要拥有实现上述特征的硬件规格,包括但不限于基于领先工艺和先进架构设计的移动计算平台,拥有集成或者独立的神经网络运算单元(如APU/NPU/TPU),大容量和高带宽的内存,以及稳定和高速的连接,硬件级和系统级的安全防御。

由此可见,芯片的“TOPS”成为了生成式AI进军智能手机行业的一道必须跨越的门槛,特别是在Counterpoint预测本地大模型参数的上限将在 2024 年增长至 130 亿和在2025 年增长至 170 亿之后,芯片必将肩负重任,而这正是联发科所擅长的领域。

据了解,凭借在边缘计算领域的深厚功底和丰富经验,联发科每年赋能20亿智能终端设备,在人机交互、生产力、娱乐体验等方面带来了前所未有的创新。公司在智能手机芯片上的影响力更是有目共睹。根据市场研究机构Counterpoint Research最新发布的报告显示,在2023年第四季度全球智能手机应用处理器市场,联发科以36%的出货量市占率份额位居第一,遥遥领先于第二名。

具体到人工智能方面,联发科也有了很深的积累。早在2018年,公司就发布了首款带有APU(AI计算单元)的智能手机芯片Heilo P60。具体到大模型方面,虽然到2023年底才爆发,但联发科技计算与人工智能技术事业群副总经理陆忠立博士在年初接受钛媒体采访的时候就透露:2019年的时候,联发科技就已经在围绕Transformer模型进行APU层面的架构、算法适配做预研了,尤其是在图像和语音方面。

到了2023年,联发科技已经将APU迭代至第七代,能在算力翻倍的情况下将功耗降低50%。也终于迎来了生成式AI应用的大爆发。在MDDC 2024上,继之前推出天玑9300以后,联发科又带来了5G旗舰生成式AI移动芯片天玑9300+。据介绍,该芯片延续全大核CPU架构,为高端手机用户和游戏玩家提供卓越体验。此外,天玑9300+ 拥有强大的生成式AI能力,率先在端侧支持AI推测解码加速技术,性能大幅提升,可以是Llama 2 70亿大模型运行速度提升至22 Token/s,实现业界最高的端侧运行速度。

在芯片硬件方面的予取予求,是联发科能够在端侧AI走向智能手机时代发挥重要作用的根本。而在软件和生态方面的并驾齐驱,则是联发科能让AI在智能手机大展拳脚的底气。

天玑AI开发套件,赋能终端开发

在接受半导体行业观察等媒体采访时,联发科技无线通信事业部生态发展资深总监章立直言:“生成式AI给了很多开发者一个新的机会”。

如他所说,在生成式AI到来之前,手机行业貌似开始陷入创新瓶颈了。而从影像卷向折叠,也让APP厂商好像无所适从。再者,因为过去已经形成规则,竞争关系比较收敛,流量也比较收敛了,所以对很多开发者来说比较难有新的创新机会。但是生成式AI不一样,它给了开发者更多的工具,让开发者拥有更丰富的资源;在这些工具的帮助下,开发者将拥有更多的创新能力,打造出爆品,章立表示。

但是,正如大家所看到的,这一切并不会一蹴而就,开发者也不能直接从传统的软件开发中无缝切换到生成式AI手机的开发生态中,当中涉及的各种工具链、芯片和模型适配以及应用开发等各种问题也不能立刻就能完美解决。

有见及此,联发科举办了首届“天玑开发者大会”,给大家展示了一个由芯片、模型和应用构成的天玑AI生态战略。并寄望与产业伙伴、开发者共同探索和发展端侧AI技术,推动终端设备和应用从触控(Graphical Touch UI)向由生成式AI赋能的智能体(Agent UI)加速演进,为用户提供更出色的交互体验、多模态内容生成能力、个性化服务以及革新的应用生态。

当中,好用的工具链,成为联发科旨在解决的第一个难题。

众所周知,部署大模型,对于开发者来说,从来不是一件容易的事情。尤其是在对功耗、硬件甚至成本有强制性需求的端侧,这个挑战尤为严峻。于是,联发科把开发者在开发AI应用时需要的工具整合在一起,推出了“天玑AI开发套件”,为开发者提供“快、全、强、易”的专业开发体验,赋能终端生成式AI应用开发全流程。

据介绍,该套件包含了快速高效的GenAI最佳实践、覆盖全球主流大模型的GenAI Model Hub、高效提升性能的GenAI优化技术和Neuron Studio 一站式视觉化开发环境等四大模块。

其中,GenAI最佳实践通过模型量化、模型编译和模型推理等方面提供INT4量化、内存压缩、Token加速等技术,,可将大模型的终端部署所需时间从数周加速到一天,这就是所谓的“快”;GenAI Model Hub适配行业前沿主流的大模型,为开发者高效构建生成式AI应用提供丰富的大模型资源,亦即是所谓的“全”;GenAI优化技术则涵括了对推测解码加速、LoRA Fusion等先进技术的支持,此之谓“强”;至于“易”,则生动体现了Neuron Studio 集成开发环境=提供的一站式可视化的开发环境,跳出传统的代码开发环境,带来“所见即所得”般更易用的开发体验。

把所有工具整合起来,用一个简单的方式让开发者可以使用,是本次开发者大会在想法上与之前最大的不同。这不仅在想法上,也在做法上以及对未来的扩充性上都有了很大的改变和转变。联发科技无线通信事业部副总经理李彦辑总结道。

值得一提的是,天玑AI开发套件并不仅仅是面向智能手机,而是覆盖了智能汽车、物联网、个人电脑等智能终端设备,为全场景生成式AI应用开发赋能。

携手上下游生态,加速AI普及

提供“称手工具”的同时,联发科还联合阿里云、百川智能、传音、零一万物、OPPO、荣耀、vivo和小米等企业,共启了一个面向全球开发者的“天玑AI先锋计划”,高效赋能开发者,构建从云端到终端的AI新生态,加速推送生成式AI技术在智能终端上的普及。

具体而言,联发科希望能够跟具有标杆性质、投入开发较早、开始导入生成式AI的应用开发者合作,一起引领整个生态往前推动。按照规划,AI先锋计划包含两部分:第一个环节是联发科会和一些大模型、OEM厂商联合,发挥移动生态底层角色拉动生态各方寻求共识,共同构建适合端侧生成式AI落地的硬件基础;第二个环节就是跟所有的APP开发厂商联手,在这样的硬件基础上,探索开发新的应用。

天玑AI先锋计划的核心目标在于向应用开发者释放开发资源,鼓励他们积极参与,以加速生态系统的构建和推进。我们期望通过先锋计划,吸引更多开发者开始使用我们的开发工具,并创造创新的生成式AI应用,李彦辑解析说。

会上我们也了解到,目前,联发科已携手阿里云通义千问 、Cocos、王者荣耀、虎牙直播、酷狗音乐、美图、全民K歌、RWKV、Soul、腾讯AI Lab、小红书等数十家生态伙伴,在影音视频和游戏等方面共创更精彩的端侧生成式AI用户体验。

值得一提的是,作为近年来手机产业最为关注的行业,游戏成为了联发科本届开发大会不得不提的又一个重点。

回顾过去几年的历程,为了让游戏玩家拥有更好的体验,联发科除了率先引入移动端硬件光追技术以外,还推出了包含游戏自适应调控技术(MediaTek Adaptive Game Technology, MAGT)和可变速率渲染(VRS/AI-VRS)的智能调控引擎以及涵括5G快速通道2.0、HyperCoex 超连接在内的多个技术,以MediaTek HyperEngine 游戏引擎为开发者和玩家带来更好的体验。

进入到生成式AI手机时代,联发科更进一步,全面升级“星速引擎”,借助自适应技术软件开发套件和硬件光线追踪技术,通过精准的性能管理、光线追踪效果优化、网络质量监测等关键技术,助力游戏开发者打造画面更逼真、流畅,触控和网络响应速度更快,续航更持久的全优体验。

联发科技无线通信事业部副总经理陈一强介绍说:“‘星速引擎’能够为游戏和平台沟通建立桥梁,在实际游戏中,不但能让设备可以根据需求让算力收放自如,响应随传随到;也能让设备可以实现精准系统监控,操控随心所欲;还能够网络精准预测,执行智能选网策略。”

此外,联发科还积极与Arm、Google、Khronos,以及Unreal Engine团队在内的产业合作伙伴共同进行前沿技术的探索,持续赋能高速拓展的天玑游戏生态圈。

联发科表示,自 “天玑”品牌诞生以来,公司一直持续通过大力投资技术与开放合作,构建了蓬勃向上的天玑移动生态。现在,先进的生成式AI正在改变移动产业,联发科始终坚信科技能够改善人类生活,并致力于以技术创新驱动产业共融、共创、共赢,将携手更多生态伙伴构建基于生成式AI应用的新时代。

每每谈到联发科,除了谈到他们在SoC、AP、基带、蓝牙、WiFi和一系列芯片方面的实力以外,公司董事长蔡明介先生提出的“一代拳王”理论以及由公司首创的“交钥匙”方案交付方式也是不得不提的两个方面。

可以毫不夸张地说,只要联发科进入的行业,它都能以其领先的技术和独到的“打法”,赢得满堂彩。其中,与产业链上下游生态企业的紧密合作,是公司屡战屡胜的不二法宝。不过,正如章立所说:我们能把土壤、环境、阳光、水准备好,把种子散下去,确保有一天能长出大树。

通过提供好的硬件平台和好的开发者工具,联发科技希望能让大模型在其平台和“土壤”上能够很顺利地落地,释放终端的能力,让手机厂商能够找到创新的用户体验。“在生成式AI到来之际,无论是开发者、芯片厂商还是手机厂商,面对的都是更巨大的市场,这应该是三方的最大公约数。”章立说。

推荐阅读
关注数
11296
内容数
1936
最有深度的半导体新媒体,实讯、专业、原创、深度,50万半导体精英关注。专注观察全球半导体最新资讯、技术前沿、发展趋势。
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息