Arm 凭借在技术生态系统中所处的独特地位,对全球半导体供应链有着全盘了解,并在数据中心、物联网、汽车、智能终端等各类市场深入布局。基于此,Arm 对未来技术的发展方向及可能出现的趋势有着广泛而深刻的洞察。我们将分三期内容为你详细列举从人工智能 (AI) 到芯片设计,再到不同技术市场的主要趋势,带你深入了解 2025 年的产业发展方向!
本期我们将聚焦 AI 领域的 11 个未来趋势,其中包含大规模投资高性能和高能效的 AI 技术;AI 推理持续发展;AI 时代中的异构计算优势;边缘侧 AI 崭露头角;小语言模型加速演进;多模态 AI 模型涌现;智能体应用不断拓展;更强大、更直观、更智能的应用;医疗服务将成为关键 AI 用例;推动实现“绿色 AI”,以及可再生能源与 AI 融合发展,带你深入洞察 AI 的发展方向,把握行业前沿脉动!
大规模投资高性能和高能效的 AI 技术
在 AI 时代如何有效管理日益增长的电力和计算需求,已成为政府、行业及整个社会优先关注的重要议题。在不影响性能的前提下,限制大型数据中心的能耗至关重要。全球数据中心每年消耗约 460 太瓦时 (TWh) 的电力,相当于德国全国的用电量,因此找到解决这一问题的方法势在必行。
实现高性能和高能效的 AI 需要整个系统层面的协同设计以及对软硬件的投资。从硬件方面来看,底层处理器技术和 CPU 架构的进一步发展将确保 AI 得到尽可能高效的处理。专用硬件将利用这些技术进步来有效应对数据中心支持密集型 AI 工作负载的各个维度,包括网络、存储、安全和数据管理。同时,创新的软件将优化 AI 工作负载,使其在更少的资源下正常运行,同时保持或提升性能表现。
AI 推理持续发展
在未来一年里,AI 推理工作负载将继续增加,这将有助于确保 AI 的广泛和持久普及。这一趋势的发展得益于具备 AI 功能的设备和服务数量的增加。事实上,大部分日常 AI 推理,如文本生成和摘要,都能在智能手机和笔记本电脑上完成,为用户提供了更快速、更安全的 AI 体验。为了支持这一增长,此类设备需要搭载能够实现更快的处理速度、更低的延迟和高效电源管理的技术。而 Armv9 架构的 SVE2 和 SME2 两大关键特性,共同作用于 Arm CPU,使其能够快速高效地执行 AI 工作负载。
AI 时代中的异构计算优势
显然,没有单一的硬件或计算组件可以解决所有工作负载的问题。尤其是当 AI 推理日益渗透到从智能恒温器到数据中心等各种设备的计算领域,这点尤为突出。我们观察到,AI 加速器在 2024 年显著增长,包括来自领先的云服务提供商的加速器。然而,要有效利用这些加速器进行 AI 工作负载的处理,需要一个 CPU 平台。Arm Neoverse 提供高度灵活的计算能力,使 Arm CPU 能够与加速器无缝结合,实现新的工程创造力和开发。例如,NVIDIA Grace Blackwell 超级芯片将 NVIDIA 的 Blackwell GPU 架构与基于 Arm Neoverse 的 Grace CPU 相结合。Arm CPU 作为全球应用最为广泛的计算平台,我们预计在 2025 年将会看到更多此类异构计算的协作。
边缘侧 AI 崭露头角
2024 年,许多 AI 工作负载已经转向在边缘侧运行,而不是在大型数据中心进行处理。这种转变不仅能为企业节省电力和成本,还能为消费者带来隐私和安全方面的保障。
到了 2025 年,我们很可能会看到先进的混合 AI 架构,这些架构能够将 AI 任务在边缘设备和云端之间进行有效分配。在这些系统中,边缘设备上的 AI 算法会先识别出重要的事件,然后云端模型会介入,提供额外的信息支持。决定在本地还是云端执行 AI 工作负载,将取决于可用能源、延迟需求、隐私顾虑以及计算复杂性等考虑因素。边缘侧 AI 工作负载代表着 AI 去中心化的趋势,使设备能在数据源附近实现更智能、更快速且更安全的处理,这对于需要更高性能和本地化决策的市场,如工业物联网和智慧城市,尤为关键。
小语言模型加速演进
随着技术的进步,规模更小、构造更紧凑、压缩率更高、量化程度更高、参数更少的模型正在快速演进。典型的例子包括 Llama、Gemma 和 Phi-3,这些模型不仅具备更高的成本效益和效率,也更容易在算力资源有限的设备上部署。Arm 预计,2025 年这类模型的数量将继续增加。这类模型能够直接在边缘侧设备上运行,不仅提升了性能,还增强了隐私保护。
Arm 预计,越来越多的小语言模型将用于端侧的语言和设备交互任务,以及基于视觉的任务,如事件解读和扫描。未来,小语言模型将从大模型中提炼出更多经验和知识,以便开发本地专家系统。
多模态 AI 模型涌现
当前,GPT-4 这样的大语言模型 (LLM) 是基于人类文本进行训练的。当这些模型被要求描述某个场景时,它们只会以文字形式回应。但现在,包含文本、图像、音频、传感器数据等多种信息的多模态 AI 模型开始出现。这些多模态模型将通过能够听到声音的音频模型、能够看到的视觉模型、以及能够理解人与人之间、人与物体之间关系的交互模型,来执行更复杂的 AI 任务。这将赋予 AI 感知世界的能力,就像人类一样,能听、能看、能体验。
智能体应用不断拓展
如今,当用户与 AI 交互时,通常是在与一个单一的 AI 进行交互,这个 AI 会尽力独立完成用户要求的任务。然后,通过智能体,在用户指定需要完成的任务时,这个智能体会将任务委托给由众多智能体或 AI 机器人组成的网络,类似 AI 的零工经济。目前,客服支持和编程辅助等行业已开始使用智能体。随着 AI 的互联性和智能程度不断提高,Arm 预计在未来一年,智能体将在更多行业取得显著发展。这将为下一个阶段的 AI 革新奠定基础,使我们的生活和工作变得更加高效。
更强大、更直观、更智能的应用
在 AI 的推动下,设备上将涌现更加强大和个性化的应用。例如更智能、更直观的个人助理,甚至私人医生。应用的功能将从简单地响应用户请求转变为根据用户及其所处环境主动提供建议,实现 AI 的超个性化。这将导致数据的使用、处理和存储数量呈指数级增长,因此业界和政府需要采取更严格的安全措施并提供监管指导。
医疗服务将成为关键 AI 用例
医疗服务似乎已成为 AI 的主要用例之一,而这一趋势将在 2025 年加速发展。AI 在医疗领域的用例包括:预测性医疗、数字记录存储、数字病理学、疫苗开发和基因疗法等,以帮助治疗疾病。2024 年,DeepMind 的创始人因与科学家合作,利用 AI 预测复杂的蛋白质结构,且准确率高达 90%,被授予诺贝尔化学奖。同时,研究证明,使用 AI 可以将药物研发周期缩短 50%。这些 AI 创新为社会带来了显著好处,加速了救命药物的研发和生产。此外,通过将移动设备、传感器和 AI 相结合,用户将能够获得更优质的健康数据,从而对个人健康做出更明智的决策。
推动实现“绿色 AI”
AI 将加速融入可持续实践。除了使用高能效技术,“绿色 AI”策略也将受到越来越多的关注。例如,为了应对日益增长的能源需求,AI 模型训练可能会来越多地选择在碳排放较低的地区和电网负荷较低的时间段进行,这可能会成为未来的标准操作。通过平衡电网上的能源负载,这种方法将帮助缓解峰值需求压力,减少总体碳排放量。因此,Arm 预计会有更多云服务提供商推出针对能效优化的模型训练调度服务。其他方法还包括:优化现有 AI 模型以提高能效,重复使用或重新定位预训练的 AI 模型,以及采用“绿色编码”以尽可能减少能源消耗。在“绿色 AI”浪潮中,我们可能还会看到自发性标准的引入,随后逐步形成正式标准,以促进 AI 的可持续发展。
可再生能源与 AI 融合发展
可再生能源与 AI 的结合有望推动整个能源行业的创新。目前,可再生能源在可靠性和灵活性方面存在不足,难以平衡峰值负载,这限制了电网脱碳进程。Arm 预计,AI 将能够更准确地预测能源需求,实时优化电网运行,并提高可再生能源的效率,从而帮助解决这些问题。电能储存解决方案也将受益于 AI,AI 能够优化电池性能和寿命,这对于平衡可再生能源的间歇性特性至关重要。
引入 AI 不仅有助于解决预测和平衡峰值需求的难题,还能预见性地识别维护需求,从而减少能源供应中断。智能电网则可利用 AI 进行实时电能流动的实时管理,有效降低能源损耗。AI 与可再生能源的深度融合,预计将极大地提高能源系统的效率和可持续性。