科技云报道：人工智能“顶流”齐聚WAIC 2024，他们都做了什么？

科技云报道原创。

一个由智能驱动的未来世界长啥样？

从完成跨海跨城航线的“空中的士”、全无人驾驶汽车、实现奔跑功能的全尺寸通用人形机器人到百度文心一言、讯飞星火、阿里通义千问、华为盘古、商汤日日新等大模型，从智能制造引领的“灯塔工厂”到融入生活、人人可体验的智能应用，一个千帆竞渡、百舸争流的智能时代正缓缓向我们伸出触手，引领我们走向无限可能的未来。

7月4日，2024世界人工智能大会暨人工智能全球治理高级别会议（以下简称“WAIC 2024”）在上海启幕。

作为世界级AI科技盛会，本届大会以一场开幕式和三场全体会议——全球治理、产业发展、科学前沿为引领，全面覆盖AI伦理治理、大模型、数据、算力、具身智能、AI for Science、智慧工业、自动驾驶、投融资、教育与人才共十大重点话题，汇聚超过1000位全球领军人物，包括图灵奖、马尔奖、菲尔兹奖得主，科研机构、知名学者，世界500强企业代表等专家和行业人士，为人工智能技术的创新与发展注入新的活力。

当人工智能从“浅水区”迈向“深水区”，相关的研究理论出现分化与争议，研发投入与盈利能力之间的矛盾日益凸显，政、产、学、研各界正沿着不同的路径探索人工智能时代的未来。本届大会，蚂蚁集团、超云、智谱AI等国内AI领域“顶流”厂商业界全面展示了前沿技术研究和最新应用成果。

产业为根应用为锚人工智能触手可及

大会开幕当天，WAIC2024公布八大“镇馆之宝”，包括蚂蚁集团基于百灵大模型的“AI智能助理”、阿里云通义灵码、智谱AI基座大模型、联想集团笔记本YOGA Book 9i AI元启、商汤Vimi可控人物视频生成大模型、特斯拉赛博越野旅行车、智能飞行器展区展出的三家电动垂直起降航空器（eVTOL）创新产品。作为本届世界人工智能大会的展览最高荣誉，“镇馆之宝”旨在奖励并展示全球人工智能领域的最新技术成果、发展趋势及商业潜力。

在产业发展主论坛上，蚂蚁集团董事长兼CEO井贤栋表示，专业智能体能够破解通用大模型在严谨产业应用的关键难题，蚂蚁集团正在携手产业合作伙伴构建专业智能体生态，加速产业应用，推动服务升级。“在人工智能时代，我们也在探索，让AI像扫码支付一样便利每个人的生活，让AI技术发展的红利惠及更多人。”

通过科技的力量，降低人工智能应用门槛，实现人工智能技术普惠化，是蚂蚁集团一直以来的希望。作为国内较早布局AI大模型的厂商，蚂蚁自研的百灵大模型2023年已通过备案，并以此为内核打造了“三个管家”，分别是AI生活管家、AI金融管家和AI医疗健康管家。这三个管家对应的生活、金融和医疗等场景，都需要严谨专业优质的服务。

当前，通用大模型落地严谨产业面临着三个“能力短板”：领域知识相对缺乏、复杂决策难以胜任、对话交互不等于有效协同。井贤栋介绍，为了破解这些难题，蚂蚁选择了构建专业智能体生态的路径，“从我们的实践来看，专业智能体是大模型落地严谨产业的有效路径。”

由于垂直领域、高质量的数据往往以多种模态存在，对隐私保护和资产价值保护的要求高，很难直接“喂给”通用大模型。为此，蚂蚁依托知识图谱、密态计算等技术，构建了大规模专业知识引擎，可以将垂直领域不同类型的数据，抽象成不涉及隐私信息的领域知识，成为大模型的“专业教材”，供大模型训练学习，也能让大模型在推理中随时“查阅”。这些“专业教材〞，是蚂蚁提升大模型的领域专业性、打造专业智能体的核心能力。

其次，针对大模型复杂推理的能力短板，蚂蚁提出了FoE专家级决策框架（Framework of Experts），让智能体借鉴人类专家的思考方式，构建专业的推理和决策能力。严谨产业中存在大量的专业决策框架及公认的行业最佳实践，大模型要达到专业水准，必须谦虚地向专家学习。

作为生活服务的“数字接口”，AI智能助理成为专业智能体生态的平台入口。用户通过与智能助理的对话，就能一键连接生活、金融、医疗等垂直行业的AI智能体，获得更专业丰富的服务。

以投资研究智能体支小助为例，学习金融专家的分析推理框架后，在接到不同的投研任务时，它会动态学习专家的思考方式，模仿专家的思路进行分析和生成，可以实现媲美人类专家的金融分析能力，目前支小助已经为超百家金融机构提供服务，其服务水平已经趋近于真人行业专家，为用户在金融投资方面提供专业化决策。

在医疗健康领域，蚂蚁和浙江卫健委联合推出数字健康管家“安诊儿”，背后就是一个连接着多家医院、多个医疗机构的智能体生态。安诊儿的服务贯穿诊前、诊中、诊后，覆盖挂号、咨询、用药、健康科普等26个环节，用户通过语音就可以唤醒的专业智能体，能为患者就医提供诸如导诊挂号、问诊陪护、医疗报告查询、健康管理等专业服务，对老年人、异地就医群体尤其友好。今年，安诊儿将升级为2.0版本，真正带来全流程的就医智能体网络。

在“隐私计算：助力大模型与数据可信融合发展”分论坛上，蚂蚁集团联合中国电信集团有限公司、中国信息通信研究院华东分院、浙江大学区块链与数据安全全国重点实验室等国内外行业专家、学者，从技术前沿、标准体系、实践成果等维度，共话下一代隐私计算技术创新和应用。

大模型的发展不仅为密态计算带来了更大的市场空间，同时也在促进密态计算技术的不断演进。在论坛上，蚂蚁集团全新发布“隐语Cloud”大模型密态计算服务。该服务依托于蚂蚁全栈可信隐私计算技术，不仅提供了密态推理、密态微调等一站式服务，实现多重数据防御，全面适用于多种场景，从用户查询的隐私到训练数据的安全，再到模型IP的保护，使用户可以低成本、高效率地获得密算服务。

作为本届WAIC的重磅发布，蚂蚁集团首发了国内首个大模型安全一体化解决方案“蚁天鉴 2.0”。蚁天鉴是业内首个实现产业级应用的大模型安全评测与防御一体化解决方案，可保障大模型的生产和使用更加安全、可控、可靠。

相比1.0版本，蚁天鉴 2.0新增了两项评测能力，一个是“大模型X-ray”，可针对大模型的内在神经元进行X光扫描来做探查和判断，让研究人员了解大模型内部在发生什么、定位可能引发风险的神经元、并进行编辑修正，在模型内部治理幻觉，实现从源头识别和抑制风险。第二是“大模型基础设施评测”。从攻击者视角出发，深入扫描模型算法组件及模型软件系统，可及时准确发现大模型供应链及运行环境安全问题，保障云到端的应用安全可控。

面对新技术的滥用场景，蚁天鉴还推出了“AI鉴真”解决方案，支持多模态内容真实性和深度伪造检测，可快速精准鉴别图像、视频、音频、文本内容的真伪，有效应对AI换脸、声音模拟、证件伪造等各类深度伪造风险场景，图像识别准确率99.9%达到行业最高优秀级别。

在大会展区的蚂蚁集团“AI鉴真中心”，展出了包括多模态AI鉴真、“谍影重重”深度伪造（Deepfake）互动，为普通人揭开“声音模拟、AI换脸”的真相，让公众进一步了解到反深伪技术的发展，守护人们的安全。

该互动模拟了蚁天鉴AIGC检测和证照深度合成检测两大能力，对抗声音模拟、证件伪造等AI滥用风险场景的过程。“攻击端”模拟了常见伪造手法，涵盖证照、视频等多样化素材可供选择，可对“防御端”检测模型进行攻击。该产品依托生成模型构建TB级样本，实时攻防对抗，快速精准鉴别图像、视频、音频、文本内容的真伪并形成检测报告，从而帮助用户识别和评估相关素材是否被篡改或深度生成，防御AI技术的潜在滥用。同时，蚂蚁集团特设“谍影重重之 Deepfake 互动展”，用户上传一张照片就可以生成仿真视频。通过场景化的体验，让观众对人工智能安全有着更为直观的了解和认识。

算力为基大模型为擎，硬核技术异彩纷呈

在本届WAIC期间，智谱AI展示了最新的人工智能技术应用成果。自新一代基座大模型GLM-4问世以来，已经有超过30万个智能体活跃在清言的智能体中心内，其中包括了诸如思维导图、文档助手、日程安排等许多出色的生产力工具。这些智能体基于GLM模型自身强大的能力以及开发者的想象力，能够越来越高效和精准地帮助用户解决问题。

清言智能体不仅拥有1亿字庞大的知识库，支持文字、表格、音频等多种文件格式和URL导入，还能递归抓取信息，更配备了思维导图、流程图、高德地图、新浪微博、飞书日历、什么值得买、微信公众号等众多实用工具，与工作生活无缝对接，让AI从数字世界走向现实。

清言智能体大幅降低了人工智能工具的应用门槛，只需一键点击，便可轻松实现开箱即用，为用户工作生活带来更多便捷与创新。无论是有经验的开发者，还是不会编程的新手，都能通过简单的自然语言，让创建一个具备人设、能自主搜索、图文转化、运行代码、使用工具的智能体，不再是一个需要数周乃至数月的开发过程，而是在几分钟内就能实现简单AI实践。

人工智能技术的普及和应用，推动了算力需求的快速增长。传统的通用算力及信创算力已逐渐转向通用AI算力和自主AI算力，以适应更加复杂多样的应用场景。同时，算力空间的重构也呈现出新趋势，从分散的机房向枢纽节点的大规模投建转变，推动了AI推理业务从中心向边缘的拓展。

超云在AI算力基础设施方面的算力产品家族和一体化AI解决方案悉数亮相，为人工智能技术的广泛应用提供了有力支撑。

5月，超云发布“AI IN ALL”发展战略，其并非仅仅是硬件的简单堆砌，而是对研发设计、专业定制、多元生态、融合集成、供应能力以及整体解决方案能力的全面挑战与考验。此战略的核心在于构建一个全方位、一体化的AI解决方案体系，通过生态系统的深度融合与多方资源的协同合作，加速企业数字化转型与智能化升级的步伐。

凭借在多元算力、智能管理、高效算能、坚实安全底座等方面的优势，超云打造了涵盖智算、信创、云系统、云计算在内的全栈算力产品家族，通过融合AI技术，实现了算力、存储、云和融合管理的无缝衔接，在提升系统便捷性、稳定性和运维效率的同时，显著降低了管理和运维成本。

回顾近年，超云在AI算力基础设施领域持续创新，为行业带来了多项突破，其更加注重打造训练和推理服务器的竞争力。尤其是在推理层面，超云更是将其提升至公司战略层面，立下了“推理之巅、超云为先”的目标。目前，超云已完成了AI推理的全栈生态搭建，大模型、高密度、液冷、边缘等各类推理机器不仅符合国内的实际需求，而且在性能、成本和使用便利性等方面都达到了较高水平。

另一个技术狂想：具身智能的爆发点

机器人行业中一直存在一个经典悖论——物理世界中最难解决的“容易”问题。如蹲下、起身、跳跃、转圈等等，对机器人来说，这些简单的动作都需要极为复杂的机械控制系统来实现。而现实生活中常见的简单任务，如做饭、冲咖啡、搬货，把流程分解成每一个动作，并且要做到“不走形”。这一类“容易”问题层层累加，难度是指数级递增的。

与基于软件平台的“对话机器人”的逻辑推理、或者更高层次的“生成式涌现”不同，目前活跃在一线的商业机器人、工业机器人整体走的还是自动化控制路线，需要解决的更多是机械控制问题。要解决这些问题，算法是有边界的，大多数研发与工程瓶颈被卡在传感器、控制器这一类硬件单元上，软硬件的智能融合处于非常早期探索阶段。

大模型在自然语言连续对话、通识理解、少样本/零样本学习等能力方向的突破，补全了让机器人产业从1%到10%跃升的技术基础，这也是业内看中机器人+大模型的主要原因，使得机器人在软件层面终于看到了变革的曙光。

特斯拉带来的Optimus二代人形机器人，更灵活，可操作任务更复杂。第二代机器人在AI大模型的加持下，体重比一代更轻，步行速度加快，身体控制能力增强；手部关节全新升级，活动更加自然，手指部分搭载触觉传感器，甚至能完成抓鸡蛋等精细活。同时，Optimus二代还可以做多个深蹲动作，显示出其平衡能力有所增强。

傅利叶发布了首款全尺寸人形机器人GR-1，并率先实现量产交付。一年来，研发团队在仿真环境中训练GR-1，再将训练好的模型迁移到现实世界。通过远程遥操采集人类的动作数据，用于训练和改进仿真模型，GR-1得以模仿学习人类运动，完成跳舞、打鼓、放置物品等日常生活动作。GR-1还能在户外复杂地形如草地、非平整路面及泥泞斜坡上顺利行走，实现稳定、自主的运动控制表现，为机器人在实际应用中的高效作业打下坚实的基础。

每一次技术革新都推动着人类文明的脚步不断向前。在科技的璀璨星河里，我们跃入了崭新的人工智能时代，如同一个巨大的熔炉，汇聚着无数的机遇与挑战，冷思考与热驱动在这里碰撞出绚烂的火花。这个时代还有很多问题需要面对和解决，但翻越一座座大山之后，我们终将抵达辽阔的星辰大海。

【关于科技云报道】

专注于原创的企业级内容行家——科技云报道。成立于2015年，是前沿企业级IT领域Top10媒体。获工信部权威认可，可信云、数博会、国家网安周与全球云计算等大型活动的官方指定传播媒体之一。深入原创报道云计算、人工智能、大模型、网络安全、大数据、区块链等企业级科技领域。

推荐阅读

目录