大模型竞速赛鸣枪开跑后,苹果似乎已经脱离了第一梯队,曾经的行业风向标并没有像其他大厂那样频繁地宣讲 AI,加之缺乏能够参与竞争的「明星产品」,其一度被贴上了「落后」的标签。但其实熟悉苹果的网友都知道,这是一家「重落地」的公司,更加擅长的是把创新技术工程化,实现「工程创新」。也正因如此,在生成式 AI 发展如火如荼之际,仍有很多网友在期待苹果的「划时代」产品。
如今,苹果终于「提枪上马」了。在刚刚结束的 WWDC24 主题演讲中,苹果发布了生成式 AI 模型 Apple Intelligence,并介绍了 iOS 18、Siri 等基于 Apple Intelligence 实现的重磅更新。
同时,此前曾盛传的苹果与 OpenAI 的合作也正式官宣,今年晚些时候,ChatGPT 将登陆 iOS 18、iPadOS 18 和 macOS Sequoia,由 GPT-4o 提供支持,用户无需创建账户即可免费访问。而 ChatGPT 的订阅用户则可以连接其账户进而访问付费功能。
本文除了介绍 Apple Intelligence 以及 Siri、iOS 18 的重磅更新外,还为大家梳理了 Siri 的发展历程,希望能够进一步展示苹果 AI 能力的升级之于 Siri 的重要性。
Apple Intelligence 终于来了
万众期待,苹果智能 Apple Intelligence 终于来了。
苹果称其为「个人智能 (personal intelligence)」,结合生成式 AI,能够为用户提供更加个性化的智能。公司高级副总裁 Craig Federighi 介绍道,「苹果智能是以用户的个人数据和背景为基础的」。
库克表示,Apple Intelligence 将改变用户使用苹果产品所能做的事情,以及苹果的产品能为用户做的事情。同时,他还强调了隐私与个性化的重要性,并提出「个人智能是苹果下一阶段的重要举措」。
此外,借助私有云计算,Apple Intelligence 可以灵活扩展其计算能力,并利用基于服务器的大型模型来处理更复杂的请求。这些模型在由 Apple 芯片驱动的服务器上运行,进一步确保用户上传的数据不被保留或暴露。
具体而言,Apple Intelligence 能够实现:
- 邮件处理:基于「优先信息 」功能,收件箱顶部的新区域将显示最紧急的电子邮件。每份邮件都配有摘要,无需打开邮件即可查询内容。智能回复能识别电子邮件中的问题,确保所有问题都能得到回复。* Image Playground:快速为朋友创建有趣的图片,甚至可以看到用户与他们的对话相关的个性化建议。
- Genmoji:用户可以通过文字描述,实现自由定制的 Genmoji 表情包。
- 写作改进: Apple Intelligence 将面向本地应用程序与第三方程序,引入全系统的校对和风格改进。
- 跨应用任务:Apple Intelligence 可以深入到用户的应用程序中,代表用户执行任务。
- ……
Siri 的前世今生:丧失领先优势,能否借力 OpenAI 浴火重生
从某种程度上讲,Siri 是乔布斯面向人机交互打出的致胜一枪,本是为苹果公司抢下了先机,后续发展却不遂人愿。如今,在 Apple Intelligence 的加持下,借助 GPT-4o,Siri 能否焕发新生呢?
收购 Siri,乔布斯生前做的最后一件事
Siri 最初是美国国防部旗下国防高等研究计划署的研究项目,定位为国家级的虚拟语音助理。2007 年,外部资金的引入促成了 Siri 公司的诞生,创始人有 Dag Kittlaus(任 CEO)、Adam Cheyer(任高级工程副总裁)及 Tom Gruber(任 CTO 和高级设计副总裁)。
2010 年,Siri 作为一款独立应用首次亮相。据报道,Siri 团队认为,Siri 最核心的竞争优势在于,其服务是与传统网络搜索信息方法的一次彻底决裂,Siri 不是搜索引擎,而是以虚拟助手形式出现、能够进行社交互动的智能 Agent。
Siri 展现出的创新性很快引起了乔布斯的注意,已经重病在身的他亲自致电 Siri 三巨头,邀请其到家中畅谈人机交互的发展,并表达了收购意愿。据 Norman Winarsky 在其演讲中回忆道,乔布斯在两周之内和 Siri 的管理团队及董事会谈了二三十次。最终,2010 年 4 月,苹果公司以 1.5—2.5 亿美元收购了 Siri。
2011 年 10 月,Siri 以智能语音助手的身份与 iPhone4s 一同面世,在深度整合之下,Siri 能够调用苹果系统的内置工具来处理预约会议、回复邮件、查看天气等简单任务。毫无疑问,Siri 凭借其前无古人的定位迅速引发热烈反响。
不幸的是,乔布斯在 iPhone 4s 发布的第二天猝然离世。有着「硅谷独家大王」之称的《纽约时报》高级科技记者约翰.马尔科夫表示,收购 Siri 是乔布斯生前做的最后一件事,带来的是苹果内部第一次翻天覆地的变化,他为苹果铺平了走向未来的道路——迎接将来人机交互的另一次重要转换。
令人意想不到的是,乔布斯的离世成为了 Siri 「泯于众人」的重要转折点。一位前苹果员工曾表示,「当史蒂夫在 Siri 发布的第二天去世的时候,他们(Siri 团队)就已经失去了愿景与蓝图,他的去世基本上标志着 Siri 原始团队计划的破灭。」
Siri 创始人三巨头中的 Adam Cheyer 和 Dag Kittlaus 于 2012 年先后离开苹果,并带走了一部分初创团队的工程师,随后联合创建了新智能语音公司 Viv Labs,这个公司最终也被三星收入囊中。Adam Cheyer 曾表示,「在乔布斯去世后,苹果公司发生了一些变化。如果乔布斯还在的话,我或许不会离开。」
这期间,苹果挖来了亚马逊搜索部门以及广告业务的高管 Bill Stasior,其主要负责语音识别、自然语义理解和搜索等多个 Siri 核心团队的管理工作。据苹果前员工向媒体透露,Bill Stasior 更倾向于将 Siri 打造成一个世界一流的搜索引擎,他将当时苹果在搜索功能方面的资源和 Siri 聚合在一起,以进一步提升 Siri 的性能,包括在网页、媒体资源以及 Wiki 百科领域的搜索能力。
这一发展方向显然与团队最初对于 Siri 「能够进行社交互动」的定位有很大不同,在 Bill Stasior 掌舵期间,出现了不少资深员工出走事件。内忧外患,在苹果内部囿于人才流失时,三星、微软、亚马逊、谷歌已经乘胜追击,也进入了智能语音助手的赛道。
三星于 2012 年在 Galaxy S3 上推出了 S Voice;2013 年,Google Now 可在 iOS 版本的 Google 搜索移动应用程序内使用;微软于 2014 年在 Windows Phone 上公布了 Cortana 小娜;亚马逊也于 2014 年在 Echo 智能扬声器上推出了 Alexa;谷歌还在 2016 年推出 Google Assistant。
与此同时,Siri 的更新却缺乏新意,在嘈杂环境中听错指令等问题也愈发凸显。如今,Siri 甚至逐渐沦为了 iPhone 的「鸡肋」功能。究其原因,笔者认为主要是苹果公司早期对于 Siri 的定位不清晰——到底是成为「世界一流的搜索引擎」还是一个能够处理复杂指令任务的「智能助手」,这也导致其发展严重滞缓。
如今,生成式 AI 大行其道,以 ChatGPT 为代表的 ChatBot 展现出了巨大潜力,苹果不仅发布了 Apple Intelligence,还宣布与 OpenAI 合作,双管齐下,能否为 Siri 注入新鲜血液呢?
整合 ChatGPT 的 Siri
从刚刚的发布来看,答案是肯定的。首先,Siri 变得更自然、更贴近语境、更个性化,能够简化、加速日常任务。如果用户说话磕磕绊绊,Siri 也能跟上,并保持从一个请求到下一个请求的上下文衔接。此外,用户还可以向 Siri 输入文字,并在文字和语音之间切换,以任何合适的方式与 Siri 交流。Siri 还采用了全新的设计,当 Siri 处于活动状态时,屏幕边缘会环绕着优雅的发光灯。
其次,基于屏幕感知功能,Siri 将能理解用户在更多应用中的操作并采取相应的行动。例如,如果朋友在「信息」中给用户发送了新地址的短信,接收者就可以发出指令:「把这个地址添加到他的联系人卡中」。
第三,Siri 还能在苹果和第三方应用程序中采取数百种新操作。例如,用户可以提出,「从阅读列表中调出那篇关于蝉的文章」,或者 「把周六烧烤的照片发送给马莉娅」,Siri 就会帮你处理。
此外,Siri 可以随时随地为用户提供设备支持,回答数以千个有关如何在 iPhone、iPad 和 Mac 上进行操作的问题。
更重要的是,Siri 将免费接入 ChatGPT,当 Siri 无法回答用户问题时,便能够「求助」ChatGPT 的专业知识,Siri 会询问用户「是否想与 ChatGPT 分享该问题」,用户能够向其发送文字、文件或图片,随后 Siri 将直接给出答案。
据 Greg Brockman 介绍,ChatGPT 将整合到 iOS、iPadOS、macOS 中,并于今年晚些时候上市,让我们拭目以待。
叠满 AI buff 的 iOS 18
虽然暂时还没有搭上 GPT 的「快车」,但 Apple Intelligence 也同样为 iOS 系统的更新注入了强大的动能。
主屏幕个性化控制
苹果向用户开放了对主屏幕的控制权,这意味着,iPhone 用户终于可以按照自己的喜好修改主屏幕,比如选择自己喜欢的照片作为壁纸,或者随意改变应用程序的位置,将它们摆放在底部右侧以便更轻松地访问。
此外,应用程序图标不仅支持暗色模式,还可以配合用户的壁纸选择其他颜色,实现个性化主屏幕设置。
升级控制中心
全新的控制中心采用多页面布局,新增了「控制中心组件库」,第三方开发者也可以将自己的应用程序接入 iOS 18 的控制中心,用户可以用更快的速度访问每天需要做的事情。增强隐私保护
有时候用户会把设备借给别人短暂使用,为了避免信息泄露,苹果采用了锁定应用程序功能。一旦用户锁定了一个应用程序,其他人想要使用它就得先通过 Face ID、Touch ID 或者密码进行身份验证。此外,用户还可以隐藏自己使用的应用程序,将其放入一个被锁定的隐藏应用程序文件夹中,避免别人「偷窥」。
Messages 回复
全新的 Tapback 功能支持使用任何表情符号或贴纸进行回复,这让用户可以更轻松、更有趣地表达自己!同时,信息应用新增了定时发送信息功能,并支持为文字添加粗体、斜体、下划线或删除线等文本格式选项,让文本效果更加丰富。
轻松手机支付
Apple 还引入了一种快速且私密的方式来「轻点支付」,只要把手机靠在一起,在不共享电话号码或电子邮件地址的情况,晚餐的账单就可以轻松支付。
自动照片分类
相簿将会根据拍摄日期、地点、人物、宠物等进行自动分类,用户可以自由排列照片的次序,方便用户查找想要的照片。
写在最后
乔布斯出色的市场预见性与产品创新力为苹果公司奠定了强大的基础,不少人认为,库克掌权后削弱了苹果的创新基因,而这也是公司在新一轮 AI 浪潮中落后的重要原因。从库克今晚提及 AI 的次数来看,苹果已经正式吹响了进攻的号角,凭借强大的硬件生态与用户基础,谋定而后动或许反而能够取得意想不到的成功。