云中子〖计算杂谈〗 · 4月8日 · 北京市

生成式AI的iPhone时代已至

从自动驾驶汽车穿梭在繁华的都市街道,到智能家居系统让人们的生活变得更加便捷舒适;从医疗领域的精准诊断与个性化治疗,到工业生产的自动化与智能化,AI的足迹已经遍布社会的各个角落。

如果哪个应用没有与AI结合,似乎就预示着它已经“落伍”了。但AI与应用相结合也绝非朝夕,依然存在着较高的“门槛”。

亚马逊云科技认为“没有一个模型可以适用于所有业务场景”,用户在使用过程中还需根据需求甄别选录。基于此,Amazon Bedrock提供一系列领先的基础模型供客户选择。

Anthropic打造更智能的Claude 3模型

Anthropic是一家人工智能安全和研究公司,致力于构建可靠、可解释和可操纵的人工智能系统。Anthropic近期推出了新一代的Claude 3系列模型,其中最智能的Claude 3 Opus在基准测试中的性能超过OpenAI的GPT-4和谷歌的Gemini Ultra,有着强大的应用潜力。

在生成式人工智能领域,Anthropic正在通过Amazon Trainium及Amazon Inferentia芯片构建模型,并开始为全球亚马逊云科技客户提供在Amazon Bedrock上对其未来基础模型的长期访问权限。同时,随着亚马逊完成了对Anthropic的40亿美元投资,双方的合作还将进一步加深。

亚马逊云科技大中华区产品部总经理 陈晓建

近日,亚马逊云科技在北京举办了生成式AI媒体沟通会,重点介绍了Amazon Bedrock + Anthropic Claude 3模型对企业构建生成式AI应用的赋能。

当前,Claude 3系列模型共有三款,包括Claude 3 Haiku,拥有即时响应能力;Claude 3 Sonnet,在技能与速度之间达到理想的平衡;以及Claude 3 Opus,为处理高度复杂任务设计的最智能模型。前两款已经在Amazon Bedrock中正式可用,Opus也将很推出。用户可根据自己的商业需求,从中选择最适合自己应用场景的组合。

“Anthropic在全球的风靡并非一蹴而就。Claude 3在数学问题、编程练习和科学推理等标准评估中超越了所有现有模型。用户可借助AI驱动的响应,自动化完成任务并保证高准确率,例如在制造业中优化特定领域的实验程序,或基于上下文数据审计财务报告等。同时,对比一下可以看到,Sonnet和Haiku的价格,相较于业界同等智能模型会便宜很多。这也是其吸引客户的重要原因之一。”谈到Claude 3的能力,亚马逊云科技大中华区产品部总经理陈晓建给予了充分肯定。

据了解,Claude 3目前已经具备多模态能力,它可接收基于图像的输入,能力与其他前沿模型大致相同,并且延迟低于其他多模态模型。

面对复杂的企业级应用,Claude 3做了针对性训练,它非常擅长理解图片、图表、图形、技术图解及光学字符识别 (OCR) ,因此在需要处理大量图像、图表、报告和其他视觉资产的企业用例中表现出色。速度方面,据相关评估结果显示,Claude 3模型在图像输入能力方面与前沿模型相当,并且Claude 3 Haiku的速度优于所有能力相当的前沿模型。

Claude 3:高效、迅捷的大模型

那么,Claude 3真的有这么强大吗?

为此,亚马逊云科技在活动现场也进行了一系列的现场测试,通过Claude3模型在Amazon Bedrock中的真实表现作出回应。

首先是名为“大海捞针(Needle In A Haystack, NIAH) ”的测试,即:在一本完整的《流浪地球》文本中插入一句《三体》的话,查看大模型能否在短时间内进行识别。主要考察Claude 3在200K级别超长上下文的准确召回能力。

虽然这个工作看似简单,但要真正做起来,会涉及到许多复杂的逻辑功能。一瞬间,测试结果出炉,Claude 3顺利识别出了那句插入的“不要回答,不要回答,不要回答!”。甚至还能识别出测试本身的局限,比如发现某“目标”句子明显是后来人为添加进原始文本的。

随后,亚马逊云科技还展示了模仿小说家古龙风格,续写小说,及代码生成、分析与优化等测试,Claude 3的表现明显优于同类模型,实用价值非常高。

基于以上能力,Claude 3能够通过图片来精准识别电商的商品,并根据商品的模特展示图精准捕捉产品细节,生成更准确的产品描述。目前已广泛应用到亚马逊电商业务之中。

利用Amazon Bedrock构建更强大的应用

有了强大的Claude 3,如何才能方便地用起来呢?

为了简化繁琐工作,亚马逊云科技在Amazon Bedrock中提供了Knowledge Bases知识库功能,它将成为企业专属的知识库。大模型虽强大,但要融入业务,需结合内部业务知识。Knowledge Bases正是这样的工具,提供全方位托管支持,简化用户将私有数据与大模型结合的流程,轻松构建内部知识库。借助Amazon Bedrock知识库,通过结合上下文信息,实现检索增强生成(RAG),并提供更准确、个性化的响应。所有检索信息均附带引文,确保透明同时减少误解。

像人利用多步执行来拆解复杂任务一样,Amazon Bedrock推出的Agents代理功能也非常善于处理多步骤的复杂任务。该功能使得客户能够使用自然语言来执行多步骤的业务任务。代理功能会使用基础模型的推理功能分解问题,并通过分步骤的方式解决用户提出的问题。Agent会利用推理功能将这个需求分解并逐步执行。Agent能够访问组织的企业系统、流程、知识库以及一些基础构建模块,进而制定出解决问题的逻辑步骤,确定调用哪些API以及调用时机,确保事务按照正确顺序完成。

同时,在用户使用大模型的过程中,还必须保障应用的安全性,为此亚马逊云科技提出了Responsible AI,并为Amazon Bedrock上提供了Guardrails功能,能够为多种基础模型和代理提供保护,并可添加内容过滤策略,保护敏感信息与用户隐私。

合规方面,Amazon Bedrock提供全面的监控和日志记录功能,为治理和审计需求提供支持。

“打通生成式AI最后三公里”是陈晓建对生成式AI应用如何落地的总结。他表示,亚马逊云科技拥有全面的技术支持资源,包括架构师、产品专家、AI实验室、数据实验室、快速原型团队和专业服务团队,协助用户完成生成式AI工程化的最后挑战。

生成式AI的iPhone时代已至

生成式AI发展迅猛,接下来最关键的一步是什么呢?

陈晓建表示,面对日趋复杂的用户需求,其实我们还有很多工作需要完成,包括基础层、模型及与业务结合三大方面。

在基础层面,芯片的现状仍面临挑战。尽管半导体芯片的技术进步迅速,但模型参数规模的迅速扩张已远超现有芯片的处理能力。从几百万参数到数十、数百亿参数的模型,其复杂性正以前所未有的速度增长。作为基础服务提供商,亚马逊云科技需不断探索如何使底层硬件能力与业务的复杂性和大模型的复杂度相匹配,确保硬件的发展能够跟上软件规模的扩张。英伟达推出的B200也远远不是硬件的顶峰,未来还有许多工作需要完成。

在模型层面,Claude 3所展现的能力确实令人瞩目。然而,要将这种能力真正与业务结合,还需付出大量努力。当前的模型可能已达到博士生水平,但要实现大学教授、院士,甚至爱因斯坦级别的突破,仍有很长的路要走。因此,包括亚马逊云科技在内的生成式AI供应商,必须持续投入研发,提升模型的能力。

至于最上层的业务结合,可以看到Amazon Q与BI、Amazon Connect智能客服等解决方案相结合的尝试。生成式AI与各行业、各场景的融合将是一项浩大的工程。还需思考如何使大模型更好地服务于各行各业,提供更强大的模型能力、更便捷的使用方式以及更低的成本。

生成式AI的iPhone时代已经到来。今天的演示让我们看到了生成式AI所能完成的种种惊人成就。但要实现这一伟大愿景,不仅亚马逊云科技需要努力,整个行业都需要付出巨大的努力。生成式AI有潜力为人类社会带来巨大的价值,但这需要我们共同去探索、实践。

推荐阅读
关注数
853
内容数
70
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息