IT大嘴巴 · 2023年04月25日 · 天津市

交互从此更简单,源1.0大模型开启多领域应用落地

许多人不知道,在ChatGPT大火之前,中文AI大模型就已经小试牛刀。

2023年开年,颠覆性的“黑科技”就席卷全球。随着AIGC应用的发展,特别是伴随着ChatGPT的大火,几乎所有的互联网公司都开始朝着AIGC努力。在中国市场,国产大模型也开启了“AI大乱斗”模式——据“金十数据”统计,包括阿里、腾讯、百度、360、网易、商汤、科大讯飞等众多互联网大厂和AI技术公司纷纷下场,甚至包括清华大学、复旦大学、中科院自动化所等科研机构也加入其中。

更有意思的是,各家大模型的命名也是千差万别,从“天工”到“文心”,从“MOSS”到“智脑”,甚至还有“曹植”和“孟子”的乱入……体现了中华文化的博大精深与源远流长。虽然众多名称让人眼花缭乱,但截至目前真正应用的却并不是很多,甚至上述许多模型还在开发与内测阶段,部分厂商也只是“预发布”或者仅有时间表而已,这不能不让人对中文大模型的应用情况担忧,尤其是担心中国在AIGC应用上大幅度落后。但其实根本不用这么紧张,因为许多人都不知道——早在2021年,我们就有了自己的中文大模型,甚至其训练规模相比同期的GPT-3模型领先近10倍。

早落地早体验,中国人自己的巨量AI模型

就在业内各家还为大模型的测试与体验争得不可开交的时候,却已有人捷足先登,开始了实际部署的应用,这就是我们今天要介绍的中文大模型平台——源1.0巨量中文AI模型(下称“源1.0”)。据悉,目前基于源1.0的AI应用已经在上海部分街道开始探索性的政务应用,而在源开发者社区中的“一键式构建专属数字人”开源架构也已经被深圳公司引入商用环节。从这两方面来说,源1.0就已经走在了行业前列。

1682389562551.png

这都得益于源1.0的抢先布局与海量数据训练。一直以来,中文大模型都被认为是一个难题,其核心就在于中文表意的复杂性和应用场景的多元化,比如同音字与多义字的出现,对于AI分析来说都是很大的挑战。而源1.0的参数规模高达2457亿,训练采用的中文数据集达5000GB,相当于26万亿汉字,几乎囊括了当时所有的中文互联网内容。

据悉,源1.0在发布时便问鼎全球最大规模的中文AI模型,并获得中文语言理解评测基准CLUE榜单的零样本学习和小样本学习两类总榜冠军;同时,登顶中文语言能力理解和生成评测基准CUGE(智源指数)精简榜总榜榜首,并获得语言理解(篇章级)、语言生成、对话交互、多语言、数学推理等5项评测最佳成绩。

为什么源1.0能有如此亮眼的表现呢?这都要得益于它的架构优势。据悉,源1.0采用transformer结构,针对Attention层和前馈层的模型空间进行结构优化,改进注意力机制聚焦文章内部联系的学习。

1682389583152.png

为了解决上面我们提到的中文应用场景复杂、语义多样化等难题,源1.0的设计者自研了海量数据过滤系统(MDFS),建立了从数据采集、粗滤、质量分类、精滤的全自动化的端到端数据工作流程,通过清洗866TB海量数据获得5TB业界最大规模高质量中文数据集;而这些数据集也为源1.0提供了海量的训练空间,使其能够快速、准确的理解语句本意并进行学习。

不仅如此,对于源社区来说,为了推动AIGC尤其是中文AI大模型的应用也是不遗余力。通过开源的方式,源1.0为开发者提供了直接可用的代码示例和大模型API,更重要的是开源了训练相关的数据,这样开发者不仅能根据自身应用或者业务情况实现自定义,更可以通过开源社区交流获得持续的支持,社区也提供了技术团队解答开发者们的各种问题,真正实现了相互促进,共同成长。

这加速了源1.0的快速落地。如今我们看到的许多中文AI大模型还处于“襁褓之中”的时候,源1.0就已经运用落地在不同领域。得益于先进的架构、算法与海量的数据训练和开源开放的社区运营,如今的源1.0可谓是中文大模型中的佼佼者,同样也赢得了众多开发者及行业用户的肯定。

应用新生态,源1.0助力生活应用数字化

我们看影视剧,许多AI机器人都能帮助人类解决那些生活中繁琐、重复的问题,而在实际工作中,我们也希望AI程序能够最大化的简化我们的工作,让每个人都能专注于业务本身。比如疫情三年,我们每个人都见证了社区居委会人员的辛勤努力,甚至一次次回答相同的问题、部署相同的工作就让他们疲惫不堪。而如今,在数字化的驱动下,AI技术是不是能帮助他们从中解脱呢?这一次,源1.0给出了答案。

其实,基层社区的数字化应用一直是国家关心的问题。早在2021年上半年,中央层面就已经发文强调“加强基层治理体系和治理能力现代化建设”,人工智能等新技术的出现为“如何加强”提供了新的思路。随着数字化应用于AIGC的结合,无论是政策层面、技术层面还是应用场景上的准备都已经完成,剩下的就需要源1.0这样的大模型“登场”发挥作用了。

以上海市的社区工作为例,一般的社区居委会配置为5-9人,但需要对接3500-5000名居民,平均每人对接400-500人,而日常工作更是琐碎,据统计所有项目加起来有119项之多,真可谓是事无巨细、亲力亲为。也正是看到了这个问题,源大模型开发者社区一群开发者依托于源1.0,为上海市静安区临汾街道打造了首个政务领域AI对话机器人“临小助”,助力社区工作人员更高效、更精准、更智能的回答各类问题。

1682389605459.png

比如与每个人相关的社保、民政、房管等问题。这些问题其实都有规定的程序要求与流程,也属于居民服务的范畴。以往,面对每一位咨询者,工作人员都要不厌其烦的一次次讲解,重复又枯燥。而在AI对话机器人“临小助”的辅助下,咨询者只要通过微信输入问题或者关键词,马上就能得到详尽的“正确答案”,相当于把各部门多本纸质的“一本通”变成统一的“一屏通”,这样不仅相应了国家提出的“就近办”、“少跑腿”要求,还提升了居委会办公效率。

1682389618214.png

此外,为提升居委会工作人员业务能力与服务水平,“临小助”还提供了包括加装电梯、业委会换届等8堂社区治理高频情景对话课程,社区工作者通过手机载体与“临小助”进行互动对话形式,提高接待群众服务群众的经验与信心,让社区小白“秒变”服务群众的能人。对街道来说,要达到相同的培训覆盖率与效果,传统线下模式可能需要数月时间,而运用AI对话机器人只要短短十分钟,反复练习、多场景练习因此成为常态,培训效率大幅提升。

一方面是业务知识“外脑”,另一方面是业务知识培训,“临小助”的出现为基层社区工作带来了大幅度改变,在实现便民服务的同时也提升了工作人员水平与服务效率,可谓是一举两得。如今,“临小助”已在上海市静安区临汾路街道、嘉定区安亭镇落地,受到了广大群众的一致好评。

同样融入我们生活的还有一款名为“一键式构建专属数字人”的开源架构。在源开发者社区中,数字化也是大家关注的方向,因此开发者郭泽将这个架构开源之后,立刻就引起了深圳某玩具公司的关注,后来公司也将该应用植入了相关平板中,为儿童提供更多情感的引导与陪伴。

据悉,这款名为“ Fay”的数字人生成平台包含Python内核及UE数字人模型,开发人员可以利用该项目简单地构建各种类型的数字人或数字助理。该项目各模块之间耦合度非常低,包括声音来源、语音识别、情绪分析、NLP处理、情绪语音合成、语音输出和表情动作输出等模块。每个模块都可以轻松地更换。这套架构相当于给只能文字聊天的ChatGPT装上好看的皮囊,并更像真人般能够实时对话,使ChatGPT更像人。

这也正是源1.0的初衷与价值所在。一方面,源1.0是规模最大的中文AI大模型,提供了强大的中文处理能力;而另一方面,结合当下AIGC的应用大趋势和数字人等应用场景,未来的源1.0还可以通过数字化、虚拟化等多种形式出现,覆盖包括社区服务、展厅导览、会场讲解、商场导购等一系列应用场景,提供包括智能客服、反诈宣传、社交娱乐等多元化的场景应用,让“好看的皮囊”与“有趣的灵魂”兼而有之,实现新突破。

以往提到智能设备与AI应用,我们总希望它能够真正改变我们的生活——无论是当年的AlphaGO还是如今的midjourney,越来越多的AI应用已经深入我们的生活。对于源1.0来说,它可以胜任包括智能创作服务、文案写作、对话交互等多种工作,成为更多用户与公司的“创作大脑”,并帮助其业务能力进一步提升。

中文AI大模型产业才刚起步,源1.0却已捷足先登。

推荐阅读
关注数
1931
内容数
247
专注开放计算、大数据应用、人工智能、企业数字化转型、云计算等领域产业观察及产学研合作。
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息