交互从此更简单，源1.0大模型开启多领域应用落地

许多人不知道，在ChatGPT大火之前，中文AI大模型就已经小试牛刀。

2023年开年，颠覆性的“黑科技”就席卷全球。随着AIGC应用的发展，特别是伴随着ChatGPT的大火，几乎所有的互联网公司都开始朝着AIGC努力。在中国市场，国产大模型也开启了“AI大乱斗”模式——据“金十数据”统计，包括阿里、腾讯、百度、360、网易、商汤、科大讯飞等众多互联网大厂和AI技术公司纷纷下场，甚至包括清华大学、复旦大学、中科院自动化所等科研机构也加入其中。

更有意思的是，各家大模型的命名也是千差万别，从“天工”到“文心”，从“MOSS”到“智脑”，甚至还有“曹植”和“孟子”的乱入……体现了中华文化的博大精深与源远流长。虽然众多名称让人眼花缭乱，但截至目前真正应用的却并不是很多，甚至上述许多模型还在开发与内测阶段，部分厂商也只是“预发布”或者仅有时间表而已，这不能不让人对中文大模型的应用情况担忧，尤其是担心中国在AIGC应用上大幅度落后。但其实根本不用这么紧张，因为许多人都不知道——早在2021年，我们就有了自己的中文大模型，甚至其训练规模相比同期的GPT-3模型领先近10倍。

早落地早体验，中国人自己的巨量AI模型

就在业内各家还为大模型的测试与体验争得不可开交的时候，却已有人捷足先登，开始了实际部署的应用，这就是我们今天要介绍的中文大模型平台——源1.0巨量中文AI模型（下称“源1.0”）。据悉，目前基于源1.0的AI应用已经在上海部分街道开始探索性的政务应用，而在源开发者社区中的“一键式构建专属数字人”开源架构也已经被深圳公司引入商用环节。从这两方面来说，源1.0就已经走在了行业前列。

这都得益于源1.0的抢先布局与海量数据训练。一直以来，中文大模型都被认为是一个难题，其核心就在于中文表意的复杂性和应用场景的多元化，比如同音字与多义字的出现，对于AI分析来说都是很大的挑战。而源1.0的参数规模高达2457亿，训练采用的中文数据集达5000GB，相当于26万亿汉字，几乎囊括了当时所有的中文互联网内容。

据悉，源1.0在发布时便问鼎全球最大规模的中文AI模型，并获得中文语言理解评测基准CLUE榜单的零样本学习和小样本学习两类总榜冠军；同时，登顶中文语言能力理解和生成评测基准CUGE（智源指数）精简榜总榜榜首，并获得语言理解（篇章级）、语言生成、对话交互、多语言、数学推理等5项评测最佳成绩。

为什么源1.0能有如此亮眼的表现呢？这都要得益于它的架构优势。据悉，源1.0采用transformer结构，针对Attention层和前馈层的模型空间进行结构优化，改进注意力机制聚焦文章内部联系的学习。

为了解决上面我们提到的中文应用场景复杂、语义多样化等难题，源1.0的设计者自研了海量数据过滤系统（MDFS），建立了从数据采集、粗滤、质量分类、精滤的全自动化的端到端数据工作流程，通过清洗866TB海量数据获得5TB业界最大规模高质量中文数据集；而这些数据集也为源1.0提供了海量的训练空间，使其能够快速、准确的理解语句本意并进行学习。

不仅如此，对于源社区来说，为了推动AIGC尤其是中文AI大模型的应用也是不遗余力。通过开源的方式，源1.0为开发者提供了直接可用的代码示例和大模型API，更重要的是开源了训练相关的数据，这样开发者不仅能根据自身应用或者业务情况实现自定义，更可以通过开源社区交流获得持续的支持，社区也提供了技术团队解答开发者们的各种问题，真正实现了相互促进，共同成长。

这加速了源1.0的快速落地。如今我们看到的许多中文AI大模型还处于“襁褓之中”的时候，源1.0就已经运用落地在不同领域。得益于先进的架构、算法与海量的数据训练和开源开放的社区运营，如今的源1.0可谓是中文大模型中的佼佼者，同样也赢得了众多开发者及行业用户的肯定。

应用新生态，源1.0助力生活应用数字化

我们看影视剧，许多AI机器人都能帮助人类解决那些生活中繁琐、重复的问题，而在实际工作中，我们也希望AI程序能够最大化的简化我们的工作，让每个人都能专注于业务本身。比如疫情三年，我们每个人都见证了社区居委会人员的辛勤努力，甚至一次次回答相同的问题、部署相同的工作就让他们疲惫不堪。而如今，在数字化的驱动下，AI技术是不是能帮助他们从中解脱呢？这一次，源1.0给出了答案。

其实，基层社区的数字化应用一直是国家关心的问题。早在2021年上半年，中央层面就已经发文强调“加强基层治理体系和治理能力现代化建设”，人工智能等新技术的出现为“如何加强”提供了新的思路。随着数字化应用于AIGC的结合，无论是政策层面、技术层面还是应用场景上的准备都已经完成，剩下的就需要源1.0这样的大模型“登场”发挥作用了。

以上海市的社区工作为例，一般的社区居委会配置为5-9人，但需要对接3500-5000名居民，平均每人对接400-500人，而日常工作更是琐碎，据统计所有项目加起来有119项之多，真可谓是事无巨细、亲力亲为。也正是看到了这个问题，源大模型开发者社区一群开发者依托于源1.0，为上海市静安区临汾街道打造了首个政务领域AI对话机器人“临小助”，助力社区工作人员更高效、更精准、更智能的回答各类问题。

比如与每个人相关的社保、民政、房管等问题。这些问题其实都有规定的程序要求与流程，也属于居民服务的范畴。以往，面对每一位咨询者，工作人员都要不厌其烦的一次次讲解，重复又枯燥。而在AI对话机器人“临小助”的辅助下，咨询者只要通过微信输入问题或者关键词，马上就能得到详尽的“正确答案”，相当于把各部门多本纸质的“一本通”变成统一的“一屏通”，这样不仅相应了国家提出的“就近办”、“少跑腿”要求，还提升了居委会办公效率。

此外，为提升居委会工作人员业务能力与服务水平，“临小助”还提供了包括加装电梯、业委会换届等8堂社区治理高频情景对话课程，社区工作者通过手机载体与“临小助”进行互动对话形式，提高接待群众服务群众的经验与信心，让社区小白“秒变”服务群众的能人。对街道来说，要达到相同的培训覆盖率与效果，传统线下模式可能需要数月时间，而运用AI对话机器人只要短短十分钟，反复练习、多场景练习因此成为常态，培训效率大幅提升。

一方面是业务知识“外脑”，另一方面是业务知识培训，“临小助”的出现为基层社区工作带来了大幅度改变，在实现便民服务的同时也提升了工作人员水平与服务效率，可谓是一举两得。如今，“临小助”已在上海市静安区临汾路街道、嘉定区安亭镇落地，受到了广大群众的一致好评。

同样融入我们生活的还有一款名为“一键式构建专属数字人”的开源架构。在源开发者社区中，数字化也是大家关注的方向，因此开发者郭泽将这个架构开源之后，立刻就引起了深圳某玩具公司的关注，后来公司也将该应用植入了相关平板中，为儿童提供更多情感的引导与陪伴。

据悉，这款名为“ Fay”的数字人生成平台包含Python内核及UE数字人模型，开发人员可以利用该项目简单地构建各种类型的数字人或数字助理。该项目各模块之间耦合度非常低，包括声音来源、语音识别、情绪分析、NLP处理、情绪语音合成、语音输出和表情动作输出等模块。每个模块都可以轻松地更换。这套架构相当于给只能文字聊天的ChatGPT装上好看的皮囊，并更像真人般能够实时对话，使ChatGPT更像人。

这也正是源1.0的初衷与价值所在。一方面，源1.0是规模最大的中文AI大模型，提供了强大的中文处理能力；而另一方面，结合当下AIGC的应用大趋势和数字人等应用场景，未来的源1.0还可以通过数字化、虚拟化等多种形式出现，覆盖包括社区服务、展厅导览、会场讲解、商场导购等一系列应用场景，提供包括智能客服、反诈宣传、社交娱乐等多元化的场景应用，让“好看的皮囊”与“有趣的灵魂”兼而有之，实现新突破。

以往提到智能设备与AI应用，我们总希望它能够真正改变我们的生活——无论是当年的AlphaGO还是如今的midjourney，越来越多的AI应用已经深入我们的生活。对于源1.0来说，它可以胜任包括智能创作服务、文案写作、对话交互等多种工作，成为更多用户与公司的“创作大脑”，并帮助其业务能力进一步提升。

中文AI大模型产业才刚起步，源1.0却已捷足先登。

推荐阅读

目录