今年元宵,伴随着如火如荼的冬奥会。冰雪盛宴不仅展示了体育的魅力与奥林匹克精神,更向全球展现了无所不在的中国科技。这场盛会中百度的AI技术屡屡刷屏,我们以小见大,从中看到了中国科技力量全面提升,科技自信冉冉升起。
很多时候,技术的价值与魅力就是这样,既在目光之中,又在生活之外。一次让我们惊叹的邂逅,背后往往有着有趣的技术逻辑,以及充满想象力的未来前景。
比如说,当你在“天下共元宵”H5中输入“我想在…看月亮”的地点时,可能并没有发现,此刻的你正在完成一次与AI的深度对话。
2月15日元宵节,在共青团中央宣传部、国家航天局探月与航天工程中心指导下,中国青年报社联合百度共同推出“天下共元宵”线上互动活动。活动以“嫦娥一号”传回的首张全月影像图为原型,使用AI生成个性化画作。这可能是很多人第一次直观体验AI大模型的魅力,体验到百度文心大模型的AIGC(AI Generated Content)价值。
“天下共元宵”不仅是一次诗意的期许与祝福,更是AI技术透过元宵佳节的窗户,射出了姣姣月光。伴随着明月升起,我们将看到大模型走向产业应用的确定性未来,看到是月下的AIGC的繁华盛景。
不仅在冬奥会,也不仅在元宵节,百度正在用AI之笔,写下一句“万里共文心”。
明月初升:月下的你,“月中”的AI
明月是中国人不变的乡愁,是人类艺术史永恒的执念。在“天下共元宵”互动活动中,用户可以输入一个地名,既可以是自己的家乡,也可以是让我们神往的异国他乡,甚至是雪山,是火星。然后AI能够快速理解这个地名,并进行联想创意,随后用艺术史上杰出画家的笔法,创作出符合主题的艺术画作,并且还能赋诗一首。
比如,当我们输入“北京”,文心大模型能够画出长城上的明月;输入“埃及”,可以看到画作中出现明月下的金字塔;当输入“火星”时,可以看到“祝融号”火星车的身影。
这个创意玩法非常有趣,让我乐此不疲地给AI出难题。直观感受是,很多不那么热门的地名,文心也能准确识别,并且找到符合当地特色的景物,这显然需要AI生成能力与知识储备的深度融合。再有就是AI作画能力非常优秀,从中可以非常清晰感觉到历史上著名画家的笔法。从印象派到水墨画,从梵高到毕加索,不仅能模仿著名风格和流派,文心甚至可以针对同一地名,给出画风笔触截然不同的多幅作品。
相信很多朋友都听说过AI大模型的价值,但这次是第一次与大模型来了一次零距离接触。元宵佳节,你在赏月,而月色中的AI则在认真读懂你意思,为你带来一份惊喜。
“诗画双绝”的背后,可以看到文心大模型在AI生成内容中,与以往的技术解决方案有着三项显著的不同:
1.可以实现跨模态转换,能够根据语义内容生成画面,完成从语言到视觉的模态转换。
2.具有优秀的全局观,生成的内容精准适宜,风格协调、配色合理,符合艺术审美。
3.文心完成的“思考等级”明显很高,其生成的内容复杂多样,产生的联想丰富,脑力极强。
这三项差异,让“天下共元宵”的内容体验与互动效果,较过去的AI生成内容有了显著提升。而这一丝“月光”,可以照见大模型走向产业,走向应用的跨越。
月满枝头:文心大模型,照见智能灯火
如果大模型只能在单一领域、单一模态中完成内容生成,那么其价值也只能在特定领域应用,很难与千行百业的真实需求相关联。而“天下共元宵”背后的文心大模型,却以核心技术突破的方式,让我们看到了大模型走向强应用与泛化场景的“正确打开方式”。
百度打造的飞桨文心大模型,全景图包含NLP(自然语言理解)大模型、CV(计算机视觉)大模型、跨模态大模型,既有基础通用的大模型,也包含面向重点领域、重点任务的大模型,以及丰富的工具与平台。
而文心大模型的最大差异化,就是其具备“知识增强”的核心特色,学习效率更高、效果更优,具有通用性好、泛化性强的特点。因此文心大模型可以更加贴近真人对世界的理解,能够听懂语言、看懂图片视频、理解真实的世界,并且能够进行对话、作画、写歌词、续写剧本、续写小说等创作。具体到“天下共元宵”的活动中,可以看到文心大模型可以根据文本自动关联地名背后的知识,联想出相关的文化景观,制作成精美的图画;又能够基于景观创作出文字内容,生成效果惊艳的诗歌,这就是知识增强大模型独特能力的一次鲜明展示。
而换个角度看,千行百业的智能化需求也必然存在两个特性:跨模态和强关联知识。文心大模型在元宵夜展示的才艺,也正是千家万户正在这个夜晚期待着的智能。可以看到知识增强这一核心技术突破方向,正在驱动着大模型从追求数据集效果,走向追求应用效果。
这是大模型的跨时代突破,也是2022年最值得期待的AI发展方向之一。而从“天下共元宵”当中我们甚至可以进一步看到,这个方向并非虚指,而是已经有了清晰的具体赛道——这就是正在愈发火热的AIGC。
月华当空:AIGC,相逢即繁华
随着社交平台与流媒体平台成为我们须臾不可离身的东西,内容创作与传播成为全球最普遍的价值生产方式,也筑造了规模庞大的泛内容产业。
当内容需求越来越旺盛,谁来提供内容,如何更高效提供内容就成为了不变的话题。曾几何时,UGC、PGC、OGC是互联网最热衷探讨的概念。但无论哪种创作方式,都无法掩盖两个事实:优质内容永远不够用,优质内容创作非常耗时耗力。
这种情况下,由AI来完成或辅助内容创作的AIGC就具备不可替代的产业必然性。快节奏的内容消费与生产,必然推动行业走向更高强度的自动化。其实,AIGC已经来到我们身边,但其模式相对单一,基本以生产简单文本和TTS声音合成为主。未来我们期待且具有价值的,必然是能够完成更复杂创作,能够读懂创作者意图与观众诉求,既有灵感,又有知识的AIGC。
这种情况下,大模型的孕育为AIGC升级带来了坚实的基础。而具有知识增强特性的文心大模型,则可以说是在大模型与高质量AIGC之间,完成了如女足姑娘一样精彩的“临门一脚”。
诚然,AIGC目前来看还有非常多需要提高和打磨的空间,但依稀已经可以看到这轮明月下,AIGC表现出了可圈可点的发展潜力。文心大模型的出现,驱动着AIGC向着三个方向发生变化:
1.AIGC创作出的内容高度个性化、定制化,具有创意与逻辑感。
2.AIGC将成为创作者的智能助手,大幅提升创作者生产效率,助力内容产业跨越式发展,实现内容创作与分发的提质增效。
3.AIGC可以与更多的产业需求、产业模型相适配,通过与行业知识对齐融合,AIGC将不仅作用于互联网内容,还将与工业设计、自动化编程、元宇宙、智能办公等场景结合,完成生产力的升级。
为了实现这些目标,需要AIGC具有一系列的产业与技术前提。其中最重要的是核心技术成熟;开发与应用平台完善;实践场景丰富。文心大模型带来了核心技术的跨越式突破;而百度打造的飞桨则提供了完善的AI技术开发平台与大模型使用工具,并且大模型的能力还可以通过百度智能云等出口赋能行业;百度自身的产品布局,可以带来一系列产业实践空间。文心已经在百度多个业务线得到了落地应用,为未来打开了足够的想象力。在数字人与智能视频合成等方向上,百度带来的AIGC能力已经可以体系化输出,并且在冬奥会等舞台上绽放。虚拟数字人、智能对话、AI新闻创作、AI图片生成、AI自动剪辑视频、AI写诗等方面都已经能够看到百度提供的AIGC能力。在文心的加持下,下一个AIGC的可能性或许就由你来发掘。多样化的产业机遇,庞大的市场需求,以及盛大的亮相舞台,让百度的AIGC布局,中国的AIGC风口,实现了相遇即繁华的最好状态。
天下共元宵的这次活动,或许是你今年AI之旅的第一站。
AIGC的落地与发展,或许是大模型拥抱产业价值,拥抱大规模应用的第一站。
百度持续的AI进取,或许是中国AI走向差异化未来,走向自立自强的第一站。
AI生明月,万里共文心。