8 月 15 日,科大讯飞召开星火认知大模型 2.0 发布会。
两个半小时的发布会里,有技术、产品发布,有现场实操演练,更有董事长刘庆峰一如既往的激情感染力。
在刘庆峰一众金句当中,如约而至,印象最为深刻。
100 天前,也就是 5 月 6 日,星火大模型发布会上,讯飞曾公布过年内的三大里程碑。
其中之一,即为:8 月 15 日,代码能力升级以及多模态交互能力提升,希望能帮助到更多的合作伙伴及开发者团队。
讯飞是守约的。
新技术、新产品全线亮相,当中几乎所有功能都做到了现场实操演示,并非录制及 PPT 阶段。
作为 1024 开发者节大考前的一次「模拟考」,星火大模型 2.0 算是年中的最重要节点。
准时赴约,那考的怎么样,又交出了怎样的答卷?
代码能力 5 大升级,部分能力超越 ChatGPT
代码能力通常被认为是认知大模型「聪明」程度的重要标志,而代码数据亦能提升认知大模型的「智慧」。
如何能让更广阔的人群、企业尝鲜使用大模型,除了平台代码能力提升之外,降低代码门槛无疑是最优解之一。
此次,讯飞星火认知大模型 2.0 对代码能力进行了 5 个维度升级,分别为:代码生成、代码补齐、代码纠错、代码解释、单元测试生成。
带来的最直观体验是,少写代码,或不写代码。
对此,刘庆峰着重提到:
只要有想象力、对场景有见地,不需要人人都是代码高手。
为了实际证明这一点,科大讯飞研究院院长刘聪,通过画红色的心形线、画马鞍面方程三维立体图、视频转 GIF 图,以及创作贪吃蛇小游戏进行了多重演示。
除搭建 Python 语言环境之外,所演示的案例,均未敲一行代码。
而根据 OpenAI 构建的代码能力公开测试集 HumanEval,当前星火 2.0 版本 Python、Java、JS、C++ 能力均较之于 1.5 版本大幅提升。其中 Python 代码能力最为突出,达到了 61 分,与 ChatGPT 仅 1 分之差。
5 项升级能力中,代码纠错、代码解释也已非常接近 ChatGPT,代码生成、代码补齐能力甚至高于 ChatGPT。
智能编程助手 iFlyCode 1.0 发布,编码效率提升 30%
iFlyCode 是此次讯飞专为用户开发的智能编程助手,它集成了大模型的 5 项代码能力,并融合至开发环境中。
为了更进一步降低开发难度,iFlyCode 还能提供专业的代码知识与服务。
这部分,我们就借由一段实操演示,对 iFlyCode 的能力做进一步说明。
演示环节,刘聪还是以去年 1024 开发者节上的「凌空手写」做案例。
在 iFlyCode 后台界面,以 Prompt 文字写出想要实现的效果:如两指捏合,进行画图。
这时,通过求助 iFlyCode,就能获取实现这一效果的关键步骤与准备事项。
基于给出的建议,还能进一步发起求助,获得更细化的步骤。
而用户需要做的,就是按照操作建议,一步步执行。
当然,如果最终效果不甚满意,也能调用 iFlyCode 的改代码能力。修改 Prompt 文字,简单的复制粘贴即可。
就「凌空手写」这类稍复杂的应用,整个过程下来,刘聪同样没有敲一行代码,并且用了不到十分钟的时间就完成操作。
此外,iFlyCode 还非常适合于如学校、医院等行业应用。即使「零编程能力」的老师或医生,也能通过 iFlyCode 行业底座,快速创建管理应用。
根据讯飞内部研发效能平台,对 2000 余名员工在 1 个月内测试使用 iFlyCode 1.0 的成效数据统计。在一些典型场景中,代码采纳率达 30%,编码效率可提升 30%,综合效率可提升 15%。
写文案、文生图、虚拟人合成视频,多模态能力再升级
多模态能力,是星火认知大模型 2.0 升级的另一重点。
刘庆峰谈到:
多模态能力是科大讯飞既定的人工智能技术长期战略,通用人工智能发展多模态能力是必由之路,也是持续迭代,形成自我造血,数据循环的非常关键的内容。
在 2022 年初,讯飞曾发布了包括多模感知、深度理解、多维表达、运动智能等核心能力的「讯飞超脑 2030 计划」。
如今,星火认知大模型 2.0 将多模态能力进一步产品化,划分为图像描述、理解推理、识图创作、文图生成以及虚拟人合成。
星火认知大模型 2.0 的多模态能力如何?我们还是看实操演示。
1、图像理解
丢给星火认知大模型任意一张照片,它都能自主识别,并给出对照片的理解释义。
2、识图创作
这个功能比较有趣,举出了给小朋友讲故事的场景,通过大模型,给出图片就能生成一则小故事。
3、文生图
随着 AIGC 的火热,文生图应用早已被大众接受。演示环节,星火认知大模型也展示出了较强的出图速度和准确度能力。
4、虚拟人合成
只需一段简短需求定义,虚拟人合成功能就能快速生成一段包含虚拟人独白的视频。
新应用:1 个新发布、2 个新迭代,学习机迎新功能
1、讯飞智作 2.0
发布会上多模态能力升级后的产品:讯飞智作 2.0 也正式发布。
升级后的讯飞智作 2.0,在视频创作方面更进一步,视频后期处理、创意视频生产均可完成。
现场,刘聪演示了一段由讯飞智作进行了虚拟人短视频生成、视频创作的视频内容。
从操作上可见,讯飞智作 2.0 的创作过程,已足够智能。只需要提出想要需求,而后按后台选项执行,就能逐步实现。
如提出:
帮我写一段黄山毛峰宣传文案,包括茶叶的产地、包装、色泽等特点。
基于讯飞智作创作的创意文案,添加「徽州风格女主播」人设,插入背景图片或由 AI 自动生成更多图片后,即能生成一段由身着徽州传统服饰的女生,娓娓道来讲述黄山毛峰茶叶的视频内容。
值得一提的是,视频语言还能切换为英文,同样可由主播播报。
2、星火语伴 2.0
6 月 9 日,科大讯飞上线发布了面向各学段学生、商务人士等广大英语学习爱好者的口语陪练老师「讯飞语伴」 App。
本次结合多模态能力,讯飞语伴升级至 2.0 版本。除了能够进行主题对话、虚拟人对话,重点推出两大核心能力——口语模考和情景交流,并且可用 AI 实现真人式陪练。
刘聪现场和讯飞星火语伴 2.0 进行了一场代入感极强的口语模拟考试,他进入星火语伴的雅思考试入口,一位 AI 英语老师便跟他展开对话。
对话结束后,系统还给出了对准确度、流畅度、语法、词汇等维度的系统性评价,并推荐相关课程,通过及时反馈来强化学习结果。
目前口语模考功能已支持 CET、雅思、托福等大型权威考试。
3、星火教师助手
全新发布的星火教师助手,支持创新规划单元教学设计、启发创设情境教学活动、一键生成互动教学课件,可帮助老师提升备课效率。
刘聪现场演示了老师如何快速生成并修改教学设计。
当他给出提示词「围绕时代品质、工匠精神」主题,生成高中语文必修(上)第二单元的教学设计。
一份逻辑清晰、细分成 4 个任务 8 个课时的教学设计随即生成,通过提示词可以直接修改细节,以及一键生成参考课件 PPT。
利用 AI,根据课本内容可生成和插入适合学生理解的图片与视频。甚至连布置实践作业,也都能通过教师助手完成。
目前,搭载了讯飞星火认知大模型的教师助手,已服务全国超过 2.5 万所学校、超过 1200 万名师生。
4、智能学习机功能上新
基于星火大模型 2.0,讯飞 AI 学习机升级了两项新功能:AI 编程空间、AI 创意画板。
新功能主要用于贴近新课标要求,拓展学科学习。
其中 AI 编程空间是学习机行业首款 AI 一对一智能编程助手,支持 Python 语言的学习、练习以及代码自动生成、修改、运行调试等功能。
通过知识问答、练习题和代码诊断等步骤,在 AI 一对一互动的过程中,让孩子逐步爱上编程。
AI 创意画板则在看懂孩子画了什么的基础上,去理解孩子想要表达的情感和意义。通过鼓励式探讨,不断提升孩子们的观察力、想象力、创造力和表达能力。
新产品,星火一体机
发布会尾声,讯飞星火和华为昇腾联合发布了星火一体机。
星火一体机基于华为鲲鹏 CPU + 昇腾 GPU,可提供对话开发、任务编排、插件执行、知识接入、提示工程等 5 种定制优化模式。以及办公、代码、客服、运维、营销、采购等 10 种以上即开即用的丰富场景包,并支持 3 种模型尺寸供用户选择。
刘庆峰表示,有了这些能力,就可以使得每一家企业、每一个行业、每一个学校、每个医院都有机会构建自己的专属大模型。
湾里小结
拥抱 AI,讯飞是笃定的。
而正是讯飞的这份笃定,持续的技术、产品迭代,也让千行百业拾取信心、找到方向。
发布会后,走在回程的路上,我听到了讯飞的合作伙伴围坐一团在探讨,如何用星火认知大模型解决适老化改造问题。
身边经过的学生代表们,正在为通过几张图片、无代码生成虚拟人视频而激动的讨论。
再过两个多月,讯飞年度 1024 开发者节将要召开,星火大模型能否比肩 ChatGPT,又将交出怎样的答卷,我们共同期待。
微信号:深圳湾 / shenzhenware
来源:深圳湾官网 / shenzhenware.com
版权声明:本文为深圳湾原创文章,极术社区经授权发布