【嘉勤点评】百度发明的基于人工智能的辅助写作方案,能够基于人工智能对写作原文进行处理,从而得到写作辅助信息,并将相应的写作辅助信息展示给用户,从而提高辅助用户写作的效果。
集微网消息,全民关注的2022年高考如约而至。在这次高考中,百度推出的数字人度晓晓作答了全国新高考Ⅰ卷题为《本手、妙手、俗手》的议论文,曾担任北京高考语文阅卷组组长的申怡认为,该作文紧扣主题、立意明确,结构完整且语言流畅。
度晓晓的“写作能力”正是建立在人工智能的基础上实现的,人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。其是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。
现实生活中,许多人在写作的时候经常因为自己的文采不佳而感到烦恼,很多时候想不出合适的词语和句子,写出来的文章干瘪苍白,或者是因为自己的阅读储备太少,没有写作灵感。这个时候就需要一个智能工具来帮助写作者。
为此,百度早在2016年10月28日就申请了一项名为“基于人工智能的辅助写作方法和装置”的发明专利(申请号:201610972240.7),申请人为北京百度网讯科技有限公司。
根据该专利目前公开的相关资料,让我们一起来看看这项技术方案吧。
如上图,为该专利中发明的基于人工智能的辅助写作方法的流程示意图,首先,获取用户输入的写作原文。接着,基于人工智能对写作原文进行处理,得到写作辅助信息,该过程中主要利用人工智能中的自然语言处理技术进行相应的处理。随后,系统再将写作辅助信息展示给用户。
如上图,为该专利中示意的词语替换推荐功能和词语联想功能的展示界面示意图,上图中的上方文本是用户输入的写作原文21,在用户输入写作原文后,给出如下方的左侧所示的词语替换部分22,该方案中的装置会自动识别写作原文中可被替换的词语(并且可以用预设标记进行标识),再基于人工智能给出可被替换的词语的推荐词语。
每个可被替换的词语的推荐词语可以在鼠标光标悬浮在可被替换的词语上时展示相应的推荐词语。在将推荐词语展示给用户时,用户可以点击需要的推荐词语后,用点击的推荐词语替换相应的可被替换的词语。这样用户就不会因为找不到准确的用词而发愁了。
在进行具体的实现过程中,会首先对原文进行切词,以得到组成写作原文的分词。对应各个分词,基于人工智能识别相应的分词是否为可被替换的词语,并在分词为可被替换的词语时,确定分词的词语替换推荐信息。
其中,会根据每个替换词对应的语言模型得分、文采得分、用户的点选信息,得到每个替换词的综合得分。如果存在综合得分大于预设得分的替换词,则确定该分词是可被替换的词语,并将综合得分大于预设得分的替换词按照综合得分进行排序,在排序后的替换词中按序选择预设个数的替换词作为该分词的词语替换推荐信息。
此外,该系统还具有词汇联想、灵感激发、智能素材推荐、智能基础改写以及智能润色改写功能。
如上图,为该系统进行智能素材推荐功能的展示界面示意图,对应写作原文,系统给出了智能素材推荐部分。在该过程中,系统会深度分析和理解用户提供的写作原文,为用户推荐相关主题的写作素材(如新闻、历史故事等),用户也可以自己选择想要的素材类型,比如新闻、历史故事等,此功能在议论文写作中非常实用。
在该功能的实现过程中,首先会从公开的网页数据中抓取优质的新闻、人文历史故事等候选素材,然后用摘要技术和文档标签技术分别对抓取的语料进行处理,生成相应摘要和文档标签。通过抽取出用户输入文本中的主题词,然后与语料的标签进行比对,召回一批候选的相近主题的素材。再使用主题模型计算用户输入与摘要的相似度,对候选的素材进行排序,将相似较高的呈现的素材的摘要呈现给用户。
最后,如上图,为该系统进行智能润色改写功能的展示界面示意图,该功能主要可以分解为三个部分:词语的替换,句子的改写以及增加词语或短句。词语的替换沿用词语替换推荐功能的技术方案,使用最优的替换结果。
句子的改写有两种方案,方案一是人工配置一些润色的规则,方案二是人工标注一些润色的训练语料,用RNN或者LSTM神经网络来进行学习。增加词或短句功能可以通过一定的模板挖掘从大数据语料中挖掘出实体或者主题对应的描写词和描写短句,并同时记录下短句周围的关键词。每次对输入文本的句子作解析,用CRF模型或者句法分析规则找出句子的核心主体词,然后根据周围关键词的匹配,添加合适的描写词或描写短句。
以上就是百度发明的基于人工智能的辅助写作方案,该方案能够基于人工智能对写作原文进行处理,从而得到写作辅助信息,并将相应的写作辅助信息展示给用户,从而提高辅助用户写作的效果。