啥都吃的豆芽 · 2019年11月14日

有关Google搜索中的BERT算法的所有你想要了解的信息

它是什么,它如何工作以及对搜索意味着什么。

谷歌表示,其最新的重大搜索更新(包括BERT算法)将有助于其更好地理解用户搜索查询背后的意图,这应该意味着搜索能得到更精确的结果。该公司表示,BERT会影响10%的搜索量,这意味着它可能会对您品牌的自然可见度和点击量产生一些影响(排名啥的)。并且这一算法未来可能性极大的会转移到移动端以及Edge computing.

George Nguyen on November 5, 2019 at 1:42 pm
英文原址[https://searchengineland.com/...]

BERT何时在Google搜索中推出?

BERT于2019年10月21日当周开始在Google的搜索系统中推出英语查询,包括精选摘要。

Google的Danny Sullivan 说,该算法将扩展到Google提供搜索功能的所有语言,但目前尚无时间表。BERT模型也被用于改善两个国家的特色片段。

什么是BERT?

BERT代表针对Transformers的双向编码器表示器,它是一种基于神经网络的自然语言处理预训练技术。用简单的语言语来说,它可以帮助Google更好地识别搜索查询中单词的上下文。

例如,在短语“nine to five(理解为朝九晚五?)”和“a quarter to five(理解为差一刻钟到五点)"中,“to”一词具有两种不同的含义,对人类来说可能是显而易见的,但对搜索引擎而言则不那么明显。BERT旨在区分这些细微差别以促进更相关的结果。

Google 于2018年11月开源BERT。这意味着任何人都可以使用BERT来训练自己的语言处理系统来回答问题或执行其他任务。

什么是神经网络?

简单地说,神经网络算法是为模式识别而设计的。对图像内容进行分类,识别笔迹甚至预测金融市场的趋势是神经网络在现实世界中的常见应用程序,更不用说点击模型等搜索应用程序了。

他们训练数据集以识别模式。Google使用Wikipedia的纯文本语料库对BERT进行了预训练,并在将其开源时进行了解释。

什么是自然语言处理?

自然语言处理(NLP)是指处理语言学的人工智能的一个分支,其目的是使计算机能够理解人类自然交流的方式。

NLP带来的进步示例包括社交监听工具,聊天机器人和智能手机上的单词建议。

就其本身而言,NLP 并不是搜索引擎的新功能。但是,BERT通过双向训练代表了NLP的进步(更多内容请参见下文)。

BERT如何工作?

BERT的突破在于它能够基于句子或查询中的整个单词集来训练语言模型(双向训练),而不是传统的以有序单词顺序(左至右或左组合词)进行训练的方法-到右和从右到左)。BERT允许语言模型根据周围的单词学习单词上下文,而不仅仅是基于紧随其后的单词。

Google 将 BERT 称为 “深度双向”,因为单词的上下文表示“始于深度神经网络的最底层”。

“例如,' 银行 ' 一词在' 银行帐户 '和' 河岸 '中将具有相同的上下文无关表示。上下文模型会根据句子中的其他单词生成每个单词的表示形式。例如,在句子“ 我访问了银行帐户”中,单向上下文模型将基于“ 我访问了 ”但未访问 “ 帐户 ” 表示“ 银行 ” 。但是,BERT 使用上一个和下一个上下文表示“ 银行 ”,即“ 我访问了 ... 帐户。””

Google展示了一些有关BERT在搜索中的应用可能如何影响结果的示例。在一个示例中,“成人数学练习书”查询以前在自然搜索结果的顶部浮出了6至8年级书的清单。应用BERT后,Google会在结果顶部显示一本名为“成年数学”的书的清单。

Google展示了一些有关BERT在搜索中的应用可能如何影响结果的示例。在一个示例中,“成人数学练习书”查询以前在自然搜索结果的顶部浮出了6至8年级书的清单。应用BERT后,Google会在结果顶部显示一本名为“成年数学”的书的清单。

image.png

您可以在该查询的当前结果中看到,六年级至八年级的书仍在排名中,但是有两本专门针对成年人的书,现在已经超过了该书,包括精选摘录。

image.png

类似于上面的搜索结果更改反映了对使用BERT的查询的新理解。青年成人的内容不会受到惩罚,而是针对特定成年人的列表被认为与搜索者的意图更加吻合。

Google是否使用BERT来进行所有搜索?

不,不完全是。BERT将增进Google对美国英语搜索中十分之一的了解。

谷歌在博客中写道:“特别是对于更长,更多的对话查询,或者在诸如“ for”和“ to”这样的介词对含义有重大影响的搜索中,搜索将能够理解查询中单词的上下文。。

但是,并非所有查询都是对话式的或包含介词的。品牌搜索和较短的短语只是可能不需要BERT的自然语言处理的两种类型的查询示例。

BERT将如何影响我具有个人特色的语言片段?

正如我们在上面的示例中看到的那样,当应用BERT时,BERT可能会影响结果。

在下面的另一个示例中,Google比较了查询的特色片段“在没有路牙子的坡上停车”,并解释说:“过去,这样的查询会使我们的系统感到困惑-我们过分重视“路牙子”一词并忽略了“没有”一词,不理解该词对于正确响应此查询有多重要。因此,我们将返回在路牙子上停车的结果。”

image.png

BERT和RankBrain有什么区别?

BERT的某些功能听起来可能类似于Google的第一种用于理解查询的人工智能方法RankBrain。但是,它们是可以用于通知搜索结果的两种独立算法。

“关于RankBrain,首先要了解的是它与常规的自然搜索排名算法并行运行,并且用于对由这些算法计算出的结果进行调整,” Perficient Digital总经理Eric Enge说。

RankBrain通过查看当前查询并查找类似的过去查询来调整结果。然后,它检查那些历史查询的搜索结果的性能。“根据所见,RankBrain可能会调整常规自然搜索排名算法结果的输出,” Enge说。

RankBrain还可以帮助Google解释搜索查询,以便它可以显示查询中可能不包含确切单词的结果。在下面的示例中,尽管该塔的名称未出现在“巴黎地标高度”查询中,但Google能够确定用户正在搜索有关埃菲尔铁塔的信息。

image.png

*“ BERT的工作方式完全不同,” Enge说。“传统算法的确会尝试查看页面上的内容,以了解其内容以及可能与之相关的内容。但是,传统的NLP算法通常只能查看单词之前的内容或单词之后的内容以了解其他上下文,以帮助其更好地理解该单词的含义。如上所述,BERT考察了单词前后的内容,以告知其对单词含义和关联性的理解。“这是自然语言处理中的一项重要改进,因为人类交流自然而然地是分层的并且是复杂的。”

Google使用BERT和RankBrain来处理查询和网页内容,以更好地理解单词的含义。

BERT并不是要取代RankBrain。Google可以使用多种方法来理解查询,这意味着BERT可以与RankGoogle 一起与其他Google算法一起单独应用,或者根据搜索词完全不组合。*

BERT可能还会影响其他哪些Google产品?

Google关于BERT的公告仅与搜索有关,但是,对Assistant也会有一些影响。当在Google Assistant上执行的查询触发它以提供来自搜索的精选摘要或网络结果时,这些结果可能会受到BERT的影响。

Google告诉Search Engine Land,目前BERT尚未用于广告,但如果将来将其集成,它可以帮助缓解困扰广告客户的一些不良匹配形式。

“我如何针对BERT进行优化?”这不是真正考虑的方法

Sullivan 说: “对于BERT来说,没有什么要优化的,也没有任何人可以重新考虑的。” “我们依然寻求并且奖励人们能够提供更多丰富内容。”

Google一直建议要保持良好的排名,以始终牢记用户的心意,并创建满足其搜索意图的内容。由于BERT是为了解释这种意图而设计的,因此向用户提供他们想要的东西仍然是Google的首选建议。

现在,“优化”意味着您可以将更多的精力放在写得好,清晰的文章上,而不必在为观众创建内容和机器的线性短语构造之间妥协。

推荐阅读
关注数
14
内容数
19
如果您需要了解海外科技公司的生态资源信息,欢迎联系:Aaron.Liu@armchina.com
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息