深圳湾 · 2020年04月08日

文字转语音功能上线,用 Google Assistant 朗读网页内容是怎样的体验

从现在开始,在已获得 GMS(Google 移动服务)许可的 Android 设备上,你可以让 Google Assistant 直接从网页上「读」文章了。(国内的手机和海外的华为手机不可以)

Google 曾在今年的 CES 上透露过这项新功能的计划。时隔两个月,Google 正式推出了这个称为「Read It」的文字转语音功能。

dh8agir0rwsgsy73p5j2.png

体验

在 Android 设备上打开网页后,说「Hey Google,Read It」,就可以语音调用 Google Assistant 直接用本国语言读网页了。

readit-1280x720.jpg
△ Google Read It 体验 | 图源:SlashGear

Google Assistant 不仅可以识别网页元数据的主要文本,还可以区分相关文本的网站链接,以及页面上的菜单或社交媒体分享按钮。

阅读时,网页浏览器还会自动滚动,并且突出显示正在读取的单词和句子。用户甚至可以选择用于阅读的声音,并且调整阅读的开始位置和阅读速度。

Google-Assistant-Read-It-1.jpg
△ Google Read It 体验 | 图源:Droid Life

它还将能够翻译超过 42 种语言,在访问非本国语言的网页内容时,Google Assistant 可以将网页翻译成本国语言并朗读。

Google 的这一新功能是自动加载到网站的,但网站管理员可以选择禁用这一功能(类似 Google 翻译)。开发人员还可以根据 Actions on Google 说明,将这一功能整合到 Android APP 中。

Google-Assistant-Read-It.jpg
△ Google Read It 体验 | 图源:Droid Life

自然语音

文字转语音(TTS)技术是 Google 一直耕耘的方向。与通常我们听到的 Google Assistant 的声音相比,Google Assistant 朗读声音有所不同。

read-it_2.png

为了让声音更接近自然语言,需要考虑不同的韵律、语调、节奏和轻重音。最终让 Google Assistant 朗读的声音听起来不那么机械,甚至更加个性化,就好像在听有声读物一样。尤其是在阅读长篇内容,或者长时间听音频时,自然就非常重要。

Google 工程副总裁 Yossi Matias 表示,Google 的网页阅读技术旨在「使用与自己大声朗读时相同的语调和节奏」来阅读内容,这与其他屏幕阅读软件不同。

Google 还透露,Google Assistant 的长篇文本阅读将从文章和网站开始,但将来有可能会扩展到包括电子邮件在内的其他内容。

无障碍阅读

实际上,包括网页阅读在内的越来越多的语音技术应用,不仅大大提升了人们浏览信息的效率,同时也为视障人士更好的获取互联网信息提供了便利。

Read It 也是 Google 利用语音技术改善网页可访问性计划的一部分。去年,Google 曾发布过一个名为「Action Blocks」的功能,用户可以创建预设的 Google Assistant 语音指令和快捷方式来运行 APP 或日程,类似于 Siri 的快捷方式选项,来帮助残障人士更好的使用手机完成相应的任务。

BedtimeStory_web.gif
△ Google Action Blocks | 图源:Google

Google 还曾经在 Google Maps 上提供了语音提示,以帮助视障人士导航。此外,Google 的 Project Euphonia 也是关注残障人士的,旨在训练语音助手更好的识别和理解语音障碍者(如口吃)。

值得一提的是,近日,MSPowerUser 通过 LinkedIn 的一则招聘,发现微软正在为 Windows 10X 开发语音控制功能。根据招聘广告,微软希望寻找有「高级语音控制经验」并且具有至少三年 C++ 编码经验的候选人,与无障碍开发团队合作,以创造「卓越的语音控制体验」。

这也透露出,Windows 10X 中的语音控制元素将体现在「无障碍开发」中。Windows 10X 是微软用于移动和可折叠设备的操作系统,它将成为 Android 和 iOS 设备的替代方案。

生产力助理

在 CES 2020 上,Google 曾披露了 Google Assistant 的用户数据:月活跃用户超过 5 亿,用户已遍布全球 30 多个国家和地区。

得益于 Google 大量搭载 Android 原生系统的手机设备,以及 Google 在语音体验上的不断迭代,Google Assistant 已经从「无处不在」的普及阶段,过渡到精细化运营的阶段。

就如同我们现在使用的 Google 网页自动翻译的功能,随着它语言理解力的提高,对于阅读效率的提升是非常显著的。这也与微软 Cortana 回归办公场景不谋而合——语音助手正在朝着生产力助理的方向演进。


微信号:深圳湾 / shenzhenware
来源:深圳湾官网 / shenzhenware.com
版权声明:本文为深圳湾原创文章,极术社区经授权发布

推荐阅读
关注数
4345
内容数
60
2020 年产品、技术、应用、行业,全面汇总整合,关注智能音频产业上下游生态。
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息