谷歌首创Translatotron同声翻译功能近日亮相

叶紫网2019-05-16 17:56:00阅读0评论 0 时代科技

【叶紫网2019年5月16日】谷歌近日展示了Translatotron,这是一种首创的翻译模式,可以直接将语音从一种语言转换成另一种语言,同时保持说话者的声音和节奏。这个工具放弃了通常的将语音翻译成文本然后再翻译成语音的步骤,而是使用端到端技术直接将说话者的声音翻译成另一种语言,该公司希望通过直接翻译模式来开拓未来。

根据谷歌的说法,Translatotron使用了一种从序列到序列的网络模型,该模型接收语音输入,将其作为语谱图(频率的可视化表示)进行处理,并用目标语言生成一个新的语谱图,结果就是翻译速度更快,而且在翻译过程中丢失东西的可能性更小。该工具还与一个可选的扬声器编码器组件,其工程保持扬声器的声音,翻译的语音仍然是合成的,听起来有点机械,但可以有效地保持说话人声音的一些要素。

最近几个月,谷歌一直在对其翻译进行微调。去年,该公司在谷歌翻译中引入了口音,可以说多种语言的基于地区的发音,并在其实时翻译科技功能中增加了更多的语言。今年早些时候,谷歌助理还为智能显示器和可以介于26种语言的扬声器设置了“口译模式”。


用户名: 快速登录 匿名发表
取消
相关阅读
谷歌智能助理迎来更新 采用全新设计

在五月初的开发者大会上,谷歌展示了一款改进后的谷歌智能助理,并表示将于今年晚些时候推出。近日,有部分来自用户称,谷歌给改进后的智能助理采用了截然不同的设计。

时代科技
谷歌Pixel 3a 骁龙670加持的小屏新机

同样是一款Pixel手机,Pixel 3a系列打破了过去高价旗舰的风格,Pixel 3a以仅有Pixel 3起售价的一半:399美元起步价在发布当日与消费者见面。而更大屏幕的版本Pixel 3a XL以479美元价格起售,为Pixel机型带来两款更亲…

时代科技
谷歌推出安卓应用内更新API:应用使用过程中也能更新

该API名为“应用程序内更新API(In-app Updates API)”,能够使应用程序可以更好地控制检查和安装更新的方式。

时代科技
谷歌用AI技术带来新技能:为视频加字幕 帮聋哑人打电话

live Caption可实现在线语言转录,将语音转化为文本,一个应用场景就是为视频自动加实时字幕。这个技术背后是语音识别技术的突破,皮查伊称甚至关闭视频声音,也可以生成字幕。

时代科技
谷歌Android Q系统:黑暗主题上线 更新系统不用重启

2019年谷歌I/O开发者大会今日开幕。会上,谷歌公布了Android Q系统,黑暗主题正式上线,还能不重启更新系统。

时代科技
谷歌:已经在研发可折叠Pixel手机 但不会很快推入市场

今天凌晨1点,谷歌I/O开发者大会如期而至。大会上,谷歌发布了Pixel 3A与Pixel 3A XL两款手机,但似乎并没有见到可折叠的机型。谷歌方面表示,谷歌一直在为可折叠手机提供原型技术。但据了解到的信息,你千万不要对…

时代科技
热点排行榜TOP ARTICLES
七日活跃作家ACTIVE WRITER

更多作家

1