中国西藏网 > 教育

网易有道的95后团队如何攻下语音识别大奖?

发布时间:2020-10-27 10:24:00来源: 中国网教育

  9月,网易有道词典官宣了代言人王源,也上线了王源同款“明星语音”功能,10月假期刚过,这支明星语音背后的团队又低调地拿下了一个国际语音大奖,即Interspeech2020口音英语语音识别挑战赛。

  Interspeech是由国际语音通信协会ISCA组织的语音研究领域的顶级会议之一,今年的赛事吸引了来自全球各地的语音技术研究者,竞赛指导委员会来自上海交大、南洋理工和美国约翰霍普金斯大学等高校和机构。有道人工智能产品部的语音团队在这届竞赛中获得二等奖。

  目前,有道在AI领域的布局主要分为,自然语言处理(NLP)、图像识别(OCR)和语音识别与合成,其中自然语言处理和图像识别都是有道的强势技术领域,为有道在互联网产品端做了大量的技术赋能。

  语音团队是成立时间相对最短,且团队非常年轻,主要负责这次竞赛项目两位团队成员都是90后,其中一位是95后。

  近年,有道在AI领域斩获颇多,除了不断更新迭代的有道词典笔等硬件产品,有道精品课等在线教育业务上,也应用了语音识别、口语打分、AI作文批改等智能技术。

  带着技术基因发展的网易有道,在语音、翻译等领域已有技术底蕴,技术也推动了有道的内容布局。

  以翻译技术起家的有道,在AI时代攻坚神经网络翻译技术(NMT),目前其NMT准确度已达到国际领先水平;AI作文批改曾入选机器之心2020人工智能金炼奖;作为王牌技术之一的OCR识别技术,已经能支持26种主流语言文字,是目前国内识别语言最多的OCR识别引擎。

  当有道词典笔逐渐成为学习场景的“三大件”之一,语音识别技术更加精进。9月推出的王源“明星语音”功能背后,则是有道自主研发的定制语音合成(Text To Speech,简称TTS)技术实力。

  孙艳庆谈及开发“明星语音”功能时,非常感概团队的不懈合作。面对这一群90后、95后同学,他们有的是猫奴,有的沉迷俄国文学,有的向往技术追星,孙艳庆的团队要求只有,活泼且脚踏实地。

  “尽管我们会参加比赛去测试我们的技术成熟度,但整个有道AI团队更注重给用户更极致的体验,希望把技术尽快触达到用户手里,获得好的用户体验和反馈。”

(责编: 常薇薇)

版权声明:凡注明“来源:中国西藏网”或“中国西藏网文”的所有作品,版权归高原(北京)文化传播有限公司。任何媒体转载、摘编、引用,须注明来源中国西藏网和署著作者名,否则将追究相关法律责任。