导航菜单

特稿:人工智能助力保护“多彩乡音”

新华社重庆8月29日特刊:人工智能帮助保护“五彩缤纷的口音”

新华社记者彭伟李华玲

“别蝎子?”“你啥啥?瞅咋咋咋?“

在2019年中国国际智能产业博览会(“智博”)上,一款采用最新人工智能方言识别技术的智能翻译机为天南海北的观众带来了愉悦。

无论是四川方言,东北方言,还是吴语软语,都是逐字转换成中文文本,然后实时翻译成英文。

展览会上的阿里巴巴人工智能实验室还开发了可以识别四川方言的智能音箱“天猫精灵”。预计将在今年9月之后正式发布。将来,基于智能扬声器终端,将通过语音交互式采样建立覆盖范围。国家动态方言数据库。

人工智能正在帮助我们留下“色彩缤纷的口音”。

方言是中国语言文化的瑰宝,继承了丰富的历史文化内涵;方言也是人们怀旧的根源,具有丰富的人文价值。在中国,一些“小方言”在经济和社会快速发展的背景下有消失的风险,方言的保护和保留迫在眉睫。

韩国首尔国立大学中文系主任Park Chin-nuk教授长期从事中国方言研究,他在接受新华社采访时表示,中国方言人口众多,范围广泛地理区域,他们在全球语言学研究中占有非常重要的地位。有助于研究人类语言的共性和个性。

早在2012年,Keda Xunfei就用粤语作为开发方言识别技术的突破口。 2017年,科技大学的输入法和中国声谷推出了“方言保护计划”。在过去的三年里,它收集了超过8600万种方言,支持了23种方言语音输入,包括粤语,四川语和湖南语等11种语言。方言的语音合成;微信小程序“我的AI说方言”也方便公众随时随地上传方言,并建立中文方言库。

阿里巴巴的人工智能实验室今年也宣布,已正式成立了一个特殊的方言保护组,并投入1亿元用于保护和发展汉语方言。

李强军,科技大学商务系副总经理,方言保护计划的创始人,介绍了方言语料库的收集,记录和归纳,作为方言识别的基础。过去,这项工作在很大程度上依赖于研究者的主观感知,很难总结完整的语音变化,句法和语义分析等,因此有必要使用人工智能建立不同方言的数据库。系统。方言的单词和发音被整理出来。

“汉语方言在语法和语音方面的特点不同,难以系统地梳理。用人工智能技术,对方言的保护和研究非常有帮助。” Park Jung-soo说。

实际上,外语语音识别和方言识别人工智能训练方法是相似的。随着技术的进步,可以使用统一的语音识别模型来引入不同的语料库,例如用于无人监督训练的本地方言。中国语言学将现代汉语方言分为十个方言区。方言识别有不同的难度。在输入法产品中实现时,识别精度略有不同。

“适应不同的方言识别,它还将促进和优化整体语音识别技术。”阿里巴巴人工智能实验室高级产品专家张平介绍了方言,使更多的区域人更好地进行交流。同时,它也保护了地域文化。 “我们的第一个四川方言模型是因为四川方言在汉语方言中占有很大比例。”

“方言版”语音识别的发展也有助于设计更适合消费者需求的智能语音交互产品。根据美国网站“Venturebeat.com”,中国已超越美国成为全球最大的智能语音市场。在2019年第一季度,智能扬声器出货量占全球总出货量的一半以上。

国外智能语音产品制造商也在努力开发能够识别各种英语口音的版本。有趣的是,有一位美国消费者抱怨亚马逊的智能语音助手“Alexa”,因为它无法识别他母亲的口音。

目前,亚马逊的“Alexa”,苹果公司的Siri和谷歌的助手可以识别标准美国人,“印度人”英语和“中国人”英语。然而,根据Vocalize.ai实验室的说法,这三种产品在识别中国口音英语方面的准确度最低。此外,他们不承认汉语方言的功能。

可以看出,具有中国特色的“方言版”语音识别产品也有助于中国企业开展差异化竞争。

http://www.sugys.com/bdsAM