产经 > 科技

中国人工智能团队开发藏语方言语音识别新技术

新华社,成都
2022-03-24 08:45

已收藏



新华社成都3月24日电(记者康锦谦)一支平均年龄仅为26岁的年轻团队,经过数年时间技术攻关,在近日通过一款输入法软件实现卫藏、安多和康巴三大藏语方言的混合精准识别,解决了困扰深牧区藏族群众前往城市交流的难题。

这群年轻人来自科大讯飞四川公司,他们开发的软件叫"东噶藏文输入法"。产品经理尼玛旺堆是一名毕业于西南民族大学的"95后",他既精通藏语、汉语,又在工作以后自学了人工智能技术。

尼玛旺堆告诉记者,依托三大藏语方言强大的语料库,新上线的"东噶藏文输入法"在智能语音识别和转写技术的基础上,开发了藏文急速语音输入和手写识别输入功能。

据了解,藏语有卫藏、安多和康巴三大方言,使用不同方言的藏族群众在日常口语交流中不完全相通。尤其对居住在偏远牧区的藏族群众来说,前往城市就医、经商、旅行,语言是一大难题。

"实现三大方言混合识别后,预计可满足全国三分之二藏族群众的使用需求。"尼玛旺堆说,"东噶"为藏语白海螺的音译,在藏族文化中,白海螺属于"吉祥八宝"之一,他们希望这款软件能为人们的交流带去便捷与吉祥。

早在2017年,"东噶藏文输入法"便已上线投用,但搜集康巴语语料库和实现藏语语音识别输入这条路,耗费了团队近5年的时间。

"研究最大的困难有两个,一是没有数据,二是小语种缺少语言专家的支持。"尼玛旺堆说。

为了解决难题,科大讯飞研究团队多渠道拓展发音人,还在西南民族大学找了近60名藏族学生,不断丰富康巴语的语料搜集。另一方面,团队成立紧急研究攻关小组,研发了一套通用性强的新一代端到端多语种语音合成系统。

来自新疆的软件开发工程师曹斌,大学学的是语言学。他告诉记者,藏语和汉语在语法结构上有许多不同,比如3月13日,在藏语中是13日3月,"若干条"在藏语中是"条若干",面对这样的问题,他们需要考虑藏文和汉文版本的展示效果。

另一方面,视觉设计工程师还要考虑藏语和汉语的词句长度问题。邓琪告诉记者,作为团队的UI设计师,有时为了追求美观,想让两语种对称,对翻译句子进行缩减或增长,但又担心翻译不准确,因此不停地进行尝试,和同事不断交流沟通,力求达到完美效果。

尼玛旺堆告诉记者,软件上线后,经常有用户找来表达感谢。记者在手机截图中看到,一位名叫普布仓决的用户说他母亲年纪大了,就只会说藏语,打字方面有困难,这款软件能自动识别藏语,妈妈使用后评价非常棒。还有用户表示这款软件对自己学习很有帮助。一些热心用户还会对软件更新提出建议,帮助团队改进。

据悉,截至目前,东噶藏文输入法累计用户数超过480万,覆盖西藏、四川、青海等地。尼玛旺堆说,他相信语言这座沟通的桥梁,不只是一种交流工具,还能拉近不同地方人们的心。
评论区

最新评论

最新新闻
点击排行