在近期于意大利都灵召开的国际计算语言学、语言资源与评估联合国际会议上,美国密歇根大学等机构的研究人员展示了如何利用人工智能技术提升人们对动物间交流的理解。
他们选择了一个名为Wav2Vec2的语音表示模型,该模型最初是使用人类语音数据训练的。研究人员先利用74只不同品种、年龄和性别的狗在各种情境下录制的叫声数据来改良这个模型,然后用它来研究狗叫声的细微差别。研究发现,Wav2Vec2的准确率高达70%,表现优于其他专门使用狗叫声数据训练的模型。
密歇根大学计算机科学与工程学院教授、人工智能实验室主任拉达·米哈尔恰说:"这是首次将针对人类语音优化的技术用于帮助解码动物间的交流。我们的研究结果表明,从人类语音中衍生出的声音和模式可以作为分析和理解其他声音(如动物的发声)的声学模式的基础。我们的研究为利用现有的语音处理技术来理解狗叫声的细微差别打开了一扇新的窗口。"
最新评论