·机器学习翻译系统通常需要大量可标记的语言实例来进行训练,包括书面和口头语言,这正是像闽南语这种没有文字的语言所不具备的。Meta的研究团队利用普通话作为中间语言来建立伪标签,首先将英语(或闽南语)语音翻译成普通话文本,然后再翻译成闽南语(或英语),并将其加入训练数据。
·“我们希望最终能够实现多种语言的实时语音到语音翻译。我们相信,无论人们身处何地,口语交流都能将他们聚集在一起——即使是在元宇宙。”
世界上大约7000种已知的语言中,有近一半的语言仍然在被使用,其中40%没有广泛的书写系统。这些没有文字的语言给现代机器学习翻译系统带来了一个独特的问题,因为它们通常需要先将口头语言转换为书面文字,翻译后再将文字还原为语音,但Meta公司10月19日宣布,已经通过其最新的开源语言人工智能(AI)解决了这个问题。
作为Meta通用语音翻译器(UST)项目的一部分,Meta 为闽南语建立了第一个AI驱动的语音翻译系统,并在视频中展示了一段闽南语和英语之间的实时翻译。该项目正致力于开发更多实时语音到语音的翻译,以便元宇宙居民更方便地互动。
00:31
本文来自网络,不代表本站立场,转载请注明出处:https://www.yzcslt.com/n/a5678.html