在周三的“实验室内部:通过 AI 直播构建虚拟世界”活动中,Meta 首席执行官马克扎克伯格不仅阐述了他的公司对未来的坚定愿景,即 Metaverse。他还透露,Meta 的研究部门正在开发一种通用语音翻译系统,该系统可以简化用户在公司数字世界中与人工智能的交互。
扎克伯格说:“这里的主要目标是建立一个通用模型,该模型可以将所有形式的知识……通过丰富的传感器捕获的所有信息。” “这将实现大规模的预测、决策和生成,以及可以从大量不同输入中学习的全新架构训练方法和算法。”
扎克伯格指出,Facebook 一直在努力开发使全球更多人能够访问互联网的技术,并相信这些努力也将转化为元宇宙。
“当人们开始在虚拟世界中传送并与来自不同背景的人一起体验事物时,这一点尤其重要,”他继续说道。“现在,我们有机会改进互联网并设立一个新标准,让我们所有人都可以相互交流,无论我们说什么语言,或者我们来自哪里。如果我们做对了,这只是一个例子人工智能如何帮助在全球范围内将人们聚集在一起。”
Meta 的计划是双重的。扎克伯格表示,首先,Meta 正在开发“No Language Left Behind”,这是一种能够学习“每种语言,即使没有大量文本可供学习”的翻译系统。“我们正在创建一个单一模型,该模型可以翻译数百种语言,具有最先进的结果和大多数语言对——从奥地利语到乌干达语再到乌尔都语。”
其次,Meta 想要创建一个 AI Babelfish。扎克伯格承诺:“这里的目标是跨所有语言的即时语音到语音翻译,即使是那些主要使用的语言;能够以任何语言与任何人交流。” “这是人们永远梦寐以求的超级大国,人工智能将在我们有生之年实现这一目标。”
这些都是来自一家公司的重大声明,其机器生成的域没有延伸到腰带以下,然而,Facebook-cum-Meta 在人工智能开发方面有着悠久而广泛的记录。仅在去年,该公司就宣布在自我监督学习技术、自然语言处理、多模态学习、基于文本的生成、人工智能对社会规范的理解方面取得进展,甚至建造了一台超级计算机来帮助其机器学习研究。
该公司仍然面临数据稀缺的主要障碍。“用于文本翻译的机器翻译 (MT) 系统通常依赖于从数百万句带注释的数据中学习,”Facebook AI Research 在周三的博客文章中写道。“正因为如此,能够进行高质量翻译的机器翻译系统只针对少数主导网络的语言而开发。”
FAIR 团队表示,在两种非英语语言之间进行翻译更具挑战性。大多数 MT 系统会首先将一种语言转换为文本,然后将其翻译成第二种语言,然后再将文本转换回语音。这滞后于翻译过程,并造成对书面文字的过度依赖,限制了这些系统对主要口头语言的有效性。直接的语音到语音系统,就像 Meta 正在研究的那样,不会以这种方式受到阻碍,从而实现更快、更高效的翻译过程。