找回密码
 立即注册

BTC: 加载中...

ETH: 加载中...

USDT: 加载中...

BNB: 加载中...

XRP: 加载中...

ADA: 加载中...

SOL: 加载中...

DOGE: 加载中...

DOT: 加载中...

SHIB: 加载中...

TRX: 加载中...

搜索
查看: 403|回复: 0

元宇宙推出即时语音翻译系统

[复制链接]

76

主题

0

回帖

228

积分

中级会员

积分
228
发表于 2025-1-17 19:38:13 | 显示全部楼层 |阅读模式
参考消息网1月17日报道 据英国《自然》周刊网站1月15日报道,巴别鱼——经典科幻系列电影《银河系漫游指南》中所设想的语言翻译动物——离现实更近了一步。科技巨头元宇宙平台公司的研究人员创建了一个机器学习系统,它可以用语音合成器将101种语言的语音即时翻译成36种目标语言中的任意一种。

这个“大规模多语言和多模式机器翻译”(SEAMLESSM4T)系统还能够实现语音到文本、文本到语音以及文本之间的翻译。该研究成果1月15日发表在《自然》杂志上。

总部位于美国加利福尼亚州门洛帕克的元宇宙公司运营着脸书网站、沃茨阿普和照片墙等社交媒体网站。该公司称,它将以开源形式将SEAMLESSM4T提供给其他希望在此基础上进行研究的研究人员。此前该公司已成功向全球开发人员发布了其LLaMA大型语言模型。

过去的几十年里,机器翻译取得了巨大进步,这在很大程度上要归功于在大型数据集上训练的神经网络的引入。主要语言(尤其是英语)的训练数据非常丰富,但其他许多语言的训练数据却非常稀少。这种不平等限制了机器可以通过训练实现的语言翻译范围。美国康奈尔大学计算机科学家艾莉森·克内克在研究论文随附的一篇“新闻与观点”文章中写道:“这会影响到互联网上不经常出现的那些语言。”

元宇宙公司的团队以之前的语音到语音翻译研究成果为基础,也参考了一个名为“一种语言也不落下”的项目,该项目旨在为大约200种语言提供文本到文本的翻译。通过积累的经验,元宇宙公司和其他地方的研究人员发现,使翻译系统支持多种语言可以提高其性能,即使在翻译训练数据有限的语言时也是如此;不过尚不清楚会出现这种情况的原因。

该团队从互联网和其他来源(如联合国档案)收集了数百万小时的语音音频文件以及人工进行的语音翻译。研究人员还收集了其中一些语音的文本记录。

该团队还使用可靠的数据来训练模型,以识别相互匹配的内容。这使得研究人员能够将大约50万小时的音频与文本匹配,并自动将一种语言的每个片段与其他语言的对应片段进行匹配。

该系统可以将语音直接翻译成(其他语言的)语音,而无需先将其转换为书面文本。语音合成器用于生成音频。它可以翻译101种语言的语音,不过截至目前,目标翻译语言仅支持36种。该系统还可以执行其他翻译任务,比如将不同语言的文本翻译为语音。

元宇宙公司计算机科学家、论文作者之一玛尔塔·科斯塔-朱萨说,性能的提升不仅是通过增加语言数量,也是通过整合不同的文本和语音组合。她表示,“这些是改进的关键”,翻译所需时间通常只有数秒钟,与专业人工翻译表现相当。

论文作者称,他们对系统进行了微调,以限制性别偏见和“额外不良结果”(即当自动翻译包含不反映原始措辞的冒犯性语言时)的发生。作者还对系统进行了控制,以防止它将一种语言中的无性别术语(例如英语中的“护士”)翻译成其他语言中的性别对应词。

克内克在其评论中写道,为进一步限制自动翻译的潜在危害,“开发人员应该考虑如何以明确模型局限性的方式显示翻译”,并考虑“在准确性有疑问时完全放弃输出”。(编译/王笛青)
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表