月亮链 月亮链
Ctrl+D收藏月亮链
首页 > 非小号 > 正文

XLS:在元宇宙里怎么交朋友?Meta发布跨语种交流语音模型 支持128种语言无障碍对话_ETA

作者:

时间:1900/1/1 0:00:00

改名Meta之后,Facebook的元宇宙愿景正在一点点实现。这一次,Facebook把目光投在了元宇宙社交上。

Meta发布语音处理模型XLS-R

近日,Meta正式发布XLS-R——一套用于各类语音任务的新型自监督模型。据悉,XLS-R由海量公共数据训练而成(数据量是过去的十倍),能够将传统多语言模型的语言支持量增加两倍以上。目前,XLS-R共支持128种语言。

Meta认为,语音交流是人们最自然的一种交互形式。“随着语音技术的发展,我们已经能够通过对话同自己的设备及未来的虚拟世界直接互动,由此将虚拟体验与现实世界融为一体。”

一韩国男子因在元宇宙内的性犯罪被判处四年监禁:金色财经报道,据韩国当地媒体moneys消息,一名30多岁的韩国男子最近因在一直在制作和存储涉及未成年人的性内容而被判处四年监禁。除了被判入狱外,罪犯还必须参加80小时的性犯罪治疗计划,并被禁止在任何与青少年或残疾人有关的实体工作七年。

上个月,韩国科学部宣布了元宇宙宇宙保护未成年人的伦理原则。[2022/9/12 13:24:29]

这与扎克伯格此前宣称的“公司业务将以元宇宙优先”不谋而合。此前,扎克伯格曾概述了他建立“元世界”的计划:一个建立在我们自己的数字世界之上的数字世界,包括虚拟现实和增强现实。“我们相信元宇宙将会接替移动互联网”。

而XLS-R作为元宇宙社交中必不可少的一环,可以帮助母语不同的人在元宇宙无障碍对话。

调查:34%的游戏玩家希望在元宇宙中使用加密货币:金色财经报道,软件开发公司Globant发布的调查显示,34%的受访者表示有兴趣在元界进行加密交易。该调查对1,000名PC、游戏机或移动游戏玩家进行了民意调查。

此外,超过一半(53%)的受访者还表示,如果他们能够从自己的劳动中赚取数字货币,他们会很乐意在虚拟游戏世界中工作。但也有一些游戏玩家表达了对加密货币和NFT的厌恶,他们认为,这些会对游戏体验产生负面影响。(Cointelegraph)[2022/7/15 2:15:11]

值得一提的是,为了通过单一模型实现对多种语言的广泛语音理解能力,Meta对XLS-R进行了微调,使其获得语音识别、语音翻译及语言识别等功能。据介绍,XLS-R在BABEL、CommonVoice以及VoxPopuli语音识别基准测试,CoVoST-2的外语到英文翻译基准测试,以及VoxLingua107语言识别基准测试中都取得了不错的成绩。

韩国乐天集团将在元宇宙平台ZEP上举办招聘说明会:3月17日消息,韩国乐天集团宣布,将在元宇宙平台“ZEP”上举办招聘说明会。乐天表示,在元宇宙空间进行招聘可以不受时间和空间的限制,也可以通过化身表达各种个性。乐天计划从此次招聘咨询开始,积极利用元宇宙进行面试和培训,并通过定期举办局域网茶会来加强与求职者的双向沟通??。(每日经济日报)[2022/3/17 14:02:26]

为了尽可能降低功能访问门槛,目前,Meta与HuggingFace联手发布了模型本体,并通过fairseqGitHubrepo全面开放。

试用地址:https://huggingface.co/spaces/facebook/XLS-R-2B-22-16

XLS-R工作原理

曼城计划在元宇宙中建造阿提哈德球场复制品:金色财经报道,英超冠军曼城计划在元界建造一个阿提哈德体育场的复制品。据报道,该运动队将与索尼公司合作建设该项目,为期三年。该项目将为俱乐部的球迷提供远程体育场访问权限。该项目将使用索尼公司子公司 Hawk-EYE 的图像分析和骨骼跟踪技术创建。该计划旨在为曼城球迷远程提供同样激动人心的体育场体验。(crypto.news)[2022/2/23 10:09:36]

据介绍,XLS-R在wav2vec2.0训练集上接受了超过43万6千小时的公开语音录音训练,从而实现了对语音表达的自监督学习方法。这样的训练量已经达到去年发布的当时最强的模型XLSR-53的10倍。利用从会议记录到有声读物的多种语音数据来源,XLS-R的语言支持范围扩展到128种,涵盖的语种量达到前代模型的近2.5倍。

作为Meta打造的有史以来最大模型,XLS-R中包含超过20亿个参数,性能远高于其他同类模型。Meta表示,事实证明,更多参数能够更充分地体现、数据集中的各类语种。此外,Meta还发现,规模更大的模型在单一语言预训练方面的性能也同样优于其他较小模型。

Meta在四种主要多语言语音识别测试中对XLS-R做出评估,发现它在37种语言上获得了超越以往模型的效能。具体测试场景为:BABEL中选取5种语言,CommonVoice中选取10种语言,MLS中选取8种语言,以及VoxPopuli上选取14种语言。

BABEL上的单词错误率基准测试结果。XLS-R较前代模型实现了显著改进。

此外,Meta还评估了语音翻译模型,即将录音资料直接翻译成另一种语言。为了打造一套能够执行多种任务的模型,Meta同时在CoVoST-2基准测试的数个不同翻译方向上对XLS-R进行了微调,使其能够在英语与多达21种语言之间实现内容互译。

在使用XLS-R对英语以外的其他语言进行编码时,获得了显著的效能提升,这也是多语言语音表达领域的一次重大突破。据Meta介绍,XLS-R在低资源语言学习中实现了显著改进,例如印尼语到英语的翻译,其中BLEU准确率平均翻了一番。BLEU指标的提升是指模型给出的自动翻译结果与处理同一内容的人工翻译结果间重合度更高,代表着模型在改进口语翻译能力方面迈出了一大步。

以BLEU指标衡量的自动语音翻译准确率,其中较高值表示XLS-R从高资源语言(例如法语、德语)、中资源语言(例如俄语、葡萄牙语)或低资源语言(例如泰米尔语、土耳其语)语音记录翻译至英语时的准确率。

Meta认为,XLS-R证明扩大跨语言预训练规模可以进一步提高低资源语言的理解性能。它不仅提高了语音识别率,同时也将由外语到英语的语音翻译准确率提高了一倍以上。

“XLS-R是我们朝着以单一模型理解多种不同语言(语音)目标迈出的重要一步,也代表着我们在利用公共数据推进多语言预训练方面做出的最大努力。我们坚信这是一条正确的探索方向,将让机器学习应用更好地理解所有人类语音、并促进后续研究,大大降低语音技术在全球范围内、特别是服务匮乏社群中的使用门槛。我们将不断开发新方法,通过低监督学习拓展模型的语言理解能力、逐步使其覆盖全球7000多种语言,实现算法的持续更新。”Meta提到。

https://ai.facebook.com/blog/xls-r-self-supervised-speech-processing-for-128-languages/

标签:XLSMETETAMETAPIXLS价格MetaDraceMetapadmetamask安卓

非小号热门资讯
NFT:NFT实用指南 如何铸造音乐NFT?_以太坊

为什么要铸造音乐NFT?“独立艺术家可以在NFT领域靠自己赚钱,从根本上消除了被公司实体低估、以及依赖于公司的风险.

1900/1/1 0:00:00
加密货币:资管巨头贝莱德旗下iShares计划推出区块链ETF_etf币价格今日行情

全球最大的资产管理公司正在筹划一只专注于区块链技术的ETF。1月21日,加密货币市场暴跌,比特币跌幅超过10%.

1900/1/1 0:00:00
DAN:叠加DeFi2.0 再看AC的野心_TOKEN

原文标题:《Dani''svision》分析随着令人期待的SOLID的推出,DaniToken生态系统很可能会在短期内大幅增长.

1900/1/1 0:00:00
加密货币:金色早报 | 俄罗斯总统普京:俄罗斯在加密采矿方面有一些优势_区块链技术通俗讲解图

头条▌俄罗斯总统普京:俄罗斯在加密采矿方面有一些优势1月26日,俄罗斯总统普京与政府在会议上讨论加密监管,普京表示,俄罗斯在加密采矿方面有一些优势。他还要求财政部和俄罗斯央行就加密监管达成一致.

1900/1/1 0:00:00
加密货币:巴基斯坦再次禁止加密货币 这次认真的?_CBD

近期,巴基斯坦国家银行和联邦政府决定禁止使用所有加密货币。这并非是首次禁令,2018年4月,SBP禁止金融服务商支持和使用虚拟货币交易,禁止国内和国际与加密货币相关的支付和转账行为.

1900/1/1 0:00:00
NFT:金色Web3.0周报 | Uniswap稳定币AMM市场份额较Curve占比已达89%_EFI

DeFi数据1.DeFi代币总市值:1373.46亿美元 DeFi总市值数据来源:Coingecko2.过去24小时去中心化交易所的交易量:555.

1900/1/1 0:00:00