你的位置:pc28 > 加拿大28pc预测软件 >
加拿大pc28开奖结果 101种谈话即时翻译,Meta新模子可作念你的“AI翻译官”
发布日期:2024-09-21 02:28    点击次数:155

近日,Meta 发布了一款全新的 AI 模子,大概翻译来自 101 种谈话的语音,这为达成及时同声传译迈出了短处一步加拿大pc28开奖结果,让你说的话在出口须臾被翻译成其他谈话成为可能。

传统的语音翻译模子频频选择多才略历程:先将语音转写成文本,再将该文本翻译成缱绻谈话,终末将翻译后的文本辩论谚语音。这种门径不仅效能较低,还可能在每个短处中产生作假或误译。而 Meta 推出的新模子 SeamlessM4T 则大概愈加奏凯地将一种谈话的语音翻译成另一种谈话的语音。相关筹论说文已于昨日发表在 Nature 上。

SeamlessM4T 在文本翻译方面的准确率比现存顶级模子特等 23%。尽管 Google 的 AudioPaLM 模子在撑持的谈话数目上青出于蓝(其掩盖 113 种谈话,而 SeamlessM4T 撑持 101 种),但 AudioPaLM 只可将这些谈话翻译成英文,而 SeamlessM4T 则大概翻译成 36 种其他谈话。

这一上风成绩于其中枢时间——并行数据挖掘。该门径通过持取会聚数据,寻找视频或音频中的语音与另一种谈话字幕相对应的内容,从而使模子学习何如将一种谈话的语音与另一种谈话的文本栽种关联。这为模子提供了大王人全新的翻译示例,显赫普及了翻译性能。

“Meta 在多功能撑持方面发达格出门色,例如文本转语音、语音转文本,以及自动语音识别。”昆尼皮亚克大学臆测机科学熟悉 Chetan Jaiswal(未参与该议论)示意,“他们所撑持的谈话数目自己便是一项了不得的设立。”

议论东说念主员在论文中强调,东说念主类译者在翻译过程中依然表现着至关遑急的作用,因为他们大概处理不同的文化配景,确保容许在另一种谈话中被准确传达。加拿大魁北克拉瓦尔大学翻译、时间与社会规模的加拿大议论主席 Lynne Bowker (未参与 Seamless 面容)也指出,这一短处尤为短处。她示意:“谈话是文化的映射,而不同文化领有各自特有的剖判步地。”

首先值得一提的是,WTT长久以来都有相应的对不参加比赛的罚款规定。今年的WTT赛事规则手册更新于12月20日,但对于运动员退赛罚款的规则并没有做改动,所以其实并非新规。

在医学或法律等规模,机器翻译必须经过东说念主工仔细校对,不然可能导致严重扭曲。Lynne Bowker 例如指出,2021 年 1 月,Google Translate 在翻译弗吉尼亚州卫生部发布的新冠疫苗大师卫生信息时,将英文的 “not mandatory”(非强制)误译为西班牙语的 “not necessary”(无须要),这一作假透彻扭曲了原信息的含义。

此外,AI 在不同谈话上的考验数据分袂存在不均,这使得现存的语音到语音翻译模子在处理某些谈话对时发达不一。例如,由于有大王人数据撑持,模子可能大概应答将希腊语翻译成英语,但在将斯瓦希里语翻译成希腊语时却濒临繁难。

为了处治这一问题,Seamless 团队对模子进行了大范畴预考验,愚弄数百万小时的多谈话语音数据进行考验。这种预考验让模子大概识别谈话的一般模式,从而在处理使用频率较低的谈话时发达得愈加出色,因为它已具备对东说念主类谈话声息的基础清醒。

值得一提的是,Seamless 系统是开源的,议论东说念主员但愿这一绽放战略大概激勉更多东说念主基于现存功能进行校正和拓展。可是,也有东说念主对其实质应用后果忽视了质疑。Jaiswal 示意:“固然 Google 的翻译模子不像 Seamless 那样开源,但它的反应速率更快、启动效能更高,并且对学术界是免费的。”

最令东说念主期待的是,Meta 的系统展现了将来达成跨谈话即时翻译的可能性,就像 Douglas Adams 在经典演义《星河系漫游指南》中描述的“巴别鱼”相似。SeamlessM4T 的翻译速率比现存模子更快,但尚未达到及时翻译的水平。不外,Meta 示意,他们正在开荒的新版 Seamless,其速率已接近东说念主类同声传舌人的发达。

“尽管这种带有蔓延的翻译还是格出门色且实用,但我合计的确的同声传译将愈加高效和有价值。”德克萨斯大学阿灵顿分校臆测谈话学推行室主任 Kenny Zhu 示意。

https://www.technologyreview.com/2025/01/15/1109994/metas-new-ai-model-can-translate-speech-from-more-than-100-languages/