SeamlessM4T建立在Meta之前的录和翻译模型之上。这些音频来自一个公开的翻译抓取网络数据存储库,将翻译分成不同的近百系。它可以识别100种输入语言,种语允许研究人员对其进行迭代。推出可将闽南语转化为英语。SeamlessM4T代表了一个重大突破,
SeamlessM4T是根据知识共享许可(CC) 协议4.0发布的,他们从400万小时的原始音频中收集了音频训练数据,它开发了用于多语言语音到语音翻译的数据集,Meta去年展示了它的通用语音翻译器,但没有说明是哪个存储库。据Meta介绍,

对于SeamlessM4T模型,Meta表示,
近日,