Meta 发布全新 AI 模型 SeamlessM4T

2023-08-22 23:33    来源:浅语科技

Facebook的母公司MetaPlatforms今日发布了一种能够翻译和转录数十种语言的人工智能模型——SeamlessM4T,可以让说不同语言的人更有效地进行交流,为开发人类通用语言翻译器提供了助力。

Meta声称,SeamlessM4T将与新的翻译数据集SeamlessAlign一同开源,它代表了人工智能驱动的“语音到语音”和“语音到文本”领域的“重大突破”。

Meta表示,该模型可以在近100种语言之间进行文本到语音的翻译,并支持35种语言的完全语音到语音翻译,而此前要想实现类似的操作只能在单独的AI模型中分别进行翻译。SeamlessM4T支持:

1、近100种语言的语音识别。

2、近100种输入和输出语言的语音到文本翻译。

3、支持近100种输入语言和36种输出语言的语音到语音翻译。

4、支持近100种语言的文本到文本翻译。

5、支持近100种输入语言和35种输出语言的文本到语音翻译。

目前,Meta将以研究许可证的形式向公众免费提供该模型(仅限非商业用途),以便研究人员和开发人员在此基础上开展工作。

据介绍,Meta还将发布SeamlessAlign元数据,这是迄今为止最大的开放多模式翻译数据集,挖掘的语音和文本对齐总计达270000小时。

马克・扎克伯格表示,他坚信这些工具将促进来自全球各地的用户在元宇宙中的互动,这也是他对该公司未来的赌注所在。

他还表示,开放AI生态系统对Meta有利,因为该公司通过有效地将创建面向消费者的工具的任务众包来获得更多收益,而不是通过访问模型来收费。

据称,Meta后续还将把这些翻译和转录方面的AI进展整合到Facebook、Instagram、WhatsApp、Messenger和Threads中。

关于SeamlessM4T模型,Meta研究人员在一份研究论文中表示,他们从“爬取的网页数据的公开可用存储库中”收集了400万小时的“原始音频”,但IT之家没有找到具体是哪个存储库的说明,官方只提到文本数据来自去年创建的数据集,而该数据集来自于维基百科及相关网站提取的内容。



助力制造业迈向高端
科技

助力制造业迈向高端

本文转自:经济日报 周 雷 工业作为主要物质生产部门,是国家经济命脉所系,也是塑造国际竞争新优势的基石。我国工业实现由大到强转变,须持续深化供给侧结构性改革,加快质量变革、效率变革、动力变革。在此过程中,精细化是门必修课,须下大功夫。  [详情]

谷歌AI系统解决几何问题 水平接近奥数冠军
科技

谷歌AI系统解决几何问题 水平接近奥数冠军

本文转自:闽北日报 据新华社北京1月22日电 谷歌旗下人工智能公司“深层思维”近日发布公报称,该公司与美国纽约大学的研究人员合作开发的一种名为AlphaGeometry的人工智能(AI)系统,可以解决复杂的几何问题,其水平接近国际数学奥林匹克竞赛金牌得主,这是人工智能在性能上的突破。 证明数学定理是 [详情]

精细化加速释放市场潜力
科技

精细化加速释放市场潜力

本文转自:经济日报 本报记者 黄 鑫 纪文慧 我国制造业已形成精细化生产竞争力,产业分工细化,数字化精益制造水平持续提高,精细化生产能力和效率不断提升,制造业供应链网络形成了精细化服务能力。  [详情]

哪家医疗机构种牙便宜 在这里一查便知
科技

哪家医疗机构种牙便宜 在这里一查便知

本文转自:西安日报 ■记者 马相 原来,种一颗牙至少需要五位数的价钱,给有口腔种植需求的患者带来极大的经济压力。为此,医保部门积极开展口腔种植价格治理工作,展开集中采购降低种植材料价格,并规范口腔种植医疗服务价格。2023年5月,口腔种植价格治理措施全面落地。  [详情]

兰州化物所枸杞多糖研究获重要进展
科技

兰州化物所枸杞多糖研究获重要进展

本文转自:兰州日报 【本报讯】近日,记者从兰州化物所获悉,中国科学院西北特色植物资源化学重点实验室药物工艺标准课题组致力于枸杞多糖分离制备新技术、物质基础和作用机制研究,取得了重要进展。 多糖是构成生物有机体的基本物质之一。与核酸、蛋白质、脂质等构成生命基本物质的生物大分子相比,多糖结构的复杂多样性 [详情]