Meta称研制出迄今最复杂人工智能语音模型 。
图片来源:英国《每日邮报》网站
科技日报北京6月25日电(采访人员刘霞)据英国《每日邮报》23日报道,脸书母公司元宇宙平台公司(Meta)称,其已研制出“迄今功能最强大的语音生成式人工智能Voicebox”,它能够模仿任何人的声音,包括逝者 。不过,由于担心这项先进技术会被滥用,Meta宣布不会公开其人工智能模型 。
Meta公司深度学习人工智能研究人员在介绍Voicebox时指出,Voicebox使用了“流匹配”方法,其表现优于当前最先进生成式语音系统使用的扩散模型 。结果显示,Voicebox生成的人工音频更容易理解,单词错误率为1.9%,低于竞争对手的5.9% 。此外,Voicebox生成的音频与真人的相似性更高,同时速度快了近20倍 。
在跨语言翻译时,Voicebox的表现优于备受赞誉的多语言文本—语音AI YourTS,单词平均错误率从10.9%降低到5.2%,音频相似度从0.335提高到0.481 。
Meta阐述了Voicebox的多种用途,称其可用来帮助视障人士听到朋友和亲人的信息,或允许非母语人士用自己的声音翻译自己所说的话 。据悉,Voicebox目前能说6种语言:英语、法语、西班牙语、德语、波兰语和葡萄牙语 。
不过,Meta强调称,由于潜在的滥用风险,他们目前不会公开Voicebox模型及其代码 。虽然他们认为向人工智能社区开放并分享研究,对于推动人工智能向前迈进非常重要,但在开放与责任之间取得正确的平衡也至关重要 。
来源: 科技日报
【迄今最复杂人工智能语音模型创建 如何使用语音查世界之最】
图片来源:英国《每日邮报》网站
科技日报北京6月25日电(采访人员刘霞)据英国《每日邮报》23日报道,脸书母公司元宇宙平台公司(Meta)称,其已研制出“迄今功能最强大的语音生成式人工智能Voicebox”,它能够模仿任何人的声音,包括逝者 。不过,由于担心这项先进技术会被滥用,Meta宣布不会公开其人工智能模型 。
Meta公司深度学习人工智能研究人员在介绍Voicebox时指出,Voicebox使用了“流匹配”方法,其表现优于当前最先进生成式语音系统使用的扩散模型 。结果显示,Voicebox生成的人工音频更容易理解,单词错误率为1.9%,低于竞争对手的5.9% 。此外,Voicebox生成的音频与真人的相似性更高,同时速度快了近20倍 。
在跨语言翻译时,Voicebox的表现优于备受赞誉的多语言文本—语音AI YourTS,单词平均错误率从10.9%降低到5.2%,音频相似度从0.335提高到0.481 。
Meta阐述了Voicebox的多种用途,称其可用来帮助视障人士听到朋友和亲人的信息,或允许非母语人士用自己的声音翻译自己所说的话 。据悉,Voicebox目前能说6种语言:英语、法语、西班牙语、德语、波兰语和葡萄牙语 。
不过,Meta强调称,由于潜在的滥用风险,他们目前不会公开Voicebox模型及其代码 。虽然他们认为向人工智能社区开放并分享研究,对于推动人工智能向前迈进非常重要,但在开放与责任之间取得正确的平衡也至关重要 。
来源: 科技日报
【迄今最复杂人工智能语音模型创建 如何使用语音查世界之最】
- 地表最强!世界上最快的摩托车,川崎H2R在他面前乖乖认怂 世界之最摩托车比赛视频
- 群发言排行榜,最新版QQ怎么看发言排行
- 美睫睫毛哪种最好,哪款睫毛膏拉长效果最好?
- 书籍最全的阅读软件,什么阅读软件图书最多最全?
- 耶稣墓找到了考古学家发现耶稣墓最终安息地
- 她是皇帝宠妃生儿子为太子最终却被砍头!
- 史上最悲惨公主:时运不济还曾被卖身为奴
- 武则天几个儿子的命运最后到底分别是怎样的?
- 解密最早的快递业务:明朝已经有了相关的业务
- 苍鹰郅都汉景帝的忠臣为何最后不得善终