切换到宽版
  • 546阅读
  • 0回复

[智能应用]普通人也能成为音频剪辑师,Meta 推出 AI 模型 Voicebox [复制链接]

上一主题 下一主题
在线huozm32831

UID: 329002

精华: 1097
职务: 超级斑竹
级别: 玉清道君
 

发帖
106074
金币
950
道行
19523
原创
29307
奖券
17275
斑龄
190
道券
10126
获奖
0
座驾
 设备
EOS—7D
 摄影级
专家级认证
在线时间: 19969(小时)
注册时间: 2007-11-29
最后登录: 2024-11-15
只看楼主 倒序阅读 使用道具 楼主  发表于: 2023-06-17
Meta 继推出 ImageBind 之后,于今天再次推出了全新的生成式 AI 模型 Voicebox。该模型帮助创作者执行音频编辑、采样和风格化等语音生成任务,即便是普通用户也能轻松上手。



Meta 在介绍 Voicebox 模型时表示,视障人士可以听到好友的回复信息、普通用户可以用自己的语调、语气来说外语。

AI 模型本身可以生成高质量的音频剪辑,消除汽车喇叭等不必要的背景噪音,同时保留音频的内容和风格,同时使用多种语言,以六种语言生成语音。该模型的未来发展包括在元宇宙游戏中为视觉助理或非玩家角色提供自然的声音。

Meta 还比较了 Voicebox 和 Vall-E、YourTTS 等其它音频 AI 模型,表明 Voicebox 更先进,在比较单词错误率和样式相似性时优于两种模型。
山庄提示: 道行不够,道券不够?---☆点此充值☆
 
  




    
快速回复
限120 字节
认真回复加分,灌水扣分~
 
上一个 下一个