Meta 开源 AI 语言模型 MusicGen，可将文本和旋律转化为完整乐曲 _MusicGen

【Meta 开源 AI 语言模型 MusicGen，可将文本和旋律转化为完整乐曲】IT之家 6 月 12 日消息，Meta 近日在 Github 上开源了其 AI 语言模型 MusicGen，该模型基于谷歌 2017 年推出的 Transformer 模型。如同模型名称所示，MusicGen 主要用于音乐生成，它可以将文本和已有的旋律转化为完整乐曲。

文章插图
研发团队表示：“我们使用了 20000 小时的授权音乐来对训练该模型，并采用 Meta 的 EnCodec 编码器将音频数据分解为更小的单元进行并行处理，进而让 MusicGen 的运算效率和生成速度都比同类型 AI 模型更为出色。”
除此之外，MusicGen 还支持文本与旋律的组合输入，例如你可以提出生成“一首轻快的曲目”并同时要求“将它与贝多芬的《欢乐颂》结合起来” 。
研发团队还对 MusicGen 的实际表现进行了测试。结果显示，与谷歌的 MusicLM 以及 Riffusion、Mousai、Noise2Music 等其他音乐模型相比，MusicGen 在测试音乐与文本提示的匹配度以及作曲的可信度等指标上表现更好，总体而言略高于谷歌 MusicLM 的水平。
Meta 已允许该模型的商业使用，并在 Huggingface 上发布了一个供演示用的网页应用。

Meta 开源 AI 语言模型 MusicGen，可将文本和旋律转化为完整乐曲

推荐阅读

直播|西班牙议员视频会议直播洗澡，被围观后辞职

印度_社会|印度历时8年所建成大桥被冲垮，刚完工1个月，耗资26亿卢比

记住：永远不要在 MySQL 中使用 UTF-8

2022年北京冬奥会什么时候举行？

央视新闻|黎巴嫩贝鲁特港恢复运营，8月4日曾发生大爆炸

「刘诗诗」朝鲜向韩方哨所开枪？韩方随即进行警告广播并开枪回应

里尚七七：身段玲珑38岁也有少女感，范冰冰近照又美了！一袭白裙气质清新

『懒人』好吃又好做的懒人美味——培根金针菇卷的做法来啦

孕育敦煌飞天的是什么文化?孕育敦煌飞天的是什么文化

biu时尚|清新又有活力，穿上“秒变”18，夏日感十足的绿色系穿搭

「秋丽泛论」气质不输女星，高颜值但却比不过利智，李连杰圣诞节秀女儿美照

LA PRAIRIE莱珀妮再度诠释纯皙紧致奢润面霜

泰坦尼克号|《泰坦尼克号》女主变得这么老？亮相颁奖礼很壮，22岁女儿也来了！

激励性早会必备的22句口号激励口号大全

「郑爽」别人想削腮，看到郑爽的“原装脸”，才懂什么叫高级美

细细品茶名优绿茶冲泡欣赏到优美的茶舞

辽沈晚报葫芦岛时刻|兴城一女子在邻居家水塘溺水而亡

炸裂|4本经典爽文，三刷四刷都不腻，好看到炸裂！

张廷玉为什么能得到雍正的重用?雍正为什么要杀张廷玉的儿子

乘坐高铁注意事项及携带物品规定充电宝乘坐高铁注意事项及携带物品规定