文本直接生成20多种背景音乐，免费版Stable Audio来了！

作者：巴比特资讯发布时间：2023-09-16

AIGC

来源：AIGC开放社区

9月14日，著名开源平台Stability AI在官网发布了，音频生成式AI产品Stable Audio。（免费使用地址：https://www.stableaudio.com/generate）

用户通过文本提示就能直接生成摇滚、爵士、电子、嘻哈、重金属、民谣、流行、朋克、乡村等20多种类型背景音乐。

例如，输入迪斯科、鼓机、合成器、贝司、钢琴、吉他、欢快、115 BPM等关键词，就能生成背景音乐。

目前，Stable Audio有免费和付费两个版本：免费版，每月可生成20个音乐，最大时长45秒，不能用于商业；付费版，每月11.99美元（约87元），可生成500个音乐，最大时长90秒，可用于商业。

如果你不想付费可以多注册几个账号，可以通过AU（一种音频编辑器）或PR将生成的音乐拼接起来可达到同样效果。

Stable Audio简单介绍

在过去几年，扩散模型在图像、视频、音频等领域获得了飞速发展，可显著提升训练和推理效率。但音频领域的扩散模型存在一个问题，通常会生成固定大小的内容。

例如，音频扩散模型可能在30秒的音频片段上进行训练，并且只能生成30秒的音频片段。为了打破这个技术瓶颈Stable Audio使用了一种更先进的模型。

这是一种基于文本元数据以及音频文件持续时间，和开始时间调整的音频潜在扩散模型，允许对生成音频的内容和长度进行控制。这种额外的时间条件使用户能够生成指定长度的音频。

与原始音频相比，使用大幅度下采样的音频潜在表示可以实现更快的推理效率。通过最新稳定音频模型，Stable Audio能在不到一秒的时间内，使用NVIDIA A100 GPU渲染出95秒的立体声音频，采样率为44.1 kHz。

训练数据方面，Stable Audio使用了一个超过80万个音频文件组成的数据集，包含音乐、音效以及各种乐器。

该数据集总计超过1.95万小时的音频，同时与音乐服务商AudioSparx进行合作，所以，生成的音乐可以用于商业化。

潜在扩散模型

Stable Audio所使用的潜在扩散模型（Latent Diffusion Models）是一种基于扩散的生成模型，主要在预训练的自动编码器的潜在编码空间中使用。这是一种结合了自动编码器和扩散模型的方法。

自动编码器首先被用来学习输入数据（例如图像或音频）的低维潜在表示。这个潜在表示捕捉了输入数据的重要特征，并且可以被用来重构原始数据。

然后，扩散模型在这个潜在空间中进行训练，逐步改变潜在变量，从而生成新的数据。

这种方法的主要优点是可以显著提高扩散模型的训练和推理速度。因为扩散过程在一个相对较小的潜在空间中进行，而不是在原始数据空间中进行，因此可以更高效地生成新的数据。

此外，通过在潜在空间中进行操作，这种模型还可以提供对生成数据的更好控制。例如，可以通过操纵潜在变量来改变生成数据的某些特性，或者通过对潜在变量施加约束来引导数据生成过程。

Stable Audio使用和案例展示

「AIGC开放社区」体验了一下免费版Stable Audio，使用方法与ChatGPT差不多直接输入文本提示即可。提示内容包括细节、心态、乐器和节拍四大类。

需要注意的是，如果想生成的音乐更细腻、有律动性和节奏，输入的文本也需要更细化。也就是说，你输入的文本提示越多，那么生成的效果就约好。

Stable Audio使用界面

以下是生成音频案例展示。

恍惚、岛屿、海滩、太阳、凌晨4点、渐进、合成器、909、戏剧和弦、合唱、欢快、怀旧、动态。

柔软的拥抱，舒适，低合成，闪烁，风和树叶，环境，和平，放松，水。

流行电子、大混响合成器、控鼓机、大气、穆迪、怀旧、酷、流行乐器、100 BPM。

3/4，3拍，吉他，鼓，明亮，快乐，拍手

本文素材来源Stability AI官网，如有侵权请联系删除

END

相关资讯

文本直接生成20多种背景音乐，免费版Stable Audio来了！

推荐体验

相关资讯

免费使用，媲美Midjourney！文本可直接生成10多种类型图片

音乐AI服务爆炸？Stable Audio是一款文本转音乐工具

效果比Sora惊艳，著名AI平台大动作！文本生成超25秒视频，带背景音乐、转场等效果

人声分离网站！帮你快速提取视频中的人声和背景音乐

2023年ai背景音乐视频,AIGC元年该如何与新媒体结合？

近期资讯

百傲化学获得实用新型专利授权：“一种基于浮子原理的多功能一体式在线测量装置”

索尼W610数码相机评测：便携性、智能拍摄与性价比兼具的选择

三诺生物获得实用新型专利授权：“一种多波段集成光学检测系统”

卓兆点胶获得实用新型专利授权：“光伏边框的自动搬运组件”

万和电气获得实用新型专利授权：“冷凝换热装置及燃气热水器”

蓝牙耳机使用指南：关机技巧与电量管理小窍门

艾能聚获得实用新型专利授权：“用于光伏板的搭接结构”

苹果笔记本强制关机指南：应对系统卡顿和崩溃的有效方法与注意事项

简单易懂的打印机添加指南：快速设置与故障排查技巧

英特尔：引领科技创新的半导体巨头，性能与品牌形象并重

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响