【有卡有网】 6 月 7 日消息,Stability AI 依托 Stable Diffusion 模型,成功扩展到音频领域,推出Stable Audio Open,该K AI 开源模型仅需用户输入提示词,即可生成高品质的音频样本。
Stable Audio Open 能够生成最长 47 秒的音乐,适用于鼓点、乐器旋律、环境音及拟声等音效制作。这款开源模型基于 transforms 扩散模型(DiT),在自动编码器的潜在空间中精细操作,从而提升生成音频的质量和多样性。
版权声明:本文采用知识共享 署名4.0国际许可协议 [BY-NC-SA] 进行授权
文章名称:《Stable Audio Open 发布开源 AI 模型》
文章链接:https://www.youkayouwang.com/it-keji/zhineng/106467.html
本站资源仅供个人学习交流,请于下载后24小时内删除,不允许用于商业用途,否则法律问题自行承担。
文章名称:《Stable Audio Open 发布开源 AI 模型》
文章链接:https://www.youkayouwang.com/it-keji/zhineng/106467.html
本站资源仅供个人学习交流,请于下载后24小时内删除,不允许用于商业用途,否则法律问题自行承担。