ACE-Step UI 指南:开源的 Suno 替代品,本地免费生成 AI 音乐
2026 年 5 月,一个名为 ACE-Step UI 的开源项目冲上了 GitHub Trending 前列,仅一周就收获了 2500+ star。它的定位非常清晰——开源的 Suno 替代品,且完全免费、本地运行。
如果你用过 Suno 或 Udio 生成 AI 歌曲,应该知道它们的痛点:每月 10-50 美元的订阅费、云端生成有隐私风险、生成数量和时长受限制。ACE-Step UI 完全解决了这些问题。
ACE-Step 1.5 是什么
ACE-Step 1.5 是一个开源的 AI 音乐生成模型,可以生成带人声的完整歌曲,最长可达 4 分钟以上。它由 ACE-Step 社区开发,模型权重在 Hugging Face 上开源,MIT 协议,可以商用。
ACE-Step UI 是它的前端界面,提供了类似 Spotify 的专业 UI,让不懂命令行的用户也能轻松使用。
核心特性
- 完整歌曲生成 — 带人声和歌词,最长 4 分钟
- 纯器乐模式 — 生成不带人声的纯音乐
- 自定义参数 — BPM、调性、拍号、时长精细控制
- 风格标签 — 定义流派、情绪、速度和配器
- 批量生成 — 一次生成多个变体
- 参考音频 — 用已有音频作为风格参考
- 音频翻唱 — 给已有音频换风格
- 局部重绘 — 只重新生成歌曲的某个段落
- 种子控制 — 固定种子可复现相同结果
- 歌词编辑器 — 带结构标签的歌词编辑
安装与部署
ACE-Step UI 基于 React 构建,后端用 Python 调用 ACE-Step 1.5 模型。你需要一台带 NVIDIA GPU(至少 12GB VRAM)的机器。如果只有 CPU,也能跑但非常慢。
前置要求
# 系统要求
- Python 3.10+
- Node.js 18+
- NVIDIA GPU + CUDA 12.1+
- 至少 16GB 内存
- 40GB 磁盘空间(存放模型权重)
快速安装
# 1. 克隆仓库
git clone https://github.com/fspecii/ace-step-ui.git
cd ace-step-ui
# 2. 安装 Python 依赖
pip install -r requirements.txt
# 3. 下载模型权重(自动,约 20GB)
python scripts/download_models.py
# 4. 启动后端
python scripts/serve.py
# 5. 另一个终端,安装前端并启动
npm install
npm run dev
启动后打开 http://localhost:5173 即可看到界面。第一次加载需要加载模型进显存,大约需要 30 秒到 1 分钟。
使用 Docker 部署(推荐)
docker compose up -d
项目根目录提供了 docker-compose.yml,会自动处理 CUDA 和模型挂载。这是最省心的方式。
使用指南
生成第一首歌
打开界面后,你会看到一个类似 Spotify 的主界面。点击右上角的 "Create" 按钮:
- 选择模式 — 完整歌曲、器乐、自定义
- 填写提示词 — 比如 "a sad piano ballad with soft female vocals, 80 BPM, key of C minor"
- 写歌词 — 可以用自带的 AI 助手帮你写
- 点击 Generate — 等待 2-5 分钟生成
提示词的质量直接影响生成效果。建议写清楚:风格、情绪、乐器、速度、调性。
提示词示例
Genre: Synthwave / Retrowave
Mood: Nostalgic, dreamy, driving
Tempo: 128 BPM
Key: A minor
Instruments: Analog synth pads, arpeggiated bass, gated reverb drums, sawtooth lead
Reference: Similar to Kavinsky - Nightcall
高级功能
- AI Enhance — 输入简单的风格描述,让 AI 自动补全成详细的提示词,包括 BPM、调性等参数
- Thinking Mode — 让 AI 先推理歌曲结构,再生成对应的音频编码,质量通常更好但更慢
- Batch Generation — 一次生成 4-8 个变体,挑最好的
- Repainting — 选中歌曲的某一段落重新生成,不改别的地方
性能调优
如果你显存有限(12GB),可以调整以下参数:
# 在 scripts/serve.py 中修改
config = {
"inference_steps": 25, # 默认 50,调低可加速
"audio_length": 30, # 默认 90 秒,短一些省显存
"batch_size": 1, # 不要超过 1
"use_fp16": True, # 半精度,省一半显存
}
24GB 显存可以流畅生成长达 4 分钟的完整歌曲。推荐 RTX 3090/4090 或 A5000 以上。
与 Suno/Udio 的对比
| 对比项 | Suno / Udio | ACE-Step UI |
|---|---|---|
| 费用 | 10-50 美元/月 | 完全免费 |
| 隐私 | 云端生成 | 100% 本地 |
| 版权 | 平台许可 | 你拥有全部权利 |
| 定制化 | 有限 | 完全控制 |
| 生成限制 | 有配额限制 | 无限制 |
| 商用 | 高付费档位 | 无限制 |
| 音质 | 顶级 | 接近顶级,持续改进 |
| 上手难度 | 零门槛 | 需 GPU 和一点配置 |
ACE-Step 的音质目前略逊于 Suno 最新版,但差距已经不是天壤之别。考虑到社区每周都在改进模型,追上只是时间问题。
常见问题
没有 GPU 能跑吗
可以用 CPU 跑,但生成一首 90 秒的歌曲可能需要 30 分钟以上。建议至少租一台云 GPU。
生成的歌曲质量怎么样
英文歌效果很好,中文歌因为训练数据中中文占比少,效果一般。社区正在优化中文支持。
支持中文歌词吗
支持,但中文语音清晰度不如英文。建议先用英文写词,等模型后续优化。
可以商用吗
ACE-Step 1.5 使用 MIT 协议,生成的音乐你拥有全部版权,可以商用、发布到流媒体平台。
总结
ACE-Step UI 是目前最值得关注的开源 AI 音乐项目。它把专业的 AI 音乐生成能力带到了桌面,不受云服务的限制和价格束缚。如果你有一块像样的 GPU,完全可以用它替代 Suno 订阅。