进入“人声分离 ”界面
导入你的音频/视频文件 支持 MP3 / WAV / M4A / FLAC / MP4 / MOV 等格式。 软件会自动识别并准备处理。
选择分离类型 一般会提供: 选择你需要的输出的「类型」。 保留人声 保留伴奏 保留人声和伴奏
开始处理(AI 模型处理) 软件会对音轨进行深度分离,耗时 5 秒到几十秒不等。
预听效果 & 导出
适合:会一点命令行、想在本地批量处理或追求免费方案的人。Spleeter 是 Deezer 开源的声源分离工具,常见用法是 2-stems / 4-stems 分离。
操作步骤(Windows/Mac/Linux):
安装 Python(3.8+)与 FFmpeg。
pip install spleeter 或按官方安装说明。
在命令行运行:spleeter separate -i yoursong.mp3 -p spleeter:2stems -o output。
输出目录会有 vocals.wav 和 accompaniment.wav,accompaniment.wav 即伴奏。
优缺点:质量比老式方法好,批量处理方便;但需要环境配置与硬件(CPU/GPU)支持。
适合:追求更好分离质量、能折腾模型和安装的人。Demucs 是 Facebook Research 的高质量分离模型,能在复杂混音下表现更好(但是需要较新硬件/依赖)。
操作步骤(简要):
安装 Python 与必要依赖。
pip install demucs,或用官方 Docker/conda 镜像。
运行:demucs --two-stems yoursong.mp3(或更细分的参数)。
在输出文件夹取 no_vocals.wav(或对应的 instrumental)。
小贴士:Demucs 对人声/乐器的分离通常更自然,但运行时间和显存需求更高。
代表服务:LALAL.AI (一键上传,几分钟出结果)。优点:速度快、界面友好;缺点:高级质量/批量通常收费。适合:想马上出伴奏用于短视频、练习或投稿的场景。
操作步骤:
打开 LALAL.AI(或 Moises)网站并注册/登录。
点击「Upload / Select file」,上传你的 mp3/wav/视频(MP4 等也可以)。
选择分离模式(2 stems:Vocal + Instrumental;或 4/5 stems 更细分)。
提交等待处理(几秒到几分钟)。
下载“Instrumental”或把 Vocals 音量拉到 0 导出。
小贴士:先用免费/试用版本测试效果,风格复杂的流行乐可能残留人声。
适合:零预算、偶尔操作的用户。原理是左右声道相位差 cancel(只在中置人声且两声道人声几乎相同的情况下比较有效)。官方也有 “Vocal Reduction and Isolation” 效果。
操作步骤(简要):
用 Audacity 打开音轨,复制一份轨道。
选择轨道下拉 -> Split Stereo to Mono。
选中一个通道,Effect -> Invert(相位反转)。
合并导出,或使用 Effect -> Vocal Reduction and Isolation 选择「Remove Vocals」。
注意:对立体声定位/混响较多的歌效果差,有时会丢低频或变薄。
适合:对音频编辑有经验、需要修复或微调的场景。用频谱编辑(Spectral Repair)、手工 EQ 删除人声频段并用门限器、降噪去残留。常用工具:Adobe Audition、iZotope RX 的谱图修复等。
操作步骤(示例):
在 DAW 打开音频,观察频谱(Spectral Display)。
用 EQ 削掉人声集中的频段(通常 1k–4kHz),搭配动态处理避免器乐受损。
用谱图修复工具(Spectral Repair)手动擦除或衰减残留的人声片段。
反复对比并导出。
优点:可对关键段落做精修;缺点:耗时且需要技巧。
小结 & 个人建议 ✍返回搜狐,查看更多
想要最快出结果:先试硬柿子音视频转换器软件,合乎大多数短视频/练习需求。
想要长期、批量、免费:学会命令行,上 Spleeter(或 Demucs)在本地跑,学会后很灵活。
追求专业发稿/产品级质量:用 iZotope RX 的 Music Rebalance 或专业谱图修复。