3分钟上手!B站开源的「声音克隆神器」,小白也能秒变配音大师
什么是Index TTS?
由B站官方开源的文本转语音(TTS)工具,支持零样本声音克隆——只需5秒参考音频,就能克隆任何人的声线,生成自然流畅的语音。中文发音准确率吊打同类工具,还能通过标点符号控制停顿,让AI语音像真人一样有节奏感!
工具直达链接
- GitHub仓库:GitHub - index-tts/index-tts: An Industrial-Level Controllable and Efficient Zero-Shot Text-To-Speech System
- 在线演示:https://index-tts.github.io(无需安装,直接试用)
3步傻瓜式使用教程
Step 1:下载安装(5分钟搞定)
- 克隆代码库:
bash
git clone https://github.com/index-tts/index-tts.git
cd index-tts
- 创建虚拟环境(需提前安装Miniconda):
bash
conda create -n index-tts python=3.10
conda activate index-tts
- 安装依赖+下载模型:
bash
pip install -r requirements.txt
huggingface-cli download IndexTeam/IndexTTS-1.5 --local-dir checkpoints
Step 2:启动Web界面 运行命令后,浏览器自动打开操作页面:
bash
python webui.py
界面说明:左侧上传参考音频(支持MP3/WAV),中间输入文本,右侧点击「生成语音」即可!
Step 3:生成语音
- 参考音频:上传清晰无杂音的5-10秒人声(如自己的录音)。
- 输入文本:支持中英文混合,用标点符号控制停顿(逗号停0.3秒,句号停0.8秒)。
- 生成示例:文本:
"大家好!今天教大家用AI克隆声音,是不是超简单?"生成效果:点击试听(需访问官方演示页)
为什么选它?
免费开源:无广告、无付费功能,代码全公开可修改。
音质炸裂:48kHz高保真音频,MOS评分4.0(接近真人水平)。
低配置友好:4GB显存即可运行,普通笔记本也能跑。
注意事项
- 路径和文件名不能含中文,否则会报错。
- 多音字可通过拼音纠正(如输入“行(xíng)走”避免误读)。
- 长文本建议分段输入,每句不超过50字。
小白友好整合包:不想折腾环境?直接下载一键启动版(提取码:77a4),解压即用!
一句话总结:从“下载”到“生成语音”全程不超过10分钟,配音、有声书、视频旁白全搞定,堪称自媒体人的效率神器!