3分钟上手!B站开源的「声音克隆神器」,小白也能秒变配音大师

3分钟上手!B站开源的「声音克隆神器」,小白也能秒变配音大师

:fire: 什么是Index TTS?

由B站官方开源的文本转语音(TTS)工具,支持零样本声音克隆——只需5秒参考音频,就能克隆任何人的声线,生成自然流畅的语音。中文发音准确率吊打同类工具,还能通过标点符号控制停顿,让AI语音像真人一样有节奏感!

:rocket: 工具直达链接

:memo: 3步傻瓜式使用教程

Step 1:下载安装(5分钟搞定)

  1. 克隆代码库:

bash

git clone https://github.com/index-tts/index-tts.git  
cd index-tts  
  1. 创建虚拟环境(需提前安装Miniconda):

bash

conda create -n index-tts python=3.10  
conda activate index-tts  
  1. 安装依赖+下载模型:

bash

pip install -r requirements.txt  
huggingface-cli download IndexTeam/IndexTTS-1.5 --local-dir checkpoints  

Step 2:启动Web界面 运行命令后,浏览器自动打开操作页面:

bash

python webui.py  

界面说明:左侧上传参考音频(支持MP3/WAV),中间输入文本,右侧点击「生成语音」即可!

Step 3:生成语音

  • 参考音频:上传清晰无杂音的5-10秒人声(如自己的录音)。
  • 输入文本:支持中英文混合,用标点符号控制停顿(逗号停0.3秒,句号停0.8秒)。
  • 生成示例:文本:"大家好!今天教大家用AI克隆声音,是不是超简单?" 生成效果:点击试听(需访问官方演示页)

:sparkles: 为什么选它?

:white_check_mark: 免费开源:无广告、无付费功能,代码全公开可修改。:white_check_mark: 音质炸裂:48kHz高保真音频,MOS评分4.0(接近真人水平)。:white_check_mark: 低配置友好:4GB显存即可运行,普通笔记本也能跑。

:warning: 注意事项

  1. 路径和文件名不能含中文,否则会报错。
  2. 多音字可通过拼音纠正(如输入“行(xíng)走”避免误读)。
  3. 长文本建议分段输入,每句不超过50字。

小白友好整合包:不想折腾环境?直接下载一键启动版(提取码:77a4),解压即用!


:light_bulb: 一句话总结:从“下载”到“生成语音”全程不超过10分钟,配音、有声书、视频旁白全搞定,堪称自媒体人的效率神器!