IndexTTS2 部署
在
一、IndexTTS2 简介
IndexTTS2 是基于 检索式语音合成(Retrieval-Augmented TTS) 思想构建的多说话人高质量 TTS 系统,是 IndexTTS(2024) 的改进版本。主要特点如下:
1. 模型结构改进
- 使用语音特征库(Voice Bank)作为索引源,通过检索相似语音片段来提升音色还原度。
- 引入更稳定的 Acoustic Model 与更高质量的 Vocoder,减少噪声与音色漂移问题。
- 生成流程更加轻量,推理速度较 IndexTTS 更快。
2. 音色克隆效果明显增强
- 小样本即可克隆某个说话人音色。
- 保留原说话人音色特征的同时,提高自然度与清晰度。
- 对情感、语调、节奏的控制更稳定。
3. 多语言能力更强
- 在多语言语料库上训练,支持中英双语及跨语种语音转换。
- 说话人音色在跨语言模式下保持一致性。
4. 用途
- 个人音色克隆
- 虚拟主播/AI 助手
- 配音与旁白
- 多语言语音生成
- 情感语音合成
二、部署
Win10部署:192.168.13.60
博主原贴:
https://mp.weixin.qq.com/s/xdOm4LdWCtYmlftdNR6Wnw
百度网盘下载地址:
https://pan.baidu.com/s/1zYrfrf5jaWxi5KWIntknpA?pwd=2046#list/path=%2F
文件已下载至192.168.13.60桌面,见下图:
【企业内容,不展示】
——1——
因博主打包制作好环境,所以根据说明可以一键启动。
附:原博主使用说明:

——2——
【windows使用说明】
系统要求:
- windows 10及以上系统
- 至少16GB内存
- 至少40GB硬盘存储空间(压缩包和解压后的文件都会占用空间)
使用说明: 特别提醒:解压路径中不能含有中文、空格或特殊字符!!!!!
- 有英伟达显卡的话安装【cuda_12.8.1_572.61_windows.exe】(没有显卡就忽略吧,可以使用cpu)
- 安装【VC_redist.x64.exe】
- 双击运行【一键启动.bat】文件。
- 启动成功后,会自动打开浏览器(保持命令行窗口运行,关闭命令行窗口TTS服务也会关闭)。
其他问题:
- 不支持AMD显卡
- 如果你有英伟达的显卡,请先双击安装【cuda_12.8.1_572.61_windows.exe】(请使用12.8版本)
- 如果你是新电脑,或者刚重装完系统,可能需要安装【VC_redist.x64.exe】
- 如果你安装CUDA失败了,那么可能需要安装【vs_BuildTools.exe】
- 运行【vs_BuildTools.exe】
- 勾选【使用C++的桌面开发】
- 点击安装
注意:
启动后命令行不要关闭,否则软件也直接关闭。
三、常见问题
1、错误:
RuntimeError: could not create a primitive
是 PyTorch 的 CPU 内核(OneDNN / MKLDNN)在 Windows 下无法创建 Conv1D primitive。
解决方案:虚拟机CPU类型由KVM改为host
作者
fffff@xf.nn
