×

一、IndexTTS2 简介

IndexTTS2 是基于 检索式语音合成(Retrieval-Augmented TTS) 思想构建的多说话人高质量 TTS 系统,是 IndexTTS(2024) 的改进版本。主要特点如下:

1. 模型结构改进

  • 使用语音特征库(Voice Bank)作为索引源,通过检索相似语音片段来提升音色还原度。
  • 引入更稳定的 Acoustic Model 与更高质量的 Vocoder,减少噪声与音色漂移问题。
  • 生成流程更加轻量,推理速度较 IndexTTS 更快。

2. 音色克隆效果明显增强

  • 小样本即可克隆某个说话人音色。
  • 保留原说话人音色特征的同时,提高自然度与清晰度。
  • 对情感、语调、节奏的控制更稳定。

3. 多语言能力更强

  • 在多语言语料库上训练,支持中英双语及跨语种语音转换。
  • 说话人音色在跨语言模式下保持一致性。

4. 用途

  • 个人音色克隆
  • 虚拟主播/AI 助手
  • 配音与旁白
  • 多语言语音生成
  • 情感语音合成

二、部署

Win10部署:192.168.13.60

博主原贴:

https://mp.weixin.qq.com/s/xdOm4LdWCtYmlftdNR6Wnw

百度网盘下载地址:

https://pan.baidu.com/s/1zYrfrf5jaWxi5KWIntknpA?pwd=2046#list/path=%2F

文件已下载至192.168.13.60桌面,见下图:

【企业内容,不展示】

——1——

因博主打包制作好环境,所以根据说明可以一键启动。

附:原博主使用说明:

——2——

【windows使用说明】

系统要求:

  1. windows 10及以上系统
  2. 至少16GB内存
  3. 至少40GB硬盘存储空间(压缩包和解压后的文件都会占用空间)

使用说明: 特别提醒:解压路径中不能含有中文、空格或特殊字符!!!!!

  1. 有英伟达显卡的话安装【cuda_12.8.1_572.61_windows.exe】(没有显卡就忽略吧,可以使用cpu)
  2. 安装【VC_redist.x64.exe】
  3. 双击运行【一键启动.bat】文件。
  4. 启动成功后,会自动打开浏览器(保持命令行窗口运行,关闭命令行窗口TTS服务也会关闭)。

其他问题:

  1. 不支持AMD显卡
  2. 如果你有英伟达的显卡,请先双击安装【cuda_12.8.1_572.61_windows.exe】(请使用12.8版本)
  3. 如果你是新电脑,或者刚重装完系统,可能需要安装【VC_redist.x64.exe】
  4. 如果你安装CUDA失败了,那么可能需要安装【vs_BuildTools.exe】
    1. 运行【vs_BuildTools.exe】
    2. 勾选【使用C++的桌面开发】
    3. 点击安装

注意:

启动后命令行不要关闭,否则软件也直接关闭。

三、常见问题

1、错误:

 RuntimeError: could not create a primitive

PyTorch 的 CPU 内核(OneDNN / MKLDNN)在 Windows 下无法创建 Conv1D primitive

解决方案:虚拟机CPU类型由KVM改为host

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

作者

fffff@xf.nn

文章推荐