DeepSeek

ChatTTS

https://chattts.com/zh
 2026-01-04  评论 0  阅读:1

基本信息

ChatTTS 是一个针对对话场景设计的语音生成模型。

ChatTTS 非常适合用于大型语言模型助手的对话任务,以及对话类音频和视频介绍。

ChatTTS 模型支持中文和英文,在语音合成方面展现出高质量和自然性,这种高水平的表现是通过大约100,000小时的中文和英文数据训练而成。

ChatTTS 项目团队计划将一个用40,000小时数据训练的基础模型开源,以帮助学术和开发社区进行进一步的研究和开发。

如何使用 ChatTTS?

要使用ChatTTS,请从GitHub下载代码,安装必要的依赖(torch和ChatTTS),导入所需的库,初始化ChatTTS,准备文本,使用infer方法生成语音,并通过IPython.display中的Audio类播放生成的音频。

ChatTTS 的核心功能

多语言支持(英语和中文)

高质量和自然听感的语音合成

与大型语言模型助手的对话任务兼容

开源计划提供训练好的基础模型