前言 CosyVoice 是阿里通义实验室于2024年7月开源的语音合成模型,擅长多语言(包括中文、英文、日文、粤语和韩语)的语音合成。它能通过3~10秒的音频样本克隆音色,并支持情感和韵律的精细控制,效果自然逼真。 本地部署 1、GitHub地址: https://github.com/FunAudioLLM/CosyVoice?tab=readme-ov-file 2、基础工具、模型、库: Python、Git、Miniconda(or Anaconda )、CUDA Toolkit、cuDNN...【查看原文】