网易有道发布TTS语音合成引擎Confucius4-TTS：3秒音频素材即可语音克隆 ...

admin 2026-6-24 05:45 8人围观话题

网易有道近日正式发布子曰4.0”TTS语音合成引擎Confucius4-TTS，这是业内首个支持14种语言跨语种无口音、且无需参考文本即可完成语音克隆的开源模型。该模型在跨语种语音克隆、免参考文本建模、情感韵律迁移及本地化 ...

网易有道近日正式发布子曰4.0”TTS语音合成引擎Confucius4-TTS，这是业内首个支持14种语言跨语种无口音、且无需参考文本即可完成语音克隆的开源模型。

该模型在跨语种语音克隆、免参考文本建模、情感韵律迁移及本地化部署等关键维度上均达到国际前沿水平，为多语种内容生成、数字人配音、跨语言教学、短剧出海及全球化传播提供了低门槛、国产化的技术底座。

目前，Confucius4-TTS已全面覆盖中文、英语、西班牙语、法语、德语、韩语、泰语、越南语等14种语言的自然流利表达。

用户仅需提供3秒音频素材，无需参考文本或前期训练，模型即可完成音色克隆，相似度超过85%，克隆任务准确度达到97%。

输入中文音频后，模型能够使用原声音色输出多语种语音，并在全过程中保持音色高度一致；同时，模型可自动提取参考音频中的情感特征，实现语调、韵律与情绪的完整迁移。

网易有道发布TTS语音合成引擎Confucius4-TTS：3秒音频素材即可语音克隆

在底层架构上，Confucius4-TTS引入GPT式语义大模型作为主干，搭配可学习说话人编码器，并采用Flow Matching流匹配生成框架，不再沿用传统的声码器方案，显著提升了生成质量与可控性。

值得关注的是，网易有道已将Confucius4-TTS全量开源，采用Apache开源协议，面向全球开发者开放完整模型权重及配套工具链，商用无限制。开发者可下载54GB完整资源包，进行本地离线部署，满足数据安全与定制化需求。

GitHub开源地址：https://github.com/netease-youdao/Confucius4-TTS

精彩评论0

我有话说......

由于苹果对iPhone 18系列的发布节奏进行了策略性调整，iPhone 17将由此成为苹果历史上...

admin2026-06-25

理论总是抽象的，但真实的案例最具说服力。在AI搜索流量爆发的初期，一批先行品牌已经...

admin2026-06-24

小米汽车官宣，小米YU7 GT达成全球首个纽北自动驾驶圈速纪录，时间为10分29秒483。小...

admin2026-06-24

网易有道近日正式发布子曰4.0”TTS语音合成引擎Confucius4-TTS，这是业内首个支持14种...

admin2026-06-24

蔚来官方宣布，第120,000台全新ES8今日在上海完成交付。自2025年9月21日开启交付以来...

admin2026-06-22

京东正式开源JoyAI-VL-Interaction实时视频视觉语言交互模型，这是全球首个全栈开源的...

admin2026-06-22

中央网信办发布通知，按照2026年清朗系列专项行动部署，即日起启动为期三个月的清朗整...

admin2026-06-19

R星今天正式宣布，万众期待的《GTA6》将于6月25日全球同步开启预购，将于11月19日正式...

admin2026-06-19

账号		自动登录	找回密码
密码			立即注册