趣丸科技开源语音大模型MaskGCT
10月24日,趣丸科技宣布与香港中文大学(深圳)联合研发的语音大模型“MaskGCT”正式在Amphion系统中开源,面向全球用户开放使用。区别于传统TTS模型,该模型采用掩码生成模型与语音表征解耦编码的技术范式,在声音克隆、跨语种合成、语音控制等任务中性能表现突出。据介绍,MaskGCT在三个TTS基准数据集上都达到了SOTA效果。
相关资讯
- ▣ 文化湾企说丨广州趣丸科技:联合港中大(深圳)开源首个语音大模型,效果全球领先跻身第一梯队
- ▣ 国产AI音乐生成效果几何?实测趣丸科技天谱乐大模型
- ▣ 广州海珠打造最盈利大模型产业集聚高地,趣丸科技等大模型企业入驻
- ▣ AI早知道|商汤科技发布东风泰语大模型;Meta计划开源 AI 模型Llama3 405B
- ▣ 全球科技早参丨OpenAI发布语音模型Voice Engine
- ▣ 腾讯混元大语言模型和3D模型正式开源
- ▣ AI早知道|国内首个端到端语音大模型Lingo;摩尔线程开源音频理解大模型MooER摩耳
- ▣ 腾讯混元宣布大语言模型和3D模型正式开源
- ▣ 盈趣科技:暂无自主研发AI大模型,开发相关AI应用
- ▣ 科大讯飞行业首发端到端语音同传大模型
- ▣ 天津大学“伏羲传语”多语言大模型正式发布并开源,应对大模型多语言能力不足
- ▣ xAI宣布开源大语言模型Grok-1并开放下载
- ▣ AI早知道|B 站开源轻量级 AI 语言模型;阿里通义Qwen2成最强开源大模型
- 科大讯飞大模型竞速2年多,答卷不只是语音
- ▣ 科大讯飞星火语音大模型“星火极速超拟人交互”8月底开放
- ▣ AI早知道|腾讯推全球首个语音指挥FPS AI ;摩尔线程开源音频理解大模型
- ▣ 中电信数智科技申请基于端到端跨语言大模型语音识别方法专利,提升语音识别准确度及鲁棒性
- ▣ OpenAI开发者大会派礼包:大幅降低模型成本,AI语音加持App,小模型“蹭”大模型性能
- ▣ 联发科 推繁中大型语言模型
- ▣ AI早知道|科大讯飞发布星火同传语音大模型;阿里巴巴推出多模态大模型Valley2
- ▣ 全球科技早参丨全球首个芯片设计开源大模型诞生
- ▣ 商汤科技发布新版日日新·商量大语言模型
- ▣ 摩尔线程正式开源音频理解大模型MooER
- ▣ 通义千问开源视觉语言模型Qwen2-VL
- ▣ 腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
- ▣ 奇富科技智能语音模型升级,川渝方言识别准确率提升超35%
- ▣ 星火语音同传大模型:讯飞同传开启沟通新篇
- ▣ 新鲜早科技丨特斯拉股价大涨近15%;腾讯混元大模型正式开源
- ▣ 白龙马云行科技申请基于大模型自我校验用于RAG系统缓解大语言模型幻觉的方法专利,缓解大语言模型幻觉