浙江君同智能申请基于条件扩散模型的语音转换对抗音频生成专利,提高语音转换对抗音频生成效率效果
金融界2024年12月19日消息,国家知识产权局信息显示,浙江君同智能科技有限责任公司申请一项名为“基于条件扩散模型的语音转换对抗音频生成方法和装置”的专利,公开号 CN 119132309 A,申请日期为2024年11月。
专利摘要显示,本发明公开了基于条件扩散模型的语音转换对抗音频生成方法和装置,包括:准备参考音频样本,基于参考音频样本并采用白盒攻击方式在语音转换任务中生成对抗音频样本,将参考音频样本和对抗音频样本组成样本对;以样本对中的对抗音频样本作为输入,并在样本对中参考音频样本作为引导条件下,对条件扩散模型进行基于对抗音频生成任务的训练;利用训练好条件扩散模型的逆向生成过程,在参考音频样本的引导下生成与参考音频样本相关且用于黑盒语音转换的对抗音频,以解决现有黑盒场景中语音转换对抗音频生成的效率与效果不足的技术问题。
本文源自:金融界
作者:情报员