語音詐財頻傳 台科大學生發明「護聲符」辨聲音真偽
台科大资管系学生王玟雅、蔡婷玗、陈俞缊及毛世鑫开发「应用音讯浮水印于对抗式攻击与深度学习之数位护声符系统」,获第29届大专院校资讯应用服务创新竞赛资安应用组第二名及资讯应用组第三名。图/台科大提供
近年有不法分子利用AI语音合成技术进行语音诈财,台湾科技大学4名学生设计语音防护App,能够辨别语音真伪,以及为声音加上特殊的「音讯浮水印」,防止声音被AI软体进行二次合成利用。
台科大资讯管理系学生王玟雅、蔡婷玗、陈俞缊及毛世鑫共同开发「应用音讯浮水印于对抗式攻击与深度学习之数位护声符系统」,提供语音防护与真伪辨识,他们设计的「护声符App」在第29届大专院校资讯应用服务创新竞赛中获资安应用组第2名及资讯应用组第3名。
王玟雅表示,亲友曾经接过陌生来电被诱导进行对话,再加上看到关于语音诈骗的新闻,让她萌生设计语音防护系统的想法。护声符App具备语音真伪辨别及数位音讯防护两大功能,并支援音档上传与录制,除了可以分辨语音是AI还是真人,还能为声音加上特殊的「音讯浮水印」,也就是人类听不见的音频或标记,防止声音被AI软体进行二次合成利用,也能作为保障声音版权的依据。
在语音真伪辨识方面,团队搜集公开的真人语音资料库与AI合成音讯,利用侦测模型整合与分类,分析真实语音与合成语音的特征与差异,训练出辨识系统,在背景音干净情况下,该系统对真人语音的辨识准确率高达99.99%,对AI合成音的辨识准确率则为 99.94%。
王玟雅指出,接下来规划完整开发即时通话中的语音辨识与防护功能,并扩展模型的语音数据库,搜集更多中文语音样本进行模型训练,增强对中文语音的支持。未来则希望可以发展成合规性工具,应用于通信、声音版权保障、生物特征验证、影视制作等领域,成为具有公信力、保障声音版权的工具。
指导老师、助理教授黄政嘉指出,声音权益在近年逐渐受到重视,例如公众人物的声音可能被不法分子利用,制作出虚假言论,严重影响其声誉;日本甚至有声优因声音遭窃取而影响工作权,但目前声音版权保障相关法规仍不完善。护声符App用的技术具有高度市场需求,但开发具公信力的系统面临诸多挑战,包括语音样本的搜集与模型建构等。