立委憂AI繁體中文資料少 廖俊智:能開放盡量開放
多名立委关注AI(人工智慧)的繁体中文资料不足,尤其少于简体,恐影响文化发展。中研院长廖俊智表示,不牵涉智财权等法规的部分,会朝开放努力,尽量释出资料来训练AI。
中研院长廖俊智今天到立法院教育及文化委员会做业务概况报告,包括民进党籍立委陈秀宝、中国民党籍立委葛如钧、洪孟楷等多人,质询时都提及对AI快速发展的担忧。
陈秀宝提到,生成式AI需要大量文本资料做训练,但目前繁体中文的资料库相对比较小;加上台湾的孩子正受抖音、小红书等短影音平台强势入侵,接收大量简体中文资讯。中研院应协助整合繁体中文的语言资料库,避免繁体中文资料大幅落后简体中文。
对此,廖俊智认同若没有大量繁中资料训练AI,对文化发展恐有负面影响。中研院正在思考尽量开放相关资料,院内不涉及智财权的资料,会尽量立即、马上开放,未来也会努力排除法规的限制,尽可能开放资料给大型语言模型训练。
葛如钧指出,日本政府最近采取大胆作法,允许AI使用任何资料,不做任何保护,借此尽可能提高日文资料数量,询问台湾是否适合比照?廖俊智说,日本的作法相当前瞻,台湾还要深入研究利弊得失,撷取各国优点并因地制宜。
洪孟楷问及台湾对AI资料的控管,适合朝向美、日的开放式,还是欧盟的相对限缩制?廖俊智表示,很难说一定要往那个方向走,关键是以人为本,让AI发展对台湾社会有正面贡献,并兼顾个人隐私、智慧财产权、公务机关机密性。他强调,每一个国家状况都不一样,需要仔细考量。