台灣發展主權AI 林之晨給建言:先做繁中資料庫
电信三雄董、总今日下午至数发部拜会部长黄彦男,台湾大总经理林之晨建议,数发部可以汇集政府、民间力量建置高品质「繁体中文共同资料库」,为主权AI发展奠定基础。记者马瑞璇/摄影
各国主权AI(人工智慧)意识兴起,台湾具备强劲AI硬体制造能力之外,更该发展主权AI,才能让台湾AI发展能力超前。电信三雄董、总今(18)日拜会新任数发部长黄彦男,除了谈打诈、阻诈议题之外,台湾大总经理林之晨也建议,数发部可以汇集政府、民间力量建置高品质「繁体中文共同资料库」,为主权AI发展奠定基础。
电信三雄董、总今日下午至数发部拜会部长黄彦男,由担任电信协会理事长的中华电信董事长郭水义带队,中华电信董事长郭水义、总经理林昭阳,台湾大董事长蔡明忠、总经理林之晨,远传董事长徐旭东、总经理井琪均全都出席,今日会议中讨论了打诈、防诈、主权AI(人工智慧)等议题。
辉达执行长黄仁勋今年二月在杜拜世界政府高峰会发表演说时,就提倡过主权AI概念,他呼吁各国应利用自己本国的基础设施、数据、人力,产出自己的AI,以满足自己国家的需求和目标。黄仁勋认为,主权AI不仅可以增强国家的科技创新能力,也用来保护、推广本国文化、语言和知识。
林之晨指出,台湾数位发展进入到「换档期」,过去一、两年,台湾几个重要的数位产业,不管是电子商务、数位广告、数位订阅制,年成长都已经降到10%,电商这几季甚至都只有个位数成长。
「数位发展部门现在很重要,要启动整个数位产业发展,AI是个关键。」林之晨表示,台湾现在的AI产业发展关键,卡在没有自己的繁体中文共同资料库(common data set),「ChatGPT、Gemini,虽然都讲繁体中文,但它们讲的繁体中文都怪怪的,因为它吃的语料不是我们台湾的语料。」
林之晨指出,AI工作有90%是资料整理、10%是训练AI,对于英语系AI模型来说,因为英语世界有许多共同资料库,因此,大众在使用Gemini、ChatGPT等生成式AI时,会觉得这几种生成式AI的表现都差不多,「台湾目前问题是没有共同资料库,如果没有高品质的繁中资料库,根本训练不出来主权AI。因此,我今天跟部长建议,要集合政府甚至民间力量去把繁中共同资料库做出来。」
对于林之晨所提建议,数发部长黄彦男也认同主权AI发展的重要。黄彦男也表示,接下来,开发繁体中文共同资料库将会是多元创新司的其中一个任务,未来,也希望能有机会跟电信业者一起合作。