賴推人工智慧島 卓內閣首場院會「台版ChatGPT」秀台語
行政院长卓荣泰今天主持上任首场行政院会,国家实验研究院科技政策研究与资讯中心副主任徐玉梅在会后记者会说明「生成式AI对话引擎TAIDE成果」。记者侯俐安/摄影
行政院长卓荣泰今天主持上任首场行政院会,就由国家科学及技术委员会今天进行「生成式AI对话引擎TAIDE成果」报告,有「台版ChatGPT」之称的TAIDE,加入台湾特色与文化后更符合台湾运用,国发会现场秀出TAIDE回答「规画台中一日游」、「台湾第一位民选总统」,内容精准度都胜过ChatGPT,还现场大秀台语。
不过对于原民台记者现场提问,TAIDE是否也能讲原住民族语?国家实验研究院科技政策研究与资讯中心副主任徐玉梅坦言,目前在发展台语、客语,但发展语言需要大量资料,原住民语在搜集上还比较困难,后续将与原民会密切沟通。
徐玉梅报告「生成式AI对话引擎TAIDE成果」指出,过去一年多来,各类生成式人工智慧(AI)应用服务纷纷出现,并带来广泛且巨大的影响有愈来愈多行业开始运用生成式AI进行各种创新。
徐玉梅表示,鉴于国际大语言模型训练资料以英文为主,且中文部分以简体内容为大宗,时有与台湾文化、价值观不符的回应内容。为保护在地文化、确保我国「数位主权」,国科会自去年4月推动发展具台湾特色、繁体中文的TAIDE模型,以促进生成式AI应用普及、带动相关产业发展,并提升国际竞争力。
徐玉梅表示,「生成式AI对话引擎TAIDE」是台湾重要的AI基础设施,第一阶段以Meta开源模型Llama 2为基础,透过搜整繁体中文及在地文本训练资料来开发预训练模型,今年4月15日正式开源释出可商用版TAIDE LX-7B模型。
至于学研版TAIDE LX-13B模型,徐玉梅表示,可以透过申请授权签署合作备忘录(MOU)取得,两项模型在写文章、写信、摘要、英翻中、中翻英等五大任务表现优异,已可与ChatGPT 3.5相当,并具备多轮对话及阻绝产生不恰当回应之能力。
另一方面,因应Meta最新对外释出的新一代大型语言模型Llama 3,TAIDE开发团队另于4月29日对外释出「升级版」Llama 3-TAIDE-LX-8B-Chat-Alpha1模型,快速回应外界期待。
徐玉梅表示,TAIDE团队亦与产学研伙伴发展多元应用,将TAIDE模型应用在农业知识检索系统「神农TAIDE」、中小学生台语教学等共7个领域。
国科会表示,将持续关注国际生成式AI进展并及时导入新技术,促使TAIDE模型与时俱进,成为台湾指标性的基础模型。并将协助推动TAIDE模型导入公、私领域创新应用,使我国在生成式AI领域持续保有竞争力,落实赖总统全力推动台湾成为「人工智慧之岛」的政策愿景。