中研院AI稱領導人是習近平遭下架 廖俊智:事後才知道
中研院开发的繁体中文语言模型AI,日前经网友实测提问却回复「我的国籍是中国」,引发议论,中研院院长廖俊智今天表示,研究员已深切反省,中研院也已学到正面教训,除赶紧下架测试版,也将成立「生成式AI风险研究小组」,避免类似事件再度发生。记者胡经周/摄影
中研院上周释出了类似CHAT GPT的大型语言模型CKIP-Llama-2-7b,并将其放上公开平台提供学术和商用。却被使用者踢爆采用简体中文版的资料库,导致使用者询问「国家领导人是谁」,得到「习近平」的答案。中研院发现出包后,三天内便将此一语言模型下架。中研院院长廖俊智今赴立院业务报告时,多位立委询问此事,廖俊智坦承是该研究员「求好心切」自行发布试用版本,他也是「事后才知道」。
立委万美玲指出,此一模型语言模型经网友测试,回答我国最高领导人是习近平,并自述是由复旦大学自然语言处理实验室和上海人工智能实验室共同开发,居住地在上海人工智能实验室服务器集,「这是抄袭对岸研究成果?」
廖俊智回应,、CKIP模型(CKIP-Llama-2-7b)为中研院个别研究人员主持的词库小组(CKIP)的实验性研究,模型尚在测试阶段,该名研究员「求快心切」自行发布试用版本,他也是事后才知情。
繁体中文语料库是发展台湾大型语言模型的重要基础,中研院也准备整合繁体中文词知识库,投入资源并规划管理机制。此一出包的CKIP模型属中研院内部计划,目的是要协助研究人员自动化分析和建构中国明清朝代人物的生平图谱。廖俊智表示,该研究员先拿到30万经费做测试,但此一经费不足以搭建繁体中文词库,因此先找了大陆的简体版词库来测试。
中研院日前已发表声明,相当重视此事件对社会的影响,将厘清事件是否违反相关规定。后续将规划成立「生成式AI风险研究小组」,深入了解AI对社会的冲击,提供研究人员相关指引,避免类似事件再度发生。但万美玲表示,此一风波代表中研院「螺丝松了」,认为中研院研究员的研究一但公开便代表中研院,此一系统三天就下架,中研院闹了笑话。
立委黄国书指出,中研院目前有六个计划跟「生成式AI」有关,经费达一千多万。廖俊智表示,据他了解,这六个计划并未使用中国大陆的资料库,他保证会跟相关计划的研究员提醒。
至于发展「台版ChatGPT」,廖俊智表示, 国科会正整合国内学研力量并与业界合作,打造可信任生成式AI对话引擎「TAIDE」,中研院很多研究员参与此一计划。
立委陈培瑜则担心,生成式AI在欧美引发许多版权问题,中研院对此是否有所准备。中研院回应,AI版权问题目前仍在法律厘清的阶段。
延伸阅读