產業導入生成式AI 邁步
由石化、医疗、电子业等跨领域业者合作的繁体中文专家模型「Project TAME」昨(1)日正式发表并免费供企业下载模型训练,以在地化文化及用语,协助台湾产业快速导入生成式AI落地应用。
这是电子业、石化业、医疗、法律等产业界提供专业领域的资料,用5,000亿个字(token)训练的语言模型,例如能精准解释买东西「很盘」就是吃亏的意思,而Project TAME的考试成绩,如台湾的大学学测、律师考试等,都超越GPT-4o、Gemini等其他语言模型。
「Project TAME」由长春集团、和硕联合科技、长庚医院、欣兴电子等企业携手台大资工、台大资管,与律果科技、亚太智能机器合作,以辉达(NVIDIA)超级电脑「Taipei-1」提供算力与算法、相关的训练框架,开源语言模型采用Llama 3 8B、70B版本。
该模型利用多家企业提供领域专业资料进行训练,是唯一拥有产业专业知识的繁体中文开源模型。参与训练的台大博士班学生林彦廷指出,模型具有在地化的特色,避免以美国为主的意识形态、文化观点,Project TAME甚至可精确回答买东西「很盘」就是吃亏的意思。
一般企业要从零开始训练10亿参数模型,约需耗资3.8亿元、耗时576小时,但以Project TAME 700亿参数模型,企业导入只需1,600万元的成本、3.5小时(模型迭代一次)就能训练企业内部资料,大幅降低导入成本及时间。
长春集团董事长林显东表示,希望建立台湾文化的语言模型,为繁体中文使用者带来更精准的本地AI应用,除提升用户体验,也将提升台湾在AI技术领域的竞争力,目前已开放各企业免费下载使用,长春集团内部已将「总裁讲工安」做成资料库可随时生成教材,还可以AI预约会议室、做摘要。
律果科技表示,法律内容有很强的在地化需求,因此协助Project TAME加入台湾法律语料进行训练,目前在台湾律师考试题目上,Project TAME分数均超过所有其他模型。欣兴电子透过公司内部资料库,把模型调校成内部专用的产业专家模型,预计未来可提供更符合公司内部作法的准确建议,提升工作效率。
延伸阅读