產業追蹤/生成式 AI 熱浪 全面襲來

近来生成式AI不仅技术上有重大突破,也在社会各界引发广泛关注与讨论。(美联社)

自2022年11月ChatGPT开放以来,生成式AI在技术和应用领域都实现飞跃性的进步。这一年间,生成式AI不仅技术上有重大突破,也在社会各界引发广泛关注与讨论。

最一开始大家都被ChatGPT流畅的书写能力、对话、总结等功能所震撼到,这也促使相关的晶圆代工、晶片设计、伺服器制造等科技产业链经历大量的订单需求。过去一年里,几乎每个月都能见证生成式AI从学术研究到商业应用,再到普及于大众的转变过程。这不仅改变人们与技术的互动方式,也为未来人类社会、经济和工作的发展开辟新的可能性。

随着资金、人才、数据和运算资源大量投入,各式各样的生成式AI应用迅速发展,有人甚至戏称,如果现在走在矽谷有块招牌掉下来,几乎都是在做生成式AI。

这一年来生成式AI发展可从多个方向探讨。文字上最知名的是ChatGPT。免费注册就可将其当作一位个人助理进行互动。不仅帮助使用者进行文章总结、列出重点、进行翻译等功能,甚至将其用为英文对话和文法家教。也可注册Google发展的Bard,或亚马逊AWS投资的Anthropic推出的Claude 2,利用这些文字类型的生成式AI,如同有位专门助理,帮你发想、总结、翻译,达到提升工作效率目的。

生成式AI面面观

在文生图的生成式AI上,像是著名的Midjourney、Stable Diffusion或DALL-E 3,可让使用者直接输入一段文字,就可依描述生成图案内容,现在有许多早安图、过年拜年等节日图都可依照自己的想法生成出图片,以此进行个别化的图片生成。许多设计师也利用文生图的生成式AI进行概念上的沟通,加速与业主之间的协议,提升案件成交率。在电子商务领域,当需要上架新商品时,商品和模特儿的图像可通过生成式AI自动合成,可大幅节省成本和时间,也为商品展示提供更多的灵活性和创意空间。

影片和影像生成则类似文生图的进化版,例如Runway Gen-2、Pika、Kaiber等公司的方案,在输入一段文字描述后产生3至5秒的影片,甚至可进行MV所需画面的生成。在图片或影像生成的技术上,对各种艺术创作、广告设计,甚至是电影和游戏行业中都有着广泛的应用前景。

生成式AI也愈来愈多语音上的服务。像是ElevenLabs和Voicebox等工具,已能生成极其自然且富有表现力的语音内容。这些工具能模仿特定人物的声音,还能在语调和情感上进行调整,充满了人性化的温度,许多商业文章、童书阅读等功能皆已进行运用。

在程式码生成方面,在开放程式码多年累积下,如GitHub Copilot、AlphaCode、Code Llama等已能根据开发者需求自动生成或优化程式码,过去原本是程式码写完,要写注解说明的动作,变成开发人员先将注解写完,AI看到注解后,会自动将程式码进行编写完成,大幅提高开发效率,也降低开发门槛。

未来生成式AI会持续发展,初步朝几个方向影响大众。如生成式AI与各种硬体连结,近期讨论热烈的AI PC/NB或AI手机,可在不用连网,又保有隐私的情况下使用生成式AI。又或者各种生成式AI在和各种软体资讯系统进行功能结合,以利大家在原有系统中,在不用下指令情况下,直接用点选方式进行生成式AI的各种应用。

基于生成式AI中重要核心LLM大型语言模型的发展,将会有各种专业领域或情境的LLM放置于软硬体中,并搭配LLM有一种多模态的能力(指AI模型可「同时」处理多种讯息,如:请AI看到夏威夷海边美景照后,同时用文字描述图片内容,并产生乌克丽丽的音乐)。运用专业领域及多模态的LLM,将使AI同时处理和理解文本、图像、声音等多种数据类型,从而提供更全面且深入的分析。

总体来看,过去一年中生成式AI不仅展示技术的成熟度,也影响各领域,未来将是生成式AI技术快速发展和广泛应用时期,也要学会如何有效掌握及管理运用全新的AI化时代。(作者是资策会MIC资深产业分析师)

延伸阅读