☰

產業追蹤／生成式 AI 熱浪全面襲來

近来生成式AI不仅技术上有重大突破，也在社会各界引发广泛关注与讨论。（美联社）

自2022年11月ChatGPT开放以来，生成式AI在技术和应用领域都实现飞跃性的进步。这一年间，生成式AI不仅技术上有重大突破，也在社会各界引发广泛关注与讨论。

最一开始大家都被ChatGPT流畅的书写能力、对话、总结等功能所震撼到，这也促使相关的晶圆代工、晶片设计、伺服器制造等科技产业链经历大量的订单需求。过去一年里，几乎每个月都能见证生成式AI从学术研究到商业应用，再到普及于大众的转变过程。这不仅改变人们与技术的互动方式，也为未来人类社会、经济和工作的发展开辟新的可能性。

随着资金、人才、数据和运算资源大量投入，各式各样的生成式AI应用迅速发展，有人甚至戏称，如果现在走在矽谷有块招牌掉下来，几乎都是在做生成式AI。

这一年来生成式AI发展可从多个方向探讨。文字上最知名的是ChatGPT。免费注册就可将其当作一位个人助理进行互动。不仅帮助使用者进行文章总结、列出重点、进行翻译等功能，甚至将其用为英文对话和文法家教。也可注册Google发展的Bard，或亚马逊AWS投资的Anthropic推出的Claude 2，利用这些文字类型的生成式AI，如同有位专门助理，帮你发想、总结、翻译，达到提升工作效率目的。

生成式AI面面观

在文生图的生成式AI上，像是著名的Midjourney、Stable Diffusion或DALL-E 3，可让使用者直接输入一段文字，就可依描述生成图案内容，现在有许多早安图、过年拜年等节日图都可依照自己的想法生成出图片，以此进行个别化的图片生成。许多设计师也利用文生图的生成式AI进行概念上的沟通，加速与业主之间的协议，提升案件成交率。在电子商务领域，当需要上架新商品时，商品和模特儿的图像可通过生成式AI自动合成，可大幅节省成本和时间，也为商品展示提供更多的灵活性和创意空间。

影片和影像生成则类似文生图的进化版，例如Runway Gen-2、Pika、Kaiber等公司的方案，在输入一段文字描述后产生3至5秒的影片，甚至可进行MV所需画面的生成。在图片或影像生成的技术上，对各种艺术创作、广告设计，甚至是电影和游戏行业中都有着广泛的应用前景。

生成式AI也愈来愈多语音上的服务。像是ElevenLabs和Voicebox等工具，已能生成极其自然且富有表现力的语音内容。这些工具能模仿特定人物的声音，还能在语调和情感上进行调整，充满了人性化的温度，许多商业文章、童书阅读等功能皆已进行运用。

在程式码生成方面，在开放程式码多年累积下，如GitHub Copilot、AlphaCode、Code Llama等已能根据开发者需求自动生成或优化程式码，过去原本是程式码写完，要写注解说明的动作，变成开发人员先将注解写完，AI看到注解后，会自动将程式码进行编写完成，大幅提高开发效率，也降低开发门槛。

未来生成式AI会持续发展，初步朝几个方向影响大众。如生成式AI与各种硬体连结，近期讨论热烈的AI PC／NB或AI手机，可在不用连网，又保有隐私的情况下使用生成式AI。又或者各种生成式AI在和各种软体资讯系统进行功能结合，以利大家在原有系统中，在不用下指令情况下，直接用点选方式进行生成式AI的各种应用。

基于生成式AI中重要核心LLM大型语言模型的发展，将会有各种专业领域或情境的LLM放置于软硬体中，并搭配LLM有一种多模态的能力（指AI模型可「同时」处理多种讯息，如：请AI看到夏威夷海边美景照后，同时用文字描述图片内容，并产生乌克丽丽的音乐）。运用专业领域及多模态的LLM，将使AI同时处理和理解文本、图像、声音等多种数据类型，从而提供更全面且深入的分析。

总体来看，过去一年中生成式AI不仅展示技术的成熟度，也影响各领域，未来将是生成式AI技术快速发展和广泛应用时期，也要学会如何有效掌握及管理运用全新的AI化时代。（作者是资策会MIC资深产业分析师）

產業追蹤／生成式 AI 熱浪 全面襲來

相关资讯

產業追蹤／生成式 AI 熱浪全面襲來