AI「更有人味」,8大應用今年亮相,數位複製人代替工作的時代快到了

OpenAl的ChatGPT在公开两个月后,估计活跃用户突破1亿人,生成AI至今仍在不断更新。

编按:日经TRENDY杂志评选未来赢家产业,第一名是AI产业。本文报导多种善用日本软实力的特殊化AI,数位复制人代替工作的时代即将来临。

ChatGPT问世,带动生成式AI风潮在2023年席卷全球,每天都可以听到AI的新闻。到了2024年,生成式AI不单单只是一股热潮,而会正式进入实用的阶段。

透过AI提升工作效率的旋风,也已经吹向设计领域。使用PLUG公司的「商品设计用图像生成AI」,只要输入含商品特征的指令,瞬间就能生成许多设计图案,大幅缩短设计的时间。

1.AI的「深化」:包装设计生成AI

这是PLUG公司的商品设计用图像生成AI。包装设计用图像的生成AI,可大幅缩短制作时间。伊藤园和Acecook公司使用了它的试用版。预定2024年春季正式提供服务。

透过AI对话的精准度也提高了。AI家事支援机器人Kachaka(Preferred Robotics公司),只要听到人呼叫,就会把架子端过来。

这款机器人的AI功能包括听懂指示的声音辨识,以及在房间内顺利行动的图像辨识技术,因此能协助做家事。2024年春季开始,将和大型语言模型(LLM)连接,可以用更自然的话来发号施令。

2.AI的「深化」:产品的AI

AI家事支援机器人Kachaka(Preferred Robotics)可用一般话语发号施令。

AI机器人遵循用户声音的指令,运来架子。预定2024年春季和LLM连接,用自然的话语也能指示。

无论工作和生活方面,AI已经无所不在,但是以ChatGPT为代表的大规模AI,每一项都由外国大数据开发,因为他们才有庞大资金和高超技术。大规模的生成式AI若要从零开始学习,需要庞大的学习成本和计算资源,几乎已经没有日本企业切入的空间。

其中可以说还有一丝光明的领域,是限定用途的「特殊化AI」。北海道大学和谐工学研究室教授川村秀宪说:「如果不需要具备ChatGPT那样的通用性,只要在特定领域发挥价值,那么小AI也可以很活跃。」

首先是2024年3月要展开商用服务的「tsuzumi」(NTT公司),它是以小型为卖点的LLM,强项是容易客制化,营运成本很低。这款LLM可以分析自家公司资料、结构化等,依企业和组织不同而调整,可望应用在专业领域。川村说:「AI变得理所当然之后,应该有更多地方可以用到日本的软实力,例如制造、款待等。我们要在最先进的科技上提供什么服务?这里正是日本可以发挥竞争力的地方。」

小型LLM还能解决AI带来的全球电力问题。NTT指出,OpenAI的LLM「GPT-3」规模的学习,使用的电力相当于核能电厂一座机组运转一个小时。如果部份改用省电且营运成本低的小型LLM,对能源问题和减碳也有贡献。

3.AI未来(2024年):日语LLM(关键科技)

NTT公司推出的tsuzumi服务。小型、轻量、强调日语的LLM。除了容易适用于专业领域外,还容易搭载在机器人。机器人可当场学习人的动作。

在网路末端设备上动作的「边缘AI」,也是解决电力问题的方法之一。手机的照片加工功能已经先一步采用,未来个人电脑、汽车、家电等各种设备,将可以直接驱动AI。

在这样的时代,可处理多种资讯的「多模式」,进一步推升了AI的等级。不只是图像、影片、声音,如果还能同时处理串流影像等,AI甚至可能自己向人类搭话说:「你钱包掉了!」

如果AI取得自行思考、自行判断的「自律性」,它的动作将更接近人类。届时应该有人希望AI不只是当助手,而是自己的「分身」。

前景看好的这种新技术也已经在日本萌芽。alt公司开发的「CLONEdev」,学习个人的所有资讯,成为数位复制人,连喜好和想法都一致,该公司也开始对员工复制人的工作支付报酬。川村说:「以后不需要自己出马的”琐碎工作”,可以交给AI的复制人,错综复杂的课题就由人类来思考。」

4.AI未来(2026到2030年):「简直和本人一模一样」的AI对话和工作

alt公司的「CLONEdev」,这是自行开发的LLM,学习社交网站、聊天的资料等各种个人的资讯,生成AI。透过影片等方式,外观和声音也可以重现,简直和本人一模一样,能够对话。

从手机、个人电脑到医疗,生成式AI无所不在

5.AI未来(2024到2026年):生成式AI大肠癌检查

AIM4CRC善用生成式AI的功能,未来可能不需吃泻药也能扫描大肠电脑断层。这样能减少身体的痛苦,增加检查大肠癌的受诊者

6.AI未来(2024到2026年):边缘AI(关键科技)

在手机等装置上处理的「边缘AI」愈来愈普及。因为也能离线使用,可以保护资安

7.AI未来(2030年):AI家事支援机器人(关键科技)

有手臂的家事支援机器人也因为生成式AI而进化。预料不久后,只要对机器人说话,复杂的指示也不成问题,可说是家庭的得力助手

8.AI未来(2030年之后):情感AI

使用AI的情感研究也在进行中。AI的情感模型,已经依据婴儿的情绪分化理论模拟成功。

让AI更进化的「多模式」

「多模式」的意思是,不只是文字,图像、影片等各种模式的资讯都能同时处理,采用这种方式,将使AI更进化。这样的AI不只能对人的问题有所反应,还能立刻判断状况,自行动作。汽车、摄影机等各种领域可望都会用到。以下为ChatGPT解析图像,用文字回答。

开发完全自动驾驶电动车的Turing公司,正在实施摄影机、操作方向盘等多模式学习。

Copyright©2024 Nikkei TRENDY. All rights reserved.