OpenAI魔法级新品 剑指谷歌

图/美联社

OpenAI发表大会重点

外媒引述消息报导,OpenAI将于13日发表大会推出具备视觉与听觉功能的人工智慧(AI)语音助理。该AI助理拥有更强的逻辑推论能力,且能够协助自动化客服判别讽刺语言,恐成为Google助理与其聊天机器人Gemini的最大威胁。

市场稍早盛传,OpenAI将抢在谷歌年度I/O开发者大会14日登场前推出AI搜寻引擎,而这将对于谷歌核心业务带来直接威胁。鉴于OpenAI聊天机器人爆红速度极快,外界认为这恐怕是谷歌搜寻数十年来面临的首次重大威胁。

但OpenAI执行长奥特曼(Sam Altman)打脸媒体说法。他在社群平台X发文表示,OpenAI在13日发表产品并不是GPT-5,也不是搜寻引擎,而是「宛如魔法」的新作。OpenAI官方亦证实,当日将更新ChatGPT与其最新版模型GPT-4。

外媒引述消息报导,OpenAI在13日活动可能宣布推出「多模态」(Multimodal)数位助理。这意味着:AI可以处理多种输入形式,不仅仅是文字而已。这个AI助理据传能够连结相机,处理现实世界的资讯,然后以语音方式向你回报它看到的讯息。

举例来说,你可以将相机对准不同语言的标志,并要求ChatGPT为你辨识与翻译,然后AI会透过对话回复给你。

事实上,Google助理与Google Gemini早已具备类似功能;而ChatGPT也可以做到这一点,但目前无法透过单一介面达成。

OpenAI在13日可能宣布升级GPT模型并纳入最新功能,透过影像输入与声音输出提供更快、更准确的回应。奥特曼最终目标是打造出类似电影《云端情人》(Her)里面的实用AI助理。

消息人士表示,这款AI助理不仅能与使用者对话、辨识物体与图像,还具备「更好的图像与声音理解能力」。它可以做到AI助理目前还无法做到的事,包括指导论文写作、解决数学问题与侦测讽刺语言等。