OpenAI釋出語音助理 擴大使用
OpenAI在旧金山举办第二届开发者大会「DevDay」。(路透)
OpenAI于1日举办开发者大会,专注于展示应用程式介面(API)新功能,包含将把旗下语音助理开放给企业和开发人员,整合到各自的App中,为人工智慧(AI)系统拟真语音对话应用在各种工作奠下根基。
OpenAI在旧金山举办第二届开发者大会「DevDay」,公司前一周才经历技术长穆拉提离职的一连串人事动荡,还有公司转型为营利企业的争议,今年活动显得格外低调。
OpenAI在会中针对开发者宣布四项可以降低成本、并让AI应用可以更加普及的功能,分别是增加指令快取(prompt caching)功能减少成本与延迟、让开发者可以微调图像模型(vision fine-tuning)、提供模型提炼(model distillation)、开放即时API(Realtime API)导入即时对话服务。
其中备受关注的是即时API功能,让开发者打造多模态(语音、文字、图像)、更低延迟的对话应用,并且更轻松地将进阶语音功能整合到应用程式中。例如,让AI代理人打电话订购巧克力。
还有让AI更易于使用的模型提炼,被视为一项变革。开发人员可以使用OpenAI大型模型来「训练」更小的模型,以此创造出针对特定需求的客制化版本,同时运行速度更快,成本更低。举例来说,医疗照护新创公司可利用这项功能,开发能在一般硬体设备上执行的AI诊断工具,让资源有限的环境更容易获得AI解决方案。
OpenAI认为,随着包括Google和苹果公司在内的科技集团竞相将所谓的AI代理人带给消费者,AI助理将在2025年「成为主流」。
现场示范的声音并未自称为AI语音助理,这种未表明自己是AI身分的做法,可能会引发一些用户以及隐私及数位权利维权者的疑虑。OpenAI在示范后表示,不会强制要求开发者以任何特定方式告知用户他们正在和AI互动。但OpenAI指出,他们规定开发者一般必须告知用户何时使用AI。