☰

OpenAI釋出語音助理擴大使用

OpenAI在旧金山举办第二届开发者大会「DevDay」。（路透）

OpenAI于1日举办开发者大会，专注于展示应用程式介面（API）新功能，包含将把旗下语音助理开放给企业和开发人员，整合到各自的App中，为人工智慧（AI）系统拟真语音对话应用在各种工作奠下根基。

OpenAI在旧金山举办第二届开发者大会「DevDay」，公司前一周才经历技术长穆拉提离职的一连串人事动荡，还有公司转型为营利企业的争议，今年活动显得格外低调。

OpenAI在会中针对开发者宣布四项可以降低成本、并让AI应用可以更加普及的功能，分别是增加指令快取（prompt caching）功能减少成本与延迟、让开发者可以微调图像模型（vision fine-tuning）、提供模型提炼（model distillation）、开放即时API（Realtime API）导入即时对话服务。

其中备受关注的是即时API功能，让开发者打造多模态（语音、文字、图像）、更低延迟的对话应用，并且更轻松地将进阶语音功能整合到应用程式中。例如，让AI代理人打电话订购巧克力。

还有让AI更易于使用的模型提炼，被视为一项变革。开发人员可以使用OpenAI大型模型来「训练」更小的模型，以此创造出针对特定需求的客制化版本，同时运行速度更快，成本更低。举例来说，医疗照护新创公司可利用这项功能，开发能在一般硬体设备上执行的AI诊断工具，让资源有限的环境更容易获得AI解决方案。

OpenAI认为，随着包括Google和苹果公司在内的科技集团竞相将所谓的AI代理人带给消费者，AI助理将在2025年「成为主流」。

现场示范的声音并未自称为AI语音助理，这种未表明自己是AI身分的做法，可能会引发一些用户以及隐私及数位权利维权者的疑虑。OpenAI在示范后表示，不会强制要求开发者以任何特定方式告知用户他们正在和AI互动。但OpenAI指出，他们规定开发者一般必须告知用户何时使用AI。

OpenAI釋出語音助理 擴大使用

相关资讯

OpenAI釋出語音助理擴大使用