麻省理工學院與豐田研究院攜手打造可引導生成式AI平台 推動機器人虛擬訓練環境進化
随着生成式AI应用不断扩展,麻省理工学院 (MIT)电脑科学与人工智慧实验室 (CSAIL)近期与丰田研究院 (Toyota Research Institute)共同开发出一款全新的AI工具——「可引导场景生成」 (steerable scene generation),让AI能自主创造并调整虚拟训练场景,进一步提升机器人学习与模拟的效率。
这项技术的核心在于让AI不只是生成图片或3D模型,而是能根据目标动态构建环境,例如打造厨房、客厅、餐厅等空间,用于测试机器人如何在真实世界中处理各类任务。该系统基于超过4400万个3D房间资料训练,并且导入名为「蒙地卡罗树搜寻」 (Monte Carlo Tree Search,MCTS)的策略,使AI能在场景生成过程中做出策略性选择,以实现更符合需求的结果。
麻省理工学院博士生暨电脑科学与人工智慧实验室研究员Nicholas Pfaff表示,这是首次将「蒙地卡罗树搜寻」应用于生成式场景设计,让AI的决策过程更接近人类的思考方式。「我们把场景生成当作一种连续决策任务,AI会不断调整与重建场景的局部结构,最终创造出更理想、更真实的模拟环境。」他指出,这种方式生成的场景复杂度与细节远胜传统扩散模型 (Diffusion Model)。
对机器人领域而言,这项研究的潜力格外关键。业界普遍认为,高品质训练资料的稀缺一直是机器人学习的瓶颈。亚马逊机器人应用科学家Jeremy Binagia指出:「这项可引导场景生成技术能让虚拟训练更加贴近物理现实,同时创造更多具挑战性与多样性的场景,有助于让机器人学习过程更全面。」
研究团队表示,透过此系统,工程师可依任务需求创造多元的训练环境,从简单的物体摆放到复杂的交互场景皆可模拟。Nicholas Pfaff补充说:「我们的引导式方法能生成真实、丰富且与任务紧密相关的场景,这对训练机器人理解与应对不同情境特别重要。」
目前这款AI平台仍处于概念验证阶段,但麻省理工学院与丰田研究院正计划进一步扩大资料规模与物件多样性,最终目标是让AI能自动创建全新资产与环境,而不再依赖固定素材库。
若此研究能持续发展,未来不仅可应用于机器人训练,也有望延伸至自驾车模拟、AR/VR交互环境设计、甚至数位孪生城市的建构。随着生成式AI逐渐进入更高层次的决策与创造阶段,麻省理工学院与丰田此项合作无疑揭示了AI在虚拟物理世界中学习与推演的新方向。
《原文刊登于合作媒体mashdigi,联合新闻网获授权转载。》