一年融资12亿的银河通用仍面临数据缺失难题
获国内具身智能赛道最大融资额的公司来了。
11月18日,界面新闻获悉,北京银河通用机器人有限公司(下称银河通用)完成5亿元战略轮融资,加上今年6月宣布的7亿元天使轮融资,累计融资12亿元,创下该赛道融资纪录。
本轮投资方包括上汽集团恒旭投资、香港投资公司HKIC、上海人工智能产业基金、北京机器人产业基金、深创投、建银国际、智友科学家基金、容亿投资、金景资本等,同时老股东IDG、经纬、蓝驰、北京人工智能产业基金等继续大幅追加投资。
值得注意的是,银河通用背后已经站了超过30家投资方,包括美元投资人、知名科研机构、产业战略投资人,同时集齐了从中央到北京、上海、香港、深圳四大政府基金的共同加持,这一情况在创投行业并不多见。
今年初到现在,具身智能正在接替大模型,成为AI融资的热点。近日,蓝驰创投合伙人曹巍便感叹,每两周就会有新的具身智能机器人Demo面世。银河通用创始人兼CTO、北京大学助理教授王鹤也频繁现身不同活动。
“不要认为具身智能就等于具身AGI。”近日,王鹤在蓝驰创投的一场论坛上表达了这样的观点。包括他在内的多位行业人士认为,具身智能领域仍面临数据缺失难题。
王鹤指出,通用机器人背后的技术一定是具身大模型,要用数据驱动基础机器人大模型,让机器人能够有极高泛化性(模型经过训练后,能够应用到新数据并做出准确预测的能力)、零代码部署能力和跨行业应用能力。这背后就需要海量的自研合成数据,10亿级别的灵巧手抓取数据去训练大模型,让大模型真正拥有泛化性,而不被真实世界能够采集的数量所局限。但现有数据不足以支持通用机器人的发展。
另一个重要问题在于,用什么方法来获取数据。灵初智能创始人兼CEO王启斌在上述论坛上指出,具身智能行业的数据有三个发展阶段,一是公司内部实验室的数据,二是国内大部分正在建设的数据中心,三是在真正的头部客户的搜索中使用。这三个阶段中,数据一定是关键的驱动因素。
智元新创技术有限公司研究院执行院长兼具身业务部部长姚卯青也同意这一观点,认为具身智能发展的核心仍然围绕AI的主要元素,即算法、数据和算力。
姚卯青指出,大模型有海量的免费互联网和图文本数据可以直接获取,而具身智能更多需要虚拟或现实中操作的关节本体的详细数据。目前这些数据是缺失的,常用的谷歌数据只有100万条,与大公司数十亿token相比,差距很大。“如果数据能突破,很多初级应用可能会快于我们的想象。”
为了解决数据不足的问题,当前,银河通用等公司主要采用合成数据用于训练和泛化模型。据王鹤透露,银河通用内部除了采用VLA范式(Vision-Language-Action Model,一种多模态模型)解决真实场景的数据链问题外,还在三维表征基础上进行强化学习。该团队创建了一个10亿规模的数据集,覆盖各种物体,进行大规模抓取标签生成,这个数据集使其训练的扩散模型能够以90%以上的成功率抓取任何给定物体。
其内部的Aloha项目也会通过合成数据解决复杂任务,如训练机器人叠衣服——通过在仿真环境中对数万件衣服进行合成仿真,最终训练出能够处理各种衣服的能力。
但王鹤也强调,具身智能真正的变化需要10亿条以上的合成高质量数据来驱动泛化,目前全世界没有看到公布的技术能做到这一点。
“高质量的仿真数据将推动移动抓取放置的迅速泛化,打造真正的基础模型。”王鹤预测,未来两到三年,机器人能够在货架场景中进一步推进抓取放置;未来三到五年,银河通用的目标是把落地做得越来越泛化,进而发展出一个千亿规模的人形机器人公共抓取放置市场。
中长期来看,该公司希望把抓取放置不断向更深的技能延展,例如挂衣服的能力,包括对柔性物体的捏、抓、拉等动作。而要让人形机器人独立完成整个洗衣周期,可能发生在五年后,这将是走向家庭端的杀手级应用。