机察室|对话宇树王兴兴:机器人“iPhone时刻”至少还要3年
蓝鲸新闻8月21日讯(记者 张晗)乘着AI的风,具身智能成为了今年资本市场最热闹的领域之一,那些曾经只会出现在科幻电影中的机器人正在离现实生活变得越来越近。
在2024年世界机器人大会正式召开之前,杭州宇树科技(以下简称“宇树”)发布了其人形机器人G1的量产版本,起售价为9.9万元,这款产品将会在世界机器人大会上首次展出。视频中的G1机器人身手敏捷,不仅可以空中劈腿,还可以自由地上下楼梯,轻巧敏捷。
从2023年8月做出H1到2024年5月发布G1,宇树不仅被投资圈关注,同样也成了机器人企业中经常拿来对比的对象。这背后的原因在于,虽然人形机器人领域十分火热,但真正卖得好的并不多,而宇树H1和G1加在一起销量可以达到几百台。更早之前,宇树的机器狗还登上过央视春晚。产品出圈之后,宇树创始人王兴兴也得到了更多人关注。
8月20日下午,王兴兴同包括蓝鲸新闻在内的媒体交流沟通了人形机器人领域关注度比较高的话题以及宇树未来的商业化方向等等。
尽管已经是人形机器人领域冉冉升起的新星,但年轻的王兴兴面对媒体和公众的经验还不太多,牛仔裤搭配印有宇树logo标签的白色T恤,拿起话筒做开篇介绍的时候,他的神态显得有些局促和紧张,但当问到与技术相关的问题时,他神采洋溢,耐心地解答着大家的疑问。
2020年之前,王兴兴很明确表示自己不会做人形机器人,因为在大一寒假的时候他自己做过小的仿真人形机器人,但没有达到预期,也没有看到一些可以落地的实用价值。王兴兴态度的转变发生在2022年,在特斯拉发布第一代人形机器人Optimus之后,人形机器人的关注度立马提升起来。同年ChatGPT的出现,使整个AI技术潮流发生了明显的质变,行业也看到了AI赋能机器人带来的潜力。“顺势而为,要追着社会潮流去做,如果做得太早或太晚,其实都是不好的。”王兴兴说道。
相比于商业化落地场景等行业普遍关心的问题,王兴兴认为现在人形机器人行业最大的难题在于,机器人AI的发展是落后于通用AI的,并未达到一个突破临界点的时刻。现在更像是ChatGPT爆发之前的1—2年,距离人形机器人行业的“iPhone时刻”至少还有3—4年的时间,但应该不会超过5年。
王兴兴判断,现在虽然行业比较热,但说2024年就是人形机器人的商用元年,其实还太早,如果明年到后年可以形成商业闭环,也就是大规模地在工厂中应用起来,才可以称之为商业化元年。
以下为王兴兴同包括蓝鲸新闻在内等媒体的对话交流,在保留原意的基础上有所删减调整:
Q:从目前人形机器人研发的角度看,大模型可重点解决哪些技术问题?主要应用在哪些方向?大模型和人工智能的应用有望降低研发成本吗?
A:目前大家说大模型的时候,一般在说大语言模型或者多模态模型,肯定是可以给机器人用的,例如去年中旬我们就接了OpenAI的大语言模型接口,但机器人真正发展下去,单纯的大语言模型还是不够的。
机器人的AI模型,跟语言模型有很大的区别。大语言模型是机器人模型的一部分,但它不是全部。举个最直观的例子,在工厂里做事的一个机器人,完全可以不说话。比如说我给它一个任务,看一张照片,或者敲一个数字进去,他只要能干活就行了,我并不需要让它说话。所以要做一个机器人的模型出来。比如把一些图像数据,机器人的一些关节指令数据,还有一些激光雷达或者别的数据加在里面,更重要一些。
但现实情况是,目前具身智能领域,每家企业的想法都不太一样,技术路线上有所差别,甚至连一些共性的方面都不太一样。例如机器人的相机应该装什么?装几个装在哪?传感器数据应该怎么采集,是存在很多的差异性的,这就导致整个机器人AI模型的技术路线其实没有那么统一,其实很难评价哪个正确哪个错误,哪个路线已经推进到哪个节奏了等等。
就像在ChatGPT模型出来以前有非常多的语言模型架构,但大家现在已经忘了,因为后来大家发现GPT模型的架构是更加有价值的,就把某些模型淘汰了。现在人形机器人有点像ChatGPT出来的前一两年,大家已经发现了这个方向要往这个方向做,但实际上没有哪家敢保证自己的方向是绝对正确的。
Q:宇树G1 9.9万元的起售价在市场上反映还是比较强烈的,为什么能够这么大幅度的降价?能不能具体分析一下在成本控制方面的一些做法?
A:我们一直希望有更合理的价格给客户。因为产品有人买,前提是价格相对比较友好,如果太贵了就买的人比较少。
我们价格目前比较有竞争力,原因也比较简单,因为我们做四足机器人已经做了很多年了,所以对于成本把控有一定的经验,例如关节电机生产、整体机械结构、传感器、如何使用更便宜的芯片等等。甚至可能大家想象不到,我们四足机器人和人形机器人,其实很多设计都是非常类似的。
所以在这样的基础上,我们目前像机器狗一台最便宜卖到9000多块钱人民币。对比起来,我们的人形机器人还是有点贵的,因为目前的量不够,人形机器人行业整个体量还没有完全起来,价格定得太低对我们公司也不是好事,对整个行业不是好事。如果明年后年整个出货量更加提升,机器人的能力也会越来越强,我觉得价格还是可以有更好的调整。
Q:今年国内外很多人形机器人宣布了进厂打工,目前您怎么看这个现象?宇树人形机器人的落地现状和未来规划是怎样的?
A:这肯定是一个趋势,埃隆·马斯克最早提出要让人形机器人去他的汽车工厂工作,所以整个行业对于汽车工厂是比较热衷的。我们过去几个月跟比如蔚来的汽车工厂有合作,就部署了我们人形机器人去做现场的搬运,包括国内的别的一些人形机器人公司也跟汽车工厂有些合作。
但这些基本上还是处于试点阶段,大家觉得这个方向有价值,共同去推进这件事情部署落地,目前还没有到真正商业闭环,当一台机器人它产生的商业价值是正向的,就是可以做到比人的成本更低,现在还没有到这个阶段。
我们公司目前主要是卖本体比较多,某种程度上并不是说我们一定要做工业市场,比如做科研教育、AI公司或者个人买来玩等等,我们也完全欢迎。从未来发展来看的话,还是尊重整个市场的反应,而不是非要制定一个今年或者明年一定要在工厂里要部署多少台的目标。
Q:具身智能过去一年中和大语言模型一样受到了市场的高度关注,您判断通用机器人领域什么时候会出现一个“iPhone时刻”?AI大模型为机器人领域带来了哪些明显的能力的提升,目前还存在哪些挑战?
A:“iPhone时刻”确实是一个非常重要的节点,但人形机器人行业距离这个时刻还有距离,因为iPhone的出现并不是说有一个特别的技术突破,更多是综合性的技术突破。比如原本已经有触摸屏了,有很好的CPU,或者还有一些图形界面已经有了,乔布斯把很好的终极产品的构想给提出来了,然后把这些技术都整合在一起。
目前在具身智能机器人AI这个领域,我个人还是比较乐观,在今年年底之前,至少全球有一家公司或实验室能把通用型的机器人AI模型给做出来。但是这个时间点,也不是“iPhone时刻”,“iPhone时刻”是指整个行业出货量暴增的节点,至少还需要3—4年的时间,但不会超过5年。
Q:人形机器人它需要通过持续研发来取得技术上的创新,融资其实也是非常重要的,在资本进入后,会不会跟原有的研发团队产生一些路线上的分歧,对公司的发展来讲影响大不大?今年年初的时候,宇树也拿到了包括美团在内的融资,未来会不会针对美团推出一些特定的机器人的服务的品类?
A:其实这个每家的情况都不一样,我们目前的股东不会过多干预我们产品研发的方向和节奏,美团确实现在是我们占比最高的投资方股东,后续的话也大概率会跟他们有些合作之类的事情。
Q:在您看来目前人形机器人发展最大的瓶颈是什么?
A:当下的所有机器人面临最大的发展问题就是底层AI的能力在全球范围内都没有达到一个像初代GPT或者初代通用AI的能力。另外其实硬件方面的成本问题也有,比如机械臂的负载能力不够,精度不太够,但总体不难解决。
Q:目前有一些声音认为2024年是人形机器人商用元年,对此您怎么看?现在机器人都还在投入期,您有没有预估或者是预判什么时候能到盈亏平衡?
A:今年的体量其实很小,就是在商业化的情况下,有些公司可能没几台,最多也就小几十台这种级别。我觉得把今年定义为商用元年这个事情,有点不好评价,有人这么说过,但我个人不喜欢这么定义这件事情。
盈亏平衡其实是相对比较容易达到的,如果你大投入大量的AI与人力,可能很难盈亏平衡或者亏损会比较严重,但我们对AI的投入相对比较克制,公司还是保留了合理的利润率。