戴文渊:AI落地最大难题是人才 或致估值泡沫破灭
戴文渊(来源:本站财经)
第四范式创始人、CEO戴文渊在2018夏季达沃斯论坛接受了新鲜小只的专访。
今年被认为是后AI时代开启的一年,行业迎来应用落地,戴文渊表示,如今AI落地最大的难题是人才。AI在很多场景都能实现落地,大的场景包括金融、广告营销等,小的场景包括制造业瓷砖最后一道工序的甄别等,但目前AI未能在绝大多数场景落地。戴文渊解释称:“并非是AI不能做这些场景,而是没有人去做。现在的科学家太少了,今天我们只覆盖了价值最大的场景。”
戴文渊表示,在中国,AI人才的缺口在百万以上,据乐观估计,现在真正靠谱的AI科学家可能在千人以下。
在戴文渊看来,资本对AI的预期是十万亿甚至百万亿的市场,行业现在靠得是这些AI科学家来获取市场,所以获取市场的速度太慢,而估值增长非常快,是照着10万亿的市场上去的,如果发展跟不上这个速度,那么行业的泡沫有可能破灭。“如果今天整个AI行业有100万以上的人才,没有人会担心泡沫问题。”戴文渊说。
AI并非无所不能
迁移学习能够降低AI的数据门槛
记者:人工智能是近几年来炙手可热的风口,现在市场上面声音很多也很杂,在您看来什么才是真正的AI?
戴文渊:实际上AI和人的智能会有一定的区分,现在人们可能对AI的理解有一定的误区。
一种是说人能做什么,AI能做什么,比方说会有很多人讨论人和AI之间能不能发生一些情感关系这是一方面;另一方面会有一种声音是觉得人工智能是比人更强,比方说像我自己不知道怎么做,AI能不能告诉我应该怎么做。
其实这两种都不对,从专业的角度来看,AI是一种新的思考的器官,它可能是人的大脑的一个外延,它可能是一个比人更好的,甚至是比大脑更好的一种思考的器官,如果你有一些问题,一是想不清楚,二是你没有那么多的精力去想,你可以让计算机帮你去想,更清楚。
举个例子,假设新闻编辑在面对1亿受众时,不可能把每个人都分析一遍,理论上是可以的,假设这个编辑精力无穷,可以把每个受众都分析一遍,给每个人去设计,编辑出每个人爱看的稿,但现实是做不到的。他做不到不是因为他不够聪明,而是他精力有限,但是AI的精力是无限的,几乎是无限的,那如果我们有能力让AI学会这个编辑,哪怕是70%的能力,AI就能把编辑的思想去外延到每一个人,这就是今天所说的千人千面。
记者:您是迁移学习领域的专家,迁移学习可以解决哪些具体的问题?
戴文渊:迁移学习针对的是一个本领叫做举一反三或者触类旁通,这种能力其实对人来说非常平常,我们每个人都有迁移学习的能力,举个例子,假设我们学过数学,再去学物理时,我们发现学的数学知识都能够帮助到我们学物理,能让我们的物理学的更快更好。
但是非常遗憾的是在迁移学习之前,AI没有这个能力。AI怎么学呢?我先学数学,数学学完了以后去学物理,会把数学之前学到的所有东西忘记,然后再从零开始学物理,是一个不会数学的人去学物理,这就是为什么AI的学习效率会低。
我们知道AI的深度学习需要百万、千万以上的数据量才能够学会,当然人不一样,往往给人一两个例子,人就学会了一个方向,这就是人的触类旁通。
我们今天其实用迁移学习在解决问题,就是说能不能把相关领域,什么叫相关领域?就像数学,数学相关领域的知识能够去帮助一个目标领域,比方说物理,能够学得更好,然后能让目标领域所需要的数据量降低,深度学习需要百万千万以上的数据,我们用迁移学习能够把这个数据量能降低2-3个数量级。
实际上,今天的迁移学习仍有很长的路要走,我们知道人所需要的数据量大约是几个就能学会,迁移学习应该需要上万(数据量),所以,今天的迁移学习虽然比深度学习有很大的进步, 但和人比仍有很大的差距。
那么迁移学习主要会应用在哪?其实在很多数据丰富的场景并不一定需要用迁移学习,虽然学习效率低,但是我可以更努力,比方说你学五个样本,我学五千万个样本,达到比你更好的效果也可以。但是有些场景是没有大样本的,举个例子,比如说医疗场景下,有些疾病全世界没有几个人得过,这就不可能去分析那么多的样本,唯一的办法就是用迁移学习把所需要的样本数量降低,这是今天迁移学习要解决的问题。
AI落地过程中最大的难题是人才
国内靠谱的AI科学家人数不足千人
记者:今年开始,AI企业开始与更多的行业场景深入结合进行落地,在您看来,AI在落地的过程中难题有哪些?
戴文渊:其实AI在落地过程中最大的难题是人才。
我们所能看到的,实际上现在在很多不同的、千奇百怪的场景其实都能够落地,大的场景包括金融的风险、广告的营销、视觉领域的人脸识别、手写识别,音频领域的语音识别,有些小的场景其实都无法想象,比方说制造业瓷砖,瓷砖生产到最后一道工序时,我们要挑出正品和次品,这个事情从技术角度来说也不是那么难做,但是它是一个非常小的场景,它和人脸识别、安防相比是小场景。类似像这样的场景其实很多很多,例如像书店的电网,我们怎么去监控它的电线有没有断掉,这些都是一些过去不太容易想到的场景。
在今天,AI为什么没有在这些绝大多数场景落地?其实不是AI不能做这些场景,而是没有人去做这些场景,因为今天的科学家太少了,一共就是这么几个科学家,那我们把所有的场景拿过来,就请让这些场景排队,科学家太少,我们只能从价值最大的场景,往相对价值没有那么大的场景去做,(所以)今天我们只覆盖了价值最大的场景。
但是,如果我们有办法让今天的AI科学家的数量提升到今天APP开发者的数量,那整体情况又会完全不一样,我们知道,APP绝对不是说只有几个大场景,绝对不是,我们想得到的、想不到的,我们都能找到APP,这是因为有庞大的开发群体。
所以其实今天AI落地最大的问题就是人才,也是非常需要去解决的,这个问题不解决可能真的AI泡沫就会担心到来了。
记者:人才的供应跟不上AI技术的发展
戴文渊:对,市场对AI的预期是,AI是个至少10万亿,以前说大市场叫万亿,AI大家对它的预期是10万亿以上甚至百万亿的市场,但是我们所去获取市场的速度现在是靠着这些科学家在获取市场,所以获取市场的速度是太慢的,然而估值增长是很快的,估值增长是照着10万亿市场以上去的,所以如果我们跟不上,那就有可能这个泡沫就破了。
记者:这个缺口有多大?
戴文渊:人才的缺口在百万以上。而现在(中国)真正靠谱的AI科学家可能在千以下,这还是相对比较乐观的估计。
记者:您刚刚提到整个行业的泡沫现象,资本对AI非常看好,导致外界人工智能产生泡沫的这种担忧,您怎么看这个现象?
戴文渊:担忧其实是这样的,资本其实并不傻,他为什么会提前预知这样的价值,是因为有这么大的市场。那么泡沫什么时候会出现呢?就是把泡泡吹大了以后,如果你填不满它就会爆掉,现在所以很关键的就是AI落地的速度,就是如果你的落地速度最后能跟上泡泡增长的速度,泡沫就不会破裂,所以现在为什么说人才很关键,就是人才速度跟得上,AI可能都不是说泡沫的问题,可能是今天的估值又太低了,如果今天整个的AI行业有100万以上的人才,没有人会担心泡沫问题。
记者:今年被认为是后AI时代的开启,行业都开始迎来应用落地,甚至说不落地的企业可能就会面临死亡,您怎么看待现在AI发展的一个档口?
戴文渊:我觉得需要去兑现,因为整个资本市场把AI的水位抬的很高,所以这个阶段AI企业需要去兑现之前的承诺,所以为什么我们现在非常重视AI人才的问题,我们现在采取的一个方式和我们过去的方式是不一样的,过去更多的企业采取的方式是我找更多的科学家发展,但是我们的观点是这个市场一共就不到1000个科学家,你就算把这些人都网罗到一起其实也解决不了这个问题,全世界的AI的科学家都在你的公司也解决不了。
所以另一个思路是什么,就是我们去找一个更大的群体把他们变成AI的开发者,我们的观点是要把过去的APP开发者,过去的java开发者,甚至是业务人员,把他们变成AI的开发者,一旦这件事情做成了,我们就再也不用担心有没有100万的AI开发者的问题了,因为这个数量是远远超过100万以上的。
(郭瑞超 guoruichao@corp.netease.com)