张钹院士:从技术层面解决人工智能安全问题
中国科学院院士、清华大学人工智能研究院院长张钹(受访者供图)
当前,由人工智能引领的新一轮科技革命和产业变革方兴未艾。在移动互联网、大数据、超级计算、传感网、脑科学等新理论新技术驱动下,人工智能呈现深度学习、跨界融合、人机协同、群智开放、自主操控等新特征,正在对经济发展、社会进步、全球治理等方面产生重大而深远的影响。
近年来,中央在多次重要会议中对人工智能的重要性和发展前景进行阐述。加快发展新一代人工智能是我们赢得全球科技竞争主动权的重要战略抓手。
当前,我国人工智能产业发展处于什么阶段?如何看待当前的发展态势?未来应如何引导产业安全有序健康发展?围绕这些问题,近日,人民网科技频道专访了中国科学院院士、清华大学人工智能研究院院长张钹。
张钹表示,当前中国在人工智能产业发展方面与国际先进水平的差距并不是很大,但企业质量有待与数量“看齐”,在拓宽应用场景、加强数据安全和算法安全等方面加大功夫。
他提出“第三代人工智能”的概念,并表示希望通过政策和法规之外的技术途径解决人工智能的安全问题。
以下为专访实录:
人民网科技:人工智能是新一轮科技革命和产业变革的重要驱动力量,加快发展新一代人工智能是事关我国能否抓住新一轮科技革命和产业变革机遇的战略问题。对于当前我国人工智能产业发展进程,您怎么看?
张钹:业界普遍认为,人工智能到目前为止经历了两代。“第一代人工智能”是知识驱动型的,也被称作“符号主义”;“第二代人工智能”是数据驱动型的,就是大家现在非常熟悉的“大数据”“深度学习”。
人工智能最早于1956年起步于国外,而在中国则起步于1978年。不过这60年中,前面40年左右,也就是“第一代人工智能”,其进展较小。真正的进展主要是在近20年里取得的,也就是“第二代人工智能”。就目前来看,中国和国际上的发展差距并不是很大。
聚焦产业领域,我们所说的人工智能产业实际上分为两个大类:一类是传统信息产业的智能化,典型的就是如BAT、字节跳动这样的互联网公司。他们在发展过程中积累了大量用户,然后根据这些用户数据建立了相应的模型或画像,也就是建立所谓的用户“知识图谱”。以物品配送为例,由用户位置、商家位置、以及骑手的位置等信息组成的几千万甚至上亿的数据,建立成库,再通过人工智能的算法将其匹配、优化,可以大大提升配送效率。通过这种方式升级传统产业,已经取得了非常大的效益。在这方面,中国是做得不错的。
人民网科技:人脸识别、智能音箱、智能客服……近年来,不仅越来越多的企业开始涉足人工智能,“人工智能”也成为高考考生最关注的专业方向之一。在您看来,当前人工智能是否“过热”?
张钹:据统计,全球10亿美金估值以上的人工智能企业一共有40家,其中美国20家,中国15家。从数量上来说,中国稳处于第二位。然而需要注意的是,这些企业虽然估值很高,但盈利能力还很有限,大部分可能还在亏本。这是不容过度乐观的。
我认为,人工智能核心产业应该是独立于信息产业的,像智能交通、智慧医疗、智慧城市、自动驾驶这样由人工智能技术发展出来的产业。这方面的产业我们现在还处于发展初期。
人民网科技:最近,“戴头盔看房”的新闻上了热搜,也由此引发了人脸识别技术是否被滥用的讨论。我们的人工智能产业要想健康发展,还面临着哪些挑战?应该如何突破?
张钹:刚才我提到,全世界人工智能的“明星”初创企业,中国占了超过三分之一。数量虽然多,但质量仍有待提升。这些企业除了盈利能力有限之外,还存在严重的“同质化”现象。
为什么会出现这种现象?首先,应用场景有限。除了人脸识别、安防等,别的领域不好用。第二,不安全。包括数据的不安全和算法的不安全。我认为这两方面是当前制约我们人工智能产业发展的主要因素。
首先是数据的不安全。我们知道,现在人工智能应用效果很大程度上依赖数据质量,但由此会带来隐私泄漏等安全问题,如果解决不好隐私保护的问题,人工智能产业不可能健康发展。
第二是算法的不安全。所谓算法的不安全,就是在一定条件下训练出来的模型,如果用到条件不大一样的地方就行不通了。术语也叫做算法对于测试环境的脆弱性,或者叫“不鲁棒性”。以无人驾驶为例,人工智能训练的时候不可能穷尽所有的情境,当遇到新的突发事件便无法处理了。同时,这种脆弱性还使得人工智能系统容易被攻击、被欺骗。
对于人工智能的安全问题,我们不仅需要从政策、法规等方面进行治理,也要尽可能地从技术层面来解决,这也是我们提出“第三代人工智能”的初衷。
所谓的“第三代人工智能”,其发展路径融合了第一代的知识驱动和第二代的数据驱动的人工智能,利用知识、数据、算法和算力4个要素,建立新的可解释和鲁棒的AI理论与方法,发展安全、可信、可靠和可扩展的AI技术。
人民网科技:当前,以深度学习为特征的“第二代人工智能”还处于方兴未艾的阶段,业界能否接受“第三代人工智能”的概念?
张钹:人工智能经历了60多年的发展,现在看来,前面这些年的发展基本上还只是“序幕”。尽管现在我们看到人工智能的各种应用很多,但实际上用到的技术基本上还是传统的信息处理,人工智能真正的问题还没有被深入研究。
此前,大多数人还不太能接受“第三代人工智能”的概念,因为大家对“第二代人工智能”的期望特别高,觉得靠深度学习,人工智能就可以不断发展下去。但后来发现并非如此。
我们是在2015年左右较早提出“第三代人工智能”这一观点的,后来有国外学者在2018年也提出了类似的观点。
人民网科技:“第三代人工智能”要从技术层面出发来解决人工智能的安全问题,具体该如何发展?
张钹:发展“第三代人工智能”,我们提出要建立可解释和鲁棒性人工智能理论;然后在此基础上,发展安全、可信、可靠和可扩展的人工智能技术;最后,推动创新应用。也就是说,要创新应用、发展产业,必须先解决前面两个问题。
具体来说,我们的方法是把知识和数据结合起来。在这四、五年里,我们做了一些相关的工作,部分成果也已经实现了产业化应用。最近通过我们孵化的企业RealAI推出的数据安全平台RealSecure、算法安全平台RealSafe,就是这些成果的直接体现。
需要指出的是,这些工作目前也只能在特定情况下“就事论事”地去解决一些安全性问题。也就是说,人工智能的安全问题目前还没有找到根本的解法,而且很可能会成为永恒的话题。正所谓“道高一尺,魔高一丈”。人工智能安全领域未来将会处于一种攻防不断对抗的状态,因此算法也必须不断更新。
发展“第三代人工智能”将是一个长期的过程。我们现在还处于摸索阶段。但好在人工智能有个特点,就是每个阶段性成果都会有很大的应用价值。这也是为什么各国目前都很重视发展人工智能的重要原因之一。