中国的AI时代,不能没有“根”
1973年,中国电子工业部发动大学和相关研发机构一起,首次联合设计了中国自主的、拥有一致指令系统、看齐美国计算机标准的全新“1000系列机”。最终在众多科研人员的共同努力下,只花了一年2个月,看起来就像是三台冰箱并排放的DJS-130计算机横空出世。
作为中国第一个形成产业规模的系列机,它在日后足足生产了2000多台,并且被应用到国民经济和国防的多个领域,是中国计算机发展史上重要的里程碑。
就在中国的科研人员还在熟悉这台用各种电子元件组件起来、只有13条引导程序的计算机,用极为传统的穿孔带来输入和输出结果的同时。大洋对岸的美国,却已经半步跨进了“PC时代”。
包括惠普、IBM在内的公司已经用上了微型化的电脑处理器,将电脑缩小为电视大小,同时在原有代码系统的基础上引入图形化接口概念,由针对私人公司设计转向个人使用的电脑概念。在个人电脑的庞大需求下,越来越多新技术和新产品横空出世,其中就包括了英特尔1978年推出的第一款X86处理器8086,以及微软1981年推出的第一代Windows系统MS-DOS。
因为在技术积累的投入上的巨大差别,中国最终还是“错过”了PC时代的浪潮。之后引领整个PC行业发展的,一直是美国和欧洲的企业。哪怕联想最终凭借“贸工技”路线走上全球PC销量冠军,但相当一部分利润仍要被欧美的处理器公司拿去。
这种情况,进入了以智能手机和平板电脑为代表的“后PC时代”才发生了一定程度的转变。因为“(前)PC时代”的深厚积累,以美国、欧洲为主的一批企业依旧主导了消费电子产品的早期发展。
但这一次我们有了3个重要筹码:第一个是领先全球的消费电子代工能力;第二个是全球最大、最普及的移动通信网络;第三个是全球最为集中、消费意愿最强烈的客户。
最终让中国的消费电子产业在3G、4G、5G的推动下获得了长足的发展。最典型的例子莫过于华为,短短20余年间,从一家生产电话交换机的小厂,最终成为了全球IT通信制造业的巨头,同时在手机、手机SoC处理器、4G/5G技术、通信基站等多个领域完全不弱于甚至超过发达国家公司的存在。
虽然我们最终在“后PC时代”的尾声追上了技术发展的浪潮,但随着“人工智能时代”这一全新阶段的出现,新挑战也已经出现——中国应如何保证在“人工智能时代”不落后,甚至领先全世界。
答案在我看来就是3个字:根技术。
颠覆的人工智能
无论是“PC时代”还是“后PC时代”也好,其最底层的核心,依旧是通用计算能力,也就是CPU(中央处理器)在支撑。相比之下,人工智能时代因为算法上的整体改变,在整个技术体系上发生了重大的改变。
这其实要从原理上说起,CPU的核心是根据半导体特性打造的逻辑和计算电路,人类编程员根据CPU的二进制算法特性,写出CPU可以高效逻辑判断和计算的程序。
相比之下,人工智能则是建立在对人类的算法“模拟”上,准确地说是对人类大脑工作模式的模拟。在这个基础上结合人类自我对于不同任务的逻辑判断思路,构建神经模型,然后利用大量的现实数据来训练神经模型,最终得到一个可以用来应用、推断的神经模型。
是不是有点抽象?我们不妨结合通用计算和人工智能的两个重要里程碑来对比一下。
1992年IBM斥巨资打造了超级计算机“深蓝”,利用数个机柜以及多达480颗特制的“象棋处理器”战胜了人类国际象棋大师。但在原理上,“深蓝”所做的事情并不复杂,依旧是穷举,而且不是无限穷举。
在当时,人类的象棋大师大概能够算到之后10步棋的所有情况,而深蓝则能够算到12步棋的所有情况。理论上能看到更多未来棋局可能性以及对应优劣,并且更不容易犯错的深蓝肯定会获胜,但在其第一次挑战中实际上输给了人类国际象棋大师。后来又调整优化了一年以后,终于雪耻。
2015年,Google旗下AI创业公司DeepMind发布了围棋人工智能AlphaGo,并且直接约战当时的世界围棋冠军。作为人类迄今为止最为复杂的棋盘类游戏,围棋理论上走法更是达到10的171次方。每一步棋都有多种下法,并且都会对整盘棋最终结果产生影响。这也是为什么人类一直坚信:机器无法通过简单穷举运算,在围棋上打败人类。
但用深度学习能力“武装”了自己的人工智能还是出乎了人们的意料,直接以4:1击败了人类世界冠军李世石。更关键的是,在这次比赛中,人工智能展现出了与人类过去3000年围棋历史完全不一样的下法策略。你也可以说,人工智能远不只是击败了人类,反而是在不断对围棋的学习中,开辟出了一整套全新的、胜率更高的走法。
从这次比赛开始,一股新潮流开始在世界最顶尖的围棋圈开始蔓延,这些顶尖棋手们在研究学习了人工智能的下法之后,纷纷采用了其中的一些思考和招式。以中国围棋选手柯洁为例,就曾专门表示“感谢AlphaGo给我们棋界带来的震撼”。
就核心能力而言,通用计算可能是“替代+加速”,人工智能则是“拟人+创新”。这显然不在一个维度上。
更重要的是,在AlphaGo之后,越来越多的企业开始将人工智能应用在各行各业上。在翻译、语音识别、大数据、自动驾驶、目标识别等多个应用场景中都表现出了充足的颠覆性,只要有足够庞大的数据集,就能生成远超人类编程水平的神经模型和算法,最终实现远超人类编程的计算效果。
显而易见,人工智能一直都是中国不能错过的浪潮。
扎根,中国迎接人工智能时代的重要保障
事实上,尽管中国在人工智能产业的发展上取得了一定的成绩,但隐忧同样存在:相比美欧这样人工智能底蕴更充实的“老玩家”,中国在人工智能根技术上的积累薄弱不少。
根据头豹研究院的《2020年中国人工智能产业投融资报告》统计,截至2019年2月,中国AI相关企业数量为745家,约占全球21.7%,其中67.3%创立于2010-2016年间。 “年轻”的中国AI企业们,多数是在2015年标志性AlphaGo围棋人工智能事件之后成立的。
AI企业整体偏年轻,对应的结果是这类企业更多专注在AI应用层,极少企业涉足底层的AI根技术。在上方统计的745家AI相关企业中,75.2%为应用层企业,22%为技术层企业,仅2.8%的企业位于基础层。
而就重要性而言,人工智能时代“根技术”的影响力将会远超PC时代和消费电子时代。所谓“根技术”是指那些能够衍生出并支撑着一个或多个技术簇的技术。根技术是技术树之根,为整个技术树持续提供滋养,很大程度上决定着技术树的荣枯。
虽然同样是由计算机硬件和软件完成整个过程,但是因为从整个计算逻辑上不同于传统的CPU和人工编程,所以人工智能的技术栈与以PC为代表的通用计算产生了许多差异。
从整体上来说,人工智能的技术栈主要分为四部分,最底层的硬件基础设施、中层的软件基础设施、更上层的技术层、以及最上层的应用层。其中应用和技术层因为更偏向应用和解决方案,合起来一起作为应用与技术层。其中硬件基础设施部分还可以分为AI处理器和AI硬件设备;软件基础设施则可以再分为处理器使能、AI框架以及开发使能平台。
而“根技术”最核心的存在就在于“软件基础设施”和“硬件基础设施”这两部分。这一点我们也可以从英伟达、谷歌这类更早进入人工智能的巨头的布局中看出。
以英伟达为例,其GPU产品最早被AI研发用于深度学习训练和推理,英伟达在不断优化自己产品AI运行效率的同时,也进一步深化到设备层,除了各种规格尺寸的人工智能GPU之外,还专门针对不同的场景应用打造成不同的解决方案,有名片大小的Jetson、也有专门针对自动驾驶场景的Drive系列产品,更有直接用超高速网络将数颗GPU联合成“超大”GPU的DGX。
在软件基础设施上,英伟达推出的CUDA解决方案更是影响深远,而在AI框架上,英伟达直接采用了谷歌的TensorFlow和Facebook打造的PyTorch。这是因为英伟达选择将更多的精力放在了技术层上,通过应用SDK深入行业深入应用。
其次是谷歌,谷歌不但鼓励子公司DeepMind推进AlphaGo项目。同时为了给AlphaGo提供充足的算力,谷歌还研发了专用于人工智能的TPU处理器。并且将TPU主机服务器化,放入了自己的云服务体系中。在后续的几年中不断更新TPU处理器版本和其解决方案,最终更将TPU作为一种云服务业务内容,向广大的客户开放。
除了两家在“根技术”上的发力,还有一点尤为值得关注,就是人工智能全栈路的技术布局协作:英伟达用CUDA串起了自己最擅长的GPU硬件和之上的整个软件架构和生态,谷歌则根据自己人工智能技术的丰厚积累,做出了行业内最受欢迎的AI框架TensorFlow。
纵观谷歌和英伟达这两家全球人工智能产业最领先的公司,它们都不约而同地选择了同时布局AI根技术的关键节点,通过关键节点之间的协作,进而让自己的人工智能生态能力和效率最大。
最重要的是,核心公司的人工智能生态,还会随着时间的推移,辐射到整个国家,乃至全球的人工智能产业,形成公司、国家在人工智能产业中的潜在话语权。
中国发展人工智能产业依然需要“弯道超车”乃至“后发制人”,而接下来唯一的关键——发展自己的人工智能。
破局人工智能,中国企业该做些什么?
最首要的,也是中国企业目前最大的短板,就是人工智能的基础硬件。更具体的说,包括了AI处理器以及利用处理器打造的各种解决方案。
原因主要有三点,一是AI硬件是AI应用推广的主要边界,尤其是像智能手机、物联网、智慧城市等强调端侧数据采集和处理的场景,需要的往往是量身定制的AI计算能力和紧凑的解决方案;其次是处理器架构和开发方式上要实现高度统一;最后是基础硬件的自主创新问题。
除此之外,为了把这些基础硬件发挥出最大价值,还必须为其配套高效软件基础设施,主要包括“芯片使能”、“AI框架”、“开发使能平台”。
要一口气在这么多环节取得进展乃至突破,显然不是易事,但中国的许多企业们在这些年里还是交出了不少成绩。一大批AI处理器、AI算法公司应运而生,纷纷开始填补AI根技术的空白,例如现在不少造车新势力就正在将国外的AI处理器换成国内创业公司的产品。
在AI框架和开发端取得进展的就更多了,不仅有百度腾讯这样的互联网巨头长期重金布局,在细分的应用场景中,例如语音语义中的科大讯飞,又例如智慧城市应用领域中的“AI四小龙”。
从追求布局整体性和前瞻性出发,目前进展最大的是华为。华为的人工智能是一条以“根技术”为核心抓手的发展之路。目前,昇腾计算产业从基础硬件到基础软件层已形成了全栈全场景的“根技术”布局,且在云、边、端侧都部署了统一架构的昇腾系列解决方案,其基础软件层的异构计算架构CANN和AI开发框架MindSpore不仅能优化流程,也能与昇腾硬件基础进行深度的优化整合,进行全栈调优。在这些根技术之上,AI开发平台MindX也进一步加快了AI应用的开发部署。
中国的AI时代,不能没有“根”。随着中国人工智能产业建设的深入,我们也将看到会有越来越多的中国AI企业,深耕于人工智能“根技术”的产品与业务。发展具有自主创新“根技术”一定是中国建设人工智能产业的共识。尽管在破局人工智能发展上,我们依然会面临挑战,但中国AI公司已经用过去数十年的努力证明了一点:在全球AI根技术竞赛中,中国同样有机会实现追赶乃至超越。