吴及:用人工智能开启未来学习的升级之路
12月22日,第十三届本站教育金翼奖在北京隆重举行。在主题演讲环节,清华大学电子工程系副系主任,长聘教授,博士生导师吴及带来了主题为《人工智能开启未来学习的升级之路》的精彩分享。
吴及提到:
下为吴及主题分享内容,经本站教育编辑整理:
大家好,我来自清华大学电子工程系,是一名大学老师,也是教育的从业者,所以今天特别荣幸能够来到本站教育金翼奖的颁奖典礼。
这是一个命题作文,让我讲一下人工智能和教育相关的话题,我是做技术的我更多的想从技术的角度讲一讲我自己的观点——人工智能未来怎么样才能助力教育提高质量和提高效率。
我今天的汇报分两个部分,第一部分讲一讲人工智能
因为人工智能对大家来说是耳熟能详的名词,耳熟能详就会存在一个问题,我们在交流的时候,每个人在说人工智能,我们心里想的人工智能不一定是同一个东西,原因有两方面:第一,技术本身发展非常快,人工智能这个词的内涵和外延不断在发生变化,十年前我们说人工智能,今天说人工智能,十年以后说人工智能,可能包含的含义完全不一样;第二,人工智能这个词,当初科学家起这个名字的时候,这个名字起的特别好,给了每个人充分的想像空间,即使没有人告诉人人工智能什么意思,你拿到这个词以后也可以发挥想象力,无穷无尽的想象空间,正因为以上这两个原因,人工智能在认识上存在非常大的差异。
首先给大家看这张照片,人工智能这个词最早起源是1956年在美国达特茅斯的会议上,造就了人工智能这个词,这张照片是拍摄于50年以后,是非常有历史意义的一张照片,这里有三个人名,参加这个会的三位科学家之一,在信息技术历史上做出巨大贡献的三位科学家。第一位是麦卡锡,stanford人工智能创始人个,第二位是明斯基,MIT人工智能实验室创始人,第三,香农,信息论创始人。
人工智能的发展也不是一帆风顺的,我们今天叫人工智能第三次浪潮,1956年达特茅斯会议只求进入了人工智能第一个黄金期,在这个黄金期里人工智能的科学家诞生了很多想象,告诉人们人工智能可以做很多事,所以出现了用计算机证明数学定理,最有名的例子是“斯特定理”在地图上用四种颜色可以把相同的国家分割开,数学家用一百多年没证明出来,但是用计算机证明出来了。出现了历史上第一个跟人聊天的机器人,出现了积木世界,这个持续了不到20年时间,随着英国国会委托做了一个报告,这个报告给人工智能很大的打击,他说当初人工智能给大家承诺的事情,20年后一件没有做到,于是AI进入第一个冬天,所有的政府停止投入资金。
上个世纪80年代初进入第二个人工智能黄金期,有一些比较典型的成果,比如神经网络,反向传播算法,出现了专家系统,包括医院的CBS系统,我们教给计算机一些规则,让它帮助人们做一些决策,这样的系统,曾经大家觉得,建十条规则可以解决一些问题,给它两万条规则,它可以解决更多的问题。日本开始了第五代计算机研究工作,这个持续时间也不到十年,又遇到很多问题,包括日本宣布第五代计算机研制失败,美国国防部高技术情报署停止了投资,规模大了以后再想应用变得极其困难,AI迎来第二次冬天。
到90年代以后,那个时候的AI不像今天,如果说哪个专业的学生学AI毕业,可能连工作都找不到,哪个人写论文说我搞神经网络的投到编辑部可能被拒了。但是历史还在往前走,IBM开始做深蓝,到2006年Hinton,深度神经网络,到2011年,微软宣布他们通过深度神经网络技术把语音识别错误率下降30%,这对于作为这方面研究的人来说是非常大的突破,2012年,机器系统基于神经网络系统战胜了以往最好的系统,之后深度学习就变得一发而不可收拾,所有任务开始尝试用深度神经网络解决,而且它一直没有让大家失望过,所以这才迎来AI第三次浪潮。
还有一些标志性的事件,有这个历史我们会知道,并不是今天进入第三次浪潮就预示着未来AI会一路向上,也许过若干年AI会迎来第三次冬天,这个我们只能拭目以待,因为这是未来。
在AI被社会广泛认知最重要的事情,AlphaGo,AlphaGo横空出世,从2010年开始战胜欧洲职业棋手冠军,2016年3月份战胜李世石3:1,Master在职业顶尖取得60连胜,2017年3:0战胜了柯洁,至此,大家相信,下围棋这件事大家不要跟科技比了,这是全世界的一个证明,人工智能很厉害,人工智能被认知了。
其实开发AlphaGo的公司是很一个很聪明的公司,他找了一件非常适合机器干的事情,围棋尽管很难,但是它是游戏,是封闭的,我们把它叫做全信息零和博弈,就是下棋双方能看到棋盘上所有的信息,打扑克就不是,看不到对方的牌,围棋是全信息的,信息输入对系统至关重要,全信息对做好一个系统提供很大的便利。
第二,零和博弈,黑棋多占一个,白棋少一个,361个空,我们看搜索空间极其巨大,任何一个计算机靠蛮力算不出来,围棋里下一个子,一个子下下去究竟好不好,在数据上都非常难以评估。还有一个现象,地平线效应,因为地球是球形的,远处有一艘船过来,你很长时间看不到,但是你一旦看到它,这个船立刻显现在你面前。
这步棋好不好,可能三五十步都看不出来,可能20步以后下一步好棋,在AlphaGo之前,人类已经发明了很多的散发,使得围棋的水平在提高,但是有限,那时候在AlphaGo之前,机器下围棋的水平,可能一个人类的儿童,学了半年以后,下赢机器就毫无问题,但是AlphaGo引入了深度学习的技术,策略网络+价值网络,策略网络,在现在的局面下,下一步棋下在什么地方,价值网络,现在的棋局判断黑棋和白棋的胜利多少,第一,决策,在哪个地方下子,第二,判断当前胜率多少,虽然观察AlphaGo和柯洁或者跟李世石下棋时候,AlphaGo一直在计算着胜率,据AlphaGo的开发者来说,等它和李世石下棋的时候还有波动,和柯洁下的时候,AlphaGo一直它会赢,这个系统凸显了这个技术所能带来的变化。但是这是一个封闭系统,是全信息零和博弈,面对现实世界很多问题既不封闭,很多选择是开放性的,人工智能要解决真实世界的问题仍然面临巨大的困难。
这里给出一个图,有监督学习,我们给了数据和准确的标注,如果只给了数据没有标注是无监督学习,下AlphaGo的棋是强化学习,根据这个棋盘未来的结果判断当时下的棋是不是一步好棋,强化学习被推崇认为是构建学习系统有效的途径。
从人工智能发展来看,人工智能并不是唯一的技术流派,至少人工智能有三个技术流派,第一,符号主义:相当于人类阅读知识,我们能读文字,建立知识图谱,建立各种知识工程,进行符号级的推理,这也是人工智能发展的重要流派;第二,连接主义,从人的神经系统那儿获得启发,信息存在在网络当中而不存在在单个节点当中,基于这样的启发,发展出一整套人工智能网络,包括深度学习技术,今天我们在第三次人工智能的浪潮最核心的进展还是在深度学习的部分;第三,行为主义,前面符号主义和连接主义只是模拟人的大脑,并没有模拟真实生物,行为主义,不追求那么高的目标,先有一个机器的生物在自然界当中完成一些基本功能,比如行走、上台阶、开门、这一派观点认为是为主义,今天有一个更形象化的名字“具身智能”,像一个生物一样生存在自然界,大家如果关注到可能会知道一个非常有名的公司,波士顿大狗,人工智能其实有很多个流派,这些流派在人工智能的发展过程中互相依存,协同发展,有些走的快一些,下一个阶段会赶上。
第三次人工智能的浪潮为什么获得今天的成功?还是不同于前两次,第一,我们今天叫快速增长的计算设施,人类用的计算能力,如果不计代价,可以认为有无限的计算能力,自己的笔记本算不过来,可以连到云和服务器上;第二,我们越来越有能力采集更多的数据,我们无论做哪一个方向都需要通过数据分析,现在人类采集数据能力非常强。还有非常重要的算法,深度学习,深度神经网络为基础的算法,有了他们一起作用,才使得人工智能走到今天的局面,我们应该客观的说,今天的人工智能水平比前两次人工智能的水平要高很多,我们能做很多事,同样也有很多事情做不好,做不对,或者有人开玩笑说,没有标注,没有人工就没有智能,我需要对数据进行标注。也有人说系统表现的不那么聪明,甚至有点智障,我们为人工智能技术应该客观的看待,它比以往强大,能做很多事情,但是还有很多不足,还有很多它做不了的事情。
Gartner技术成熟度曲线,任何一个事情按照这个曲线发展来看,都有初发、期望膨胀,然后进入幻灭低谷,但是会缓慢的复苏,这样一个波峰波谷走了不止一次,是不是三次能走完,我们不知道,很当先进技术都有这个过程。
现在出现了各种各样构型的神经网络,这是我想讲的第一部分,关于人工智能我自己的见解和认识。
第二,人工智能和教育行业。
以我们现在国家发展的阶段,社会的经济水平,我们对教育对人才培养的需求越来越大,包括政府对教育提出很高的要求,我们有“双减”,我理解最终目的,我们需要培养的人是有全面素质的,有更好的创造力,而不是只是会学习考试内卷的,那么在这样一个背景下,教育最需要做的事情就是提质增效,让学生更有效的学习,以更高的效率掌握知识和技能,这样的人才可能是我们未来社会发展更需要的。
这样一个途径是什么?从做技术的角度,三个过程,数字化、科学化、个性化。
给大家举个例子,教育当中个性化推荐可能是现在做的相对成熟或者比较有效果的学习方式,一个孩子学那么多知识,或者做那么多题,总会有一些方面学的好,有些学的不好,我们现在教育讲的是同质化,所有同学做同样的作业,所有同学参加同样的考试,面对同样的问题,如果我们了解每个学生强在哪儿,不足在哪儿,如果要发挥它的长板应该学什么,补足短板应该学什么,我们就能够给他们提供个性化的能力,个性化对提高效率,提高质量来说非常重要。个性化这件事并不那么容易,个性化,我们得知道学生的现状,了解知识的体系和架构,需要我们的教育工作者投入非常多的精力把知识的结构描述出来,在这个结构下定位每个学生哪儿是不足之处,这个不足之处由于什么造成的,知道根源在哪儿,会更有效。
如果有很多基础性的工作,我们会让不同的学生走不同的学习路径,从而有更好教学效果,未来个性化教学的道路是重要的发展方向,某种程度来说,教育培养人也不希望培养出来是千篇一律的人,系里做教学改革的时候,我们在大学里不光有核心课,还有各种选修课,我们每年培养出来三百个学生,每个学生的特点都不一样,因为社会需要不同的人才,而不是千篇一律的。这需要大量的工作需要大家一起努力。
第二,技术对细节的追求。
(清华附中校长)王校长非常重视体育锻炼,特别是在清华附中,鼓励孩子们从事各种各样体育运动,从体育运动来培养孩子的素质和精神,这一点我非常赞成。
奥运会提高成绩靠什么?肯定得个性化,个性化以后做什么?我们去分析,比如苏炳添的特点是什么,他个子矮,步长不如黑人,但是他的步频快,苏炳添在29岁以后跑进了10s,这是非常不容易的,如果没有详细的技术分析,很难让运动员做这么精细化的调整。
跳水,中国跳水已经可以对3D成像虚拟化做的那么细,如果拿这个教育运动员,或者把这个技术用在学生身上,也会取得更好的效果。
我们自己也在做一个工作,对学生在中学里的体育来说,引体向上是比较难的题目,拉不起来,拉不起来很多时候不一定完全是这个学生能力不够,很重要是发力方式不对,他们告诉我引体向上拉的好应该是背部肌肉发力,而我们学生是腹部肌肉发力,所以我们做了一个分析,让实验室做引体向上的时候,我们拍视频拍他怎么拉,而且放了机电感应器,用力情况好的人能做起来,腹部在发力,臂部发力不够的同学就是拉不起来,我们采集的数据验证了这个观点,我们告诉学生如果背部肌肉不够,或者背部发力方式不好,能不能做一些特定的锻炼,让他增长背部肌肉,学会背部发力。如果有这样的方式,相当于我们能够针对性地解决每个学生的问题,提高他的能力,我跟清华体育部的老师交流比较多,他们说不一定拼命上量是好事,还是要科学,跑量,每天跑这么多就够了,再跑没用,只有损失,缺失哪儿就练什么,这才是科学化个性化,在数字化基础上的工作。
我们未来在任何一个方向的教育或者学习都要形成这样一个闭环,首先是智能化信息采集,做知识能力综合评估,形成个性化的学习或者训练方案,再进行质效评价,有了这个过程以后知道学生的优点在哪儿,缺点在哪儿,针对他的缺点怎么改进,改进方案有没有效,有效可以坚持,没有效可以换一个方案,如果这样可能会给我们的孩子带来更多的帮助。当然技术不是全部,我们需要有管理、专家,但是在这个过程中技术也许能发挥一点作用,在数字化、科学化和个性化的过程当中,给我们的教育提供一些帮助,使得质量和效率能够得到进一步的提升,为我们未来的社会培养更出色的人才,谢谢!
附嘉宾介绍:
吴及:
清华大学电子工程系副主任,长聘教授,博士生导师。清华-讯飞联合实验室主任。IEEE 高级会员,中国语音产业联盟技术工作组组长,认知智能国家重点实验室学术委员会委员,口腔数字化医疗技术和材料国家工程实验室第二届技术委员会委员,中国计算机学会语音对话与听觉专业组委员。2018-2022教育部电信类专业教学指导委员会副秘书长,承担国家重点研发计划、863、国家自然科学基金、工信部电子发展基金等多项国家科研项目。
吴及1996年毕业于清华大学电子工程系无线电技术与信息系统专业,2001年获得清华大学电子工程系信号与信息处理专业博士学位。2006年,清华大学与AI龙头企业科大讯飞联合创立清华-讯飞医疗语言处理技术联合研究中心(清华-讯飞联合实验室),吴及担任实验室主任。清华-讯飞联合实验室是集产学研于一体的创新团体,聚焦于智慧医疗行业,所研发的医考机器人“智医助理” 以超过96.3%的人类考生的高分456(总分600,及格线360)成功通过了国家执业医师资格考试,是世界上首个通过国家执业医师资格考试的AI医考引擎;相关成果在AAAI,ACL,BIBM以及自然子刊Nature Communication等顶级期刊会议发表高水平学术论文数十篇,申请专利数十项。