展望下一個十年的校務研究
【文.傅远智/国立台北科技大学人文与社会科学学院副院长、台湾校务研究专业协会副秘书长、张育慈/国立台北科技大学技术及职业教育研究所硕士生】
我国高等教育将校务研究纳入校务运作的一环迄今已近十年,无论是校务评鉴、招生专业化,以及教育部推动的各项竞争型计划,都能看到校务研究的身影。历经十年的发展,各校也已逐步将校务研究融入作为校务决策的重要组成部分。展望下一个十年,台湾校务研究仍然有许多未解的挑战,不仅需要校务研究领域同仁的努力,更需要所有高等教育行政主管凝聚共识,才能在数据时代,让校务研究为校务决策者提供更专业的服务,本文即着眼于此提出推动方向的建议。
如何取得优质的数据这一个议题仍旧困扰着各校校务研究单位,教育部大学校院校务资料库已经维运了近二十年,这一个数据资料库是以各校依据表单定义自行填报的方式所组成,对于教育部以及外部利害关系人了解各校的办学情形是一项重要的管道。该资料库对于我国高等教育数据建设有一定的贡献,也确实部分解决了高等教育数据收集与储存的问题。但是,真正能够让学校用来发现本身的问题并进行自我改善,目前校务资料库的资料是远远不足的。
首先,这种加总性数据填报的方式,令各校在应对每年例行的填报作业上,仍是由校内各职能单位各自填报加总性数据方式进行,内部横向数据未能串接,校内仍存在着数据孤岛的问题。其次,学校内部受到各种申请作业期程的关系,例如学生办理休退学等,数据本身其实是动态更新。校内仅有加总性数据的结果,往往也造成数据正确性难以核对的问题。其三,大学校院校务资料库经过数年的累积,数据表单本身要填报的各项栏位众多,但到底有多少是能直接反映大学本身办学成效也是值得商榷。最后,要促进学校自我改善,除了内部的资料外,外部的资料,包括学生生源组成、学生毕业流向、甚至大学研究对于产业的影响,这些能反映各大学服务对象的组成以及经由高等教育后对于社会产生的影响,才是校务治理真正需要知道的反馈讯息。
针对上述的问题,过去十年来各校在全国性大学校长会议或是教务会议中都曾多次呼吁教育部协助各校取得毕业生流向资料以供学校了解并改善教学之用。事实上,教育部也曾多次试图建立一个能够串接个人数据资料的教育数据处理中心。虽然至今并未实现,但过程中经过许多教育先进的摸索与努力,教育体系需要一个数据处理中心来提升教育政策与校务治理的品质的想法获得越来越多人的支持。
从大学校务治理层面来看,大学端最迫切需要取得的数据无非是三种,第一是学生生源数据,第二是学生毕业就业数据,第三则是大学研究表现数据。首先,在学生生源数据方面,由于招生专业化的关系,各校近年执行很多生源分析的工作,也都取得不俗的成果,但囿于学校取得的数据往往是学生入学后在校填报的数据,学生在考试阶段,例如甄选入学或联合登记分发时选填志愿的过程,甚至更往前为学生在高中阶段专业科目的成绩等,都难以为各校校务研究单位取得。面对少子化的威胁,大学的校务治理层往往需要知道校内各个科系是属于全国性招生,或者是地区性招生,例如热门的校系学生往往来自全国各地,而非热门的校系往往生源会比较集中在部分的地区。在确认本身校系招生的地位后,便需要评估哪些校系在市场中是竞争相同生源的校系,而这一个部分便能直接从分析学生在选填志愿的过程中获得。即便目前各校没有这方面的数据,也有数据分析技术比较好的校务研究单位借由交叉查榜的方式去发现各个校系的竞争者,但总得来说,能做到这个部分学校并不普遍。
若是从科技大学端来看,由于与技术型高中群科对应比较紧密,如果校系本身是属于地区性招生,其实很容易就可以了解正在和多少相同属性的大学校系竞争多大规模的高中生源。例如位于南部地区且属于地区性招生的科技大学,所招收的学生就很有可能也是位于南部地区的技术型高中学生。我国整体学龄人口虽然逐年减少,但地区间人口消长的情形却有极大的差异,例如新竹县市周围便出现既有的高中无法容纳学龄人口的情况,即便是同一个县市,例如桃园,也在国小阶段出现旧城区学校生源不足,但新的都市规划区学校容量不足的情况。这些分析的结果能有助于各大学正确评估本身的招生规模,从另一个角度想,面对学龄人口正在增加的地区,也能及早因应。当前的校务研究往往仅能去看自己内部的情形,但事实上,全国性产业聚落板块以及都市重划带动的人口移动,都正在改变着大学校园外部的环境,但包括教育主管机关以及各大学校务研究单位都还未能充分利用生源数据,来省视全国教育资源配置的合理性。
其次是毕业生就业资料,在过去十年,教育部能与劳动部串接学生的就业资料并提供各校以校系为单位的学生平均就业薪资。但即便是在例行的校务评鉴,各校还是习惯于使用自行透过校友电访调查而来的毕业生就业资料。这种自行调查而来的毕业生就业资料,其正确性以及完整性存在很明显的问题。各校如果能取得学生的投保纪录,究竟能为大学校务治理带来哪些有助于回馈办学的讯息呢?
首先,一个人的劳保投保纪录会包含以下几个基本栏位:投保人、投保时间、投保状态、投保金额、公司统一编号以及公司所在县市等。公司统一编号还可以进一步串接经济部的公司行号注册资料,以获得公司有哪些营业登记项目、资本额以及公司规模等。所以对串接后的劳保投保纪录进行数据清理后,可以帮助校务研究人员了解校友毕业后在各个时间点的投保薪资、就业天数,工作地点以及所投入的行业,但我们无法从数据中得到的就是该名校友在该公司实际从事的职位。即便是如此,我们已经获得许多重要的讯息,例如,某一个科系校友毕业后就业状态是否稳定,薪资水准是否高于平均水准,薪资水准是否受到地区性的影响,毕业校友进入到某一个行业的人数等。
这些细部性的资料不仅有助于大学掌握毕业校友的就业情形,借由了解学生就业的目的地以及行业的特性,在课程以及人才培育上做比较及时的调整,从教育主管机关的角度,在人力资源培育以及媒合上也能进行整体的评估。举例来说,随着台湾在半导体产业进入另一个飞跃性发展的阶段,许多县市纷纷设立科学园区来因应半导体产业的扩张,但新设立的科学园区往往设在土地尚未充分开发的都市边缘,而周围即便有大学,大学科系本身也是在1990年代左右设立,与当前的周边产业结构已出现脱节。当前教育部对于新设系所的审查,仍旧是由各校在总量管制下提交个案审查的方式进行,另外就是配合国家政策对于特定领域的系所进行扩张或缩减。但无论是个案审查或是基于国家政策,都鲜少有当地产业人力需求的事实性数据作为布局的基础。
最后是大学研究表现数据,大学研究表现数据最核心也最为人所熟悉的就是大学教师的论文发表数据,专业术语称为书目资料。事实上,书目资料并不仅能呈现某位教师在某一年发表多少论文这种简单的讯息,更包括但不限于反映了一位教师的研究方向以及科学网络。以一所大学来说,学校教师所有发表的书目资料反映了这所大学的研究方向,以及在这个领域是否具备技术优势,这对于一个国家的技术创新生态系统来说是一个非常宝贵的讯息,例如国内的高科技产业想要寻求技术突破的合作伙伴,这就是一个非常重要的指引。近年来受惠于数据科学的发展,机器阅读的技术使得我们不仅仅知道学术论文之间的相互引用的关系,我们也能知道学术论文被专利引用的路径,接着再串接每一个专利证号所登载的技术领域分类码以及专利所有权人等资讯后,甚至对于每一个专利所有权人在专利登记资料中,我们还能进一步确认专利所有权人所属的国籍。在这些资料的整合下,我们已经能知道大学的科学成果是如何促进技术的发展,甚至是哪些国家的公司及技术领域直接受惠于我国大学的研究成果。
国内大学对于研究表现数据的应用普遍还停留在因应大学排名的竞争,作为校内研究奖励的基础。即便是教育主管机关,对于大学研究表现数据也鲜少去了解这些大量的资料所蕴含的讯息。目前校务资料库里与研究相关所呈现是加总后的论文发表量,获得政府机关补助的科研经费以及各校获得的专利数量,然而,这些讯息仅仅是书目资料中所呈现最表层且极有可能被刻意扭曲的讯息。在对于整个科研经费资助、研究发表成果、研究成果对专利形成的影响、专利持有公司,以及公司所在地等资讯充分的掌握下,不仅有助于检讨科研经费分配的有效性,在学校层级也能盘点本身的研究优势,在国内外寻找可以共同投入技术开发的公司,达到释放大学研究能量促进产业升级,并增加大学内部经济收益的目的。
上述这三种数据都有助于教育主管机关以及各大学进行校务策略性的规划,并使得校务决策的方向更贴近社会与产业发展的脉络。然而,我国当前校务研究面临的是如何取得数据以及是否具备分析这些数据的能力。首先,在如何取得数据上,个人资料保护法的存在是为了让个人资料在符合公共利益的前提下保障个人资料的使用,并不是阻止个人资料被使用。我们这几年面临的矛盾在于我们被期望透过数据分析提供良好的决策品质,但我们往往也被限制使用好的个人层级数据来进行数据分析,就好像期待一个数据分析人员在没有取得正确数据的条件中获得一个可靠的发现,无疑是缘木求鱼。若是数据治理是一个国家必须走的方向,透过科学的数据才能有效的协调资源的配置,那在个人资料保护法的框架下解决各校取得优质的数据该当是教育主管机关的首要任务,而不能仅仅是一句有违个人资料保护法的疑虑搁置了议案的讨论。
事实上,姑且不论中央教育主管机关,各县市政府教育主管机关乃至于各级学校,由于长年不重视也不投入资源,对于辖下学生学籍资料及段考成绩资料等基本的资料都欠缺维护。这种不重视数据基础建设的结果,会使得各项教育规划流于空谈,更无法以科学的角度去检视后续的发展。而形塑出务实不务虚的高等教育治理文化,恰恰好是未来十年身处于高等教育激烈转型过程中的各个学校都必须面对的问题。
回到校务研究来看,各校直接取得学生个人资料确实也存在一定的风险,这个风险来自于各校校务研究在资料保存以及数据分析的能力上都存在相当显著的差异。借鉴健保资料库加值中心的经验,成立一个教育数据加值中心是一个可行的方案。各校依照意愿提供学籍资料后,由教育主管机关与其他数据源串接后,将原始资料统一存放在这个教育数据加值中心。各校派员至指定的教育数据加值中心处理学校本身的数据资料,并将分析结果携出。若没有意愿提供学生学籍资料的学校,便按照原有的数据取得方式进行校内的校务研究。
拥有好的数据也要有足够的能力对于庞大的数据进行分析才能发挥数据真正的价值。当前并非各校校务研究人员都能处理这种堆叠式的行政资料,校内与这种堆叠式的行政资料结构比较相近的是学生的修课纪录,亦即一个学生在一个学期会有多笔选课资料。但是包括学生在甄选入学阶段的多个志愿选填,学生进入就业市场后不同时间的投保纪录,大学教师在不同时间段研究发表纪录对于不同时间专利的影响等,这些都需要校务研究人员经过相当程度的数据清理训练,才能从流水帐式的数据结构中萃取出可以被理解的重要讯息。当前社会科学领域的统计课程从未涉及这一个部分的训练,学生在学习时往往也是处理已经被清理后可以投入分析模型的数据结构,事实上,在真实世界里并不存在这种已经被清理好的数据结构。即便是许多以大数据为名的数据分析课程,也鲜少有机会让学生有机会去处理,除了取得这方面资料本身即具有难度外,更重要的是在处理这方面的数据资料还需要对该特定领域有足够的专业背景才能在数据清理过程中有清楚的方向。
举劳保投保资料为例,在劳动经济学领域里用来衡量一个人在劳动力市场的稳定性,可以以在一定时间的就业天数来测定,若要知道一个人在劳动力市场的价值,可以以一个人在一定时间内的最高月薪来测定等。若要知道大学研究对于技术创新的影响,就必须了解每一个专利均有国际专利分类码(International Patent Classification, IPC),而国际专利分类码有其分类的架构与体系,可以代表该专利是属于哪一个技术领域。若是处理学生在甄选入学时的数据,就必须清楚知道筛选倍率、面试、志愿序以及录取决定等各个阶段的意涵,以及决定的顺序。简言之,若没有数据清理技术的训练,以及对于数据本身代表的意涵有深入的认识,即便拥有与学校本身有关的各项数据,校务研究人员也难以做出有意义的分析。
为了使得校务研究能帮助高等教育更好的回应社会的需要,无论是在招生规模与系所设置,人力需求与供给,以及研究成果的社会影响力等,都需要更好的数据以及更专精的数据分析技术。我国校务研究社群可以致力于推动两个任务,首先,促成教育数据处理中心的设立,各校应与教育主管机关合作,促使与各校有关的学校外部数据能被顺利取得并有效利用,共同制定并遵守数据使用规范。其次,校务研究社群可以采集中住宿训练的方式,邀请有实际处理各项数据经验的专家,以一周工作坊方式使用共同的程式语言,教导校务研究人员能够编写程式语言清理学校自己的数据,并产出一些基本的统计图表。此外,必须跳脱既有的校务研究议题,邀请专业领域专家,例如劳动经济学、书目计量、专利智财,甚至是人口区域发展等,介绍该领域专业知识以及新知提供校务研究人员认识与大学相关数据本身的意涵。
校务研究本身就是一项跨领域的学科,而大学本身在社会中扮演一个重要的转化器,包括促进社会阶级流动,将知识转化成技术,提供周围产业所需的技术人才等,这些议题不仅与校务发展切身相关,更会决定整个高等教育系统能为国内社会与经济发展带来何种程度的贡献。