在线教育题库系统的设计心得
一、前言
题库对于在线教育从业者来说都不陌生,可以说题库是在线教育的核心,各大教育公司对于题库的重视不言而喻。
但是题库的后台设计对于很多人又很头疼,没有现成的系统可以借鉴,题库的各个层级关系梳理不清,试题试卷入库和维护,试题数据结构等都是题库设计中的重点问题。
本文将从题库的各个层级展开介绍这些问题的解决方案和个人看法。
二、题库的架构
题库的三层架构:基础属性层,基础资源层和资源业务层。不仅仅是题库,如果把资源类型进行扩充,这样的架构同样也适用于其它资源类型。
梳理清楚这三层结构可以对题库整体有一定的感知,就像人体的骨骼一样,结构清晰且方便掌握各个功能的设计方向。
资源业务层的上一层还可以加上资源应用层,指的是资源需要应用到哪些终端,比如APP、小程序、web等,这样的设计思路其实是参照中台思想将题库打造成成内容中台的规划。
三、基础属性层
基础属性包含了资源的所有的属性,比如学科、章节、知识点和难易度等。属性的管理维护是否要做到穷尽?对于通用性且有拓展性需求的属性,是需要进行属性管理,但是当某些资源的属性并不具备上述两种特性时,对属性进行单独管理维护性价比就不高了。
知识点对于题库来说是核心中的核心。各种类型的资源之间是以知识点进行关联的,资源关联上知识点之后便可以进行基于知识点的推荐逻辑,现在市面上各种AI智能推荐都是以知识点为基础进行的。
属性的维护以知识点和章节的关联为重点(我之前从事的是初中阶段的在线教育,教材同步是当时的强需求,应用端推荐的内容不能超过教师的教学进度,这就需要资源具有知识点和章节两个属性)。
在章节和知识点的关联这个问题上,我之前也走过一些弯路,具体的思路是每个资源都打上知识点和章节的标签,教研老师每录一道题或者上传一节课都需要打上知识点和章节的标签,针对初中阶段一道试题可能会涉及很多版本教材的章节,那么章节的人工关联工作量是可想而知的,这样的方式效率低,还容易出错。
其实针对数理化这类理科学科来说,教材的章节与知识点是有着强一对一关联关系的,可以提前在题库系统中将这些学科的章节与知识点进行关联,上传的每个资源只需要打上知识点标签后,系统便会自动关联上章节属性。针对英语,语文等文科性质的学科,章节和知识点没有强关联关系,目前的打标签方式还是两者都需要进行。
至于智能打标签,也有一些头部的教育公司在尝试,但是效果都不太好。在这里还是希望行业内的从业人员们可以在这方面进行技术突破,这也将是整个教育行业的福报。
四、基础资源层 1. 试题入库
资源层的重难点其实就是试题入库,如何高效的将试题录入题库是关键。试题入库的方式分为:人工录入和系统识别,而系统识别目前最多的是Excel和Word识别。
人工录入其实就是将试题复制粘贴到题库系统,试题自身也是有结构的,它包括题干、选项、小题、答案、解析等,如果要录入一道英语完型填空的试题,仅录入花费的时间就很长。
Excel的系统识别其实本质还是人工录入的逻辑,只是它可以做到批量,但是理科的公式问题无法解决,录题效率仍不高。
Word识别的方式目前已经有部分公司在尝试研究,它是通过在Word中添加特征的方式进行规则识别,既可以解决公式录入的问题,也极大的提高了录题的效率。
Word自动识别包括了格式转换,XML解析,公式解析并转换成LaTeX,这块后面会专门出一篇文章详细说明。
2. 数据格式
试题入库之后接下来就是如何维护,数据应该以什么格式进行存储,什么样的格式更便于前端的显示。针对文科这些无公式的学科,其实直接以HTML格式存储就可以了。但是数学等有大量公式的学科,由于HTML对于公式其实兼容性很差,以LaTeX格式储存是个好方法。
LaTeX是一种基于TEX的排版系统,对于生成复杂表格和数学公式方面兼容性很好。写过科技类的论文的同学们应该都接触过LaTeX,对于复杂公式和表格的处理应该深有体会。在这里就不多做更多的介绍了。
将Word文件进行文档格式转换成XML并进行特征解析,公式识别则调用第三方软件Mathpix(一款公式识别神器),解析完成后将数据转换成LaTeX格式并进行储存。
同时也可以基于LaTeX格式再转换HTML格式进行储存,这样的处理是提前在库里准备好HTML格式可以直接在前端展示(LaTeX不可以直接在前端展示),防止用户请求的时候再进行转换,响应时间过长。
3. 题型类型
不同学段所包含的题型可能不尽相同,不同题型的试题在后台的维护和前端的展示也不相同。
以初中学段来说,初中所涉及的学科多且全国各地市的教材版本也不相同,目前已知的题型就有100多种。题库的设计不可能对这100多种题型出100多种题目录入模板(开发量大,无扩展性),所以要针对这么多题型进行归类,把相同结构的题型归为一类。
这样处理的好处是,不论是否有新的题型对于系统来说只要把它归为已有的类型中就可以兼容。在这里我们将题型分为:选择型,简答型和综合型。
五、结语
题库的设计一定是建立在对业务和用户足够熟悉的基础上的,如果不熟悉业务,设计就会变得层级混乱,结构不清晰,看见什么就做成什么样子。
只有熟悉业务,熟悉教研,才能反推系统应该如何设计,如何能够做到高扩展性和复用性。题库的用户其实就是教研老师,多和老师们沟通,多了解他们工作的业务流程,最好能够亲身感受下他们的工作,这样就可以很快掌握到题库的优化方向。
以上就是我在题库设计中总结的几点心得,希望能够给到更多题库设计者们一点启发,也希望大家能够指出问题,给出建议!
本文由 @一条酸奶中的 原创发布于人人都是产品经理,未经许可,禁止转载
题图来自Unsplash,基于CC0协议