首页 > 产品 > 利用计算机视觉和图像处理技术构建答题卡识别系统

利用计算机视觉和图像处理技术构建答题卡识别系统

早些年总公司从阅卷系统起家,经过这些年的发展阅卷系统技术逐渐成熟市场也都做烂了,近些年阅卷系统逐步的变成教育信息化公司争夺各地教育机构与学校地盘的工具,更有像科大讯飞这样财大气粗的公司直接送成套软硬件到校,由此可见教育信息化这个市场的白热化,越来越难做了。早几年教育信息化这个市场还算是个半封闭的市场,大大小小厂商盘踞一方,谁也搞不死谁,但近年随着市场越来越热闹,『钱途』被不断地发掘,不断的出现大鱼吃小鱼,像互联网行业一样赢家通吃越来越普遍。所以就像很多传统行业一样,越来越多的公司在谋求转行,追逐更大的市场。

闲话扯的有点远,写这个主题主要是因为项目需要做一个成绩分析系统,区别于传统阅卷系统的,主要使用场景是服务于线下培训机构学生报班前的整体科目能力测评和课程练习测验的成绩分析与学习情况跟踪,系统主要由一个答题卡识别模块+成绩分析模块,今天先聊聊答题卡识别模块是如何构建的吧。

谈到答题卡相信大家都用过,目前自动化机器识别的主流的还只能识别客观题部分,即选择题、判断题。对,就是大家涂答题卡的时候涂黑部分。当然也有个别『奇葩』,像科大讯飞能做到英语作文这样的主观题批阅,背后高大上的什么人工智能、神经网络计算等技术原理就不谈了,其实个人认为目前这些还只是辅助手段,噱头成份多一点,真正能用于教学实际的应该还有点距离。

另外答题卡识别还不得不提到一个概念『光学划记符号辨识(OMR)』,传统市场上的答题卡识别使用的是光学标记阅读机,采用光学传感器识别答题卡填涂部位,信号采集速度快,性能稳定。这也被很多大型考试等场合使用,但相对成本也比较高。还有一种的就是我这里要说的将答题卡扫描成图片,利用计算机视觉和图像处理技术识别出填涂特征点,对指定区域内特征点进行定位和坐标比对得出答案。这个方案当然有其明显特征,图片扫描设备相对通用性高,甚至有厂商能做到使用手机拍照识别,这个在某些轻量级的使用场景优势就比较明显

技术方案原理

尝试过多种识别方案,最终选择的识别率比较高的如下

1.图片预处理,对图片进行压缩和灰度处理,最终得到一张二值图

2.关键定位点识别

3.图片透视转换与纠错

4.参考坐标定位点识别与位置数据提取

5.答题卡填涂区域识别与位置数据提取

6.答案比对获取

 

原始图片

自设计答题卡手机拍照

填涂区域特征点识别

wrap2

识别结果

填涂结果

总结:

以上采用的样例是手机拍照图片,使用扫描仪采集图片识别率更高可达到实际生产要求,手机拍照因为角度和阴影干扰稳定性较差,需要在光线比较均匀的场景拍照。

另外一个影响识别率的一个重要因素是填涂点质量,存在填涂点较小或笔迹较淡不识别率低的情况,经过调校正常填涂情况下识别率还是比较满意的。

需要说明的是第2、3点在扫描仪采集的情况下图片输出比较稳定,而且很多扫描仪自带图片位置纠正功能的情况下基本上可以跳过

针对手机拍照现在还在研究亮度和对比度处理,经过处理后整体识别率将进一步提高

  1. 本文目前尚无任何评论.

=2加3(必填)请输入两数相加的结果。