拍照搜题产品的一点思路
在线教育似乎火了有一段时间了,公司总算下定决心趟这个浑水,临危受命从原来团队跳出来组建团队,本以为跳出坑了,没想到又进了另外一个大坑。算是在认真做产品了,自我安慰一下 🙂
除了线上产品外,还有线下传统纸质教辅发行,打着『互联网+教辅』的概念,让传统教辅通过APP与线上资源和系统结合起来,既是对传统教辅的升级把内容形式丰富起来,又可以通过APP搜集用户数据,推荐个性化学习资源,将线下用户导到线上。这就是我们的故事 🙂
好了,回归正题,现在计划做一款『拍照搜题』功能,是的类似于小猿搜题、学霸君等产品。。。
总体思路其实也算简单
- APP拍题照片上传
- 后台采用OCR识别出照片文字内容
- 根据文字内容匹配后台题库
- 展现匹配到的题库内容
整个过程就几步,但往往很多人第1步就被难倒了,APP拍照如果原始图片上传按手机分辨率来说一张图大的可以到好几M,所以第一步需要对图片进行预处理,这就要考虑到几点因素了
- 图片分辨率
- OCR识别的图片特点
其中OCR识别技术其实最终都会把图片转换为二值图,注意二值图比灰度图更小
直接在手机端将图片进行缩放,变换为二值图,这个时候再上传,文件的大小比原图已经小很多了,调整合适的分辨率图片可以控制在几十K的范围,图片上传的速度应该有质的提升。将图片压缩处理工作放在手机端处理,分布式计算,提升用户体验也节约了服务器端计算资源成本,是不是很机智 🙂
关于OCR识别问题,目前主流的OCR产品基本上都是商用的,当然开源的 tesseract 也是一个备选项,但需要一定的研发实力,如果条件允许还是建议直接采购,商用的产品成熟度和性能确实不错。
剩下就是将OCR识别内容与题库中的数据进行匹配的过程了,大概讲一下吧,这里面确实门道很多,如果要做的好也确实需要一定的研发实力。
首先你需要有一个好用的搜索工具,这个很重要。有同学举手说我可以拿数据库全文检索工具凑合么?我觉得可以,如果你的要求仅仅只是凑合的话,我认为是没有问题的,不过你老板看到了会打人的。。。
其实就是一个搜索引擎工具和一个中文分词工具,仔细研究一下市面上好用的解决方案不少,使用门坎也不高,如果有实力投入研发的话再加上深度学习算法匹配成功率更高,当然到一定程序后每提高一丢丢都需要的代价会越来越高,毕竟每个环节都会产生一定的数据失真,一个很好的深度学习和纠错机制应该是产品成熟阶段必经之路
好了,最后一个问题
要做好拍照搜题功能,你还有一个海量题库的距离,几乎所有的拍照搜题工具其真正原型其实就是根据拍照文字内容匹配数据库中的原题,也就是说一道题如果你想能把他通过拍照搜题工具搜出来的前题条件是这道题首先得要在你的题库里面。
顺便说一句,一道题入库成本正常情况下应该是在3-5块钱人民币的样子,高质量题可能会到15-20块钱,好吧拍照搜题功能其实真没有那么简单,我已经在这条不归之路上了。。。。。