简介

chineseOCR_lite 超轻量级中文ocr,支持竖排文字识别, 支持ncnn推理 , psenet(8.5M) crnn(6.3M) anglenet(1.5M) 总模型仅17M

Docker安装chineseocr_lite

docker run -dit -p 8080:8080 -v /mnt/d/data/:/data --name chineseocr vitzy/chineseocr_lite # 查询镜像 docker ps # 进入容器 docker exec -it <your container name or id> /bin/bash # 拉取代码 cd data/ git clone https://github.com/ouyanghuiyu/chineseocr_lite # 运行项目 cd chineseocr_lite/ python3 app.py 8080

在浏览器中打开 http://127.0.0.1:8080/ocr

通用OCR测试

ocr文字识别包离线(基于chineseocrlite的身份证火车票)(1)

基本文字都识别出来,打分:90分

火车票测试

ocr文字识别包离线(基于chineseocrlite的身份证火车票)(2)

关键内容识别不出来,打分:30分

身份证测试

ocr文字识别包离线(基于chineseocrlite的身份证火车票)(3)

身份证号、地址可以识别出来,姓名、出生日期没有。打分:60分

银行卡测试

ocr文字识别包离线(基于chineseocrlite的身份证火车票)(4)

银行卡识别错误,中文文字基本都对,打分:20分

车牌号识别

ocr文字识别包离线(基于chineseocrlite的身份证火车票)(5)

车牌号完全正确,打分:100分

总结

chineseocr_lite 对于中文文字识正确别率大约在80%以上,但是对于特定的模型利于火车票识别率较低,需要自己训练模型。市场上的大部分OCR都是要收费的,开源中文OCR项目更是少之又少,感谢作者的开源。源码地址:https://github.com/ouyanghuiyu/chineseocr_lite ,有兴趣的同学可以去下载学习。

,