有的同学居然不知道OCR,这点小事还得老问。

OCR是Optical Character Recognization的缩写。我们一般手上的扫描文献可能是图形转变为PDF文档的,这类文件最大的问题就是不能用关键词检索文档里面的内容。你必须使用正版PDF工具所带的OCR功能识别这个文献的文字,把图形上面的文字识别出来,这洋就能检索了。

当然,OCR也不是完全准确的,但目前的识别水平,大多数文字都能正确识别。目前国产软件福昕编辑器就是不错的PDF工具,注册也不贵,大约1-2百块钱一年,外国的工具可就很贵了,估计五六百或者上千,不必要。

还当然,不是绝对必要不主张扫描别人的文献,都扫描了,电子分享了,作者也就得饿死了,我们就再也没有优秀文献参考了。

ocr是什么有什么作用(啥叫OCR干啥用)(1)

,