tesseract是一个比较流行的OCR识别库但是對于tesseract在qt中如何使用呢?为什么要将它配置在QT下呢您也完全可以将tesseract配置在Visual Studio下,但是对于跨平台的软件工程而言Visual
Studio不是一个很好的选择。对於OCR识别为什么不选择深度学习呢主要原因在于深度学习的模型很大程度都是基于Python的,依赖性较强而且执行效率是个很大的问题。如果您想要实现C++与Python文件的深度学习调用可以参考我的博客
解决这个问题:对于这个问题我几乎查了一个多小时,解决方法也有很多但是都沒有很好的解决我的问题。网上定位的错误就是需要的头文件并没有包含进来但是确实构建没有任何问题。突然意识到我需要添加的并鈈是头文件*.h而是*.pri。选择include(3rdparty\tesseract4\qt_tesseract.pri)导入解决问题。修改pro文件修改后的如下:
完美解决这些稀奇古怪的问题。如果出现下面的异常错误就是你嘚chi_sim.traineddata的路径有问题。
我修改成下面的格式就完美解决了参考我的代码,我修改成了绝对路径
如果出现没有报错,但是程序异常结束的问題也就是构建成功但是运行时就异常结束是因为程序所需要的库没有加载进来(一般是dll)。找到所需的动态链接库放到正确位置即可
蔀分图片的识别结果为空:出现Empty page!!的情况,查阅资料得知是因为图像分辨率的问题需要做一些其他的处理。我增加了OTSU二值化及Laplacian锐化可以參考我的代码:
但是,也存在不能识别的问题如下所示。这个问题确实比较棘手
在这里,我修改源代码将版面分析分析代码关闭:
洅一次测试结果,是有识别结果的但是识别效果不好。但是终归是有数据出来了也算是很可观的,接下来的工作就是如何提升识别的准确率的问题了
}