一张图片识别出两种结果应该是引擎的问题

登录

本帖最后由 yangyuan 于 2017-3-13 17:53 编辑

开发中遇到的  以为是我们代码的问题  后来直接用识别的工具还是会这样

1 一张图片jpg格式的

上图是识别的正确的 4.4  识别为4.4

2 同样的jpg格式下图 4.4 识别为理.理
下图的获得过程：  用画图格式获得上图  截取其中部分另存为下图  没有修改尺寸按截取部分的尺寸直接保存  格式为JPG
该bug重复概率100% 只是把图片切出来识别  就会出现该情况  貌似很严重

Richard.Ma · Richard.Ma

你好，这个应该是手动选择识别区域的问题吧，如果自动选择区域，应该会识别页面所有的东西的

yangyuan · yangyuan

Richard.Ma 发表于 2017-2-14 09:54
你好，这个应该是手动选择识别区域的问题吧，如果自动选择区域，应该会识别页面所有的东西的

问题是就需要手动框区域识别啊不然怎么把识别的结果分门别类对不对？
而且同样的图片裁剪一下同样框中的范围识别结果就不一样不能吧？用贵方的工具但是该情况如果无法解决或者贵方无法提供解决思路（不能说自动识别就解决了哦

）那么我方在使用中会不断出现该情况。。。

yangyuan · yangyuan

现在发现的就是"4"这个数字在裁剪后的图片中出现识别为"理"的情况

Richard.Ma · Richard.Ma

yangyuan 发表于 2017-2-14 11:19
问题是就需要手动框区域识别啊不然怎么把识别的结果分门别类对不对？
而且同样的图片裁剪一下同 ...

并不是说这个意思，因为对一般的客户来说基本上是用自动区域识别的，你能不能提供一下识别为“理”的裁剪后的图片，因为我这边裁剪后没有复现出这个问题，另外使用的demo是C语言的么

yangyuan · yangyuan

OCR - MICR - ICR - OMR\C Windows API\OCR Professional 用的是这个

yangyuan · yangyuan

Richard.Ma 发表于 2017-2-14 11:30
并不是说这个意思，因为对一般的客户来说基本上是用自动区域识别的，你能不能提供一下识别为“理”的裁剪 ...

已回复这个问题因为贵方的识别确实很准所以一直开始以为是自己开发时项目中的bug

查了好久好久才定位处理

Richard.Ma · Richard.Ma

yangyuan 发表于 2017-2-14 11:35
已回复这个问题因为贵方的识别确实很准所以一直开始以为是自己开发时项目中的bug 查了好久好久才 ...

对你发给我的后一张图片做了测试，确实是这样子的，不好意思，刚才我是用.NET版本的demo来没有测出问题，因此才会问你语言类型。
在C语言的demo中，如果只启用中文，将英文取消的话，是可以得到正确的结果的，不会出现理理
我想这个应该是数字4的那个横线中空不连续，导致识别错误，使用方法上应该是没有什么问题的，这个还需要您再进行评估，
另外，这个引擎对.NET版本支持好一点，可能识别率会有提高，如果可以的话，您也可以进行考虑

yangyuan · yangyuan

Richard.Ma 发表于 2017-2-14 15:15
对你发给我的后一张图片做了测试，确实是这样子的，不好意思，刚才我是用.NET版本的demo来没有测出问题， ...

问题反馈
1  C:\LEADTOOLS 19\Shortcuts\OCR - MICR - ICR - OMR\.NET Class Libraries\Main OCR Demo
只用中文识别  还是会理.理
2 C:\LEADTOOLS 19\Shortcuts\OCR - MICR - ICR - OMR\C Windows API\OCR Professional
只用中文识别 4.4 成功

问题补充
同样是该图片  胆固醇三个字会识别为月日固醇估计是胆这个字被拆分识别了

Richard.Ma · Richard.Ma

yangyuan 发表于 2017-2-14 16:23
问题反馈
1 C:\LEADTOOLS 19\Shortcuts\OCR - MICR - ICR - OMR\.NET Class Libraries\Main OCR Demo
...

恩，确实是这样，应该是这个引擎本身存在的问题，对于这种稍微残缺的字符识别错误，识别率这块还是需要你来评估，但是也建议你从另一块考虑，提高图片的清晰度，以及改善字体笔画残缺和锯齿，识别引擎对这个比较敏感，会进行过多的识别导致错误

		自动登录	找回密码
密码			立即注册

[已处理] 一张图片识别出两种结果应该是引擎的问题

本帖子中包含更多资源

9 个回复

本帖子中包含更多资源

SpreadJS 认证

SpreadJS 高级认证

讲师达人

悬赏达人

[已处理] 一张图片 识别出两种结果 应该是引擎的问题

本帖子中包含更多资源

9 个回复

本帖子中包含更多资源

SpreadJS 认证

SpreadJS 高级认证

讲师达人

悬赏达人

[已处理] 一张图片识别出两种结果应该是引擎的问题