找回密码
 立即注册

QQ登录

只需一步,快速开始

yangyuan

注册会员

11

主题

28

帖子

109

积分

注册会员

积分
109
yangyuan
注册会员   /  发表于:2017-2-13 22:51  /   查看:4352  /  回复:9
本帖最后由 yangyuan 于 2017-3-13 17:53 编辑

开发中遇到的  以为是我们代码的问题  后来直接用识别的工具还是会这样   

1   一张图片jpg格式的

上图是 识别的正确的 4.4  识别为4.4

2 同样的jpg格式 下图 4.4 识别为理.理   
下图的获得过程 :  用画图格式 获得 上图  截取其中部分另存为下图  没有修改尺寸 按截取部分的尺寸直接保存  格式为JPG  
该bug重复概率100%    只是把图片切出来识别  就会出现该情况  貌似很严重





本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x

9 个回复

倒序浏览
Richard.Ma讲师达人认证 悬赏达人认证 SpreadJS 开发认证
超级版主   /  发表于:2017-2-14 09:54:54
沙发
你好,这个应该是手动选择识别区域的问题吧,如果自动选择区域,应该会识别页面所有的东西的
回复 使用道具 举报
yangyuan
注册会员   /  发表于:2017-2-14 11:19:17
板凳
Richard.Ma 发表于 2017-2-14 09:54
你好,这个应该是手动选择识别区域的问题吧,如果自动选择区域,应该会识别页面所有的东西的

问题是就需要手动框区域识别啊  不然怎么把识别的结果分门别类 对不对?
而且 同样的图片 裁剪一下  同样框中的范围识别结果就不一样   不能吧?  用贵方的工具 但是该情况如果无法解决 或者贵方无法提供解决思路(不能说自动识别就解决了哦) 那么我方在使用中会不断出现该情况。。。
回复 使用道具 举报
yangyuan
注册会员   /  发表于:2017-2-14 11:20:45
地板
现在发现的 就是"4"这个数字 在裁剪后的图片中 出现识别为"理"的情况
回复 使用道具 举报
Richard.Ma讲师达人认证 悬赏达人认证 SpreadJS 开发认证
超级版主   /  发表于:2017-2-14 11:30:56
5#
yangyuan 发表于 2017-2-14 11:19
问题是就需要手动框区域识别啊  不然怎么把识别的结果分门别类 对不对?
而且 同样的图片 裁剪一下  同 ...

并不是说这个意思,因为对一般的客户来说基本上是用自动区域识别的,你能不能提供一下识别为“理”的裁剪后的图片,因为我这边裁剪后没有复现出这个问题,另外 使用的demo是C语言的么
回复 使用道具 举报
yangyuan
注册会员   /  发表于:2017-2-14 11:33:24
6#
OCR - MICR - ICR - OMR\C Windows API\OCR Professional  用的是这个

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复 使用道具 举报
yangyuan
注册会员   /  发表于:2017-2-14 11:35:30
7#
Richard.Ma 发表于 2017-2-14 11:30
并不是说这个意思,因为对一般的客户来说基本上是用自动区域识别的,你能不能提供一下识别为“理”的裁剪 ...

已回复  这个问题 因为贵方的识别确实很准 所以一直开始以为是自己开发时项目中的bug 查了好久好久 才定位处理
回复 使用道具 举报
Richard.Ma讲师达人认证 悬赏达人认证 SpreadJS 开发认证
超级版主   /  发表于:2017-2-14 15:15:51
8#
yangyuan 发表于 2017-2-14 11:35
已回复  这个问题 因为贵方的识别确实很准 所以一直开始以为是自己开发时项目中的bug 查了好久好久 才 ...

对你发给我的后一张图片做了测试,确实是这样子的,不好意思,刚才我是用.NET版本的demo来没有测出问题,因此才会问你语言类型。
在C语言的demo中,如果只启用中文,将英文取消的话,是可以得到正确的结果的,不会出现理理
我想这个应该是数字4的那个横线中空不连续,导致识别错误,使用方法上应该是没有什么问题的,这个还需要您再进行评估,
另外,这个引擎对.NET版本支持好一点,可能识别率会有提高,如果可以的话,您也可以进行考虑
回复 使用道具 举报
yangyuan
注册会员   /  发表于:2017-2-14 16:23:50
9#
Richard.Ma 发表于 2017-2-14 15:15
对你发给我的后一张图片做了测试,确实是这样子的,不好意思,刚才我是用.NET版本的demo来没有测出问题, ...

问题反馈
1  C:\LEADTOOLS 19\Shortcuts\OCR - MICR - ICR - OMR\.NET Class Libraries\Main OCR Demo
只用中文识别  还是会理.理
2 C:\LEADTOOLS 19\Shortcuts\OCR - MICR - ICR - OMR\C Windows API\OCR Professional
只用中文识别 4.4 成功

问题补充
同样是该图片  胆固醇三个字 会识别为 月日固醇   估计是胆 这个字被拆分识别了
回复 使用道具 举报
Richard.Ma讲师达人认证 悬赏达人认证 SpreadJS 开发认证
超级版主   /  发表于:2017-2-14 16:46:23
10#
yangyuan 发表于 2017-2-14 16:23
问题反馈
1  C:\LEADTOOLS 19\Shortcuts\OCR - MICR - ICR - OMR\.NET Class Libraries\Main OCR Demo
...

恩,确实是这样,应该是这个引擎本身存在的问题,对于这种稍微残缺的字符识别错误,识别率这块还是需要你来评估,但是也建议你从另一块考虑,提高图片的清晰度,以及改善字体笔画残缺和锯齿,识别引擎对这个比较敏感,会进行过多的识别导致错误
回复 使用道具 举报
您需要登录后才可以回帖 登录 | 立即注册
返回顶部