找回密码
 立即注册

QQ登录

只需一步,快速开始

zhuseeav

注册会员

9

主题

26

帖子

73

积分

注册会员

积分
73

活字格认证

[已处理] OCR表单识别

zhuseeav
注册会员   /  发表于:2017-11-14 13:22  /   查看:5062  /  回复:9
扫描的同样图像,用OCR制作的表单识别模板,在识别时仅能识别模板制作时使用的那张图片,其它图片用autoEngine.Run全返回空,不能识别,请指导。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x

9 个回复

倒序浏览
Richard.Ma讲师达人认证 悬赏达人认证 SpreadJS 开发认证
超级版主   /  发表于:2017-11-14 16:33:31
沙发
您好,您可以将对应的源码编译直接运行,另外我看到您待识别的图片里面实际上并不完全一样,有的模板是8行信息,待识别的有的是6行,有的是7行
回复 使用道具 举报
zhuseeav
注册会员   /  发表于:2017-11-14 16:46:20
板凳
本帖最后由 zhuseeav 于 2017-11-14 16:52 编辑

多行的是住所,这些不影响字段的行距和范围,多行字会变小成两行,我把dropOut="None" 改成 WordsDropout,
我把多行的住所不划区域,也一样   autoEngine.Run返回是null
用哪个图生成模板,哪个图就能识别,其它图不能识别

补充一下:
我把xml结构自己分析,把value bounds 里的范围解析后,载入图像加入区域,然后用OcrZone 、 IOcrPageCharacters对应的ocrPage.GetText方法就可以识别结果
回复 使用道具 举报
Richard.Ma讲师达人认证 悬赏达人认证 SpreadJS 开发认证
超级版主   /  发表于:2017-11-14 17:40:22
地板
本帖最后由 Richard.Ma 于 2017-11-14 17:41 编辑

我指的是信息项的多少,模板只有6个信息项
您可以使用示例图里的1.tif作为模板,来识别3,4 图片,应该就可以得到正确的结果了作为模板的图片,一定要只保留公用的信息,不要把特别的信息,以及杂点等保留进去


回复 使用道具 举报
zhuseeav
注册会员   /  发表于:2017-11-14 18:03:04
5#
我就是用DEMO中的CSMasterFormsEditor基于图片1制作的,就是只做其中一个数据项, CSFormsDemo只识别图片1,不识别其它图片。
反过来,用图片3制作,只识别图片3,不识别其它图片。
是不是还有其它设置?还是图片清晰度不够?
回复 使用道具 举报
Richard.Ma讲师达人认证 悬赏达人认证 SpreadJS 开发认证
超级版主   /  发表于:2017-11-15 13:32:09
6#
我把第一个tif文件做了一个模板您可以试试,这个是没有问题的

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复 使用道具 举报
zhuseeav
注册会员   /  发表于:2017-11-15 13:51:15
7#
这个在我这里也是这样,第一个tif可以识别出来,其它的都找不到表单。我晚一会儿找些用300dpi彩色试下
回复 使用道具 举报
Richard.Ma讲师达人认证 悬赏达人认证 SpreadJS 开发认证
超级版主   /  发表于:2017-11-15 16:08:41
8#
zhuseeav 发表于 2017-11-15 13:51
这个在我这里也是这样,第一个tif可以识别出来,其它的都找不到表单。我晚一会儿找些用300dpi彩色试下

好的,我是用SDK自带的演示程序来进行测试,3,4 都可以识别。您这边如果是自己写的程序,可以和演示程序对比一下代码
回复 使用道具 举报
zhuseeav
注册会员   /  发表于:2017-11-16 05:18:29
9#
我也是用自带的演示测试的,版本问题吗?
回复 使用道具 举报
Richard.Ma讲师达人认证 悬赏达人认证 SpreadJS 开发认证
超级版主   /  发表于:2017-11-16 12:30:11
10#
也有可能,最新版本您可以通过英文官方网站下载
https://www.leadtools.com/downloads

如果还有问题的话,您可以发送问题到这个邮箱,我们给您提供专门的选型售前服务
Richard.Ma@grapecity.com
回复 使用道具 举报
您需要登录后才可以回帖 登录 | 立即注册
返回顶部