TIF文件转双层PDF时内存不足

收藏

我笔记本电脑配置有4GB 的内存 i3的CPU 这样配置的电脑代码在运行过程中 10页以内的TIF文件转换PDF文件基本都正常，当出现20页以上的时候 PDF文档有就会抛出异常，提示 Not enough memory for this memory Operation。(前提是我的TIF文件是300分辨率的，幅面都是在A3左右，我是把多个的单页的TIF文件转换成一个PDF文件)。

                              IOcrEngine _ocrEngine = OcrEngineManager.CreateEngine(OcrEngineType.Professional, false);
                              // 启动OCR引擎
                              _ocrEngine.Startup(null, null, null, Path.Combine(Application.StartupPath, "OcrProfessionalRuntime"));
                              // 创建文档
                              IOcrDocument _ocrDocument = _ocrEngine.DocumentManager.CreateDocument();
                              _ocrEngine.LanguageManager.EnableLanguages(new string[] { "zh-Hans", "en" });
                              // 启用拼写检查系统，并将英文设置为拼写语言
                              _ocrEngine.SpellCheckManager.SpellCheckEngine = OcrSpellCheckEngine.Native;
                              _ocrEngine.SpellCheckManager.SpellLanguage = "en";
                              foreach (string fileName in ArrFilepath)
                              {
                                 Application.DoEvents();
                                 if (!File.Exists(fileName)) return;
                                 _ocrDocument.Pages.AddPage(fileName, null);
                              }
                              Application.DoEvents();
                              // 识别所有页面
                              // 注意，我们不需要调用AutoZone，引擎会检查页面是否被分区，若无，则会自动分区
                              _ocrDocument.Pages.Recognize(null);
                              PdfDocumentOptions pdfs = _ocrDocument.DocumentWriterInstance.GetOptions(DocumentFormat.Pdf) as PdfDocumentOptions;
                              pdfs.ImageOverText = true;//图像与文字双层PDF
                              pdfs.PageRestriction = DocumentPageRestriction.Relaxed;
                              switch (this.cbDocumntType.Text)
                              {
                                 case "PDF": pdfs.DocumentType = PdfDocumentType.Pdf; break;
                                 case "PDF/A": pdfs.DocumentType = PdfDocumentType.PdfA; break;
                                 case "PDF12": pdfs.DocumentType = PdfDocumentType.Pdf12; break;
                                 case "PDF13": pdfs.DocumentType = PdfDocumentType.Pdf13; break;
                                 case "PDF15": pdfs.DocumentType = PdfDocumentType.Pdf15; break;
                                 case "PDF16": pdfs.DocumentType = PdfDocumentType.Pdf16; break;
                              }
                              _ocrDocument.DocumentWriterInstance.SetOptions(DocumentFormat.Pdf, pdfs);
                              _ocrDocument.Save(strSavePDFPath, DocumentFormat.Pdf, null);
                              Application.DoEvents();
                              // 释放此文档
                              _ocrDocument.Dispose();
                              // 关闭OCR引擎
                              _ocrEngine.Shutdown();
                              GC.Collect();

caihuamao520 · caihuamao520

谁有遇到类似的问题吗？要怎么解决这个问题！着急啊！

gw0506 · gw0506

这个可能没什么好办法了，就是内存不够。

caihuamao520 · caihuamao520

那我加大内存可以解决这个问题吗，还是要怎么操作。还是说控件支持不了那么大的幅面

gw0506 · gw0506

控件不会限制文件尺寸，控件就是本质就是算法而已。加内存应该可以。

caihuamao520 · caihuamao520

哦好的。哪有多个双层PDF合并成一个双层PDF的代码，或例子吗

caihuamao520 · caihuamao520

gw0506 发表于 2016-11-10 10:26
控件不会限制文件尺寸，控件就是本质就是算法而已。加内存应该可以。

哦好的。哪有多个双层PDF合并成一个双层PDF的代码，或例子吗

gw0506 · gw0506

caihuamao520 发表于 2016-11-10 12:36
哦好的。哪有多个双层PDF合并成一个双层PDF的代码，或例子吗

可能没有现成的例子。
另外，我不太明白双层PDF指的是什么？

caihuamao520 · caihuamao520

双层PDF 简单的说，指将纸质档案通过扫描仪快速录入后，经过去污、纠偏和OCR识别，然后可以直接生成可以检索的PDF文件。这个PDF文件是双层的，上层是原始图像，下层是识别结果。

gw0506 · gw0506

感谢指教，我也找了一些资料，了解了。

LeadTools再处理图像，进行OCR这些功能都可以满足，不过最终如何生成双层PDF没有Demo，还得请您动手评估一下。

		自动登录	找回密码
密码			立即注册

[保留处理] TIF文件转双层PDF时内存不足

25 个回复

活字格认证

[保留处理] TIF文件转双层PDF时 内存不足

25 个回复

活字格认证

[保留处理] TIF文件转双层PDF时内存不足