Acrobat9的clearscan实例比对

coolspace · 发表于 2010-3-17 16:43:24

最近求助两本自扫书籍，获得tif后，自己经过图像处理等步骤制作成可搜索标注的pdf

第一本是用abbyy finereader来进行ocr的，中间ocr的效果不错，但是出现了莫名其妙的边距问题。

这次我特意装上了adobe acrobat 9专业版进行ocr
发现9多了clearscan ocr选项。实际使用起来效果不错

以下附件是几个对比页面
附件一是原图像pdf
附件二是可搜索的图像(精确)的结果
附件三是 clearscan的结果

其中完整的文件大小对比是(500+页的pdf)

原pdf 可搜索 clearscan
73.7M 76.4M 23.6M

coolspace · 发表于 2010-3-17 16:44:22

从最后的阅读效果上来说，clearscan大部分情况下完胜image和可搜索图像，但是clearscan一旦遇到识别错误就比较麻烦，因为不带有原图

estd_ray · 发表于 2010-3-20 11:49:10

这个支持中文不？

星星之火 · 发表于 2010-3-20 13:03:22

根据gigapedia几个大牛的经验来看,acrobat prof. 9.0的clearscan慎用。原因是ocr不准确可能会导致最后的结果与原来图象差异很大，特别是那些有很多数学公式和图表的文档。这种错误具体原因不明，也不好有效地检测。

coolspace · 发表于 2010-3-24 15:55:37

额，我测试了一本外文书：Fuel Cell Fundamentals 和一本中文书：朱镕基答记者问
clearscan效果都很不错，只有Fuel Cell Fundamentals书的部分符号有问题(本身酒不是很清楚)

其他的问题没有发现，例如中文错字什么的

		自动登录	找回密码
密码			注册

[【推荐】] Acrobat9的clearscan实例比对

本帖子中包含更多资源