找回密码
 注册
搜索
热搜: 超星 读书 找书
查看: 803|回复: 4

[【推荐】] Acrobat9的clearscan实例比对

[复制链接]
发表于 2010-3-17 16:43:24 | 显示全部楼层 |阅读模式
最近求助两本自扫书籍,获得tif后,自己经过图像处理等步骤制作成可搜索标注的pdf

第一本是用abbyy finereader来进行ocr的,中间ocr的效果不错,但是出现了莫名其妙的边距问题。

这次我特意装上了adobe acrobat 9专业版进行ocr
发现9多了clearscan ocr选项。实际使用起来效果不错

以下附件是几个对比页面
附件一是原图像pdf
附件二是 可搜索的图像(精确)的结果
附件三是 clearscan的结果

其中完整的文件大小对比是(500+页的pdf)

原pdf     可搜索      clearscan
73.7M      76.4M               23.6M

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?注册

×
回复

使用道具 举报

 楼主| 发表于 2010-3-17 16:44:22 | 显示全部楼层
从最后的阅读效果上来说,clearscan大部分情况下完胜image和可搜索图像,但是clearscan一旦遇到识别错误就比较麻烦,因为不带有原图
回复

使用道具 举报

发表于 2010-3-20 11:49:10 | 显示全部楼层
这个支持中文不?
回复

使用道具 举报

发表于 2010-3-20 13:03:22 | 显示全部楼层
根据gigapedia几个大牛的经验来看,acrobat prof. 9.0的clearscan慎用。原因是ocr不准确可能会导致最后的结果与原来图象差异很大,特别是那些有很多数学公式和图表的文档。这种错误具体原因不明,也不好有效地检测。
回复

使用道具 举报

 楼主| 发表于 2010-3-24 15:55:37 | 显示全部楼层
额,我测试了一本外文书 :Fuel Cell Fundamentals 和一本中文书:朱镕基答记者问
clearscan效果都很不错,只有Fuel Cell Fundamentals书的部分符号有问题(本身酒不是很清楚)

其他的问题没有发现,例如中文错字什么的
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|网上读书园地

GMT+8, 2024-5-4 15:13 , Processed in 0.343347 second(s), 5 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表