找回密码
 注册
搜索
热搜: 超星 读书 找书
查看: 2639|回复: 4

[【其它】] 晕!奥国懒人电子化图书

[复制链接]
发表于 2007-8-6 12:01:26 | 显示全部楼层 |阅读模式
网站名称:Austrian Literature Online(奥地利文学在线,ALO)
旧地址:http://alo.uibk.ac.at/webinterface/library
新地址:http://c108-dig24.uibk.ac.at:9090/aloWeb/default.alo
病症:这样残疾的扫描图片,OCR是绝对不可能的



例图原始位置:
http://alo.uibk.ac.at/webinterfa ... amp;zoom=3&ocr=

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?注册

×
回复

使用道具 举报

发表于 2007-8-8 14:57:33 | 显示全部楼层
想必是拍出来的,我以前拍的书,也存在这个问题,不过,我一直想知道,如何把背景设成纯色,或透明色
回复

使用道具 举报

 楼主| 发表于 2007-8-8 16:21:19 | 显示全部楼层
引用第1楼valery于2007-08-08 14:57发表的 :
想必是拍出来的,我以前拍的书,也存在这个问题,不过,我一直想知道,如何把背景设成纯色,或透明色
傻也见过翻拍的古书——手套在画面上都能够看到,但人家最终制作成的电子版,手套也没有了,倾斜也校正了,文字也OCR了(当然错误也是很多)。
想对扫描的图书进行处理,这个软件不错:

http://www.cadal.cn/softdown/scanfix.rar
由印度提供的图像处理软件,具有强大的图像处理功能,下载后解压缩安装,即可进行图像处理。
需要注意的是:一,输入需要TIFF格式;二,彩色的压缩后基本就费啦;三,Dasha用这个软件压缩过总谱,也惨不忍睹。
Dasha的专业制图的朋友是用Photoshop调整“阀值”,但最终文件还是不如这个软件压缩得高。
回复

使用道具 举报

发表于 2007-8-8 20:38:29 | 显示全部楼层
嗯,倾斜可以校正,至于OCR也应该是相当简单。中文的的OCR一般图片的正确识别都可以达到90%以上,何况只是有区区几十个字母的外文呢。
回复

使用道具 举报

发表于 2007-8-9 02:19:06 | 显示全部楼层
引用第1楼valery于2007-08-08 14:57发表的 :
想必是拍出来的,我以前拍的书,也存在这个问题,不过,我一直想知道,如何把背景设成纯色,或透明色

一般来说,可以用ACDSee将图片由彩色转为灰度。即可达到你的要求。

如果想再好的效果,试着减少颜色数量就可以。

至于透明色,需要用Gif的格式,大多数编辑Gif的软件都有设置透明色的功能。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|网上读书园地

GMT+8, 2024-6-6 16:09 , Processed in 0.380466 second(s), 5 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表