找回密码
 注册
搜索
热搜: 超星 读书 找书
查看: 2510|回复: 41

[【其它】] 发现一个ocr的神奇软件

[复制链接]
发表于 2017-5-3 21:29:56 | 显示全部楼层 |阅读模式
本帖最后由 闲云青林 于 2017-5-6 11:23 编辑

版面还原 可修改字库 300页图书ocr只要5分钟 简体识别率比ABByy高
居然软件安装完毕30m
除了繁体ocr一堆乱码外完美了
软件是佳能RosettaStone  网上有下载

评分

2

查看全部评分

回复

使用道具 举报

发表于 2017-5-3 22:08:15 | 显示全部楼层
比ABByy高???
回复

使用道具 举报

发表于 2017-5-4 15:08:01 | 显示全部楼层
是甚麼軟體,何以沒有交代。我猜不能夠超越過ABBYY。
回复

使用道具 举报

发表于 2017-5-4 18:07:29 | 显示全部楼层
abbyy应该是最好的吧,我用过的其他ocr没有比他好的
回复

使用道具 举报

发表于 2017-5-5 00:15:27 | 显示全部楼层
本帖最后由 ywb_jerry 于 2017-5-5 00:17 编辑

就理论上的识别率来说,感觉知网那个软件简体中文是最好的。能到95%以上,你可以用它打开并ocrPDF文档,虽然我并不知道后面保存什么的要怎么办。
因为知网论文作为样本扫描pdf的质量还是可以的,所以ocr起来很顺,自己不需要再动手校错。
我用的是很老的软件版本,不是最新的。

Adobe Pro和Abbyy的识别率都略次之,大概到80%,再往上走就不行了,也许跟软件内置的汉语字体库有关。Adobe会有一些比较神奇的识别而且是批量性的错误,比如——“破折号”识别成一 一或者相反。
我原来动过心思用Adobe pro先ocr出来文字底本,然后修改精校,后面发现劳动量太大,跟翻译挑错差不多性质,但是如果用知网那个caj什么的,感觉应该会轻松很多,只是没坚持几个。
Abbyy的汉语也是,真心不要指望,它唯一的好处保留格式也会直接出现排版上的问题,如果没有word排版经验,你改它识别错误的地方,玩起来会很累。
理论上说起来其实并不复杂,复杂的是,书本身的扫描情况,灰度,清晰度这些。每本书都可能不一样,所以会导致理论识别率的降低。
回复

使用道具 举报

发表于 2017-5-5 00:20:52 | 显示全部楼层
ywb_jerry 发表于 2017-5-5 00:15
就理论上的识别率来说,感觉知网那个软件简体中文是最好的。能到95%以上,你可以用它打开并ocrPDF文档,虽 ...

请问知网哪个软件?谢谢

点评

记性不好,也很久没用了,cajviewer,楼下也提示了  发表于 2017-5-5 13:37
回复

使用道具 举报

发表于 2017-5-5 06:46:17 | 显示全部楼层
既然说的是老软件,应该是caj浏览器吧。
回复

使用道具 举报

发表于 2017-5-5 07:50:34 | 显示全部楼层
说了半截话,不公布答案,到底是什么软件,要说用的多又小,那就是caj了
回复

使用道具 举报

发表于 2017-5-5 09:13:48 | 显示全部楼层
随着机器深度学习的发展,机器识别越来越强大,自己可以用cntk和TensorFlow等深度学习库自行开发,效果都超过人眼的识别率了!不过电脑需要GTX1070以上的显卡,amd的显卡不支持。
回复

使用道具 举报

 楼主| 发表于 2017-5-5 12:36:21 来自手机 | 显示全部楼层
wjmnsx 发表于 2017-5-5 07:50
说了半截话,不公布答案,到底是什么软件,要说用的多又小,那就是caj了

你眼神不好 软件名字我说了
回复

使用道具 举报

 楼主| 发表于 2017-5-5 12:37:32 来自手机 | 显示全部楼层
eeeeee 发表于 2017-5-5 09:13
随着机器深度学习的发展,机器识别越来越强大,自己可以用cntk和TensorFlow等深度学习库自行开发,效果都超 ...

你这逼装大了  那验证码做的乱七八糟的还有意义?
回复

使用道具 举报

发表于 2017-5-5 12:50:03 | 显示全部楼层
佳能ocr?不能再具体点?
回复

使用道具 举报

发表于 2017-5-5 13:00:44 | 显示全部楼层
路过学习下,以备以后有ocr这样的需求
回复

使用道具 举报

发表于 2017-5-5 14:13:00 | 显示全部楼层
学习了
回复

使用道具 举报

发表于 2017-5-5 15:29:36 | 显示全部楼层
没想到佳能这么强。
顺便,abbyy的2014版比2012版强很多。
回复

使用道具 举报

 楼主| 发表于 2017-5-5 19:06:16 来自手机 | 显示全部楼层
zuoning 发表于 2017-5-5 15:29
没想到佳能这么强。
顺便,abbyy的2014版比2012版强很多。

你用过abbyy2014了?11 12ocr简体中文都有缺字缺标点   ocr繁体识别率个别字不如汉王pdf  当然汉王pdf是免费版 故意把识别率降低的
回复

使用道具 举报

发表于 2017-5-5 21:04:09 | 显示全部楼层
学习了  cnki没看过
回复

使用道具 举报

发表于 2017-5-5 22:56:00 | 显示全部楼层
ywb_jerry 发表于 2017-5-5 00:15
就理论上的识别率来说,感觉知网那个软件简体中文是最好的。能到95%以上,你可以用它打开并ocrPDF文档,虽 ...

知网的是什么软件呀
回复

使用道具 举报

发表于 2017-5-5 23:34:55 | 显示全部楼层
看来ABBYY公司要关门了。。。
回复

使用道具 举报

发表于 2017-5-6 08:24:25 | 显示全部楼层
楼主推荐的软件下载尝下鲜!
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|网上读书园地

GMT+8, 2024-4-26 10:36 , Processed in 0.489975 second(s), 10 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表