找回密码
 注册
搜索
热搜: 超星 读书 找书
查看: 11979|回复: 44

关于超星全息文本图书的几个问题

[复制链接]
qdlsy 该用户已被删除
发表于 2005-4-6 12:57:43 | 显示全部楼层 |阅读模式
超星主站的全息文本图书,好多人都提出来不能看,能看的好多不能下载,其实超星全息文本图书和普通的书是一样的,只是阅读已经众所周知,需要3.8版本阅览器,至于下载,有的能下,有的不能下,也是收不收费的问题。超星书能看就能下好像也成了一种默认,只是技巧而已了!
      超星主站的全息文本图书,其实就是PDF文件,而且多数还是用汉王OCR得到的,超星对这些PDF用自己的格式(PDG)进行了重新封装,也就是说,PDF + 超星算法 = PDG文件了,如果能够找到它的算法,并对全息文本型PDG进行逆算法转换,是完全可以得到标标准准的PDF文件的。
      超星阅览器在阅读全息文本图书时,每读一页,就要解码当前页前后的几页,据我观察,一般是解码6页,前2后3,但也不尽相同,这可能是为了提高阅读时的速度吧!对全息文本图书的打印,和Apabi一样,是作为图像来处理的,所以打出来的文件体积变得很大,但是它的打印(在线)是有限制的,一本书打出来会有好多空白页,同一本书每次打印产生的空白页位置是相同的,在开头的附加页好像找不出什么规律,但后面正文页是每隔几页就产生一(几)页空白页,严重的每隔一页就产生几页空白页,这种空白页的产生好像是随机的。
      附件是我从PDG文件中提取的PDF文件,方法很烦,如果能得到编程高手的帮助,我想搞定超星的全息文本图书应该不远了!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?注册

×
回复

使用道具 举报

发表于 2005-4-6 13:40:30 | 显示全部楼层
qdlsy又要去给超星唱戏了?其实得到的是pdf还是pdg不重要,关键是把它下载下来,如果能够下载下来,我个人觉得pdg可能还好一点吧,我总觉得不过期而超星又能够读的情况下就没有必要去转换为pdf。

我已经发现文本书里面有错字、别字、漏字,还有超星ocr原版后出来的文本里面“超星员工”懒得打或者他们打不出来的比较怪的字被空着。看来文本书不能完全忠实于原著原版。目前我还不喜欢文本图书。
回复

使用道具 举报

发表于 2005-4-6 14:07:55 | 显示全部楼层
那看来文本书没啥价值啊,既然能下,也不用太折腾了吧.
回复

使用道具 举报

发表于 2005-4-6 14:22:21 | 显示全部楼层
下面是引用zhuce2003于2005-04-06 13:40发表的:
  qdlsy又要去给超星唱戏了?其实得到的是pdf还是pdg不重要,关键是把它下载下来,如果能够下载下来,我个人觉得pdg可能还好一点吧,我总觉得不过期而超星又能够读的情况下就没有必要去转换为pdf。

我已经发现文本书里面有错字、别字、漏字,还有超星ocr原版后出来的文本里面“超星员工”懒得打或者他们打不出来的比较怪的字被空着。看来文本书不能完全忠实于原著原版。目前我还不喜欢文本图书。
下载不是难事吧?
超星现在还没聪明到那种程度
回复

使用道具 举报

发表于 2005-4-6 14:32:29 | 显示全部楼层
下面是引用raogy于2005-04-06 14:22发表的:

下载不是难事吧?
超星现在还没聪明到那种程度
1.下载当然不是难事,和下载普通pdg书没有什么两样。即使什么手段都失灵,起码还有你那个“乖乖”工具可以给超星最后一击啊。哈哈。

2.我同意zhishi管理员的话,能够下载就不用去折腾它了。我一直坚持一个原则:能够下载而不过期的书绝不打印为pdf。我相信打印后总不可能有原样清晰的,任何的打印应该都是变相拷贝原样一次,理论上拷贝的东西都不可能有原样的清晰。

3.当然,下载后要过期的我就不会去下载它的:)

4.raogy还是抽点时间把你那个“乖乖”工具再折腾一下,把它折腾的没有现在那个bug。
回复

使用道具 举报

发表于 2005-4-6 14:35:22 | 显示全部楼层
下面是引用zhishi于2005-04-06 14:07发表的:
那看来文本书没啥价值啊,既然能下,也不用太折腾了吧.

还是普通pdg图书好,绝对忠实于原版原著。哈哈。
回复

使用道具 举报

发表于 2005-4-6 14:42:59 | 显示全部楼层
我同意楼上的意见,这种书还是要终于原版的.所以自己转txt也不是个好主意,除非是小说之类的,可是小说之类的也不必到CX看,别处也有很多的,还方便.
回复

使用道具 举报

发表于 2005-4-6 14:53:52 | 显示全部楼层
嘿嘿,我一般是转成djvu
用bx先转成图片
djvu的图像处理能力似乎无人能及
回复

使用道具 举报

发表于 2005-4-6 14:57:02 | 显示全部楼层
下面是引用zhishi于2005-04-06 14:42发表的:
我同意楼上的意见,这种书还是要终于原版的.所以自己转txt也不是个好主意,除非是小说之类的,可是小说之类的也不必到CX看,别处也有很多的,还方便.

是的,除了小说之类的可以不严格要求忠实于原版原著外(小说就仅仅阅读而已,不会被引用,即使引用一般也不会要求注出原版页码和出版社、出版日期的),其他书都应该要求完全忠实于原版原著,否则就不好使用,起码不方便引用,下载超星书无非就是免了去图书馆核对原文和页码以及版权页那些东西,如果不能完全忠实于原版原著,起码我是不愿意要那样的书的。

小说之类在我看来没有必要去超星下载下来啊,小说随便找一个什么图书馆里面都很容易找到。
回复

使用道具 举报

qdlsy 该用户已被删除
 楼主| 发表于 2005-4-6 14:59:34 | 显示全部楼层
其实各位说得都不错,我也说了,全息文本图书实际上就是PDF文件,而且多数还是用汉王OCR得到的,超星对这些PDF用自己的格式(PDG)进行了重新封装,按Cracker的说法,相当于对PDF加了一层壳,如果你能把这壳脱了,你就是老大了! 但是由于它的文本图书多数是由OCR得到的,所以就像注册兄说的那样,错字、别字、漏字偏多就在所难免了。至于过不过期还不知道,不过我想既然已经封装成超星格式的了,应该和普通PDG文件一样,过期的事也会发生的。还说一句,个人认为PDF格式较为普遍,如果能从全息文本图书中提取PDF文件出来还是值得的,因为经过超星重新封装,毕竟增加了文件的体积了!
回复

使用道具 举报

发表于 2005-4-6 15:09:03 | 显示全部楼层
to qdlsy:
1.能够做到下载普通pdg图书不过期那么也同样可以做到下载文本图书不过期啊。

2.转换不转换为其他格式确实是个人喜好的问题,但从使用的方便和不费时间去搞那些转换来考虑,我个人还是认为能够下载下来而不过期的都没有必要去转换。raogy转换为djvu,体积是变小了,但清晰度也不可能比在超星里面高。而且你那样转换太费时间,先转换bmp再转换为djvu,哈哈,我是不愿意花那些时间的。

3.现在硬盘那么大,还怕超星书它多占几个g的空间吗。哈哈,反正我是不怕它多占几个g的空间的。所以我从来不为了体积变小而转换pdg为其他格式。
回复

使用道具 举报

发表于 2005-4-6 15:22:20 | 显示全部楼层
下面是引用qdlsy于2005-04-06 14:59发表的:
其实各位说得都不错,我也说了,全息文本图书实际上就是PDF文件,而且多数还是用汉王OCR得到的,超星对这些PDF用自己的格式(PDG)进行了重新封装,按Cracker的说法,相当于对PDF加了一层壳,如果你能把这壳脱了,你就是老大了!

哈哈,你已经脱掉那层壳啊,说明你已经是“老大”。
回复

使用道具 举报

qdlsy 该用户已被删除
 楼主| 发表于 2005-4-6 16:14:26 | 显示全部楼层
下面是引用coolman于2005-04-06 15:31发表的:
我很感兴趣的啦. 你既然能提取出来,编程应该不难吧.

其实也没什么技巧,它在打开PDG文件时能够在内存中找到完整的PDF格式文件,而且进而发现超星格式的PDG一页对应6页PDF(比如超星页码为1_6.pdg ,7_6.pdg 这样连续两页转换成PDF则是6+6=12页),内存中的PDF以%%PDF开始,以%%EOF结束,但%%EOF好像有时不止一个。我知道的就是这些了,现在就请coolman出手吧!
回复

使用道具 举报

发表于 2005-4-6 17:27:57 | 显示全部楼层
下面是引用zhuce2003于2005-04-06 13:40发表的:
  qdlsy又要去给超星唱戏了?其实得到的是pdf还是pdg不重要,关键是把它下载下来,如果能够下载下来,我个人觉得pdg可能还好一点吧,我总觉得不过期而超星又能够读的情况下就没有必要去转换为pdf。

我已经发现文本书里面有错字、别字、漏字,还有超星ocr原版后出来的文本里面“超星员工”懒得打或者他们打不出来的比较怪的字被空着。看来文本书不能完全忠实于原著原版。目前我还不喜欢文本图书。

我也喜欢pdg。我喜欢ssreader书这样放着。关于小说的书,我不会费时间转化pdf。
小说在非超星的图书馆也不少,而且新书比较多。“乖乖”工具我还没有看。楼上几位老师的讨论很精彩,我也来冒个泡。
回复

使用道具 举报

发表于 2005-4-6 17:42:14 | 显示全部楼层
这融融,现在怎么突然一下子见人就叫“老师”阿,看来上面各位需要反过来叫一声“融融老师”了,哈哈。
回复

使用道具 举报

发表于 2005-4-6 20:46:11 | 显示全部楼层
下面是引用raogy于2005-04-06 14:22发表的:

超星现在还没聪明到那种程度

"那种程度"指的是抵御“乖乖”工具的下载吗?
回复

使用道具 举报

发表于 2005-4-7 10:06:27 | 显示全部楼层
是不是可以调用pdg2.dll的某个函数来转成pdf呢?
回复

使用道具 举报

发表于 2005-4-7 10:14:00 | 显示全部楼层
下面是引用flyfox于2005-04-07 10:06发表的:
是不是可以调用pdg2.dll的某个函数来转成pdf呢?
下面是引用zhishi于2005-04-06 14:07发表的:
既然能下,也不用太折腾了吧.
回复

使用道具 举报

发表于 2005-4-7 14:14:33 | 显示全部楼层
下面是引用zhuce2003于2005-04-06 20:46发表的:


"那种程度"指的是抵御“乖乖”工具的下载吗?
游客,本帖隐藏的内容需要积分高于 150 才可浏览,您当前积分为 0

这里没星探吧?
回复

使用道具 举报

qdlsy 该用户已被删除
 楼主| 发表于 2005-4-7 18:40:04 | 显示全部楼层
下面是引用flyfox于2005-04-07 10:06发表的:
是不是可以调用pdg2.dll的某个函数来转成pdf呢?

flyfox兄的想法不错,不过应该是你搞过的那个pdgview文件里的某个函数,能不能成就要看Coolman兄和你了   
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|网上读书园地

GMT+8, 2026-3-15 06:37 , Processed in 0.093700 second(s), 6 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表