找回密码
 注册
搜索
热搜: 超星 读书 找书
楼主: wingdd

[【原创】] 全球首创!超星PDF页面标签批量导出神器正式发布!

[复制链接]
发表于 2025-5-25 19:19:35 | 显示全部楼层
成功提取了一个

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?注册

×
回复

使用道具 举报

发表于 2025-5-25 21:01:26 | 显示全部楼层
谢谢,不明觉厉
回复

使用道具 举报

发表于 2025-5-25 21:31:36 来自手机 | 显示全部楼层
感谢分享强软



回复

使用道具 举报

发表于 2025-5-26 01:02:09 | 显示全部楼层
不明觉厉,赞一赞
回复

使用道具 举报

发表于 2025-5-26 01:25:24 来自手机 | 显示全部楼层
dsarmf 发表于 2025-5-25 19:19
成功提取了一个

这样提取出来,感觉像页面与页码对应关系,后续怎么用呢?
回复

使用道具 举报

 楼主| 发表于 2025-5-26 04:03:41 | 显示全部楼层
MeiZone 发表于 2025-5-26 01:25
这样提取出来,感觉像页面与页码对应关系,后续怎么用呢?

这是一个中间辅助工具,因为有的pdf一个页面几张图片,安娜的最后一页的页码标签和读秀页码没有关系,就是英文的安娜档案馆。这个拆解pdf页面个图片没有固定的解决方案。还得靠自己手调。pdf补丁丁,可以导出所有图片,也可以导出按照页码合成的图片。这个页面拆封的选择交给使用者。


pdf补丁丁导出打开 你的pdf,选择导出图片,选择jpg图片无损合并为png,文件命名 文件掩码选择 000000,点击提取图片
这样,pdf的图片就提取到一个文件夹

接下来你的工作就是把对应关系 修改一下,利用正则表达式替换,生成重命名批处理脚本
比如你导出的文本是
  1. 000001        cov001.png
  2. 000002        fow001.png
  3. 000003        fow002.png
  4. 000004        fow003.png
  5. 000005        fow004.png
  6. 000006        fow005.png
  7. 000007        fow006.png
  8. 000008        fow007.png
  9. 000009        fow008.png
  10. 000010        fow009.png
  11. 000011        fow010.png
  12. 000012        fow011.png
  13. 000013        fow012.png
  14. 000014        !00001.png
  15. 000015        !00002.png
  16. 000016        !00003.png
  17. 000017        000001.png
  18. 000018        000002.png
  19. 000019        000003.png
  20. ...
  21. 000233        000217.png
  22. 000234        000218.png
  23. 000235        Anna’s Archive
复制代码


检查得知最后一页不是图片
使用emeditor打开文本文件,
把最后一行删除


打开搜索替换对话框,启用正则表达式
查找:
(.+)\t(.+)\.(png|jpg|pdg)
替换为:
ren "$1.png" "$2.pdg"

你就得到了
  1. ren "000001.png" "cov001.pdg"
  2. ren "000002.png" "fow001.pdg"
  3. ren "000003.png" "fow002.pdg"
  4. ren "000004.png" "fow003.pdg"
  5. ren "000005.png" "fow004.pdg"
  6. ren "000006.png" "fow005.pdg"
  7. ren "000007.png" "fow006.pdg"
  8. ren "000008.png" "fow007.pdg"
  9. ren "000009.png" "fow008.pdg"
  10. ren "000010.png" "fow009.pdg"
  11. ren "000011.png" "fow010.pdg"
  12. ren "000012.png" "fow011.pdg"
  13. ren "000013.png" "fow012.pdg"
  14. ren "000014.png" "!00001.pdg"
  15. ren "000015.png" "!00002.pdg"
  16. ren "000016.png" "!00003.pdg"
  17. ren "000017.png" "000001.pdg"
  18. ren "000018.png" "000002.pdg"
  19. ren "000019.png" "000003.pdg"
  20. ...
  21. ren "000234.png" "000218.pdg"
复制代码



另存为 1.bat 到图片文件夹
1.bat 保存的时候选择 编码 (系统默认 936 gb2312),换行符 (CR+LF Windows)
执行批处理文件1.bat

安娜档案馆的读秀图书就可以还原成pdg了。


具体的正则表达式还要根据实际情况修改
像下面这种的 fow001.000 fow001.001是多余的拆分图,fow001.png是合成图

  1. 000001        cov001.jpg
  2. 000002        cov002.jpg
  3. 000003        bok001.jpg
  4. 000004        leg001.png
  5. 000005        fow001.000
  6. 000006        fow001.001
  7. 000007        fow001.png
  8. 000008        fow002.000
  9. 000009        fow002.001
  10. 000010        fow002.png
  11. 000011        fow003.000
  12. 000012        fow003.001
  13. 000013        fow003.png
  14. 000014        fow004.000
  15. 000015        fow004.001
复制代码



在重命名替换前,需要 搜索
查找:
(.+)\t(.+)\.(\d{3})
替换为:空白
这样就清除了多余的图片

评分

1

查看全部评分

回复

使用道具 举报

发表于 2025-5-26 07:32:12 | 显示全部楼层
感觉命令行都是很厉害的样子
回复

使用道具 举报

发表于 2025-5-26 08:38:23 | 显示全部楼层
还是搞个gui吧,还是有很多人只会双击运行,不知道去cmd里面。
而且还有输入代码和文件名,挺费劲的。
回复

使用道具 举报

发表于 2025-5-26 08:40:20 | 显示全部楼层
我平时是用pdf xchange editor调页面标签,一本一核比较稳妥。

这个软件看起来要复杂些(?)
回复

使用道具 举报

发表于 2025-5-26 10:05:52 | 显示全部楼层
好像很厉害的样子
回复

使用道具 举报

发表于 2025-5-26 11:04:29 | 显示全部楼层
牛!必须买!
回复

使用道具 举报

发表于 2025-5-26 11:12:18 | 显示全部楼层
wingdd 发表于 2025-5-24 16:52
进入cmd环境

cd /d D:\ebook\pdf目录

收藏备用,很实用的工具。
回复

使用道具 举报

发表于 2025-5-26 11:52:39 | 显示全部楼层
大帅哥 支持
回复

使用道具 举报

发表于 2025-5-26 13:54:13 | 显示全部楼层
不知道干吗,先下了再说
回复

使用道具 举报

发表于 2025-5-26 17:03:18 | 显示全部楼层
支持一波!
回复

使用道具 举报

发表于 2025-5-26 17:45:03 | 显示全部楼层
wingdd 发表于 2025-5-26 04:03
这是一个中间辅助工具,因为有的pdf一个页面几张图片,安娜的最后一页的页码标签和读秀页码没有关系,就 ...

命令行,正则表达式,又要好好学习一番了,每天学习新东西,感觉自己还不太老。哪天不想学了,或者学不动了,就是真的老了。


谢谢楼主悉心解惑。





回复

使用道具 举报

发表于 2025-5-26 20:31:05 | 显示全部楼层
导出结果为标准TSV,每一行精准对应PDF页码与标签
回复

使用道具 举报

发表于 2025-5-27 11:52:22 | 显示全部楼层
感觉很厉害的样子!
回复

使用道具 举报

发表于 2025-5-27 14:18:53 | 显示全部楼层
这么好的软件,先收藏起来
回复

使用道具 举报

发表于 2025-5-28 17:41:26 来自手机 | 显示全部楼层
看起来不错的样子
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|网上读书园地

GMT+8, 2026-3-14 10:07 , Processed in 0.087407 second(s), 4 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表