引用第59楼stonewang于2009-12-18 23:02发表的 : 支持****年**月**日格式。 请问killl版: 1、公元前的如何处理? .......
使用道具 举报
引用第58楼killl于2009-12-18 22:51发表的 : 一切可以商量,按照整理时最简单的方法来。 如何最省事就如何做。 .......
您需要 登录 才可以下载或查看,没有账号?注册
引用第61楼stonewang于2009-12-18 23:58发表的 : killl说得极是。相关原则在整理前必须明确下来,以免重复劳动。
引用第62楼shunu于2009-12-19 01:45发表的 : 感谢kill版主如此体谅。 6月21日的数据不知道为什么提取保存后有错误,所有内容都在一个字段里。请大侠给看看是什么原因。谢谢。 .......
引用第66楼ever__f于2009-12-19 15:57发表的 : 感觉一条条的复制粘贴太麻烦了,所以自己在kill斑竹生成的xls文件的基础上做了一个excel宏,可以大大简化操作,放上来给大家共享吧。 1.打开excel,将安全设置中宏的安全性设置为中。 2.双击打开下载的文件edit.xla 3.在弹出的安全警告中选运行宏。 .......
引用第69楼ever__f于2009-12-19 16:48发表的 : 还有繁体字的问题,用不用转换为简体。。。。。。。
引用第64楼killl于2009-12-19 12:20发表的 : ] 一些html标签的问题,过滤掉就行了。试试新版
引用第73楼shunu于2009-12-20 07:49发表的 : 非常方便,谢谢ever__f兄! 但是提取出来的内容有多余的,比如: .......
引用第74楼killl于2009-12-20 10:11发表的 : 那个只能是预提取,需要自己重新构造,但是我们一定要统一的就是,字段的先后顺序 .......
引用第76楼ever__f于2009-12-20 10:15发表的 : 我提取的思路是:找到内容部分的第一个“年”字,然后找到之后的第一个“日”字,根据这两个位置找出时间;然后在“日”字以后的位置50字作为找出事件概述的来源,然后前面的逗号、冒号、破折号等等都去掉了,再把后面的句号及其以后的部分也去掉了。 当然这只能提取格式规范的,格式不规范的就只能手工处理了。。。 .......
本版积分规则 发表回复 回帖后跳转到最后一页
Archiver|手机版|小黑屋|网上读书园地
GMT+8, 2026-6-8 22:02 , Processed in 0.103745 second(s), 4 queries , Redis On.
Powered by Discuz! X3.5
© 2001-2026 Discuz! Team.