使用道具 举报
引用第22楼lovesmile于2009-03-16 22:26发表的 : 版权问题阿……
引用第4楼醉乡常客于2008-10-05 13:53发表的 : 悟空还没吃三藏。
引用第26楼simpleeee于2010-05-21 10:20发表的 : 2、采集超星有ss号的图书数据,匹配超星和国图的数据,挑出古籍和影印本,下载。 接下来的工作: 3、采集中美百万数据,挑出古籍和影印本,下载。 4、下载国图扫描的民国期刊和方志。 .......
引用第26楼simpleeee于2010-05-21 10:20发表的 : 哎呀,被挖出来就汇报一下进展吧。一直用业余时间做,所以比较慢 工作是这样进行的: 1、采集国图数据,把古籍和影印本挑出(因为国图的数据全)。 2、采集超星有ss号的图书数据,匹配超星和国图的数据,挑出古籍和影印本,下载。 .......
引用第30楼simpleeee于2010-05-21 10:30发表的 : 前期数据整理和资源下载,我投入的也就是业余时间和接入网线还有硬盘的钱,不会超过五千块。后期网站开发没什么难度,有一个月也就挂出来了,但我希望加上一些SNS功能和实用的功能,比如由用户进行点校、文本化,具体就8多说了,估计会做成一个商业项目,否则不会长久,但不会对用户收一分钱~~
引用第33楼simpleeee于2010-05-21 10:57发表的 : 嗯,LS说的句句在点子上。扫描工作从最受关注的同时质量最差、或者没有来源的书开始。同一本书的不同影印版只要有就都放上,由用户进行选择、推荐。全文检索是卖点,用积分鼓励文本化,可能会有用户或者“用户”拿点校本OCR之后发上来,但这个事情必须由用户来做~~
引用第35楼水天于2010-05-21 13:09发表的 : 以为是新帖,原来是旧的
引用第8楼simpleeee于2008-10-06 00:28发表的 : 我突然想到这帖子应该发到国学数典论坛才会有振臂一呼的效应
本版积分规则 发表回复 回帖后跳转到最后一页
Archiver|手机版|小黑屋|网上读书园地
GMT+8, 2025-12-23 11:01 , Processed in 0.091802 second(s), 4 queries , Redis On.
Powered by Discuz! X3.5
© 2001-2025 Discuz! Team.