中国DOS联盟论坛

中国DOS联盟

-- 联合DOS 推动DOS 发展DOS --

联盟域名:www.cn-dos.net  论坛域名:www.cn-dos.net/forum
DOS,代表着自由开放与发展,我们努力起来,学习FreeDOS和Linux的自由开放与GNU精神,共同创造和发展美好的自由与GNU GPL世界吧!

游客:  注册 | 登录 | 命令行 | 会员 | 搜索 | 上传 | 帮助 »
中国DOS联盟论坛 » DOS批处理 & 脚本技术(批处理室) » [讨论]监控多个网站连载小说更新的问题
作者:
标题: [讨论]监控多个网站连载小说更新的问题 上一主题 | 下一主题
honghunter
中级用户





积分 321
发帖 135
注册 2007-2-4
状态 离线
『楼 主』:  [讨论]监控多个网站连载小说更新的问题

俺的初步想法:


1,用个txt保存关注的小说的主页链接。
例如:http://club.book.sina.com.cn/yuanchuang/writing.php?wid=21359

2,过滤出有效的章节列表。
就是那些类似下面的链接。
http://club.book.sina.com.cn/yuanchuang/chapter.php?id=339061

然后和保存的列表比较,如果发现新链接就下载。


我现在遇到的问题是,发现我这样的做法对于网站本身的选择非常重要。
因为我现在就发现,sina的虽然容易抓取,但是更新慢,小说似乎也不多。

于是考虑,对于同一个小说,同时监控几个网站的更新情况。
但是又遇到问题,就是不同网站上面的同一个小说的章节划分,
可能是不一样的。

请教大家,这个有什么可行的处理方法?



探讨批量下载与智能化的下载
2007-4-29 01:46
查看资料  发短消息 网志   编辑帖子  回复  引用回复
zhoushijay
高级用户

Autowalk


积分 845
发帖 375
注册 2007-3-3
状态 离线
『第 2 楼』:  

这个办法好,只是我不知道如果小说有更新是目录地址会变吗?和下面的章节地址没关系吧,还是怎么的?

2007-4-29 02:17
查看资料  发送邮件  发短消息 网志   编辑帖子  回复  引用回复
honghunter
中级用户





积分 321
发帖 135
注册 2007-2-4
状态 离线
『第 3 楼』:  

从我观察的几个小说站点看,小说的主页是不变的,其中上面的“21359”。估计是数据库中的标识符字段。

多数站点的小说章节一旦发布,也会有个不变的ID号,类似上面的“339061”。



探讨批量下载与智能化的下载
2007-4-29 02:22
查看资料  发短消息 网志   编辑帖子  回复  引用回复
zhoushijay
高级用户

Autowalk


积分 845
发帖 375
注册 2007-3-3
状态 离线
『第 4 楼』:  

既然是不变的那怎么从地址知道他有没有更新呢?

2007-4-29 02:26
查看资料  发送邮件  发短消息 网志   编辑帖子  回复  引用回复
honghunter
中级用户





积分 321
发帖 135
注册 2007-2-4
状态 离线
『第 5 楼』:  

我的办法“过滤出有效的章节列表”,比如昨天过滤出来是47个,今天发现超过47个了,那么就是有更新了。



探讨批量下载与智能化的下载
2007-4-29 02:29
查看资料  发短消息 网志   编辑帖子  回复  引用回复
zhoushijay
高级用户

Autowalk


积分 845
发帖 375
注册 2007-3-3
状态 离线
『第 6 楼』:  

这个难度有点大,得好好想想

2007-4-29 02:32
查看资料  发送邮件  发短消息 网志   编辑帖子  回复  引用回复
honghunter
中级用户





积分 321
发帖 135
注册 2007-2-4
状态 离线
『第 7 楼』:  

继续思考ING



探讨批量下载与智能化的下载
2007-4-29 19:17
查看资料  发短消息 网志   编辑帖子  回复  引用回复
honghunter
中级用户





积分 321
发帖 135
注册 2007-2-4
状态 离线
『第 8 楼』:  

还有一个问题,就是因为同时监控多个小说,又要在多个站点上进行监控。所以,需要存储的信息也很多,我现在是每个站点的每个小说一个文件夹(里面几个文件)记录情况,感觉实在太繁琐了。



探讨批量下载与智能化的下载
2007-4-29 19:37
查看资料  发短消息 网志   编辑帖子  回复  引用回复
honghunter
中级用户





积分 321
发帖 135
注册 2007-2-4
状态 离线
『第 9 楼』:  

请大家给点意见、建议吧。



探讨批量下载与智能化的下载
2007-4-29 21:51
查看资料  发短消息 网志   编辑帖子  回复  引用回复
honghunter
中级用户





积分 321
发帖 135
注册 2007-2-4
状态 离线
『第 10 楼』:  

怎样才能精简用于存储状态的文件,是我现在考虑的主要问题。

现在对于每一个小说,在每个站点,要记录好几个文件。
小说主页1个;
小说的章节列表一个;
每个装节一个。



探讨批量下载与智能化的下载
2007-5-1 06:31
查看资料  发短消息 网志   编辑帖子  回复  引用回复
zerocq
中级用户




积分 458
发帖 196
注册 2006-10-5
状态 离线
『第 11 楼』:  

一篇小说最后1章的网页文件名总是比前边高,每个网站都是这样的吧

把小说最后一篇的文件名记录在记事本文件中

curl下载页面取得最高的名件名和记录比较..更新记录...下载.....

思路^o^

2007-5-1 18:02
查看资料  发送邮件  发短消息 网志   编辑帖子  回复  引用回复
honghunter
中级用户





积分 321
发帖 135
注册 2007-2-4
状态 离线
『第 12 楼』:  

谢谢,我考虑一下。



探讨批量下载与智能化的下载
2007-5-2 23:21
查看资料  发短消息 网志   编辑帖子  回复  引用回复
honghunter
中级用户





积分 321
发帖 135
注册 2007-2-4
状态 离线
『第 13 楼』:  

顶一下,期待各位给出提示。



探讨批量下载与智能化的下载
2007-5-3 12:47
查看资料  发短消息 网志   编辑帖子  回复  引用回复
honghunter
中级用户





积分 321
发帖 135
注册 2007-2-4
状态 离线
『第 14 楼』:  

有没有使用批处理快速存取大量变量的方法哪?



探讨批量下载与智能化的下载
2007-5-9 07:36
查看资料  发短消息 网志   编辑帖子  回复  引用回复

请注意:您目前尚未注册或登录,请您注册登录以使用论坛的各项功能,例如发表和回复帖子等。


可打印版本 | 推荐给朋友 | 订阅主题 | 收藏主题



论坛跳转: