|
honghunter
中级用户
积分 321
发帖 135
注册 2007-2-4
状态 离线
|
|
2007-4-29 01:46 |
|
|
zhoushijay
高级用户
Autowalk
积分 845
发帖 375
注册 2007-3-3
状态 离线
|
『第
2 楼』:
这个办法好,只是我不知道如果小说有更新是目录地址会变吗?和下面的章节地址没关系吧,还是怎么的?
|
|
2007-4-29 02:17 |
|
|
honghunter
中级用户
积分 321
发帖 135
注册 2007-2-4
状态 离线
|
『第
3 楼』:
从我观察的几个小说站点看,小说的主页是不变的,其中上面的“21359”。估计是数据库中的标识符字段。
多数站点的小说章节一旦发布,也会有个不变的ID号,类似上面的“339061”。
|
探讨批量下载与智能化的下载 |
|
2007-4-29 02:22 |
|
|
zhoushijay
高级用户
Autowalk
积分 845
发帖 375
注册 2007-3-3
状态 离线
|
『第
4 楼』:
既然是不变的那怎么从地址知道他有没有更新呢?
|
|
2007-4-29 02:26 |
|
|
honghunter
中级用户
积分 321
发帖 135
注册 2007-2-4
状态 离线
|
『第
5 楼』:
我的办法“过滤出有效的章节列表”,比如昨天过滤出来是47个,今天发现超过47个了,那么就是有更新了。
|
探讨批量下载与智能化的下载 |
|
2007-4-29 02:29 |
|
|
zhoushijay
高级用户
Autowalk
积分 845
发帖 375
注册 2007-3-3
状态 离线
|
|
2007-4-29 02:32 |
|
|
honghunter
中级用户
积分 321
发帖 135
注册 2007-2-4
状态 离线
|
|
2007-4-29 19:17 |
|
|
honghunter
中级用户
积分 321
发帖 135
注册 2007-2-4
状态 离线
|
『第
8 楼』:
还有一个问题,就是因为同时监控多个小说,又要在多个站点上进行监控。所以,需要存储的信息也很多,我现在是每个站点的每个小说一个文件夹(里面几个文件)记录情况,感觉实在太繁琐了。
|
探讨批量下载与智能化的下载 |
|
2007-4-29 19:37 |
|
|
honghunter
中级用户
积分 321
发帖 135
注册 2007-2-4
状态 离线
|
|
2007-4-29 21:51 |
|
|
honghunter
中级用户
积分 321
发帖 135
注册 2007-2-4
状态 离线
|
『第
10 楼』:
怎样才能精简用于存储状态的文件,是我现在考虑的主要问题。
现在对于每一个小说,在每个站点,要记录好几个文件。
小说主页1个;
小说的章节列表一个;
每个装节一个。
|
探讨批量下载与智能化的下载 |
|
2007-5-1 06:31 |
|
|
zerocq
中级用户
积分 458
发帖 196
注册 2006-10-5
状态 离线
|
『第
11 楼』:
一篇小说最后1章的网页文件名总是比前边高,每个网站都是这样的吧
把小说最后一篇的文件名记录在记事本文件中
curl下载页面取得最高的名件名和记录比较..更新记录...下载.....
思路^o^
|
|
2007-5-1 18:02 |
|
|
honghunter
中级用户
积分 321
发帖 135
注册 2007-2-4
状态 离线
|
|
2007-5-2 23:21 |
|
|
honghunter
中级用户
积分 321
发帖 135
注册 2007-2-4
状态 离线
|
|
2007-5-3 12:47 |
|
|
honghunter
中级用户
积分 321
发帖 135
注册 2007-2-4
状态 离线
|
|
2007-5-9 07:36 |
|