标题: 【求助】htm2txt的批量转换
[打印本页]
作者: hjkk123
时间: 2008-5-27 19:29
标题: 【求助】htm2txt的批量转换
参考:
http://www.cn-dos.net/forum/view ... mp;page=1#pid154652
要将下面网页按顺序从
http://www.123123123.com/read.php?id=12345&fpage=1到
http://www.123123123.com/read.php?id=12345&fpage=16 转换成txt
并且按依次合并为xiaoshuo.txt 怎么弄
[
Last edited by hjkk123 on 2008-5-27 at 07:42 PM ]
作者: hjkk123
时间: 2008-5-27 19:40
HtoX32c.exe 很不错
不过好像非要把网页下载下来,要转换htm的文件,麻烦
作者: knoppix7
时间: 2008-5-27 21:01
都一样
不下下来。。你想怎么转换.
总之最后都要下下来
作者: hjkk123
时间: 2008-5-27 21:08
但是HtoX32c.exe命令后面好像只接htm,你能不能举个例子
HtoX32c.exe
http://www.baidu.com/ 好像不行啊,不支持url
难道再用curl,拉倒了,两个三方外部命令,太麻烦
[
Last edited by hjkk123 on 2008-5-27 at 09:13 PM ]
作者: vkill
时间: 2008-5-29 18:24
Quote: |
Originally posted by hjkk123 at 2008-5-27 21:08:
但是HtoX32c.exe命令后面好像只接htm,你能不能举个例子
HtoX32c.exe http://www.baidu.com/ 好像不行啊,不支持url
难道再用curl,拉倒了,两个三方外部 ... |
|
那也可以用vbs来下载了
作者: hjkk123
时间: 2008-5-29 18:43
可以举个例子吗
作者: knoppix7
时间: 2008-5-29 19:06
搜索
作者: hjkk123
时间: 2008-5-29 19:59
我搜索过了,搜索不到
在什么地方,用什么关键字搜索呢
作者: knoppix7
时间: 2008-5-29 21:38
http://www.cn-dos.net/forum/view ... =%E4%B8%8B%E8%BD%BD
作者: hjkk123
时间: 2008-5-29 21:52
还是比较麻烦,那能帮我把代码写出来吗
或者把
set oDOM = WScript.GetObject(WScript.Arguments(0))
do until oDOM.readyState = "complete"
WScript.sleep 200
loop
WScript.Echo oDOM.Body.InnerText
改成能批量处理url的就好了
[
Last edited by hjkk123 on 2008-5-29 at 09:57 PM ]
作者: clian76
时间: 2008-5-30 11:53
不知道楼主是想要网页源代码还是网页显示的内容?
作者: slore
时间: 2008-5-30 13:14
For i
= 0
To WScript.Arguments.Count
- 1
Set oDOM
= WScript.
GetObject(WScript.Arguments
(0
))
Do Until oDOM.readyState
= "
complete"
WScript.sleep 200
Loop
WScript.Echo oDOM.Body.InnerText
Next
作者: plp626
时间: 2008-5-30 17:46
谁能把Word转为txt?
作者: hjkk123
时间: 2008-5-30 20:31
Quote: |
Originally posted by slore at 2008-5-30 01:14 PM:
For i = 0 To WScript.Arguments.Count - 1
Set oDOM = WS ... |
|
16个网址不会都写吧,能不能写个支持通配符
或者循环的才好啊
作者: slore
时间: 2008-5-30 20:59
For i = 1 To 16
Set oDOM = WScript.GetObject("http://www.123123123.com/read.php?id=12345&fpage=" & i )
Do Until oDOM.readyState = "complete"
WScript.sleep 200
Loop
WScript.Echo oDOM.Body.InnerText
Next