Board logo

标题: 【求助】htm2txt的批量转换 [打印本页]

作者: hjkk123     时间: 2008-5-27 19:29    标题: 【求助】htm2txt的批量转换

参考:
http://www.cn-dos.net/forum/view ... mp;page=1#pid154652

要将下面网页按顺序从
http://www.123123123.com/read.php?id=12345&fpage=1
http://www.123123123.com/read.php?id=12345&fpage=16 转换成txt
并且按依次合并为xiaoshuo.txt 怎么弄

[ Last edited by hjkk123 on 2008-5-27 at 07:42 PM ]
作者: hjkk123     时间: 2008-5-27 19:40
HtoX32c.exe 很不错
不过好像非要把网页下载下来,要转换htm的文件,麻烦
作者: knoppix7     时间: 2008-5-27 21:01
都一样
不下下来。。你想怎么转换.
总之最后都要下下来
作者: hjkk123     时间: 2008-5-27 21:08
但是HtoX32c.exe命令后面好像只接htm,你能不能举个例子
HtoX32c.exe http://www.baidu.com/ 好像不行啊,不支持url
难道再用curl,拉倒了,两个三方外部命令,太麻烦

[ Last edited by hjkk123 on 2008-5-27 at 09:13 PM ]
作者: vkill     时间: 2008-5-29 18:24


  Quote:
Originally posted by hjkk123 at 2008-5-27 21:08:
但是HtoX32c.exe命令后面好像只接htm,你能不能举个例子
HtoX32c.exe http://www.baidu.com/ 好像不行啊,不支持url
难道再用curl,拉倒了,两个三方外部 ...

那也可以用vbs来下载了
作者: hjkk123     时间: 2008-5-29 18:43
可以举个例子吗
作者: knoppix7     时间: 2008-5-29 19:06
搜索
作者: hjkk123     时间: 2008-5-29 19:59
我搜索过了,搜索不到
在什么地方,用什么关键字搜索呢
作者: knoppix7     时间: 2008-5-29 21:38
http://www.cn-dos.net/forum/view ... =%E4%B8%8B%E8%BD%BD
作者: hjkk123     时间: 2008-5-29 21:52
还是比较麻烦,那能帮我把代码写出来吗
或者把
    set oDOM = WScript.GetObject(WScript.Arguments(0))

    do until oDOM.readyState = "complete"
    WScript.sleep 200
    loop

    WScript.Echo oDOM.Body.InnerText
改成能批量处理url的就好了

[ Last edited by hjkk123 on 2008-5-29 at 09:57 PM ]
作者: clian76     时间: 2008-5-30 11:53
不知道楼主是想要网页源代码还是网页显示的内容?
作者: slore     时间: 2008-5-30 13:14
For i = 0 To WScript.Arguments.Count - 1
    Set oDOM = WScript.GetObject(WScript.Arguments(0))
   
Do Until oDOM.readyState = "complete"
        WScript.sleep 200
    Loop
   
WScript.Echo oDOM.Body.InnerText
Next
作者: plp626     时间: 2008-5-30 17:46
谁能把Word转为txt?
作者: hjkk123     时间: 2008-5-30 20:31


  Quote:
Originally posted by slore at 2008-5-30 01:14 PM:
For i = 0 To WScript.Arguments.Count - 1
    Set oDOM = WS ...

16个网址不会都写吧,能不能写个支持通配符
或者循环的才好啊
作者: slore     时间: 2008-5-30 20:59
For i = 1 To 16
    Set oDOM = WScript.GetObject("http://www.123123123.com/read.php?id=12345&fpage=" & i )
    Do Until oDOM.readyState = "complete"
        WScript.sleep 200
    Loop
    WScript.Echo oDOM.Body.InnerText
Next