中国DOS联盟论坛

中国DOS联盟

-- 联合DOS 推动DOS 发展DOS --

联盟域名:www.cn-dos.net  论坛域名:www.cn-dos.net/forum
DOS,代表着自由开放与发展,我们努力起来,学习FreeDOS和Linux的自由开放与GNU精神,共同创造和发展美好的自由与GNU GPL世界吧!

游客:  注册 | 登录 | 命令行 | 会员 | 搜索 | 上传 | 帮助 »
作者:
标题: 【求助】htm2txt的批量转换 上一主题 | 下一主题
hjkk123
初级用户





积分 160
发帖 82
注册 2007-5-14
状态 离线
『楼 主』:  【求助】htm2txt的批量转换

参考:
http://www.cn-dos.net/forum/view ... mp;page=1#pid154652

要将下面网页按顺序从
http://www.123123123.com/read.php?id=12345&fpage=1
http://www.123123123.com/read.php?id=12345&fpage=16 转换成txt
并且按依次合并为xiaoshuo.txt 怎么弄

[ Last edited by hjkk123 on 2008-5-27 at 07:42 PM ]

2008-5-27 19:29
查看资料  发短消息 网志   编辑帖子  回复  引用回复
hjkk123
初级用户





积分 160
发帖 82
注册 2007-5-14
状态 离线
『第 2 楼』:  

HtoX32c.exe 很不错
不过好像非要把网页下载下来,要转换htm的文件,麻烦

2008-5-27 19:40
查看资料  发短消息 网志   编辑帖子  回复  引用回复
knoppix7
银牌会员





积分 1287
发帖 634
注册 2007-5-2
来自 cmd.exe
状态 离线
『第 3 楼』:  

都一样
不下下来。。你想怎么转换.
总之最后都要下下来

2008-5-27 21:01
查看资料  发短消息 网志   编辑帖子  回复  引用回复
hjkk123
初级用户





积分 160
发帖 82
注册 2007-5-14
状态 离线
『第 4 楼』:  

但是HtoX32c.exe命令后面好像只接htm,你能不能举个例子
HtoX32c.exe http://www.baidu.com/ 好像不行啊,不支持url
难道再用curl,拉倒了,两个三方外部命令,太麻烦

[ Last edited by hjkk123 on 2008-5-27 at 09:13 PM ]

2008-5-27 21:08
查看资料  发短消息 网志   编辑帖子  回复  引用回复
vkill
金牌会员





积分 4103
发帖 1744
注册 2006-1-20
来自 甘肃.临泽
状态 离线
『第 5 楼』:  



  Quote:
Originally posted by hjkk123 at 2008-5-27 21:08:
但是HtoX32c.exe命令后面好像只接htm,你能不能举个例子
HtoX32c.exe http://www.baidu.com/ 好像不行啊,不支持url
难道再用curl,拉倒了,两个三方外部 ...

那也可以用vbs来下载了

2008-5-29 18:24
查看资料  发送邮件  访问主页  发短消息 网志   编辑帖子  回复  引用回复
hjkk123
初级用户





积分 160
发帖 82
注册 2007-5-14
状态 离线
『第 6 楼』:  

可以举个例子吗

2008-5-29 18:43
查看资料  发短消息 网志   编辑帖子  回复  引用回复
knoppix7
银牌会员





积分 1287
发帖 634
注册 2007-5-2
来自 cmd.exe
状态 离线
『第 7 楼』:  

搜索

2008-5-29 19:06
查看资料  发短消息 网志   编辑帖子  回复  引用回复
hjkk123
初级用户





积分 160
发帖 82
注册 2007-5-14
状态 离线
『第 8 楼』:  

我搜索过了,搜索不到
在什么地方,用什么关键字搜索呢

2008-5-29 19:59
查看资料  发短消息 网志   编辑帖子  回复  引用回复
knoppix7
银牌会员





积分 1287
发帖 634
注册 2007-5-2
来自 cmd.exe
状态 离线
『第 9 楼』:  

http://www.cn-dos.net/forum/view ... =%E4%B8%8B%E8%BD%BD

2008-5-29 21:38
查看资料  发短消息 网志   编辑帖子  回复  引用回复
hjkk123
初级用户





积分 160
发帖 82
注册 2007-5-14
状态 离线
『第 10 楼』:  

还是比较麻烦,那能帮我把代码写出来吗
或者把
    set oDOM = WScript.GetObject(WScript.Arguments(0))

    do until oDOM.readyState = "complete"
    WScript.sleep 200
    loop

    WScript.Echo oDOM.Body.InnerText
改成能批量处理url的就好了

[ Last edited by hjkk123 on 2008-5-29 at 09:57 PM ]

2008-5-29 21:52
查看资料  发短消息 网志   编辑帖子  回复  引用回复
clian76
中级用户





积分 363
发帖 162
注册 2007-4-22
状态 离线
『第 11 楼』:  

不知道楼主是想要网页源代码还是网页显示的内容?

2008-5-30 11:53
查看资料  发送邮件  发短消息 网志   编辑帖子  回复  引用回复
slore
铂金会员





积分 5212
发帖 2478
注册 2007-2-8
状态 离线
『第 12 楼』:  

For i = 0 To WScript.Arguments.Count - 1
    Set oDOM = WScript.GetObject(WScript.Arguments(0))
   
Do Until oDOM.readyState = "complete"
        WScript.sleep 200
    Loop
   
WScript.Echo oDOM.Body.InnerText
Next



S smile 微笑,L love 爱,O optimism 乐观,R relax 放松,E enthusiasm 热情...Slore
2008-5-30 13:14
查看资料  发短消息 网志   编辑帖子  回复  引用回复
plp626
银牌会员

钻石会员


积分 2278
发帖 1020
注册 2007-11-19
状态 离线
『第 13 楼』:  

谁能把Word转为txt?



山外有山,人外有人;低调做人,努力做事。

进入网盘(各种工具)~~ 空间~~cmd学习
2008-5-30 17:46
查看资料  发短消息 网志   编辑帖子  回复  引用回复
hjkk123
初级用户





积分 160
发帖 82
注册 2007-5-14
状态 离线
『第 14 楼』:  



  Quote:
Originally posted by slore at 2008-5-30 01:14 PM:
For i = 0 To WScript.Arguments.Count - 1
    Set oDOM = WS ...

16个网址不会都写吧,能不能写个支持通配符
或者循环的才好啊

2008-5-30 20:31
查看资料  发短消息 网志   编辑帖子  回复  引用回复
slore
铂金会员





积分 5212
发帖 2478
注册 2007-2-8
状态 离线
『第 15 楼』:  

For i = 1 To 16
    Set oDOM = WScript.GetObject("http://www.123123123.com/read.php?id=12345&fpage=" & i )
    Do Until oDOM.readyState = "complete"
        WScript.sleep 200
    Loop
    WScript.Echo oDOM.Body.InnerText
Next



S smile 微笑,L love 爱,O optimism 乐观,R relax 放松,E enthusiasm 热情...Slore
2008-5-30 20:59
查看资料  发短消息 网志   编辑帖子  回复  引用回复

请注意:您目前尚未注册或登录,请您注册登录以使用论坛的各项功能,例如发表和回复帖子等。


可打印版本 | 推荐给朋友 | 订阅主题 | 收藏主题



论坛跳转: