标题: 如果用CMD将网页保存为文本文件?
[打印本页]
作者: nghr
时间: 2008-1-20 21:08
标题: 如果用CMD将网页保存为文本文件?
例如:
http://www.for-ever.cn/nod32/
我现在想将这个打开的网页自动保存为a.txt
如何写脚本?请大哥们指点一下
作者: HAT
时间: 2008-1-21 15:04
FYI.
Quote: |
Q:
我需要在每天上午10点钟打开一个网页,然后将该网页保存至C:\test文件夹下,文件格式使用默认的htm即可,文件名为当前系统日期。打开这个网页很简单,我把这个网页设置为主页,然后在批处理里面这样写:
@echo off
"C:\Program Files\Internet Explorer\IEXPLORE.EXE"
我的问题是,如何才能用批处理将这个打开的网页保存到硬盘呢?望批处理前辈指教。
A:
'来个VBS,保存成download.vbs可以直接在命令行中执行
'On Error Resume Next
Dim fso, s, FileName, URL, HTML, cdo
URL = "http://www.csdn.net" '需要下载的页面路径
FileName = "C:\test\" & CStr(Year(Now) & Month(Now) & Day(Now)) & ".mht" '保存的文件名
Set cdo = CreateObject("cdo.Message")
cdo.CreateMHTMLBody URL, 31
Set s = cdo.GetStream
s.SaveToFile FileName, 2
s.Close
msgbox("完成") |
|
作者: 3391617
时间: 2008-1-21 16:45
楼上:
错误:
“行10
字符1
写入文件失败”
http://www.for-ever.cn/nod32/这种动态网页里的数据真的可以保存下来吗?
期待高人~~~~~~~
[
Last edited by 3391617 on 2008-1-21 at 04:56 PM ]
作者: ngd
时间: 2008-1-21 23:00
如果只是保存网页 借助 wget 或者 curl 就可以了
wget http://www.for-ever.cn/nod32/
或者 curl http://www.for-ever.cn/nod32/ >a.txt
要将网页保存为 txt文本文档 还得去掉 文件中的 html标签
举个例子 借助sed 去掉网页中的 <> 标签
curl http://www.for-ever.cn/nod32/ | sed -e "s/<[^>]*>//g" >a.txt