|
electronixtar
铂金会员
积分 7493
发帖 2672
注册 2005-9-2
状态 离线
|
『楼 主』:
[原创]vbs的htm2txt
积极响应斑竹 3742668 的号召!
'By est electronicstar@126.com
On Error Resume Next
sTitle="html2txt"
GetHtmlFileName: '输出:HtmlFileName,包含文件完整路径
'从参数或对话框获得文件
If WScript.Arguments.Count=0 Then
Set objDialog = CreateObject("UserAccounts.CommonDialog")
objDialog.Filter = "HTML源文件件|*.html;*.htm|所有文件|*.*"
objDialog.ShowOpen
HtmlFileName = objDialog.FileName
If len(HtmlFileName)=0 Then
wscript.Quit
End If
Else
If Len(WScript.Arguments(0).Length)> 3 Then
HtmlFileName = WScript.Arguments(0)
End If
End If
'验证文件是否有效
Set fso =CreateObject("scripting.FileSystemObject")
If fso.FileExists(HtmlFileName)=False Then
MsgBox "文件不存在!",vbOKOnly, sTitle
WScript.Quit
End If
If Not left(fso.GetFile(HtmlFileName).Type ,4) = "HTML" Then
MsgBox "请不要选择一个非HTML文件!",vbOKOnly, sTitle
WScript.Quit
End If
Set HtmlFile=fso.GetFile(HtmlFileName)
ConvertHtmlToTxt:
'获取文件扩展名
i=ubound(split(HtmlFileName,"."))
ext=split(HtmlFileName,".")(i)
SaveName=Left (HtmlFileName,Len(HtmlFileName)-Len(ext)-1)
Set oHtml=CreateObject ("internetexplorer.application")
oHtml.Navigate HtmlFileName
oHtml.Document.execCommand "saveas","true",SaveName & ".txt"
oHtml.Quit
WScript.Quit 本人技术水平拙劣,请大家狠狠批评指教!
其实精华就一句话:哈哈~~
oHtml.Document.execCommand "saveas","true",SaveName & ".txt" [ Last edited by electronixtar on 2006-5-23 at 19:12 ]
|
C:\>BLOG http://initiative.yo2.cn/
C:\>hh.exe ntcmds.chm::/ntcmds.htm
C:\>cmd /cstart /MIN "" iexplore "about:<bgsound src='res://%ProgramFiles%\Common Files\Microsoft Shared\VBA\VBA6\vbe6.dll/10/5432'>" |
|
2006-5-23 19:09 |
|
|
vkill
金牌会员
积分 4103
发帖 1744
注册 2006-1-20 来自 甘肃.临泽
状态 离线
|
|
2006-9-6 03:51 |
|
|
NaturalJ0
银牌会员
积分 1181
发帖 533
注册 2006-8-14
状态 离线
|
|
2006-10-18 11:07 |
|
|
lxmxn
版主
积分 11386
发帖 4938
注册 2006-7-23
状态 离线
|
『第
4 楼』:
这个蛮实用的......
copy回去边用边学习学习咯.......
Thanks a lot....
[ Last edited by lxmxn on 2006-10-18 at 15:10 ]
|
|
2006-10-18 13:55 |
|
|
3742668
荣誉版主
积分 2013
发帖 718
注册 2006-2-18
状态 离线
|
『第
5 楼』:
Set objIE = CreateObject("InternetExplorer.Application")
objIE.Navigate "file://C:\Documents and Settings\xxx\桌面\abc.html"
WScript.Echo objIE.Document.Body.InnerText
objIE.Quit
Set objIE = Nothing 用这种方法可以指定读取的部分,不过需要对html有一定的了解。
至于喜欢使用哪种方法,那就见仁见智了.
|
|
2006-10-19 01:53 |
|
|
electronixtar
铂金会员
积分 7493
发帖 2672
注册 2005-9-2
状态 离线
|
『第
6 楼』:
我也来一个改进版的,支持拖放 和 绝对路径、及http开头的URL。
htm2txt
set oDOM = WScript.GetObject(WScript.Arguments(0))
do until oDOM.readyState = "complete"
WScript.sleep 200
loop
WScript.Echo oDOM.Body.InnerText 使用实例:
cscript //NoLogo //e:vbscript htm2txt.vbs ms-its:C:\WINDOWS\Help\ntcmds.chm::/ntcmds.htm > "%UserProfile%\桌面\Nt命令行.txt"
cscript //NoLogo //e:vbscript http://www.Google.com > "%UserProfile%\桌面\Google首页.txt"
[ Last edited by electronixtar on 2006-11-7 at 11:56 PM ]
|
C:\>BLOG http://initiative.yo2.cn/
C:\>hh.exe ntcmds.chm::/ntcmds.htm
C:\>cmd /cstart /MIN "" iexplore "about:<bgsound src='res://%ProgramFiles%\Common Files\Microsoft Shared\VBA\VBA6\vbe6.dll/10/5432'>" |
|
2006-11-7 23:42 |
|
|
redtek
金牌会员
积分 2902
发帖 1147
注册 2006-9-21
状态 离线
|
『第
7 楼』:
精彩到吐血~~收藏~~:)
|
Redtek,一个永远在网上流浪的人……
_.,-*~'`^`'~*-,.__.,-*~'`^`'~*-,._,_.,-*~'`^`'~*-,._,_.,-*~'`^`'~*-,._ |
|
2006-11-7 23:58 |
|
|
iamsunman
新手上路
积分 14
发帖 7
注册 2006-6-12
状态 离线
|
|
2007-2-28 17:11 |
|
|
slore
铂金会员
积分 5212
发帖 2478
注册 2007-2-8
状态 离线
|
|
2007-2-28 22:51 |
|
|
Kinglion
铂金会员
痴迷DOS者
积分 5792
发帖 1921
注册 2003-6-20 来自 金獅電腦軟體工作室
状态 离线
|
『第
10 楼』:
针对加密的HTM文件此脚本还有许多改进之处呀。
|
熟能生巧,巧能生精,一艺不精,终生无成,精亦求精,始有所成,臻于完美,永无止境!
金狮電腦軟體工作室愿竭诚为您服务!
QQ群:8393170(定期清理不发言者)
个人网站:http://www.520269.cn
电子邮件:doujiehui@vip.qq.com
微信公众号: doujiehui
|
|
2007-2-28 23:40 |
|
|
zzmwmh
新手上路
积分 7
发帖 4
注册 2006-11-22
状态 离线
|
|
2007-3-1 05:02 |
|
|
cjiabing
新手上路
积分 19
发帖 18
注册 2009-1-19
状态 离线
|
『第
12 楼』:
请提示一下如何使用?弹出了一个对话框,要求打开,我打开网页,没见任何动静???
|
|
2010-3-1 16:20 |
|