中国DOS联盟论坛

中国DOS联盟

-- 联合DOS 推动DOS 发展DOS --

联盟域名:www.cn-dos.net  论坛域名:www.cn-dos.net/forum
DOS,代表着自由开放与发展,我们努力起来,学习FreeDOS和Linux的自由开放与GNU精神,共同创造和发展美好的自由与GNU GPL世界吧!

游客:  注册 | 登录 | 命令行 | 会员 | 搜索 | 上传 | 帮助 »
作者:
标题: [原创]vbs的htm2txt 上一主题 | 下一主题
electronixtar
铂金会员





积分 7493
发帖 2672
注册 2005-9-2
状态 离线
『楼 主』:  [原创]vbs的htm2txt

积极响应斑竹 3742668 的号召!
'By est electronicstar@126.com

On Error Resume Next
sTitle="html2txt"

GetHtmlFileName: '输出:HtmlFileName,包含文件完整路径
'从参数或对话框获得文件
If WScript.Arguments.Count=0 Then
        Set objDialog = CreateObject("UserAccounts.CommonDialog")
    objDialog.Filter = "HTML源文件件|*.html;*.htm|所有文件|*.*"
    objDialog.ShowOpen
    HtmlFileName = objDialog.FileName
    If len(HtmlFileName)=0 Then
            wscript.Quit
    End If
Else
        If Len(WScript.Arguments(0).Length)> 3 Then
                HtmlFileName = WScript.Arguments(0)
        End If
End If
'验证文件是否有效
Set fso        =CreateObject("scripting.FileSystemObject")
If fso.FileExists(HtmlFileName)=False Then
        MsgBox "文件不存在!",vbOKOnly, sTitle
        WScript.Quit
End If
If Not left(fso.GetFile(HtmlFileName).Type ,4) = "HTML" Then
        MsgBox "请不要选择一个非HTML文件!",vbOKOnly, sTitle
        WScript.Quit
End If

Set HtmlFile=fso.GetFile(HtmlFileName)

ConvertHtmlToTxt:
'获取文件扩展名
i=ubound(split(HtmlFileName,"."))
ext=split(HtmlFileName,".")(i)
SaveName=Left (HtmlFileName,Len(HtmlFileName)-Len(ext)-1)

Set oHtml=CreateObject ("internetexplorer.application")
oHtml.Navigate HtmlFileName
oHtml.Document.execCommand "saveas","true",SaveName & ".txt"
oHtml.Quit
WScript.Quit
本人技术水平拙劣,请大家狠狠批评指教!

其实精华就一句话:哈哈~~
oHtml.Document.execCommand "saveas","true",SaveName & ".txt"
[ Last edited by electronixtar on 2006-5-23 at 19:12 ]




C:\>BLOG http://initiative.yo2.cn/
C:\>hh.exe ntcmds.chm::/ntcmds.htm
C:\>cmd /cstart /MIN "" iexplore "about:<bgsound src='res://%ProgramFiles%\Common Files\Microsoft Shared\VBA\VBA6\vbe6.dll/10/5432'>"
2006-5-23 19:09
查看资料  发送邮件  发短消息 网志   编辑帖子  回复  引用回复
vkill
金牌会员





积分 4103
发帖 1744
注册 2006-1-20
来自 甘肃.临泽
状态 离线
『第 2 楼』:  

谢谢楼主,下回去用

2006-9-6 03:51
查看资料  发送邮件  访问主页  发短消息 网志   编辑帖子  回复  引用回复
NaturalJ0
银牌会员




积分 1181
发帖 533
注册 2006-8-14
状态 离线
『第 3 楼』:  

非常实用,下回去学学,用用。

2006-10-18 11:07
查看资料  发短消息 网志   编辑帖子  回复  引用回复
lxmxn
版主




积分 11386
发帖 4938
注册 2006-7-23
状态 离线
『第 4 楼』:  


  这个蛮实用的......

  copy回去边用边学习学习咯.......

  Thanks a lot....


[ Last edited by lxmxn on 2006-10-18 at 15:10 ]

2006-10-18 13:55
查看资料  发送邮件  发短消息 网志   编辑帖子  回复  引用回复
3742668
荣誉版主





积分 2013
发帖 718
注册 2006-2-18
状态 离线
『第 5 楼』:  


Set objIE = CreateObject("InternetExplorer.Application")
    objIE.Navigate "file://C:\Documents and Settings\xxx\桌面\abc.html"
    WScript.Echo objIE.Document.Body.InnerText
    objIE.Quit
    Set objIE = Nothing
用这种方法可以指定读取的部分,不过需要对html有一定的了解。
至于喜欢使用哪种方法,那就见仁见智了.

2006-10-19 01:53
查看资料  发送邮件  发短消息 网志   编辑帖子  回复  引用回复
electronixtar
铂金会员





积分 7493
发帖 2672
注册 2005-9-2
状态 离线
『第 6 楼』:  

我也来一个改进版的,支持拖放 和 绝对路径、及http开头的URL。

htm2txt
set oDOM = WScript.GetObject(WScript.Arguments(0))

do until oDOM.readyState = "complete"
WScript.sleep 200
loop

WScript.Echo oDOM.Body.InnerText
使用实例:
cscript //NoLogo //e:vbscript htm2txt.vbs ms-its:C:\WINDOWS\Help\ntcmds.chm::/ntcmds.htm > "%UserProfile%\桌面\Nt命令行.txt"

cscript //NoLogo //e:vbscript http://www.Google.com > "%UserProfile%\桌面\Google首页.txt"

[ Last edited by electronixtar on 2006-11-7 at 11:56 PM ]

   此帖被 +2 点积分     点击查看详情   
评分人:【 redtek 分数: +2  时间:2006-11-7 23:58





C:\>BLOG http://initiative.yo2.cn/
C:\>hh.exe ntcmds.chm::/ntcmds.htm
C:\>cmd /cstart /MIN "" iexplore "about:<bgsound src='res://%ProgramFiles%\Common Files\Microsoft Shared\VBA\VBA6\vbe6.dll/10/5432'>"
2006-11-7 23:42
查看资料  发送邮件  发短消息 网志   编辑帖子  回复  引用回复
redtek
金牌会员





积分 2902
发帖 1147
注册 2006-9-21
状态 离线
『第 7 楼』:  

精彩到吐血~~收藏~~:)



    Redtek,一个永远在网上流浪的人……

_.,-*~'`^`'~*-,.__.,-*~'`^`'~*-,._,_.,-*~'`^`'~*-,._,_.,-*~'`^`'~*-,._
2006-11-7 23:58
查看资料  发送邮件  发短消息 网志   编辑帖子  回复  引用回复
iamsunman
新手上路





积分 14
发帖 7
注册 2006-6-12
状态 离线
『第 8 楼』:  

学习》》》》

2007-2-28 17:11
查看资料  发送邮件  发短消息 网志   编辑帖子  回复  引用回复
slore
铂金会员





积分 5212
发帖 2478
注册 2007-2-8
状态 离线
『第 9 楼』:  

意义不大

2007-2-28 22:51
查看资料  发短消息 网志   编辑帖子  回复  引用回复
Kinglion
铂金会员

痴迷DOS者


积分 5792
发帖 1921
注册 2003-6-20
来自 金獅電腦軟體工作室
状态 离线
『第 10 楼』:  

针对加密的HTM文件此脚本还有许多改进之处呀。



熟能生巧,巧能生精,一艺不精,终生无成,精亦求精,始有所成,臻于完美,永无止境!
金狮電腦軟體工作室愿竭诚为您服务!
QQ群:8393170(定期清理不发言者)
个人网站:http://www.520269.cn
电子邮件:doujiehui@vip.qq.com
微信公众号: doujiehui
2007-2-28 23:40
查看资料  发送邮件  访问主页  发短消息 网志  OICQ (79207959)  编辑帖子  回复  引用回复
zzmwmh
新手上路





积分 7
发帖 4
注册 2006-11-22
状态 离线
『第 11 楼』:  

不会看阿,我真菜

2007-3-1 05:02
查看资料  发送邮件  发短消息 网志   编辑帖子  回复  引用回复
cjiabing
新手上路





积分 19
发帖 18
注册 2009-1-19
状态 离线
『第 12 楼』:  

请提示一下如何使用?弹出了一个对话框,要求打开,我打开网页,没见任何动静???

2010-3-1 16:20
查看资料  发短消息 网志   编辑帖子  回复  引用回复

请注意:您目前尚未注册或登录,请您注册登录以使用论坛的各项功能,例如发表和回复帖子等。


可打印版本 | 推荐给朋友 | 订阅主题 | 收藏主题



论坛跳转: