中国DOS联盟论坛

中国DOS联盟

-- 联合DOS 推动DOS 发展DOS --

联盟域名:www.cn-dos.net  论坛域名:www.cn-dos.net/forum
DOS,代表着自由开放与发展,我们努力起来,学习FreeDOS和Linux的自由开放与GNU精神,共同创造和发展美好的自由与GNU GPL世界吧!

游客:  注册 | 登录 | 命令行 | 会员 | 搜索 | 上传 | 帮助 »
中国DOS联盟论坛 » DOS批处理 & 脚本技术(批处理室) » 用什么工具来提取页面中的所有的超链接?
作者:
标题: 用什么工具来提取页面中的所有的超链接? 上一主题 | 下一主题
bosinl2004
初级用户





积分 47
发帖 26
注册 2007-11-2
状态 离线
『楼 主』:  用什么工具来提取页面中的所有的超链接?

请问用什么工具可以来提取页面中的所有的超链接?

比如 geturl 1.htm 1.txt
就是把1.htm中包含的超链接都提取到1.txt中去了。

2009-4-16 09:06
查看资料  发送邮件  发短消息 网志   编辑帖子  回复  引用回复
tireless
银牌会员





积分 2025
发帖 1122
注册 2007-9-5
状态 离线
『第 2 楼』:  


geturls.exe < 1.htm > 1.txt
http://upload.cn-dos.net/img/1407.zip

2009-4-16 09:38
查看资料  发短消息 网志   编辑帖子  回复  引用回复
darkkid
初级用户





积分 34
发帖 12
注册 2009-2-18
状态 离线
『第 3 楼』:  

这么简单的需求,应该无需要特殊工具,批处理应该就ok

[ Last edited by darkkid on 2009-4-16 at 09:44 ]

2009-4-16 09:39
查看资料  发送邮件  发短消息 网志   编辑帖子  回复  引用回复
freeants001
中级用户




积分 330
发帖 244
注册 2006-4-14
来自 湖北
状态 离线
『第 4 楼』:  

LS,这么好的东西不用,我收下了,呵~~~

2009-4-16 09:52
查看资料  发送邮件  发短消息 网志   编辑帖子  回复  引用回复
freeants001
中级用户




积分 330
发帖 244
注册 2006-4-14
来自 湖北
状态 离线
『第 5 楼』:  


sss=WScript.createobject("scripting.filesystemobject").opentextfile("你的文件.txt",1).readall()
fl=WScript.createobject("scripting.filesystemobject").createtextfile("url.txt",2,true)
re=/(?:http|https|ftp|mms|rtsp):\/\/(?:&(?=amp;)|[A-Z0-9\.\/=\?%_~@#:;\+\- ]){1,250}/gi
while((arr=re.exec(sss))!=null)fl.writeline(arr);


2009-4-16 10:18
查看资料  发送邮件  发短消息 网志   编辑帖子  回复  引用回复
sady2009
初级用户





积分 58
发帖 60
注册 2009-2-18
状态 离线
『第 6 楼』:  

正需要.很好用.谢谢2楼提供

2009-4-16 23:49
查看资料  发短消息 网志   编辑帖子  回复  引用回复
wcf147
新手上路





积分 3
发帖 3
注册 2010-4-19
状态 离线
『第 7 楼』:  



  Quote:
Originally posted by freeants001 at 2009-4-16 10:18:
[code]sss=WScript.createobject("scripting.filesystemobject").opentextfile("你的文件.txt",1).readall()
fl=WScript.createobject("scripting.filesystemobject").create ...

我是新手
不知道如何用

2010-4-30 00:02
查看资料  发送邮件  发短消息 网志   编辑帖子  回复  引用回复
740011611
初级用户





积分 96
发帖 83
注册 2009-6-4
来自 信阳
状态 离线
『第 8 楼』:  

链接失效了

2010-4-30 20:22
查看资料  发送邮件  发短消息 网志  OICQ (740011611)  编辑帖子  回复  引用回复
yishanju
银牌会员

[b]看你妹啊[/b]


积分 1488
发帖 1357
注册 2006-5-20
状态 离线
『第 9 楼』:  



  Quote:
Originally posted by 740011611 at 2010-4-30 20:22:
链接失效了

http://upload.cn-dos.net/img/1407.zip





有问题请发论坛或者自行搜索,再短消息问我的统统是SB
2010-4-30 21:37
查看资料  发短消息 网志   编辑帖子  回复  引用回复
yonghu111
初级用户





积分 90
发帖 57
注册 2010-4-12
状态 离线
『第 10 楼』:  

正则就行

2010-5-1 00:13
查看资料  发送邮件  发短消息 网志   编辑帖子  回复  引用回复
freeants001
中级用户




积分 330
发帖 244
注册 2006-4-14
来自 湖北
状态 离线
『第 11 楼』:  

更新下5楼JS代码:P
srcFile = "test.txt";
dstFile = srcFile + "_url.txt";
fso=WScript.createobject("Scripting.FileSystemObject");
sss=fso.opentextfile(srcFile,1).readall();
fl=fso.createtextfile(dstFile,1,false);
re=/(["']?)((?:http|https|ftp|mms|ed2k|Flashget|thunder|rtsp):\/\/(?:[][@!\w\/(&=.*?)+|`%~:;\-,$\'])+)\1/g;
while((arr=re.exec(sss))!=null)fl.writeline(arr[2]);
[ Last edited by freeants001 on 2010-5-1 at 19:47 ]

2010-5-1 19:03
查看资料  发送邮件  发短消息 网志   编辑帖子  回复  引用回复

请注意:您目前尚未注册或登录,请您注册登录以使用论坛的各项功能,例如发表和回复帖子等。


可打印版本 | 推荐给朋友 | 订阅主题 | 收藏主题



论坛跳转: