中国DOS联盟论坛

中国DOS联盟

-- 联合DOS 推动DOS 发展DOS --

联盟域名:www.cn-dos.net  论坛域名:www.cn-dos.net/forum
DOS,代表着自由开放与发展,我们努力起来,学习FreeDOS和Linux的自由开放与GNU精神,共同创造和发展美好的自由与GNU GPL世界吧!

游客:  注册 | 登录 | 命令行 | 会员 | 搜索 | 上传 | 帮助 »
中国DOS联盟论坛 » DOS批处理 & 脚本技术(批处理室) » [已解决]求从html文件中分离出URL的dos工具或脚本
作者:
标题: [已解决]求从html文件中分离出URL的dos工具或脚本 上一主题 | 下一主题
scanjet
新手上路





积分 4
发帖 1
注册 2007-12-1
状态 离线
『楼 主』:  [已解决]求从html文件中分离出URL的dos工具或脚本

大概跟flashget的那个"用flashget下载所有链接"的功能差不多,就是给出一个html文件,然后可以列出里面
所有的链接, 最好还可以通过修改参数或表达式来定制精确输出结果.

Dos命令行下面,我试了grep, sed, 没成功.
例如
grep -o http://([w-]+.)+[w-]+(/[w- ./?%&=]*)? test.htm
(表达式是照抄网上的),结果不是没东西出来,就是出来一堆东西....似乎它们是按行来操作的???
可是目标的行数位置都是不确定的话,怎么办??

比如说, 一个html文件test.htm包含以下代码
......
<a href="http://down2.download.com/2/5/52/6x1196486834x203330712200/tools.rar">
.....
我打 grep 参数|正则表达式 test.html, 我只要它返回以下结果就够了
http://down2.download.com/2/5/52/6x1196486834x203330712200/tools.rar
谢谢...

[ Last edited by scanjet on 2007-12-1 at 10:58 PM ]

2007-12-1 16:05
查看资料  发短消息 网志   编辑帖子  回复  引用回复
junchen2
高级用户





积分 537
发帖 219
注册 2007-8-4
来自 杭州--半山
状态 离线
『第 2 楼』:  

awk -F\042 "$0~/<a href=\042http:\/\/down2.download.com\//{for (i=1;i<=NF;i++){ if($i~/http:\/\/down2.download.com\/2\/5\/52\/6x1196486834x20333071/) print $i}}" test.htm

2007-12-1 19:50
查看资料  发送邮件  发短消息 网志   编辑帖子  回复  引用回复

请注意:您目前尚未注册或登录,请您注册登录以使用论坛的各项功能,例如发表和回复帖子等。


可打印版本 | 推荐给朋友 | 订阅主题 | 收藏主题



论坛跳转: