中国DOS联盟论坛

中国DOS联盟

-- 联合DOS 推动DOS 发展DOS --

联盟域名:www.cn-dos.net  论坛域名:www.cn-dos.net/forum
DOS,代表着自由开放与发展,我们努力起来,学习FreeDOS和Linux的自由开放与GNU精神,共同创造和发展美好的自由与GNU GPL世界吧!

游客:  注册 | 登录 | 命令行 | 会员 | 搜索 | 上传 | 帮助 »
中国DOS联盟论坛 » DOS批处理 & 脚本技术(批处理室) » 求提取文本中的内容保存到另一文本!
作者:
标题: 求提取文本中的内容保存到另一文本! 上一主题 | 下一主题
catfen
新手上路





积分 8
发帖 3
注册 2007-7-1
状态 离线
『楼 主』:  求提取文本中的内容保存到另一文本!

以下是1.txt中的内容的其中一段。
  <td align="center" width="16" style="border-bottom:1px #bac1bd dotted;"><a href="http://user.qzone.qq.com/729876636" target="_blank"><img src="/samebarlist/images/icon_star.gif" border="0"></a></td>

我只想把QQ号码都保存到另一个文本中,怎么写啊?

2008-3-13 17:25
查看资料  发送邮件  发短消息 网志   编辑帖子  回复  引用回复
lxmxn
版主




积分 11386
发帖 4938
注册 2006-7-23
状态 离线
『第 2 楼』:  


sed -n "s'.*http://user.qzone.qq.com/\([0-9]\+\).*'\1'p" 1.txt | more >qq.txt


2008-3-13 17:45
查看资料  发送邮件  发短消息 网志   编辑帖子  回复  引用回复
bat-zw
金牌会员

永远的学习者


积分 3105
发帖 1276
注册 2008-3-8
状态 离线
『第 3 楼』:  

命令太高深了,看不懂

2008-3-13 17:58
查看资料  发送邮件  发短消息 网志  OICQ (841615149)  编辑帖子  回复  引用回复
catfen
新手上路





积分 8
发帖 3
注册 2007-7-1
状态 离线
『第 4 楼』:  

是啊,不过还是不行啊

2008-3-13 18:10
查看资料  发送邮件  发短消息 网志   编辑帖子  回复  引用回复
catfen
新手上路





积分 8
发帖 3
注册 2007-7-1
状态 离线
『第 5 楼』:  

SED不是内部或外部命令啊,是SET吗?

[ Last edited by catfen on 2008-3-13 at 06:13 PM ]

2008-3-13 18:12
查看资料  发送邮件  发短消息 网志   编辑帖子  回复  引用回复
sylovanas
初级用户





积分 107
发帖 42
注册 2007-9-3
状态 离线
『第 6 楼』:  

sed是第三方工具,要另外下载

2008-3-13 18:19
查看资料  发送邮件  发短消息 网志   编辑帖子  回复  引用回复
pooronce
中级用户





积分 484
发帖 250
注册 2007-6-5
状态 离线
『第 7 楼』:  



  Quote:
Originally posted by lxmxn at 2008-3-13 05:45 PM:
sed -n "s'.*http://user.qzone.qq.com/\([0-9]\+\).*'\1'p" 1.txt | more >qq.txt

不如用grep了
grep -oP "(?<=qq.com\/)\d*(?=\")" 1.txt
不过楼主似乎还不知道cygwin

如果findstr有支持只显示查找到文本而不是显示行就好了

2008-3-13 18:31
查看资料  发送邮件  发短消息 网志   编辑帖子  回复  引用回复
lxmxn
版主




积分 11386
发帖 4938
注册 2006-7-23
状态 离线
『第 8 楼』:  



  Quote:
Originally posted by pooronce at 2008-3-13 18:31:


不如用grep了
grep -oP "(?<=qq.com\/)\d*(?=\")" 1.txt
不过楼主似乎还不知道cygwin

如果findstr有支持只显示查找到文本而不是显示行就好了

这个正则不错,本来是想用grep来完成的,不过想到grep不像sed那样有一些替换和插入的功能,所以没用grep来做。

2008-3-13 20:52
查看资料  发送邮件  发短消息 网志   编辑帖子  回复  引用回复
suntb
高级用户





积分 581
发帖 277
注册 2006-12-23
状态 离线
『第 9 楼』:  


@echo off
for /f "tokens=11 delims== " %%a in ('findstr "user.qzone.qq.com" 1.txt') do (
  for /f "tokens=3 delims=/" %%b in ("%%~a") do (echo %%b>>QQ.txt)
)
QQ.txt
[ Last edited by suntb on 2008-3-13 at 11:43 PM ]

2008-3-13 23:23
查看资料  发短消息 网志   编辑帖子  回复  引用回复
suntb
高级用户





积分 581
发帖 277
注册 2006-12-23
状态 离线
『第 10 楼』:  

以上代码去引号的思路参考了论坛帖子:
http://www.cn-dos.net/forum/viewthread.php?tid=20838

2008-3-13 23:25
查看资料  发短消息 网志   编辑帖子  回复  引用回复
stance
初级用户





积分 64
发帖 46
注册 2008-4-21
状态 离线
『第 11 楼』:  

謝謝suntb

2008-4-21 17:50
查看资料  发送邮件  发短消息 网志   编辑帖子  回复  引用回复

请注意:您目前尚未注册或登录,请您注册登录以使用论坛的各项功能,例如发表和回复帖子等。


可打印版本 | 推荐给朋友 | 订阅主题 | 收藏主题



论坛跳转: