中国DOS联盟论坛

中国DOS联盟

-- 联合DOS 推动DOS 发展DOS --

联盟域名:www.cn-dos.net  论坛域名:www.cn-dos.net/forum
DOS,代表着自由开放与发展,我们努力起来,学习FreeDOS和Linux的自由开放与GNU精神,共同创造和发展美好的自由与GNU GPL世界吧!

游客:  注册 | 登录 | 命令行 | 会员 | 搜索 | 上传 | 帮助 »
中国DOS联盟论坛 » DOS批处理 & 脚本技术(批处理室) » [已结]批量提取文本[不使用sed能不能办到]
作者:
标题: [已结]批量提取文本[不使用sed能不能办到] 上一主题 | 下一主题
wjdidi
初级用户





积分 175
发帖 55
注册 2007-4-30
状态 离线
『楼 主』:  [已结]批量提取文本[不使用sed能不能办到]

文件夹下的文件均为xx.xml
文件内容如下:
<?xml version="1.0" encoding="GB2312"?>
<!-- Edited with XMLSPY C.+ v2007 rel. 2 U  by QQ 49636010 -->
<event id="538" name="边境-鲁潇(210,7)">
        <!--new means new quest, default is quest on user-->
.....
要求是提取第三行中的"538"和"边境-鲁潇"到新文件x.txt

仅使用P处理能不能办到

[ Last edited by wjdidi on 2008-7-8 at 01:26 PM ]

2008-7-7 20:10
查看资料  发短消息 网志   编辑帖子  回复  引用回复
bat-zw
金牌会员

永远的学习者


积分 3105
发帖 1276
注册 2008-3-8
状态 离线
『第 2 楼』:  

可以,如下:
@echo off
for /f "delims=" %%a in ('dir /b *.*ml') do (
    for /f "tokens=3,5 delims=<>=( " %%i in ('findstr /c:"event id=" %%a') do echo %%~i %%~j>>new.txt
)
start new.txt


   此帖被 +1 点积分    点击查看详情   
评分人:【 wjdidi 分数: +1  时间:2008-7-7 21:00




批处理之家新域名:www.bathome.net
2008-7-7 20:33
查看资料  发送邮件  发短消息 网志  OICQ (841615149)  编辑帖子  回复  引用回复
wjdidi
初级用户





积分 175
发帖 55
注册 2007-4-30
状态 离线
『第 3 楼』:  

zw19750516的代码可以用,谢谢

不过我对代码有部分还是不太懂:

1.   dir /b  这个地方,帮助说明里是说:使用空格式(没有标题信息或摘要)。不太明白是什么意思
2. delims=<>=( 还有就是这个地方

能否帮忙解释一下,越详细越好!

感谢!!

2008-7-7 21:05
查看资料  发短消息 网志   编辑帖子  回复  引用回复
bat-zw
金牌会员

永远的学习者


积分 3105
发帖 1276
注册 2008-3-8
状态 离线
『第 4 楼』:  

dir /b就是仅列出文件名,不列出其它信息,如一个文件夹中有文件1.txt 2.txt 3.txt 4.exe
dir /b *.txt后将输出如下:
1.txt
2.txt
3.txt
delims=<>=( 就是将“<”“>”“=”“(”“空格”都做为行中的分隔符,如下:
<event id="538" name="边境-鲁潇(210,7)">
分隔符event分隔符id分隔符"538"分隔符name分隔符"边境-鲁潇分隔符210,7)"分隔符
    1    2    3     4      5      6 

[ Last edited by zw19750516 on 2008-7-7 at 09:27 PM ]



批处理之家新域名:www.bathome.net
2008-7-7 21:23
查看资料  发送邮件  发短消息 网志  OICQ (841615149)  编辑帖子  回复  引用回复
pusofalse
银牌会员




积分 1604
发帖 646
注册 2008-4-13
状态 离线
『第 5 楼』:  

只要没特殊字符。。。不借助第三方工具还是可以的。。



心绪平和,眼藏静谧,无比安稳的火... Purification of soul...Just a false...^_^
2008-7-7 21:36
查看资料  发送邮件  发短消息 网志   编辑帖子  回复  引用回复
wjdidi
初级用户





积分 175
发帖 55
注册 2007-4-30
状态 离线
『第 6 楼』:  



  Quote:
Originally posted by zw19750516 at 2008-7-7 09:23 PM:
dir /b就是仅列出文件名,不列出其它信息,如一个文件夹中有文件1.txt 2.txt 3.txt 4.exe
dir /b *.txt后将输出如下:
1.txt
2.txt
3.txt
delims=<>=( 就是将“< ...

我把你写的代码拆成一句句的,单独执行,再跟结果对比,终于搞明白了。
dir /b也是,执行了之后看出来结果了,分隔符这一块,我终于算是彻底搞明白了,哈哈,上面的delims不用<>也可以,直接"tokens=3,5 delims==( "就行

谢谢你,感谢!

2008-7-7 22:00
查看资料  发短消息 网志   编辑帖子  回复  引用回复
26933062
银牌会员





积分 2268
发帖 879
注册 2006-12-19
状态 离线
『第 7 楼』:  

这样效率应该高些。
:
@echo off
for /f "tokens=4,6 delims=<>=(: " %%i in ('findstr /c:"event id=" *.*ml') do (
   >>name.txt echo %%~i %%~j
)
start name.txt
[ Last edited by 26933062 on 2008-7-7 at 10:10 PM ]

   此帖被 +1 点积分     点击查看详情   
评分人:【 pusofalse 分数: +1  时间:2008-7-7 22:45




致精致简!
2008-7-7 22:01
查看资料  发短消息 网志   编辑帖子  回复  引用回复
pusofalse
银牌会员




积分 1604
发帖 646
注册 2008-4-13
状态 离线
『第 8 楼』:  

原来可以使用通配符。。^_^



心绪平和,眼藏静谧,无比安稳的火... Purification of soul...Just a false...^_^
2008-7-7 22:45
查看资料  发送邮件  发短消息 网志   编辑帖子  回复  引用回复
vkill
金牌会员





积分 4103
发帖 1744
注册 2006-1-20
来自 甘肃.临泽
状态 离线
『第 9 楼』:  

处理xml还是喜欢 xml.exe

2008-7-8 12:16
查看资料  发送邮件  访问主页  发短消息 网志   编辑帖子  回复  引用回复

请注意:您目前尚未注册或登录,请您注册登录以使用论坛的各项功能,例如发表和回复帖子等。


可打印版本 | 推荐给朋友 | 订阅主题 | 收藏主题



论坛跳转: