Board logo

标题: 如何只提取文本文件中指定的内容 [打印本页]

作者: lanlinlan     时间: 2007-1-6 22:36    标题: 如何只提取文本文件中指定的内容

以下文件 我只要纳税人识别号和纳税人名称  其他都不要 请问如何实现??

系统为WINXP SP2  文件为文本文件 SFHR.txt  样式如下:
  <RECORD 纳税人识别号="111111111111111" 纳税人名称="测试测试测试测试" 状态="0" 地址="" 邮编="" 联系人="" 联系电话="" />
    <RECORD 纳税人识别号="111111111111112" 纳税人名称="杭州技术有限公司" 状态="0" 地址="" 邮编="" 联系人="" 联系电话="" />

现我只想保留:

111111111111111     测试测试测试测试
111111111111112     杭州技术有限公司

[ Last edited by namejm on 2007-1-6 at 08:57 PM ]
作者: 9527     时间: 2007-1-6 22:56

for /f "tokens=3,5 delims== " %a in (sfhr.txt) do @echo %~a   %~b

作者: lanlinlan     时间: 2007-1-6 23:52
好象不行哦  !!!测试通不过
作者: redtek     时间: 2007-1-7 00:37
我测试着可以~:)

CMD Shell 下直接输入命令运行测试:
C:\TEMP\str>for /f "tokens=3,5 delims== " %a in (sfhr.txt) do @echo %~a   %~b
111111111111111   测试测试测试测试
111111111111112   杭州技术有限公司
9527兄在for命令里用的是一个%号(代表是直接在命令行上运行的,不能写到.bat文件中运行)。所以lanlinlan兄直接运行即可。

如果希望写到批处理文件内,就用双%号~:)
作者: vkill     时间: 2007-1-7 02:26
sed "s/.*\([0-9]\{15\}\).*\([^0-9=\x22]\{16\}\).*/\1 \2/" SFHR.txt
作者: lanlinlan     时间: 2007-1-7 09:39
呵呵 厉害  直接在CMD里是可以的哦  只是我想输出为a.txt  
for /f "tokens=3,5 delims== " %%a in (sfhr.txt) do @echo %%~a  %%b >>a.txt

为什么输出的样子为:

111111111111111   "测试测试测试测试"
111111111111112   "杭州技术有限公司"

要去掉引号改怎么写啊?
作者: namejm     时间: 2007-1-7 09:42
  把 %%b 换成 %%~b 。
作者: lanlinlan     时间: 2007-1-7 09:54
呵呵 真的很感谢大家  搞定了!!!