中国DOS联盟论坛 - Powered by Discuz! Board

标题: 如何在文本中提取两个特征码之间的字符？ [打印本页]

作者: lixinwu 时间: 2007-1-27 00:27 标题: 如何在文本中提取两个特征码之间的字符？

从文本中提取指定的ip地址并导出，提取<TD class=name>和</TD>之间的ip，文本0.txt如下：

           <TD class=speed>Russian Federation </TD></TR>

        <TR>

          <TD class=name>127.0.0.1:8000 </TD>

          <TD class=countgood>1835 </TD>

          <TD class=speed>United States </TD></TR>

        <TR>

          <TD class=name>157.0.0.2:3128 </TD>

          <TD class=cont1></TD>

          <TD class=speed>Denmark </TD></TR>

        <TR>

          <TD class=name>212.47.86.217:8080 </TD>

我这个批处理总是不成功，请各位看看错在哪里了？

for /f "tokens=1,2 delims=e^>" %%a in ('type 0.txt ^| findstr /c:"^</T" ') do (

        set set=%%a

        set "set=!set!"

echo  !set! >>1.txt

)

[ Last edited by namejm on 2007-1-26 at 05:46 PM ]

作者: namejm 时间: 2007-1-27 01:33
　　选好分隔符号很重要，试试下面的代码：

@echo off

for /f "tokens=2 delims=>:" %%i in ('findstr \. 0.txt') do echo %%i

pause

作者: lixinwu 时间: 2007-1-27 03:49
多谢了，好用，学习中。。。。

作者: amao 时间: 2007-2-3 21:28
@sed "/:/!d;s/.*>\(.*\):.*/\1/" 0.txt

作者: anqing 时间: 2007-2-3 23:46
@echo off
for /f "tokens=2 delims=>:" %%i in ('findstr \. 0.txt') do echo %%i
pause
这种用法头一次看到
sed命令真强，不过可惜要下载？不是原来的xp命令，在xp中它和for即使有速度上的差别，也可忽略，必竟p是小程序

作者: flyingphf 时间: 2008-3-30 15:17
这个sed命令我看不大懂啊，能具体说一下吗，如果中间是中文可以提取的吗

作者: wzq5510 时间: 2008-3-30 19:01
我饿得我

作者: sylovanas 时间: 2008-3-30 19:39
/:/!d
不包含:字串的行删除

s/.*>\(.*\):.*/\1/
将一行中有>任意字串到:任意字串到结尾的行改成()之内的字串

如果要搜寻中文建议用变量，但可能会牵扯到字码问题