Board logo

标题: 如何在文本中提取两个特征码之间的字符? [打印本页]

作者: lixinwu     时间: 2007-1-27 00:27    标题: 如何在文本中提取两个特征码之间的字符?

从文本中提取指定的ip地址并导出,提取<TD class=name>和</TD>之间的ip,文本0.txt如下:
           <TD class=speed>Russian Federation </TD></TR>
        <TR>
          <TD class=name>127.0.0.1:8000 </TD>
          <TD class=countgood>1835 </TD>
          <TD class=speed>United States </TD></TR>
        <TR>
          <TD class=name>157.0.0.2:3128 </TD>
          <TD class=cont1></TD>
          <TD class=speed>Denmark </TD></TR>
        <TR>
          <TD class=name>212.47.86.217:8080 </TD>
我这个批处理总是不成功,请各位看看错在哪里了?
for /f "tokens=1,2 delims=e^>" %%a in ('type 0.txt ^| findstr /c:"^</T" ') do (
        set set=%%a
        set "set=!set!"
echo  !set! >>1.txt
)
[ Last edited by namejm on 2007-1-26 at 05:46 PM ]
作者: namejm     时间: 2007-1-27 01:33
  选好分隔符号很重要,试试下面的代码:
@echo off
for /f "tokens=2 delims=>:" %%i in ('findstr \. 0.txt') do echo %%i
pause

作者: lixinwu     时间: 2007-1-27 03:49
多谢了,好用,学习中。。。。
作者: amao     时间: 2007-2-3 21:28
@sed "/:/!d;s/.*>\(.*\):.*/\1/" 0.txt
作者: anqing     时间: 2007-2-3 23:46
@echo off
for /f "tokens=2 delims=>:" %%i in ('findstr \. 0.txt') do echo %%i
pause
这种用法头一次看到
sed命令真强,不过可惜要下载?不是原来的xp命令,在xp中它和for即使有速度上的差别,也可忽略,必竟p是小程序
作者: flyingphf     时间: 2008-3-30 15:17
这个sed命令我看不大懂啊,能具体说一下吗,如果中间是中文可以提取的吗
作者: wzq5510     时间: 2008-3-30 19:01
我饿得我
作者: sylovanas     时间: 2008-3-30 19:39
/:/!d
不包含:字串的行删除

s/.*>\(.*\):.*/\1/
将一行中有>任意字串到:任意字串到结尾的行改成()之内的字串

如果要搜寻中文建议用变量,但可能会牵扯到字码问题