标题: [共同讨论]for语句读取文本内容的一些陷阱
[打印本页]
作者: namejm
时间: 2007-1-25 05:33
标题: [共同讨论]for语句读取文本内容的一些陷阱
1、普通for语句会忽略以分号开头的文本:
test.txt内容:
;abc
ai
::te
,te st
test
测试代码:
@echo off
for /f "delims=" %%i in (test.txt) do echo %%i
pause
此陷阱在不用for的 type test.txt、more test.txt和findstr .* test.txt 语句中不存在。
2、在for语句中使用带 tokens=1* delims=: 的 findstr /n .* test.txt 的时候,会过滤掉行首的所有冒号:
test.txt同1;
测试代码:
@echo off
for /f "tokens=1* delims=:" %%i in ('findstr /n .* test.txt') do echo %%j
pause
解决问题1和问题2的通用方案:
稍微复杂一点的:
@echo off
for /f "delims=" %%i in ('findstr /n .* test.txt') do (
set "str=%%i"
call set "str=%%str:*:=%%"
call echo "%%str%%"
)
pause
最简洁的
(经测试,这个方案不具备通用性,因为"delims= eol=" 会把行首为引号的内容过滤掉,看来真是前门驱虎后门进狼、引号和分号不能兼顾啊):@echo off
for /f "delims= eol=" %%i in (test.txt) do echo %%i
pause
简洁方案中的"delims= eol=" 顺序不能颠倒,否则会出现偏差。
不知道强大的 for 还会有哪些陷阱会让不明就里的我们往里跳,请各位收集一下,以便日后编写代码的时候能少走弯路。
[
Last edited by namejm on 2007-5-17 at 09:17 PM ]
作者: 9527
时间: 2007-1-25 05:42
首先我想说的是FOR语句默认是忽略以“分号”开头的行,而不是冒号。
其次for /f "eol= delims=" %%a in (xxx) do command 命令中不会忽略任何符号开头的行,也就是说会显示全部的内容........
作者: lzmyst
时间: 2007-1-25 05:46
几乎所有教程都说delims要放在最后,今天才知道也是有陷阱的。
作者: pengfei
时间: 2007-1-25 05:51
又一个值得注意的地方, 不能说是陷阱, 任何程序自然不能顾及所有方面, 这就得靠我们平时多留意了.
作者: namejm
时间: 2007-1-25 05:54
Quote: |
Originally posted by 9527 at 2007-1-24 16:42:
首先我想说的是FOR语句默认是忽略以“分号”开头的行,而不是冒号。 |
|
呵呵,多谢提醒,笔误已经修正。
Quote: |
其次for /f "eol= delims=" %%a in (xxx) do command 命令中不会忽略任何符号开头的行,也就是说会显示全部的内容........ |
|
这个方案会忽略掉以空格打头的行,兄弟测试一下就知道了。
Quote: |
Originally posted by pengfei at 2007-1-24 16:51:
又一个值得注意的地方, 不能说是陷阱, 任何程序自然不能顾及所有方面, 这就得靠我们平时多留意了. |
|
这些值得注意的地方,在微软的使用手册里没有任何地方提及,究竟是它刻意忽略的bug还是问题太小而不屑于提及异或是没有察觉到,已经无从得知,但是从使用者的角度来说,有bug的地方却没有正式的说明,无异于是一个个隐藏着的陷阱等着别人往里跳^_^
[
Last edited by namejm on 2007-1-24 at 05:59 PM ]
作者: vkill
时间: 2007-1-25 08:22
"delims= eol=" 顺序不能颠倒
for /?上不是这样的啊
作者: namejm
时间: 2007-1-25 08:31
哈哈,for /? 里还说:eol=c -指一个行注释字符的结尾(就一个) 。我狂吐血ing——嘿嘿,实际上是过滤掉以 c 打头的行,不知是哪个家伙翻译的,E文也太差了点吧?
言归正传,我所说的顺序不能颠倒,并不是指所有的情形,而是说为了能同时处理以分号和冒号打头的行内容,这个顺序不能颠倒。
作者: vkill
时间: 2007-1-25 08:43
Quote: |
Originally posted by namejm at 2007-1-25 08:31:
哈哈,for /? 里还说:eol=c -指一个行注释字符的结尾(就一个) 。我狂吐血ing——嘿嘿,实际上是过滤掉以 c 打头的行,不知是哪个家伙翻译的,E ... |
|
汗,才发现for /?有这么大个超级错误,狂晕中
作者: pengfei
时间: 2007-1-25 09:24
for /f "eol= delims=" %%i in (test.txt) do echo %%i "eol= delims=" 不能颠倒, 本机测试没有发现错误.
看来for /?的注释真的有点问题啊.
eol=c - 指一个行注释字符的结尾(就一个)
delims=xxx - 指分隔符集。这个替换了空格和跳格键的
默认分隔符集。
上面的说明我们在理解时产生了歧义, eol是过滤与行首字符匹配的行. 就像delims默认的分隔符为空格或TAB. 而eol的默认过滤的行首字符为;号, 而for /?却没有说明.
namejm兄说明给出的解决代码, for /f "delims= eol=" %%i in (test.txt) do echo %%i 它的作用和"delims=" 一样是取消默认空格作为分隔符, 而"eol="是取消;作分隔符.
下面代码为过滤行首为冒号的行, 同时取消了默认的分号分隔符.
@echo off
for /f "delims= eol=: " %%i in (test.txt) do echo %%i
pause
test.txt
abc
:123
4:56
;
;def
::
dok:cto:::
elo分隔符只能为一个, 上面代码故意让elo有两个分隔符, 可是只过滤了行首为:号的行, 而空格行却没有过滤.
作者: hxmupdata
时间: 2007-3-14 22:30
看个帖要花半个小时,,,不愧是经典帖..............................
作者: wudixin96
时间: 2007-4-4 01:07
下面代码为过滤行首为冒号的行, 同时取消了
默认的分号分隔符.
CODE: [Copy to clipboard]
--------------------------------------------------------------------------------
@echo off
for /f
"delims= eol=: " %%i in (test.txt) do echo %%i
pause
应该是
下面代码为过滤行首为冒号的行, 同时取消了默认的
空格和跳格键分隔符.
作者: ccuu668
时间: 2007-5-2 15:32
看来只有多多学习学习基础的东西了.看的不彻底.
作者: luowei14
时间: 2007-8-15 17:27
。。。呵。。microsoft还有这个BUG啊。。。晕晕
作者: knoppix7
时间: 2007-8-15 22:04
set /?里的BUG更多。。。
作者: dai13910
时间: 2008-1-11 14:39
恩!很多细节值得推敲
作者: 不得不爱
时间: 2008-1-11 14:51
我再补充1句,FOR 不能处理超长行的文本
作者: ehejia
时间: 2008-1-13 10:48
FOR的陷阱烦的很 我做了个脚本就是掉陷阱了害我找好久。。。 感谢楼猪提供的方法
作者: 7testing
时间: 2010-6-7 15:13
for /f "eol=" %i in (test.txt) do echo %i