Board logo

标题: 过滤掉文本中未知的数字和字母 [打印本页]

作者: xixi27     时间: 2007-4-28 06:13    标题: 过滤掉文本中未知的数字和字母

请问如何过滤掉一个文本文件中所有的未知的数字和字母,并另存在一个新文本。这些数字和字母是穿插在文档中的。
如:细细哈哈12咚咚ajs
     思索
     今天0D12
作者: lxmxn     时间: 2007-4-28 06:47
是要过滤掉字母和数字呢?还是过滤掉中文字符?请把问题描述再具体一点,方便大家阅读。
作者: xixi27     时间: 2007-4-28 06:52
可能没描述清楚,是把文档中所有的数字及字母过滤掉,只留下汉字
作者: vkill     时间: 2007-4-28 07:07
sed
作者: lxmxn     时间: 2007-4-28 07:11
vkill 把命令写出来吧,用批处理有点小麻烦。
作者: vkill     时间: 2007-4-28 07:47
sed "s/[0-9a-zA-Z]/ /g" life
作者: youxi01     时间: 2007-4-28 08:06
简单的还是可以处理的(不考虑特殊字符,对很多的空格处理不太合理)

利用批处理来处理,简单的演示代码:
@echo off
setlocal enabledelayedexpansion

for /f "delims=" %%i in (test.txt) do (
    call :Check "%%i" OK
    echo !OK!
)

pause>nul

:Check 处理对象 传回结果
set "str=%~1"
set str_=

for /l %%i in (0 1 1000) do (
    set tm_str=!str:~%%i,1!
    if "!tm_str!"=="" set %2=!str_! & goto :eof
    if "!tm_str!"==" " set str_=!str_!!tm_str!
    if !tm_str! GTR Z set str_=!str_!!tm_str!
)
说明:test.txt中的内容,为要处理的文本内容
处理对象,小文本,且不含特殊字符(因为特殊字符在此未考虑)
作者: zhoushijay     时间: 2007-4-28 08:20

set fso=createobject("scripting.filesystemobject")
set txt=fso.opentextfile("11.txt")
gettxt=txt.readall
numtxt=len(gettxt)

for i=1 to numtxt
    unite=mid(gettxt,i,1)
    on error resume next
    int(unite)
    if err.number=0 then
       gettxt=replace(gettxt,unite," ")
    end if
    if asc(unite)>=65 and asc(unite)<=122 then
       if asc(unite)<91 or asc(unite)>96 then
          gettxt=replace(gettxt,unite," ")
       end if
    end if

next
msgbox gettxt,,"过滤"
set newtxt=fso.createtextfile("22.txt")
newtxt.write gettxt
'vbs版的!
'11.txt为需要过滤的文件,请自己修改,22.txt为保存后的文本,可以不改。

作者: xixi27     时间: 2007-4-28 22:50
多谢各位的帮忙,麻烦的是我要处理的文本里面有很多空格,而且如果数字或者字母单独在一行内时,过滤后会有问题。

另外,会出现 “ECHO处于关闭状态 “ 的提示,这是什么意思啊?
请各位帮忙!谢谢!
作者: huzixuan     时间: 2007-4-29 00:53

@echo off
setlocal enabledelayedexpansion
for /f "delims=" %%i in (test.txt) do (
set str=%%i
set "str=!str: =!"
for /l %%j in (0,1,9) do (
if not "!str!"=="" set str=!str:%%j=!
)
for %%k in (a,b,c,d,e,f,g,h,i,j,k,l,m,n,o,p,q,r,s,t,u,v,w,x,y,z) do (
if not "!str!"=="" set str=!str:%%k=!
)

if not "!str!"=="" (
>>New.txt echo !str!
) else (
echo.
)
)

notepad New.txt
[ Last edited by huzixuan on 2007-4-29 at 06:14 AM ]
作者: xixi27     时间: 2007-4-29 02:24
楼上的回答可以解决数字或者字母单独成行的问题,但是如果数字或者字母之间有空格的话还是存在问题啊!

另外,能否解答一下出现 “ECHO处于关闭状态” 的问题呢?  非常感谢!
作者: lxmxn     时间: 2007-4-29 03:46
出现“ECHO处于关闭状态”的原因是echo命令后面的值为空。
作者: huzixuan     时间: 2007-4-29 06:15
先将 变量中 所有空格替换掉,然后依次替换掉 数字 以及 字母
最后读出变量
已经修改 10 楼代码
作者: huzixuan     时间: 2007-4-29 06:37
不知道哪个效率高一些
set fso = CreateObject("Scripting.FileSystemObject")
set rfile = fso.OpenTextFile("test.txt",1)
set wfile = fso.CreateTextFile("Wfile.txt")
str = rfile.readall
for k = 0 to 9         
str = replace(str,k," ")  ' 将 0 - 9 数字置空
next
for i = 65 to 90
str = replace(str,chr(i)," ")   ' 将 a-z 小写字母置空
next
FOR J = 97 TO 122
STR = REPLACE(STR,CHR(J)," ")   ' 将 A-Z 大写字母置空
NEXT
wfile.write str
wfile.close

作者: xixi27     时间: 2007-4-29 07:13
多谢huzixuan,我刚刚已经在你原来代码的基础上解决了问题,跟你的想法一样!
同时也谢谢其他各位的帮忙,这几天刚刚接触批处理,不过在这里真的学到了很多的东西,谢谢大家了!

还有一个问题,“echo."代表啥啊?
作者: Vampire     时间: 2007-4-29 07:27
显示空行。
作者: weilong888     时间: 2007-4-29 09:48
再加一行代码可能就没有空行了。
@echo off
setlocal enabledelayedexpansion
for /f "delims=" %%i in (test.txt) do (
set str=%%i & set "str=!str: =!" & set "str=!str: =!" )
for /l %%j in (0,1,9) do (
if not "!str!"=="" set "str=!str:%%j=!")  
for %%k in (a,b,c,d,e,f,g,h,i,j,k,l,m,n,,o,p,q,r,s,t,u,v,w,x,y,z) do (
if not "!str!"=="" set "str=!str:%%k=!")
if not "!str!"=="" (
>>new.txt echo !str!) else (
echo.)
notepad new.txt
[ Last edited by weilong888 on 2007-4-29 at 10:03 AM ]
作者: mqw624     时间: 2010-12-6 19:37


  Quote:
Originally posted by youxi01 at 2007-4-28 08:06:
简单的还是可以处理的(不考虑特殊字符,对很多的空格处理不太合理)

利用批处理来处理,简单的演示代码:
[code]
@echo off
setlocal enabledelayedexp ...

高手