标题: 过滤掉文本中未知的数字和字母
[打印本页]
作者: xixi27
时间: 2007-4-28 06:13
标题: 过滤掉文本中未知的数字和字母
请问如何过滤掉一个文本文件中所有的未知的数字和字母,并另存在一个新文本。这些数字和字母是穿插在文档中的。
如:细细哈哈12咚咚ajs
思索
今天0D12
作者: lxmxn
时间: 2007-4-28 06:47
是要过滤掉字母和数字呢?还是过滤掉中文字符?请把问题描述再具体一点,方便大家阅读。
作者: xixi27
时间: 2007-4-28 06:52
可能没描述清楚,是把文档中所有的数字及字母过滤掉,只留下汉字
作者: vkill
时间: 2007-4-28 07:07
sed
作者: lxmxn
时间: 2007-4-28 07:11
vkill 把命令写出来吧,用批处理有点小麻烦。
作者: vkill
时间: 2007-4-28 07:47
sed "s/[0-9a-zA-Z]/ /g" life
作者: youxi01
时间: 2007-4-28 08:06
简单的还是可以处理的(不考虑特殊字符,对很多的空格处理不太合理)
利用批处理来处理,简单的演示代码:
@echo off
setlocal enabledelayedexpansion
for /f "delims=" %%i in (test.txt) do (
call :Check "%%i" OK
echo !OK!
)
pause>nul
:Check 处理对象 传回结果
set "str=%~1"
set str_=
for /l %%i in (0 1 1000) do (
set tm_str=!str:~%%i,1!
if "!tm_str!"=="" set %2=!str_! & goto :eof
if "!tm_str!"==" " set str_=!str_!!tm_str!
if !tm_str! GTR Z set str_=!str_!!tm_str!
)
说明:test.txt中的内容,为要处理的文本内容
处理对象,小文本,且不含特殊字符(因为特殊字符在此未考虑)
作者: zhoushijay
时间: 2007-4-28 08:20
set fso=createobject("scripting.filesystemobject")
set txt=fso.opentextfile("11.txt")
gettxt=txt.readall
numtxt=len(gettxt)
for i=1 to numtxt
unite=mid(gettxt,i,1)
on error resume next
int(unite)
if err.number=0 then
gettxt=replace(gettxt,unite," ")
end if
if asc(unite)>=65 and asc(unite)<=122 then
if asc(unite)<91 or asc(unite)>96 then
gettxt=replace(gettxt,unite," ")
end if
end if
next
msgbox gettxt,,"过滤"
set newtxt=fso.createtextfile("22.txt")
newtxt.write gettxt
'vbs版的!
'11.txt为需要过滤的文件,请自己修改,22.txt为保存后的文本,可以不改。
作者: xixi27
时间: 2007-4-28 22:50
多谢各位的帮忙,麻烦的是我要处理的文本里面有很多空格,而且如果数字或者字母单独在一行内时,过滤后会有问题。
另外,会出现 “ECHO处于关闭状态 “ 的提示,这是什么意思啊?
请各位帮忙!谢谢!
作者: huzixuan
时间: 2007-4-29 00:53
@echo off
setlocal enabledelayedexpansion
for /f "delims=" %%i in (test.txt) do (
set str=%%i
set "str=!str: =!"
for /l %%j in (0,1,9) do (
if not "!str!"=="" set str=!str:%%j=!
)
for %%k in (a,b,c,d,e,f,g,h,i,j,k,l,m,n,o,p,q,r,s,t,u,v,w,x,y,z) do (
if not "!str!"=="" set str=!str:%%k=!
)
if not "!str!"=="" (
>>New.txt echo !str!
) else (
echo.
)
)
notepad New.txt
[
Last edited by huzixuan on 2007-4-29 at 06:14 AM ]
作者: xixi27
时间: 2007-4-29 02:24
楼上的回答可以解决数字或者字母单独成行的问题,但是如果数字或者字母之间有空格的话还是存在问题啊!
另外,能否解答一下出现 “ECHO处于关闭状态” 的问题呢? 非常感谢!
作者: lxmxn
时间: 2007-4-29 03:46
出现“ECHO处于关闭状态”的原因是echo命令后面的值为空。
作者: huzixuan
时间: 2007-4-29 06:15
先将 变量中 所有空格替换掉,然后依次替换掉 数字 以及 字母
最后读出变量
已经修改 10 楼代码
作者: huzixuan
时间: 2007-4-29 06:37
不知道哪个效率高一些
set fso = CreateObject("Scripting.FileSystemObject")
set rfile = fso.OpenTextFile("test.txt",1)
set wfile = fso.CreateTextFile("Wfile.txt")
str = rfile.readall
for k = 0 to 9
str = replace(str,k," ") ' 将 0 - 9 数字置空
next
for i = 65 to 90
str = replace(str,chr(i)," ") ' 将 a-z 小写字母置空
next
FOR J = 97 TO 122
STR = REPLACE(STR,CHR(J)," ") ' 将 A-Z 大写字母置空
NEXT
wfile.write str
wfile.close
作者: xixi27
时间: 2007-4-29 07:13
多谢huzixuan,我刚刚已经在你原来代码的基础上解决了问题,跟你的想法一样!
同时也谢谢其他各位的帮忙,这几天刚刚接触批处理,不过在这里真的学到了很多的东西,谢谢大家了!
还有一个问题,“echo."代表啥啊?
作者: Vampire
时间: 2007-4-29 07:27
显示空行。
作者: weilong888
时间: 2007-4-29 09:48
再加一行代码可能就没有空行了。
@echo off
setlocal enabledelayedexpansion
for /f "delims=" %%i in (test.txt) do (
set str=%%i & set "str=!str: =!" & set "str=!str: =!" )
for /l %%j in (0,1,9) do (
if not "!str!"=="" set "str=!str:%%j=!")
for %%k in (a,b,c,d,e,f,g,h,i,j,k,l,m,n,,o,p,q,r,s,t,u,v,w,x,y,z) do (
if not "!str!"=="" set "str=!str:%%k=!")
if not "!str!"=="" (
>>new.txt echo !str!) else (
echo.)
notepad new.txt
[
Last edited by weilong888 on 2007-4-29 at 10:03 AM ]
作者: mqw624
时间: 2010-12-6 19:37
Quote: |
Originally posted by youxi01 at 2007-4-28 08:06:
简单的还是可以处理的(不考虑特殊字符,对很多的空格处理不太合理)
利用批处理来处理,简单的演示代码:
[code]
@echo off
setlocal enabledelayedexp ... |
|
高手