Board logo

标题: 据说unicode转ANSI的批处理 [打印本页]

作者: electronixtar     时间: 2006-10-23 08:23    标题: 据说unicode转ANSI的批处理


@Echo off
Md temp
For %%a in (*.inf)  Do Type  %%a  >Temp\%%a
Copy  Temp\*.inf  /y
Del  Temp\*.inf
Rd  Temp
把很多 *.inf、*.ini 等Unicode格式转换成ANSI可以减小文件体积,功能不变!

大家想一下,能不能基于这个原理做一个精简注册表的呢?

[ Last edited by electronixtar on 2006-10-23 at 08:24 ]
作者: namejm     时间: 2006-10-23 08:32
  把Unicode转换成ANSI格式的真的能保证功能不变吗?虽然不知道是否正确,但是对这个说法有点怀疑。有知道的请解释一下原理。
作者: electronixtar     时间: 2006-10-23 08:40
因为 Unicode 保存英文用 2 个字节,而ANSI只要1个字节。系统里很多inf,用ANSI的完全够了
作者: nipo     时间: 2008-5-11 13:20    标题: 测试结果令人鼓舞,也有点奇怪!

双向测试了一个文本,

1、ANSI的。名称RVI.txt,内容如下:

{N=2,300,14}
V1:=((C-O)+2*(REF(C-O,1)+REF(C-O,2)+REF(C-O,3)))/6;
V2:=((H-L)+2*(REF(H-L,1)+REF(H-L,2)+REF(H-L,3)))/6;
NUM:=SUM(V1,N);
DENUM:=SUM(V2,N);
RVI:NUM/DENUM;
RVISIG:(RVI+2*(REF(RVI,1)+REF(RVI,2)+REF(RVI,3)))/6

测试用的代码:

cls
::@Echo off
del /s /q RVI.inf RVI_cheng.inf
echo.
For %%a in (RVI.txt) Do Type %%a >RVI.inf
echo.
For %%a in (RVI.inf) Do Type %%a >RVI_cheng.inf
start RVI.inf
start RVI_cheng.inf
exit

测试结果:
RVI.inf---UNICODE编码,显示正常。
RVI_cheng.inf---ANSI编码,显示字符异常。如下:

{   N   =   2   ,   3   0   0   ,   1   4   }   
   
   V   1   :   =   (   (   C   -   O   )   +   2   *   (   R   E   F   (   C   -   O   ,   1   )   +   R   E   F   (   C   -   O   ,   2   )   +   R   E   F   (   C   -   O   ,   3   )   )   )   /   6   ;   
   
   V   2   :   =   (   (   H   -   L   )   +   2   *   (   R   E   F   (   H   -   L   ,   1   )   +   R   E   F   (   H   -   L   ,   2   )   +   R   E   F   (   H   -   L   ,   3   )   )   )   /   6   ;   
   
   N   U   M   :   =   S   U   M   (   V   1   ,   N   )   ;   
   
   D   E   N   U   M   :   =   S   U   M   (   V   2   ,   N   )   ;   
   
   R   V   I   :   N   U   M   /   D   E   N   U   M   ;   
   
   R   V   I   S   I   G   :   (   R   V   I   +   2   *   (   R   E   F   (   R   V   I   ,   1   )   +   R   E   F   (   R   V   I   ,   2   )   +   R   E   F   (   R   V   I   ,   3   )   )   )   /   6   


2、UNCODE的。名称RVI_other.txt,内容不变。

测试代码,除了改一下文件名称,别的没变:
:clss
::@Echo off
del /s /q RVI_other.inf RVI_other_cheng.inf
echo.
For %%a in (RVI_other.txt) Do Type %%a >RVI_other.inf
echo.
For %%a in (RVI_other.inf) Do Type %%a >RVI_other_cheng.inf
start RVI_other.inf
start RVI_other_cheng.inf
exit

测试结果:
生成RVI_other.inf、RVI_other_cheng.inf。显示都和原本一样,但都是ANSI编码的。

这个测试说明,此Type方法确实能造成字符编码的改变,但机制还不清楚。尤其是第一个测试UNICODE-->ANSI造成字符显示异常,而第二个测试同样用UNCODE码却显示正常,不解。

[ Last edited by nipo on 2008-5-11 at 01:40 PM ]
作者: slore     时间: 2008-5-11 14:40
你的BAT能正常运行?
作者: knoppix7     时间: 2008-5-11 18:21
用cmd /a(/u)也可以的.而且保险..
作者: nipo     时间: 2008-5-11 21:43
回5楼:

我用的是.cmd,运行正常。

回6楼:

谢谢你的提示,我也看到了相关的贴子,查看了cmd/?。

我之所以对这个贴子的方法感兴趣,除了编码转换之外,还有它的TYPE功能。这至少可以在理论上认定,在DOS环境下可以独立地操作UNICODE编码文件。

具体实现上,在文本处理上我还是新手,希望引起各位高手对这个问题的重视,大家齐心协力,加速这一问题的解决。

这个问题对DOS很重要,UNCODE问题不解决,压缩了DOS的生存空间。不仅在处理文本上,在网络等许多方面的应用也一样,解决了它,DOS又得到一片新天地。

[ Last edited by nipo on 2008-5-11 at 09:47 PM ]