|
DOSforever
金牌会员
积分 4639
发帖 2239
注册 2005-1-30
状态 离线
|
|
2008-8-25 07:05 |
|
|
stockghost
中级用户
积分 215
发帖 105
注册 2007-6-2
状态 离线
|
『第
2 楼』:
刚才用UEStudio拷贝过去编辑了,却发现只有一个'?'
SlickEdit也是一样
拷贝到DOS下的编辑器,发现显示正确,只有一个字符,代码0xFA
|
|
2008-8-25 09:47 |
|
|
stockghost
中级用户
积分 215
发帖 105
注册 2007-6-2
状态 离线
|
|
2008-8-25 09:49 |
|
|
DOSforever
金牌会员
积分 4639
发帖 2239
注册 2005-1-30
状态 离线
|
|
2008-8-25 22:48 |
|
|
DOSforever
金牌会员
积分 4639
发帖 2239
注册 2005-1-30
状态 离线
|
|
2008-9-13 03:44 |
|
|
tigerpower
中级用户
大师兄
积分 377
发帖 99
注册 2005-8-26
状态 离线
|
『第
6 楼』:
因为各个字符集并非出自同一组织,所以相互之间是交集的关系,大多数字符集包含ASCII,而Unicode包含所有的字符集。
Windows XP把所有的文件名存储为Unicode,所以能在文件名里看见这些字符。
而在中文版Windows XP中的命令行cmd.exe默认以GBK编码运行(就是cp936),所以那些在GBK编码中没有的字符就看不到。
可以正常处理 Unicode 编码的纯文本编辑器,如果没有以unicode编码打开,就无法保存那些字符集中没有的字符。
我们可以看看楼主所找出的都是些什么字符:
打开记事本,将那6个字符复制上去,且一行一个,
文件->另存为->编码:Unicode big endian,文件名:c:\ch.txt
然后打开命令行,运行:
echo d 100 l 22 | debug c:\ch.txt
这条命令查看ch.txt的16进制格式,结果类似于:
-d 100 l 22
0B67:0100 FE FF 30 FB 00 0D 00 0A-00 B7 00 0D 00 0A FF 62 ..0............b
0B67:0110 00 0D 00 0A FF 63 00 0D-00 0A 30 0C 00 0D 00 0A .....c....0.....
0B67:0120 30 0D 0.
然后开始 -> 附件 -> 系统工具 -> 字符映射表
字体选Arial Unicode MS,选中下方“高级查看”,字符集:Unicode,分组:全部
在“转到Unicode”框里填上面红色的四个字符(如30FB),
就找到了该字符,并在最下方有该字符的名字,这6个字符依次是:
片假名中间点
中间点
半形左角括号
半形右角括号
左角括号
右角括号
[ Last edited by tigerpower on 2008-9-16 at 08:35 PM ]
|
|
2008-9-15 21:49 |
|
|
DOSforever
金牌会员
积分 4639
发帖 2239
注册 2005-1-30
状态 离线
|
|
2008-9-16 03:53 |
|
|
tigerpower
中级用户
大师兄
积分 377
发帖 99
注册 2005-8-26
状态 离线
|
『第
8 楼』:
没有Arial Unicode MS就选MS Mincho或MS Gothic,至于Lucida Sans Unicode,虽然是用Unicode编码的字体,但是不支持日文,所以日文字符(30FB)是找不到的。
Windows XP本身是设计成Little Endian结构的。
修改过游戏的朋友都知道,4字节查找金钱1000(16进制的3E8)在内存里是E8 03 00 00,这就叫Little Endian。
而Windows XP中的程序几乎都是Little Endian的,所以你见到一些程序UTF-16默认使用Little Endian。
但这只是Windows中的规矩,根据Unicode官方,当UTF-16不标明是BE还是LE时,默认是指BE,
具体还需根据文件头部的BOM(Byte Order Mark)判别。
至于是怎么想到要看它的 Unicode big endian 编码嘛,我也是试出来的:)
|
|
2008-9-16 21:32 |
|
|
DOSforever
金牌会员
积分 4639
发帖 2239
注册 2005-1-30
状态 离线
|
|
2008-9-17 01:18 |
|
|
tigerpower
中级用户
大师兄
积分 377
发帖 99
注册 2005-8-26
状态 离线
|
『第
10 楼』:
没标明Unicode的字体有些也是用Unicode编码的,比如上次提到的那二个日文字体。
记事本对于默认字体中没有的字就去找另外一种字体显示它。
Lucida Console里根本就没有汉字,能显示汉字是因为系统中有宋体。
至于它是以什么规则、什么顺序去找字体就不清楚了(Windows XP中文版中的记事本对找不到的字似乎会寻找宋体)。
但不是都能找到的,下方蓝色方框里第二行是六字真言的藏文写法,你贴到记事本看看,通常不能显示(如浏览器不能正常显示,请安装Arial Unicode MS字体)
另外,有O 字样的是OpenType字体。
六字大明咒:唵嘛呢叭咪吽
ༀ་མ་ཎི་པད་མེ་ཧཱུྃ
|
|
2008-9-17 22:17 |
|
|
DOSforever
金牌会员
积分 4639
发帖 2239
注册 2005-1-30
状态 离线
|
|
2008-9-19 02:54 |
|
|
tigerpower
中级用户
大师兄
积分 377
发帖 99
注册 2005-8-26
状态 离线
|
『第
12 楼』:
我上传了一个:Arial Unicode MS
md5:
bea62eb276a6f49d409efb49e1d190bb *arialuni.7z
|
|
2008-9-19 20:48 |
|
|
DOSforever
金牌会员
积分 4639
发帖 2239
注册 2005-1-30
状态 离线
|
|
2008-9-20 02:05 |
|
|
fujianabc
金牌会员
积分 3467
发帖 1616
注册 2004-6-21
状态 离线
|
『第
14 楼』:
Quote: | Originally posted by DOSforever at 2008-9-20 02:05 AM:
嘿嘿,不错,能正确显示了。
原来所说的六字是指翻译成汉字为六个字,原藏文为17个字
|
|
藏文是6个字,好像你显示的有问题,把藏文每个字的音素都拆开了,我vista的ie 7下显示的是6个字(每个字以倒三角形符号为间隔)
[ Last edited by fujianabc on 2008-9-21 at 11:46 AM ]
附件
1: 5o2V6I63_ysamN7Yvq4HK[1].png (2008-9-21 11:45, 2.79 K,下载次数: 1)
|
|
2008-9-20 21:14 |
|
|
DOSforever
金牌会员
积分 4639
发帖 2239
注册 2005-1-30
状态 离线
|
|
2008-9-21 01:52 |
|