中国DOS联盟论坛

中国DOS联盟

-- 联合DOS 推动DOS 发展DOS --

联盟域名:www.cn-dos.net  论坛域名:www.cn-dos.net/forum
DOS,代表着自由开放与发展,我们努力起来,学习FreeDOS和Linux的自由开放与GNU精神,共同创造和发展美好的自由与GNU GPL世界吧!

游客:  注册 | 登录 | 命令行 | 会员 | 搜索 | 上传 | 帮助 »
中国DOS联盟论坛 » DOS批处理 & 脚本技术(批处理室) » 【求助】type “htm文件” 乱码
作者:
标题: 【求助】type “htm文件” 乱码 上一主题 | 下一主题
plp626
银牌会员

钻石会员


积分 2278
发帖 1020
注册 2007-11-19
状态 离线
『楼 主』:  【求助】type “htm文件” 乱码

我是想对网页文件用sed,find进行处理,找到我想要的链接地址,可我遇到了编码的问题。


大家可以把联盟的网页文件脱机存盘【保存类型选择仅html】,然后在cmd下type 这个文件,里面的汉子会全成了乱码;

为了这个问题,我在网上搜索了下编码的原理,联盟论坛的源文件里有
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
说明htm文件要显示的内容在源文件中是以utf-8编码的,我从网上得知,并用winhex作实验知道:
utf-8编码的文本文件前三个字符是 ee bb bf,英文字符占一个字节,汉字占三个字节。
我在查看联盟的网页文件,文件头没有eebbbf字样,说明从文本的方式来看源文件是ascii编码的。

那么我想,要让cmd识别htm文件里的汉子,首先得把htm的源文件里要显示的汉子转换为ascii才行,这个转换我不知道是怎么实现的,但是我知道用notepad就可以很简单的另存为ascii来实现。
========================================
1. 以上只是我个人对编码的理解,如果有误请大家指出。

2. 大家能否说下记事本转换的原理,或者提下这种转换的vbs代码或者是命令行工具【是把utf-8的htm文件转换为ascii编码的htm文件】

[ Last edited by plp626 on 2010-6-23 at 20:17 ]



山外有山,人外有人;低调做人,努力做事。

进入网盘(各种工具)~~ 空间~~cmd学习
2010-6-23 20:15
查看资料  发短消息 网志   编辑帖子  回复  引用回复

请注意:您目前尚未注册或登录,请您注册登录以使用论坛的各项功能,例如发表和回复帖子等。


可打印版本 | 推荐给朋友 | 订阅主题 | 收藏主题



论坛跳转: