中国DOS联盟论坛

中国DOS联盟

-- 联合DOS 推动DOS 发展DOS --

联盟域名:www.cn-dos.net  论坛域名:www.cn-dos.net/forum
DOS,代表着自由开放与发展,我们努力起来,学习FreeDOS和Linux的自由开放与GNU精神,共同创造和发展美好的自由与GNU GPL世界吧!

游客:  注册 | 登录 | 命令行 | 会员 | 搜索 | 上传 | 帮助 »
中国DOS联盟论坛 » DOS批处理 & 脚本技术(批处理室) » 一个关于chm格式电子书的批处理
作者:
标题: 一个关于chm格式电子书的批处理 上一主题 | 下一主题
mn960mn
初级用户





积分 24
发帖 20
注册 2009-1-14
状态 离线
『楼 主』:  一个关于chm格式电子书的批处理

我在网上下了很多chm格式的电子书
想把里面的类容都复制到txt里面去
一个一个的复制太麻烦

求高手给个批处理能一次性的把里面的类容都
复制到txt里面去
(要一个chm页面的类容复制到一个txt里面去)

谢谢

2009-2-25 22:44
查看资料  发送邮件  发短消息 网志   编辑帖子  回复  引用回复
lxmxn
版主




积分 11386
发帖 4938
注册 2006-7-23
状态 离线
『第 2 楼』:  

可以分成这样几个步骤进行处理:

1、先用hh的反编译参数把chm文件分解成html格式的文件;
hh -decompile 输出目录 目标chm文件

2、利用sed等命令行工具去掉html文件里面的标签;
sed -i "s/<[^>]*>//g" html_files

3、利用for命令把第2步处理得到的html文件改名或者把处理后的内容定向到其它文件即可。

自己组织一下代码吧。

2009-2-26 05:14
查看资料  发送邮件  发短消息 网志   编辑帖子  回复  引用回复

请注意:您目前尚未注册或登录,请您注册登录以使用论坛的各项功能,例如发表和回复帖子等。


可打印版本 | 推荐给朋友 | 订阅主题 | 收藏主题



论坛跳转: