中国DOS联盟论坛

中国DOS联盟

-- 联合DOS 推动DOS 发展DOS --

联盟域名:www.cn-dos.net  论坛域名:www.cn-dos.net/forum
DOS,代表着自由开放与发展,我们努力起来,学习FreeDOS和Linux的自由开放与GNU精神,共同创造和发展美好的自由与GNU GPL世界吧!

游客:  注册 | 登录 | 命令行 | 会员 | 搜索 | 上传 | 帮助 »
中国DOS联盟论坛 » DOS批处理 & 脚本技术(批处理室) » 【已结】获得文件第69行到倒数第二行间的内容
作者:
标题: 【已结】获得文件第69行到倒数第二行间的内容 上一主题 | 下一主题
asnahu
初级用户





积分 99
发帖 53
注册 2006-8-18
状态 离线
『楼 主』:  【已结】获得文件第69行到倒数第二行间的内容

如题。现在有一千多个网页文件,想删除其中多余的网页标记和脚本代码,通过观察发现从第69行到倒数第二行是正文内容,文件分别位于同一个目录下的不同文件夹下,请问批处理如何实现?:)

初步代码如下:
@echo off
setlocal enabledelayedexpansion
for /r %%i in (*.html) do (
    set/a n=!n!+1
    for /f "delims=" %%a in ('type %%i^|sed -n "69,$p"^|sed "$d"')  do (
    echo %%a>>%%~dpi!n!.html
    )
)

pause
新的代码:
@echo off
setlocal enabledelayedexpansion
for /r %%i in (*.html) do (
    set/a n=!n!+1
    for /f "delims=" %%a in ('type %%i^|sed -n "69,$p"^|sed "$d"^|sed "s/^</<html>\n<head>\n  <meta http-equiv=\"Content-Type\" content=\"text\/html^; charset^=GB2312\">\n  <title><\/title>\n  <style><\/style>\n<body>\n</"') do (
    echo %%a>>%%~dpi!n!.html
    )
)

pause
补充:以上代码基本解决问题,但网页中的charset标记被去掉了,所以现在打开生成的网页都是“西方”,请问如何保留原来的编码?{解决}

[ Last edited by asnahu on 2009-6-28 at 21:39 ]

附件 1: process.7z (2009-6-27 23:25, 8.06 K,下载次数: 5)
2009-6-27 21:34
查看资料  发送邮件  发短消息 网志   编辑帖子  回复  引用回复
Hanyeguxing
银牌会员

正在学习中的菜鸟...


积分 1039
发帖 897
注册 2009-3-1
来自 在地狱中仰望天堂
状态 离线
『第 2 楼』:  

解析文件时保留第2行,并按语法补全



批处理之家 http://bbs.bathome.net/forum-5-1.html
2009-6-28 00:02
查看资料  发送邮件  发短消息 网志   编辑帖子  回复  引用回复
lxmxn
版主




积分 11386
发帖 4938
注册 2006-7-23
状态 离线
『第 3 楼』:  

调整浏览器的编码类型,自动或者GB2312。

2009-6-28 00:17
查看资料  发送邮件  发短消息 网志   编辑帖子  回复  引用回复
yishanju
银牌会员

[b]看你妹啊[/b]


积分 1488
发帖 1357
注册 2006-5-20
状态 离线
『第 4 楼』:  

尝试改进代码以适应需要就对了




有问题请发论坛或者自行搜索,再短消息问我的统统是SB
2009-6-29 00:35
查看资料  发短消息 网志   编辑帖子  回复  引用回复

请注意:您目前尚未注册或登录,请您注册登录以使用论坛的各项功能,例如发表和回复帖子等。


可打印版本 | 推荐给朋友 | 订阅主题 | 收藏主题



论坛跳转: