中国DOS联盟

-- 联合DOS 推动DOS 发展DOS --

联盟域名：www.cn-dos.net 论坛域名：www.cn-dos.net/forum
DOS，代表着自由开放与发展，我们努力起来，学习FreeDOS和Linux的自由开放与GNU精神，共同创造和发展美好的自由与GNU GPL世界吧！

游客: 注册 | 登录 | 命令行 | 会员 | 搜索 | 上传 | 帮助 »

中国DOS联盟论坛 » DOS批处理 & 脚本技术（批处理室） » 【已结】获得文件第69行到倒数第二行间的内容

asnahu
初级用户

积分 99
发帖 53
注册 2006-8-18
状态离线

『楼主』: 【已结】获得文件第69行到倒数第二行间的内容

如题。现在有一千多个网页文件，想删除其中多余的网页标记和脚本代码，通过观察发现从第69行到倒数第二行是正文内容，文件分别位于同一个目录下的不同文件夹下，请问批处理如何实现？:)

初步代码如下：

@echo off 

setlocal enabledelayedexpansion

for /r %%i in (*.html) do (

    set/a n=!n!+1

    for /f "delims=" %%a in ('type %%i^|sed -n "69,$p"^|sed "$d"')  do (

    echo %%a>>%%~dpi!n!.html

    )

)

pause

新的代码：

@echo off

setlocal enabledelayedexpansion

for /r %%i in (*.html) do (

    set/a n=!n!+1

    for /f "delims=" %%a in ('type %%i^|sed -n "69,$p"^|sed "$d"^|sed "s/^</<html>\n<head>\n  <meta http-equiv=\"Content-Type\" content=\"text\/html^; charset^=GB2312\">\n  <title><\/title>\n  <style><\/style>\n<body>\n</"') do (

    echo %%a>>%%~dpi!n!.html

    )

)

pause

补充：以上代码基本解决问题，但网页中的charset标记被去掉了，所以现在打开生成的网页都是“西方”，请问如何保留原来的编码？{解决}

[ Last edited by asnahu on 2009-6-28 at 21:39 ]