Board logo

标题: [求助]需要截取并筛选合并文件求助 [打印本页]

作者: qq43142691     时间: 2010-5-19 22:04    标题: [求助]需要截取并筛选合并文件求助

各位朋友好。
我这里有个难题,折腾我一天了,论坛也搜索过N次了,还是没办法搞好。请大家帮帮忙,谢谢:
我有 test 文件夹内含 文件名字规则如下:
125.67.89.242_201326601-day.png
125.67.89.242_201326601-month.png
125.67.89.242_201326601-week.png
125.67.89.242_201326601-year.png
125.67.89.242_201326601.html
125.67.89.242_201326601.log
125.67.89.242_201326601.old
----------------------------------------------分割线---------------------------
举例其中一个html文件内容如下:
<!-- Begin Head -->
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">
<HTML>
<HEAD>
<TITLE>Aux6/0/1 -- hdw-S8512-1</TITLE>---红色字就是我想提取的
<META HTTP-EQUIV="Refresh" CONTENT="300">
<META HTTP-EQUIV="Pragma" CONTENT="no-cache">
<META HTTP-EQUIV="Cache-Control" content="no-cache">
<META HTTP-EQUIV="Expires" CONTENT="Wed, 19 May 2010 08:35:23 GMT">
<META HTTP-EQUIV="Generator" CONTENT="MRTG 2.10.15">
<META HTTP-EQUIV="Date" CONTENT="Wed, 19 May 2010 08:35:23 GMT">

<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=iso-8859-1">
<!-- maxin d 0 -->
<!-- maxout d 0 -->
<!-- avin d 0 -->
<!-- avout d 0 -->
<!-- cuin d 0 -->
<!-- cuout d 0 -->
<!-- maxin w 0 -->
<!-- maxout w 0 -->
<!-- avin w 0 -->
<!-- avout w 0 -->
<!-- cuin w 0 -->
<!-- cuout w 0 -->
<!-- maxin m 0 -->
<!-- maxout m 0 -->
<!-- avin m 0 -->
<!-- avout m 0 -->
<!-- cuin m 0 -->
<!-- cuout m 0 -->
-----------省略N行------
</BODY>
</HTML>
------------------------------分割线------------------------------------
问题是:
我要 1 提取 文件夹 下面 html 的 文件名.html 和 文件名 作为变量
     2 提取每个 文件夹 下面 html 的 内容 <TITLE> 之间的名字title作为变量 </TITLE>
获得 变量 文件名.html -----变量A
获得 变量 文件名    ------ 变量B
获得 变量 title内容   ----- 变量C
以上3个变量写入文件为:

<td><DIV><B>变量C </B></DIV>
<DIV><A HREF="变量A"><IMG BORDER=1 ALT="变量B Traffic Graph" SRC="碧昂两B-day.png"></A><BR>
<SMALL><!--#flastmod file="变量A" --></SMALL></DIV>

--------------------------分割线-----------
我找了好多资料都没法搞。希望各位能帮忙想象办法,感激不尽
QQ 43142691

[ Last edited by qq43142691 on 2010-5-19 at 22:11 ]
作者: Hanyeguxing     时间: 2010-5-19 23:21

@echo off
for %%a in (*.html) do (
    set a=%%a&set c=%%~na
    for /F "usebackq delims=" %%b in ("%%a") do (
        set b=%%b
        setlocal enabledelayedexpansion
        if /i "!b:~0,7!!b:~-8!"=="<TITLE></TITLE>" for /f "delims=" %%c in ('more +10^<"%~fs0"') do echo.%%c
        Endlocal
))>>out.txt
exit
<td><DIV><B>!b:~7,-8! </B></DIV>
<DIV><A HREF="!a!"><IMG BORDER=1 ALT="!c! Traffic Graph" SRC="碧昂两B-day.png"></A><BR>
<SMALL><^!--#flastmod file="!a!" --></SMALL></DIV>
条件1:操作当前目录
条件2:所有被处理文件为ANSI编码
条件3:<TITLE>Aux6/0/1 -- hdw-S8512-1</TITLE>的行首行尾没有其他任何字符