|  | 
 
| amark 新手上路
 
  
 
 
 
 积分 3
 发帖 3
 注册 2009-2-3
 状态 离线
 | 
| 『楼 主』:
 [已结][NT]如何在超长行中检索关键字?
 
使用 LLM 解释/回答一下 
 
 
我要做的事情是这样子的:有一个XML报文,大小大约是1M左右,最长的一行大约有4000多字节,这样子的话,用find命令无法在这种超长行中检索关键字.
 现在的想法.
 1,用findstr命令,测试过,可以检索4KB的行
 2,把长行割成短行,这基本就是报文解析的事了.
 希望有过类似经验的朋友一起探讨.
 
 Last edited by amark on 2009-2-9 at 11:20 ]
 
 
 
 
 |  | 
|  2009-2-3 15:47 |  | 
|  | 
 
| yishanju 银牌会员
 
      [b]看你妹啊[/b]
 
 
 积分 1488
 发帖 1357
 注册 2006-5-20
 状态 离线
 |  | 
|  2009-2-3 15:54 |  | 
|  | 
 
| yishanju 银牌会员
 
      [b]看你妹啊[/b]
 
 
 积分 1488
 发帖 1357
 注册 2006-5-20
 状态 离线
 |  | 
|  2009-2-3 16:03 |  | 
|  | 
 
| HAT 版主
 
         
 
 
 
 积分 9023
 发帖 5017
 注册 2007-5-31
 状态 离线
 |  | 
|  2009-2-3 20:37 |  | 
|  | 
 
| amark 新手上路
 
  
 
 
 
 积分 3
 发帖 3
 注册 2009-2-3
 状态 离线
 | 
| 『第 5 楼』:
 
 
使用 LLM 解释/回答一下 
 
 
呃,是这样的.当findstr检索并返回这个4KB的行后,仍然需要在这4KB中找到特定关键字段.
 如:
 <errorfields><field name="date" type="0" value="" value1=今天" value2="昨天" time1="20090204" time2="20090203"/></errorfields>
 并把这段中的几个值如"今天""昨天""20090204""20090203"提取出来.
 昨天试着用for /f "tokens=31* delims=<> usebackq" %%i in (error.txt)来做这步工作.
 结果%%i只能取到第31个节点的内容,如attribute name="television" type="0" value="1"
 而想要对%%j也就是含有所需关键字段的字符串做进一步处理时,由于xml是utf-8编码的,echo %%j将会得到一堆乱码.
 现在正在整理思路.
 PS:条件所限,无法使用第三方工具.对2楼的建议先行谢过
 
 Last edited by amark on 2009-2-4 at 09:11 ]
 
 
 
 
 |  | 
|  2009-2-4 09:08 |  | 
|  | 
 
| netbenton 银牌会员
 
      批处理编程迷
 
 
 积分 1916
 发帖 752
 注册 2008-12-28
 来自 广西
 状态 离线
 | 
| 『第 6 楼』:
 
 
使用 LLM 解释/回答一下 
 
 
那就把它转换成ASCII码再用三方处理吧,偶觉得for /f可能搞不定4k以上的长字段,节点多更是处理不了。
 除非再用其它办法分行。
 
 
 
 
 
 |  
                  |  精简
 =>    个人
  网志  |  | 
|  2009-2-4 09:31 |  | 
|  | 
 
| yishanju 银牌会员
 
      [b]看你妹啊[/b]
 
 
 积分 1488
 发帖 1357
 注册 2006-5-20
 状态 离线
 | 
| 『第 7 楼』:
 
 
使用 LLM 解释/回答一下 
 
 
最多代码繁杂点,批处理应该是可以从XML中截出需要的字符串的传个文件上来看看就知道了
 
 
 
 
 
 |  
                  |  
 有问题请发论坛或者自行搜索,再短消息问我的统统是SB
 |  | 
|  2009-2-4 15:40 |  | 
|  | 
 
| amark 新手上路
 
  
 
 
 
 积分 3
 发帖 3
 注册 2009-2-3
 状态 离线
 | 
| 『第 8 楼』:
 
 
使用 LLM 解释/回答一下 
 
 
上周做好了.调了一个vbs来把>替换成>/n,解决长行的问题.调了另一个vbs把utf8转成unicode,然后再type成ansi.解决乱码的问题,再此谢谢楼上诸位的意见和建议. 
 
 
 
 |  | 
|  2009-2-9 11:25 |  | 
|  | 
 
| yishanju 银牌会员
 
      [b]看你妹啊[/b]
 
 
 积分 1488
 发帖 1357
 注册 2006-5-20
 状态 离线
 |  | 
|  2009-2-9 12:19 |  |