|
lxh623
初级用户
积分 34
发帖 30
注册 2008-11-24
状态 离线
|
『楼 主』:
[已结] 文本片断提取
文献管理软件很多人用,输出格式大体是特征符号分隔的段落。见实例(以“------”分隔,第一个前面没有“----”)。
文件夹下面有许多这样的文件,我想用文本a中的每行关键词去搜索这些文件,如果有,就把该行所在的片断(从------,到------)(第一个前面没有“----”;输出包括字符“------”)输入到文本b。
谢谢您!
例文:
--AU-- STARZEWSKI, K. H.; STARZEWSKI, K. H.; OSTOJA STARZEWSKI A K H,
--TI-- new polyacetylene-contg. polymer prods. - prepd. by polymerising acetylene in presence of polymer different from polyacetylene and nickel cpd. as catalyst
--YP-- 1987
--VL-- DE3526234-A DE352
--NB-- EP210498-A2; DE35262
--RU-- leescott
--RT-- Patent
--PB-- BAYER AG (FARB);
--TT-- EP210498-A2; DE3526234-A; EP210498-A; JP62022856-A; US4769422-A; US4833201-A; EP210498-B; DE3684827-G; JP95068428-B2
--AB-- New polyacetylene-contg. polymer prods. contain, by wt. 0.1-99 (1-50) % polyacetylene and 99.9-1 (99-50) % other polymers, pref. contg. polar gps. The prods. contain the polyacetylene in highly dispersed heterogeneous or in homogeneous distribution. The polymers are pred. by polymerising C2H2 in the presence of (a) a polymer different from polyacetylene and pref. contg. polar gps. and (b) Ni cpd. which are catalysts for the prodn. of polyacetylene and are not inactivated by the polymer soln. 【USE/ADVANTAGE】 - Uses range from non-conductors, via semi-conductors to electrical conductors., e.g., in an example, for antistatic purposes. Doping with I2 increase electrical conductivity. The prods. can be worked up to shaped articles, e.g. filaments or foil without a loss of their electrical properties. The chemical properties resist storage.
--DI-- 2009-4-15
--DM-- 2009-4-15
--PR-- Normal
--C1-- EP210498-A2 DE3526234-A 29 Jan 1987 198705 Pages: 6 EP210498-A 04 Feb 1987 198705 JP62022856-A 31 Jan 1987 198710 US4769422-A 06 Sep 1988 198838 Pages: 4 US4833201-A 23 May 1989 198924 Pages: 5 EP210498-B 15
--C2-- A12 (Di-and higher olefins, acetylenics, nitroso compounds); A85 (Electrical applications); E11 (Containing P and/or Si); L03 (Electro-(in)organic, chemical features of electrical devices); X12 (Power Distribution/Components/Converters)
--C4-- A04-A02; A07-A02; E05-L02C; L03-A; L03-A02D; L04-A04; X12-D01C
--MB-- leescott
--RS-- EP210498-A2 DE3317825-A BAYER AG (FARB) OSTOJASTAR K H A, WITTE J, BARTI H DE3403493-A BAYER AG (FARB) OSTOJASTAR K H A, WITTE J EP80065-A BASF AG (BADI) NAARMANN H, NAEGELE D, PENZIEN K US4394304-A MASSACH【USE】TTS INST TECHNOLOGY (MASI) WNEK G E EP210498-A DE3317825 BAYER AG (FARB) OSTOJASTAR K H A, WITTE J, BARTI H DE3403493 BAYER AG (FARB) OSTOJASTAR K H A, WITTE J EP80065-A BASF AG (BADI) NAARMANN H, NAEGELE D, PENZIEN K US4394304-A MASSACH【USE】TTS INST TECHNOLOGY (MASI) WNEK G E US4769422-A US3211714-A US4394304-A MASSACH【USE】TTS INST TECHNOLOGY (MASI) WNEK G E US4454178-A BASF AG (BADI) NAARMANN H, NAEGELE D, PENZIEN K US4481312-A BAYER AG (FARB) HOCKER J, MERTEN R, WILLENBERG B US4537982-A BAYER AG (FARB) OSTOJASTAR K H A, WITTE J, BARTI H US4616067-A GTE LABS INC (SYLV) LEE K I, JOPSON H US4620021-A BAYER AG (FARB) OSTOJA S, WITTE J, BERTL H US4833201-A DE3317825 BAYER AG (FARB) OSTOJASTAR K H A, WITTE J, BARTI H DE3403493 BAYER AG (FARB) OSTOJASTAR K H A, WITTE J EP80065-A BASF AG (BADI) NAARMANN H, NAEGELE D, PENZIEN K JP60225305 DAINICHISEIKA COLOR & CHEM MFG (DAIC); UKIMA GOSEI KK (UKIM-Non-standard) US3211714-A US4394304-A MASSACH【USE】TTS INST TECHNOLOGY (MASI) WNEK G E US4454178-A BASF AG (BADI) NAARMANN H, NAEGELE D, PENZIEN K US4481312-A BAYER AG (FARB) HOCKER J, MERTEN R, WILLENBERG B US4537982-A BAYER AG (FARB) OSTOJASTAR K H A, WITTE J, BARTI H US4616067-A GTE LABS INC (SYLV) LEE K I, JOPSON H US4620021-A BAYER AG (FARB) OSTOJA S, WITTE J, BERTL H US4705645-A GTE LABS INC (SYLV) LEE K I, JOPSON H WO8302617-A MASSACH【USE】TTS INST TECHNOLOGY (MASI) WNEK G E EP210498-B DE3317825 BAYER AG (FARB) OSTOJASTAR K H A, WITTE J, BARTI H DE3403493 BAYER AG (FARB) OSTOJASTAR K H A, WITTE J EP80065-A BASF AG (BADI) NAARMANN H, NAEGELE D, PENZIEN K US4394304-A MASSACH【USE】TTS INST TECHNOLOGY (MASI) WNEK G E JP95068428-B2 JP58052337-A SHOWA DENKO KK (SHOW); HITACHI LTD (HITA) KOBAYASHI Y, YAMAGUSHI K, KIRA M JP58225154-A QMC IND RES LTD (QMCI-Non-standard) YOUNG R J JP59172539-A SHOWA DENKO KK (SHOW) JP59215348-A SHOWA DENKO KK (SHOW)
--CA-- C08F-002/44; C08F-004/60; C08F-038/02; C08F-238/02; C08F-291/00; C08L-001/08; C08L-019/00; C08L-029/04; C08L-033/20; C08L-039/06; C08L-049/00; C08L-101/00; H01B-001/12; H01J-029/28; C08F-004/70; C08L-027/06
--SE-- DE3526234 23 Jul
--LP-- 2009-4-15 22:13:05
------
--AU-- SHIBATA, Y.; SHIBATA, Y.; SHIBATA, Y.; SHIBATA, Y.; SHIBATA, Y.
--TI-- optical deformation sensor using waveguide - has light through waveguide varied by deg. of elastic deformation achieved by applying load
--YP-- 1987
--VL-- EP210372-A EP1072
--NB-- EP210372-A2; EP21037
--RU-- leescott
--RT-- Patent
--PB-- SUMITOMO ELECTRIC IND CO (SUME);
--TT-- EP210372-A2; EP210372-A; US4750796-A; JP61277028-A; CA1270662-A
--AB-- The sensor is in the form of a press button (10) in a casing (11) and contg. an optical waveguide (12). The latter may have a round, square or rectangular cross-section and comprises a cladding of elastomer. Elasticity of the cladding helps in the restoration of the press button to its original position after the application of a load. The amt. of light propagated through the waveguide is varied according to a deg. of elastic deformation of the waveguide. 【USE/ADVANTAGE】 - For pressure, strain, light switch. In proof against Em field interference.
--DI-- 2009-4-15
--DM-- 2009-4-15
--PR-- Normal
--C1-- EP210372-A2 EP210372-A 04 Feb 1987 198705 Pages: 18 US4750796-A 14 Jun 1988 198826 Pages: 9 JP61277028-A 08 Dec 1986 199028 CA1270662-A 26 Jun 1990 199029
--C2-- A89 (Photographic, laboratory equipment, optical); L01 (Glass including composition, forming, but not containers); P81 (Optics); S02 (Engineering Instrumentation, recording equipment, general testing methods); V07 (Fibre-optics and Light Control)
--C4-- A12-L03; L03-B04; L03-D04D; S02-F01X; S02-K03B; V07-F01A1; V07-K01
--MB-- leescott
--CN-- 1987030660
--RS-- EP210372-A2 GB2056672-A GEC TRAFFIC AUTOMATION LTD (ENGE) HARDY A J US3712705-A US4212514-A SOC NOUV CONNEXION (CONN-Non-standard) PRUNIER J C, BELLEMON Y WO8500897-A1 MITSUBISHI RAYON CO LTD (MITR); YAMAMOTO T (YAMA-Individual) YAMAMOTO T, MURATA R EP210372-A GB2056672 GEC TRAFFIC AUTOMATION LTD (ENGE) HARDY A J US3712705-A US4212514-A SOC NOUV CONNEXION (CONN-Non-standard) PRUNIER J C, BELLEMON Y WO8500897-A MITSUBISHI RAYON CO LTD (MITR); YAMAMOTO T (YAMA-Individual) YAMAMOTO T, MURATA R US4750796-A JP121787 US4212514-A SOC NOUV CONNEXION (CONN-Non-standard) PRUNIER J C, BELLEMON Y US4386269-A AVON RUBBER CO LTD (AVOR) MURPHY R J, TURNER D M US4421979-A TRW INC (THOP) ASAWA C K, AUSTIN J W, BARNOSKI M K, PERSONICK S D, JACKSON A R US4750796-A "IBM Technical Disclosure Bulletin", by Kaser et al., vol. 16, No. 18, Jan. 1974.
--CA-- G01D-005/26; G01L-001/24; G02B-006/16; H01J-005/16
--SE-- JP119576 31 May 1
--LP-- 2009-4-15 22:13:05
------
[ Last edited by lxh623 on 2009-5-1 at 10:15 ]
|
|
2009-4-24 22:50 |
|
|
freeants001
中级用户
积分 330
发帖 244
注册 2006-4-14 来自 湖北
状态 离线
|
『第
2 楼』:
Quote: | Originally posted by lxh623 at 2009-4-24 22:50:
...文件夹下面有许多这样的文件,我想用文本a中的每行关键词去搜索这些文件,如果有,就把该行所在的片断(从------,到------) |
|
给楼主提两点意见:
1.上面红色的文字,文本a.txt中的每一行与文献资料的每一段的关系是AND或OR,楼主没有说明.
2.最好把a.txt的内容也贴一份出来,这样别人才能更好的帮助你.
[ Last edited by freeants001 on 2009-4-25 at 05:08 ]
|
|
2009-4-25 00:50 |
|
|
netbenton
银牌会员
批处理编程迷
积分 1916
发帖 752
注册 2008-12-28 来自 广西
状态 离线
|
『第
3 楼』:
两个代码,
第二个更高效一点
@echo off&setlocal enabledelayedexpansion
set a=b
set b=a
for /f %%a in (a.txt) do (set str=!str! %%a)
(for /f "delims=" %%a in ('dir /b/a-d') do (
set c=a
findstr "%str%" "%%a">nul
if !errorlevel!==0 (
for /f "delims=" %%i in ('type "%%a"') do (
if !c!==b echo.%%i
if "%%i"=="------" call set c=%%!c!%%
))
))>b.txt
@echo off&setlocal enabledelayedexpansion
for /f "delims=:" %%a in ('findstr /g:a.txt *.txt') do set ##%%a=1
set a=b
set b=a
(for /f "delims==#" %%a in ('set ##') do (
set c=a
for /f "delims=" %%b in ('type "%%a"') do (
if !c!==b echo.%%b
if "%%b"=="------" call set c=%%!c!%%
)
))>b.txt [ Last edited by netbenton on 2009-4-25 at 04:48 ]
|
精简
[你的+我的+他的]=>[大家的] 个人网志 |
|
2009-4-25 01:12 |
|
|
lxh623
初级用户
积分 34
发帖 30
注册 2008-11-24
状态 离线
|
『第
4 楼』:
'findstr /g:a.txt *.bat'是不是应该为*.txt?批处理只是一闪就关闭。
[ Last edited by lxh623 on 2009-4-25 at 03:59 ]
|
|
2009-4-25 03:56 |
|
|
lxh623
初级用户
积分 34
发帖 30
注册 2008-11-24
状态 离线
|
『第
5 楼』:
Quote: | Originally posted by freeants001 at 2009-4-25 00:50:
给楼主提两点意见:
1.上面红色的文字,文本a.txt中的每一行是否与文献资料的每一段的关系,楼主没有说明.
2.最好把a.txt的内容也贴一份出来,这样别人才能更好的帮助你. |
|
我以为说的还算明白。
文本a.txt中的每一行是搜索关键词。
附件
1: b.rar (2009-4-25 04:23, 8.65 K,下载次数: 5)
|
|
2009-4-25 04:23 |
|
|
netbenton
银牌会员
批处理编程迷
积分 1916
发帖 752
注册 2008-12-28 来自 广西
状态 离线
|
『第
6 楼』:
re 4L
是应该.bat为.txt
在3L已经改回来了.见笑了^_^
|
精简
[你的+我的+他的]=>[大家的] 个人网志 |
|
2009-4-25 06:28 |
|
|
freeants001
中级用户
积分 330
发帖 244
注册 2006-4-14 来自 湖北
状态 离线
|
『第
7 楼』:
@echo off
set KWF="a.txt"
del $dest$.txt>nul
for /r %%i in (*.txt) do set n=0& if /i "%%~nxi" neq %KWF% call:CONVERT "%%~i"
del $$$.tmp>nul&&pause
goto:eof
:CONVERT
for /f "usebackq delims=" %%i in ("%~1") do (
if "%%~i" neq "------" (
echo %%i>>$$$.tmp
) else (
echo ------>>$$$.tmp
set/a n+=1
call :match "%~1"
type nul>$$$.tmp
)
)
GOTO:EOF
:MATCH
echo 查找文件 "%~nx1" 第 %n% 段……
findstr /g:%KWF% $$$.tmp>nul&&type $$$.tmp>>$dest$.txt
GOTO:EOF [ Last edited by freeants001 on 2009-4-25 at 06:43 ]
|
|
2009-4-25 06:33 |
|
|
lxh623
初级用户
积分 34
发帖 30
注册 2008-11-24
状态 离线
|
『第
8 楼』:
使用了很久,好像都不行?麻烦二位再看看。
另外,如果再加个条件,在含有“--AB--”和“--TI-- ”的行中搜索,可行吗?
[ Last edited by lxh623 on 2009-4-25 at 23:40 ]
|
|
2009-4-25 12:31 |
|
|
netbenton
银牌会员
批处理编程迷
积分 1916
发帖 752
注册 2008-12-28 来自 广西
状态 离线
|
『第
9 楼』:
还不行吗?
那你得举个例子才能明白你的意思了。
如:
a.txt关键字内容:
kkk
zzz
要搜索文件举例:
zzz
------
dddd
------
aaaa
------
33444
b.txt 结果为:
???
|
精简
[你的+我的+他的]=>[大家的] 个人网志 |
|
2009-4-25 13:33 |
|
|
lxh623
初级用户
积分 34
发帖 30
注册 2008-11-24
状态 离线
|
『第
10 楼』:
Quote: | Originally posted by netbenton at 2009-4-25 13:33:
还不行吗?
那你得举个例子才能明白你的意思了。
如:
a.txt关键字内容:
kkk
zzz
要搜索文件举例:
zzz
b.txt 结果为:
??? |
|
应该是行!
只怪自己当初没想明白,如果加个条件TI+AB,就好了。
现在,C2里面有不少silicone。
能不能再请您们帮帮忙?
谢谢啦!
[ Last edited by lxh623 on 2009-4-25 at 23:41 ]
|
|
2009-4-25 22:22 |
|
|
netbenton
银牌会员
批处理编程迷
积分 1916
发帖 752
注册 2008-12-28 来自 广西
状态 离线
|
『第
11 楼』:
不明白楼主的意思了,是不是增加--TI-- 和 --AB--间的内容输出呢?
C2又是怎么回事呢?
楼主要是再说不明白,恐怕是无人帮你的
|
精简
[你的+我的+他的]=>[大家的] 个人网志 |
|
2009-4-26 02:47 |
|
|
freeants001
中级用户
积分 330
发帖 244
注册 2006-4-14 来自 湖北
状态 离线
|
『第
12 楼』:
@echo off&setlocal enabledelayedexpansion
set KWF="a.txt"
del $dest$.txt>nul
for /r %%i in (*.txt) do (set n=1& if /i "%%~nxi" neq %KWF% call:CONVERT "%%~i")
pause&goto:eof
:CONVERT
set/a tp=0
for /f "usebackq delims=" %%i in ("%~1") do (
set lb6=%%i
set lb6=!lb6:~0,6!
echo %%i>>$$$.tmp
if "!lb6!" equ "--AB--" (echo %%i|findstr /g:%KWF% >nul&&set/a tp=1)
if "!lb6!" equ "--TI--" (echo %%i|findstr /g:%KWF% >nul&&set/a tp=1)
if "!lb6!" equ "--LP--" (
if "!tp!" equ "1" (
echo 文件 "%~nx1" 第 !n! 段,符合要求……
type $$$.tmp>>$dest$.txt
set/a tp=0
type nul>$$$.tmp
)
set /a n+=1
)
)
GOTO:EOF [ Last edited by freeants001 on 2009-4-26 at 06:10 ]
|
|
2009-4-26 06:01 |
|
|
lxh623
初级用户
积分 34
发帖 30
注册 2008-11-24
状态 离线
|
『第
13 楼』:
Quote: | Originally posted by netbenton at 2009-4-26 02:47:
不明白楼主的意思了,是不是增加--TI-- 和 --AB--间的内容输出呢?
C2又是怎么回事呢?
楼主要是再说不明白,恐怕是无人帮你的 |
|
坦白交待,在含有“--AB--”和“--TI-- ”的行中搜索。谢谢!
C2指的是“--C2-- ”。
[ Last edited by lxh623 on 2009-4-26 at 09:46 ]
|
|
2009-4-26 09:38 |
|
|
yishanju
银牌会员
[b]看你妹啊[/b]
积分 1488
发帖 1357
注册 2006-5-20
状态 离线
|
『第
14 楼』:
建议上传要处理的文件,说清楚要做什么
|
有问题请发论坛或者自行搜索,再短消息问我的统统是SB |
|
2009-4-26 10:43 |
|
|
lxh623
初级用户
积分 34
发帖 30
注册 2008-11-24
状态 离线
|
『第
15 楼』:
Quote: | Originally posted by yishanju at 2009-4-26 10:43:
建议上传要处理的文件,说清楚要做什么 |
|
谢谢!附件在5楼!
|
|
2009-4-26 10:55 |
|
|