中国DOS联盟论坛

中国DOS联盟

-- 联合DOS 推动DOS 发展DOS --

联盟域名:www.cn-dos.net  论坛域名:www.cn-dos.net/forum
DOS,代表着自由开放与发展,我们努力起来,学习FreeDOS和Linux的自由开放与GNU精神,共同创造和发展美好的自由与GNU GPL世界吧!

游客:  注册 | 登录 | 命令行 | 会员 | 搜索 | 上传 | 帮助 »
中国DOS联盟论坛 » DOS批处理 & 脚本技术(批处理室) » [求助成功]文档拆分 一 (拆分NCBI中fasta格式的文档)
作者:
标题: [求助成功]文档拆分 一 (拆分NCBI中fasta格式的文档) 上一主题 | 下一主题
biogene
新手上路





积分 5
发帖 5
注册 2009-5-21
来自 中国
状态 离线
『楼 主』:  [求助成功]文档拆分 一 (拆分NCBI中fasta格式的文档)

在国立生物技术信息中心(NCBI)中的碱基序列下载后,是在一个文件中,文档扩展名为.fasta,很多个序列都在一个文档中,使用起来不是太方便,请大家帮我看看能否用拆分文本文档的方法拆分(扩展名为.fasta,可以用写字板打开)。

要求:
1、将文件从空行处拆分为单个文件
2、将每段中如'>gi|167427515|gb|'后面的字符如''EU289029’'提取出来做为文件名
3、将拆分后文件的扩展名改为.seq

多谢各位大侠了。

文本样式下载地址: http://biogene.ys168.com/?jdfwkey=wwmfl1
文本样式:
>gi|167427515|gb|EU289029.1| Newcastle disease virus strain VG/GA clone 5, complete genome
ACCAAACAGAGAATCCGTGAGTTACGATAAAAGGCGAAGGAGCAATTGAAGTCGCACGGGTAGAAGGTGT
GAATCTCGAGTGCGAGCCCGAAGCACAAACTCGAGGAAGCCTTCTGCCAACATGTCTTCCGTATTCGACG.........................

>gi|167424515|gb|EU289029.1| Newcastle disease virus strain VG/GA clone 5, complete genome
ACCAAACAGAGAATCCGTGAGTTACGATAAAAGGCGAAGGAGCAATTGAAGTCGCACGGGTAGAAGGTGT
GAATCTCGAGTGCGAGCCCGAAGCACAAACTCGAGGAAGCCTTCTGCCAACATGTCTTCCGTATTCGACG.........................

>gi|218511471|gb|FJ480823.1| Newcastle disease virus strain Go/CH/HLJ/2/06 fusion protein (F) mRNA, complete cds
ATGGGCTCCAGACCTTCTACCAAGAACCCAGCACCTATGATGCTGACTATCCGGGTCGCGCTGGTACTGA
GTTGCATCTGTCCGGCAAACTCCATTGATGGCAGGCCTCTTGCAGCTGCAGGAATTGTGGTTACAGGAGA.............................

>gi|167427515|gb|EU289029.1| Newcastle disease virus strain VG/GA clone 5, complete genome
ACCAAACAGAGAATCCGTGAGTTACGATAAAAGGCGAAGGAGCAATTGAAGTCGCACGGGTAGAAGGTGT
GAATCTCGAGTGCGAGCCCGAAGCACAAACTCGAGGAAGCCTTCTGCCAACATGTCTTCCGTATTCGACG.........................

[ Last edited by biogene on 2009-5-22 at 23:10 ]

2009-5-23 00:48
查看资料  发送邮件  发短消息 网志   编辑帖子  回复  引用回复
yishanju
银牌会员

[b]看你妹啊[/b]


积分 1488
发帖 1357
注册 2006-5-20
状态 离线
『第 2 楼』:  

贴 下载地址

   此帖被 +1 点积分    点击查看详情   
评分人:【 biogene 分数: +1  时间:2009-5-23 01:20





有问题请发论坛或者自行搜索,再短消息问我的统统是SB
2009-5-23 00:56
查看资料  发短消息 网志   编辑帖子  回复  引用回复
biogene
新手上路





积分 5
发帖 5
注册 2009-5-21
来自 中国
状态 离线
『第 3 楼』:  

下载地址已经贴上了,在我的永硕网盘http://biogene.ys168.com/?jdfwkey=wwmfl1  ---一般文件-- NCBI文件样式.fasta

[ Last edited by biogene on 2009-5-22 at 18:18 ]

2009-5-23 01:14
查看资料  发送邮件  发短消息 网志   编辑帖子  回复  引用回复
netbenton
银牌会员

批处理编程迷


积分 1916
发帖 752
注册 2008-12-28
来自 广西
状态 离线
『第 4 楼』:  


@echo off&setlocal enabledelayedexpansion
for /f "delims=" %%a in (NCBI文件样式.fasta) do (
    for /f "tokens=4 delims=|" %%b in ("%%a") do (if "%%b" neq "" set name=%%~nb.seq)
    echo %%a>>!name!
)
pause


   此帖被 +1 点积分    点击查看详情   
评分人:【 biogene 分数: +1  时间:2009-5-23 05:53




精简
[你的+我的+他的]=>[大家的]    个人网志   
2009-5-23 01:39
查看资料  发送邮件  发短消息 网志  OICQ (37659560)  编辑帖子  回复  引用回复
biogene
新手上路





积分 5
发帖 5
注册 2009-5-21
来自 中国
状态 离线
『第 5 楼』:  

很好用,谢谢netbenton的帮助

2009-5-23 06:40
查看资料  发送邮件  发短消息 网志   编辑帖子  回复  引用回复

请注意:您目前尚未注册或登录,请您注册登录以使用论坛的各项功能,例如发表和回复帖子等。


可打印版本 | 推荐给朋友 | 订阅主题 | 收藏主题



论坛跳转: