注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

wangyufeng的博客

祝愿BB 健康开心快乐每一天

 
 
 

日志

 
 

Get Sequences Based on Genbank ID by R scripts  

2013-05-03 11:02:54|  分类: Perl & bioperl |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
# Get fasta files from GenBank based on genebank ID
library(stringr)
library(plyr)
library(Biostrings)
ids <- data.frame(V1=c("NC_xxxxxx"))
ids$urls <- str_c("http://eutils.ncbi.nlm.nih.gov/entrez/eutils/efetch.fcgi?db=nuccore&id=", ids$V1, "&rettype=fasta&retmode=text")
#-----------------------------------------------------------------------------
saveMyFasta <- function(url) {
  x <- readDNAStringSet(filepath = url, format = "fasta", nrec = 1L, skip = 0L, use.names = TRUE)
  writeXStringSet(x, str_c(ids[ids$urls == url, ]$V1,".fa"))
}
#-----------------------------------------------------------------------------
l_ply(ids$urls, saveMyFasta, .progress = "text")

  评论这张
 
阅读(763)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017