注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

wangyufeng的博客

祝愿BB 健康开心快乐每一天

 
 
 

日志

 
 

如何使用perl提取网页内容  

2010-11-02 10:27:12|  分类: Perl & bioperl |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

my $begin="开头的特征字符";
my $end="结束的特征字符";
use LWP::Simple;
my $url="网页的地址";
my $doc=get($url);
if ($doc=~m/$begin(.*)$end/is);
print $1;#此时的$1可能就是你需要的内容了

如提取SNP序列:

#!/usr/bin/perl


use LWP::Simple;

open(INFILE1, "E:/基因上SNP/chr_18_10000.txt");
open(OUTFILE, ""+>E:/chr_18_10000_xulie.txt")|| die "Cannot open the newfile: $!\n";;
foreach $x (<INFILE1>){
    chomp $x;
$url="
http://www.ncbi.nlm.nih.gov/sites/entrez?db=snp&cmd=search&term=rs$x";
$_=get($url);
if(/<pre>(.*)<\/pre>/)    {
print OUTFILE "$1\n";   }
                                       }
 close  OUTFILE;

 close  INFILE1;
exit;

本 文引用地址: http://www.sciencenet.cn/m/user_content.aspx?id=249136
  评论这张
 
阅读(2198)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017