生物信息学分析过程中常常会遇到大数据分析,而批量下载序列是一个省工省时的好方法,分享一个简单的方法。
工具/原料
安装有perl程序的电脑一台
方法/步骤
1
将图中的perl代码编辑为perl程序,不会的去问度娘。
2
编辑好的程序如图,是这么一个图标,这么一个格式(pl)
3
准备你需要下载的基因ID,把ID号写入一个文本文档,每行一个ID号,以玉米基因序列下载为例。
4
准备一个fasta格式的玉米序列库,你可以根据自己的需要准备相应的数据库。将这三者(ID、序列库、pl程序放到D盘的同一个文件夹内,文件夹标记为1)
5
调动cmd,以此键入“cd..” (回车); “cd..” (回车); “cd 1”(回车);“dir”(回车)如下图,出现D盘文件夹1的内容。然后输入“perl 4.pl 3.fasta 1.txt >seq1.txt”。输入完之后回车运行即可。
6
打开文件夹1,你会发现多了一个文件——seq1.txt.
7
打开这个txt,即为下载的序列
注意事项
先了解perl的相关知识。
上一篇:乙型肝炎表面抗体阳性是什么意思?
下一篇:如何防止信用卡海外盗刷