Cactus的安装和简单使用

Cactus是发表在Nature正刊上的一款多基因组比对软件,能够完成多个物种的基因组比对。其代码可在Github页面找到。

Cactus的安装

如果要使用源码编译,需要服务器的sudo权限。因此这里我推荐使用作者预先编译好的版本,这里我用Cactus v2.9.0作为示例。 此链接为下载包,参考此页面进行安装。 首先确认是否安装了‘virtualenv‘这个包。

virtualenv –version

如果没有安装,可以使用以下命令安装

python3 -m pip install virtualenv

下载预编译包后,解压并进入文件夹

$ tar -xzf cactus-bin-v2.9.0.tar.gz
$ cd cactus-bin-v2.9.0

然后运行以下命令进行配置安装

$ virtualenv -p python3.8 venv-cactus-v2.9.0
$ printf “export PATH=$(pwd)/bin:$PATH; export PYTHONPATH=$(pwd)/lib:$PYTHONPATH” >> venv-cactus-v2.9.0/bin/activate
$ source venv-cactus-v2.9.0/bin/activate
$ python3 -m pip install -U setuptools pip wheel
$ python3 -m pip install -U .
$ python3 -m pip install -U -r ./toil-requirement.txt

基本会一切顺利完成cactus的安装,这时候可以使用简单的样例来测试cactus的使用。

$ cactus ./jobstore ./examples/evolverMammals.txt ./evolverMammals.hal –realTimeLogging

Cactus的简单使用

cactus的使用教程可以参考官方页面
我的使用命令为

$ cactus /path/to/js /path/to/seqfile /path/to/output/hal –workDir /path/to/workdir

1. /path/to/js 这个文件夹我也不知道放什么,只要确保为空文件夹或不存在就好
2. /path/to/seqfile 存放进化树和数据位置,示例如下

(Crab_eating_macaque:0.33, (Gibbons:5.08, (Orangutans:3.17, (Gorillas:4.00, (Chimpanzees:6.83, Humans:1.94)anc3e:5.56)anc4e:2.38)anc5e:0.77)anc2e:0.75);
Humans /path/to/Humans.fna
Chimpanzees /path/to/Chimpanzees.fna
Gorillas /path/to/Gorillas.fna
Orangutans /path/to/Orangutans.fna
Gibbons /path/to/Gibbons.fna
Crab_eating_macaque /path/to/Crab_eating_macaque.fna

第一行为进化树,必须要严格符合Newick格式。第二部分是各个物种fasta文件的位置,可以是本地位置,也可以是url链接。
3. /path/to/output/hal是输出的hal文件
4. –workDir /path/to/workdir 应该是存放中间文件位置,确保该文件夹的硬盘空间足够大,不然可能会报错。