实用工具统计数据集序列信息介绍:
用法:python dataInfo.py input.fasta mafft datasetName 参数描述:
处理非法字符的脚本介绍:
用法:python preprocess.py filepath resultName 参数描述:
处理N的脚本介绍:在比对核苷酸的序列时,N的存在影响比对的难度。同时,不同的比对软件对于N的处理各不相同,得到的比对结果有的包含N,有的将N删掉了,难以比较软件的精度。该脚本处理数据后,可以降低比对的难度并统一比对后的结果,方便比较软件优劣。
用法:# 使用前先编译 g++ deal_N.cpp -o xxx # 以下内容是Unix系统的使用方法,在Windows系统下使用时仅将./xxx替换为xxx.exe即可 # 1 删除文件中的N并记录N的位置 ./xxx -1 in_original.fasta out_removeN.fasta recordN.tmp # 2 将N插入到比对结果中 ./xxx -2 in_ans_withoutN.fasta out_ans_withN.fasta recordN.tmp # 3 从源文件和结果文件中生成带有N的最终结果文件 ./xxx -3 in_original.fasta in_ans_withoutN.fasta out_ans_withN.fasta 参数描述:
|