MRMD: Maximum-Relevance-Maximum-Distance
|
|
|
|
MRMD
     MRMD 特征选择方法主要有两部分决定的:- 其一是特征和实例类标之间的相关性,MRMD用Pearson相关系数来计算特征和类标之间的相关性
- 其二是特征之间的冗余性,,用三种距离函数(Euclidean距离,Cosine距离和Tanimoto系数)来计算特征之间的冗余性。
DownLoad
Usage
java -jar mrmd.jar -i input -o output.txt
可选参数
(1)距离函数 -df : the distance function default(1),默认为1 (1 = Euclidean Distance, 2 = Cosine Distance, 3 = Tanimoto coefficient, 4 = mean)
(2)经过特征选择后的arff文件 -a : outputfile of arff default (out.arff)
(3)用于自动验证特征准确率的分类器 -m : opt model type defauly(rf)
(目前可支持: rf, svm, bagging,其中rf表示randomforest,
(4)如果特征维度比较多的时候,可以只挑选部分特征进行自动化特征选择 -sn 1000
(5) -N 表示不进行优化
注意:输入的arff的类别标签要求是数字!否则报错。
Download
We have got our project on Github(https://github.com/heshida01/mrmd)All Rights Reserved Copyright @ 2016|Prof. Quan Zou
Last Modified in 2016/2/23