淘先锋技术网

首页 1 2 3 4 5 6 7

【MATLAB第32期】【更新中】基于MATLAB的降维/全局敏感性分析/特征排序/数据处理分类问题MATLAB代码实现(持续更新)

本文敏感性分析主要分析分类问题(fisher、rf、arf、nca等)。

版本更新:

2023/8/2 增加基于拥挤距离和Pearson相关系数的IPCC方法(用SVM进行交叉验证分类预测评估)

clear all
warning('off','all');
tic;
load classdata  %导入数据
ContributeRate=0.9;
item=randperm(size(classdata,1));%数据打乱
classdata=classdata(item,:);% 数据打乱重组
xtrain=classdata(:,1:end-1);% 输入变量
ytrain=classdata(:,end);%输出标签
Nf=10;   %  选择特征数量 
[m,n]=size(xtrain); % m代表行  n代表列 

%拥挤前保存原始xdata
Xdatasave=xtrain;

%%0和1之间的归一化
xtrain= (xtrain-min(xtrain)) ./ (max(xtrain)-min(xtrain));

%%--------拥挤阶段
%计算特征的拥挤/相关距离
crowdingDistance = IPCC(Xdatasave, ytrain);
%%--------对特征值进行排名
[res,ind]=sort(crowdingDistance,'descend');
%%--------选择最重要的特征
indfeat=ind(1:Nf);
%%-----------评估准确性
kfold=5;           %  交叉验证K值
Acc = Eval(xtrain(:,indfeat),ytrain,kfold);   %分类器评估

在这里插入图片描述

在这里插入图片描述

正确率=100%
总特征变量数量 = 21
筛选的特征变量数量= 1
筛选的特征变量编号为: 16  19  18   2  17   4   7  20  10   5  14   6   1

一、降维方法(分类)

常见的降维方法:
常见的敏感性分析法:

*(一).全局敏感性分析(sobol、蒙特卡洛方法)


(二).非全局敏感性分析
1.变量筛选(Fisher算法、临近成分分析NCA、RF随机森林、ARF自适应随机森林)

二、案例数据

案例数据classdata 3998×22 ,前21列为变量,第22列为标签,案例采用2分类,即[1,2],多分类也满足。
在这里插入图片描述

三、实际应用

(1)Fisher算法

%% 1.Fisher
addpath('D:特征排序\Fisher')
load classdata
ContributeRate=0.9;
id=randperm(size(classdata,1));%数据打乱
classdata=classdata(id,:);% 数据打乱重组
xtrain=classdata(:,1:end-1);% 输入变量
ytrain=classdata(:,end);%输出标签
[W] = Fisher_Score(xtrain,ytrain) ;
plot2

在这里插入图片描述
在这里插入图片描述

(2)近邻成分分析NCA(用于分类)

%% (2)近邻成分分析NCA(用于分类)
addpath('D:\特征排序\NCA')
load classdata
ContributeRate=0.9;
[xx,mdl]=myfscnca(xtrain,ytrain,0.9);
xnca=classdata(:,xx);

在这里插入图片描述
在这里插入图片描述

(3)临近成分分析NCA

%% (3)近邻成分分析NCA
addpath('D:\特征排序\NCA')
ContributeRate=0.9;
xtrain =data(:,1:end-1);
ytrain =data(:,end);
[xx,mdl]=myfsrnca(xtrain,ytrain,0.9);
xnca=data(:,xx);

(4)随机森林RF

%% (3)随机森林RF
addpath('D:\特征排序\RF')
load classdata
ContributeRate=0.9;
[XT,RFModel,w]= mycrf(classdata,ContributeRate);
xrf=classdata(:,XT);

在这里插入图片描述在这里插入图片描述

(5)自适应随机森林ARF

%% (4)自适应随机森林ARF
addpath('D:\小论文文件包最终版\基坑与算法文献\副业\特征排序\ARF')
load classdata
ContributeRate=0.9;
params.RFLeaf=[5,10,20,50,100,200,500]; %RFLeaf定义初始的叶子节点个数,这里设置了从5到500。
params.Maxepoch=500; % 选择叶子节点个数对应的最大训练步数
[XT,RFModel,w,params]= mycarf(classdata,ContributeRate,params);
xarf=classdata(:,XT);

在这里插入图片描述

nTree = 20;nLeaf = 5;
在这里插入图片描述
在这里插入图片描述

四、代码获取

私信回复‘32’即可获取下载链接。