交叉验证的理解

在进行分类任务时常常要进行交叉验证

常用的函数是crossvalind,具体使用形式如下:
indices=crossvalind(‘Kfold’,100,5) ‘Kfold’是交叉验证的参数,用K折交叉验证用此参数。100可看做样本数据有100个,5是把样本数据分为5堆,用其中4堆做训练,剩下的一堆做测试。具体见下:

data=floor(100*rand(100,90));
indices=crossvalind('Kfold',100,5);

for k=1:1:5
   test_label  =(indices==k);       %%% 测试索引
   train_label =~test_label;        %%% 训练索引

   test_data  =data(test_label,:);    %%% 测试索引
   train_data =data(train_label,:);   %%% 训练索引

end

data是原始数据,100行90列,每行看做一个样本,所以crossvalind中的参数100可看做100个样本,得到indices是100个样本对应的堆序号,即分成5堆,序号1-5,每堆序号对应相应地原始数据。
for循环内是分别取索引对应的数据

发布了76 篇原创文章 · 获赞 45 · 访问量 10万+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章