SVM算法实验实验报告.docx
《SVM算法实验实验报告.docx》由会员分享,可在线阅读,更多相关《SVM算法实验实验报告.docx(17页珍藏版)》请在优知文库上搜索。
1、svm分类算法一、数据源说明1、数据源说远和理解:ticeval2000.txt:这个故据集是须要预料(4000个客户记录)的数据集。它和ticdata2000.txt它具有相同的格式,只是没有最终一列的目标记录。我们只希望返回预料目标的列表集,全部数据雉都用制表符迸行分隔。共有4003(目己加了三条数据),依据要求,用来做预料。tictgts2000.txt:最终的目标评估数据。这是一个实际状况下的目标数据,将与我们预料的结果进行校验。我门的预料结果将放在result.txt文件中。致搭集理解:本试验任务可以理解为分类问遂,即分为2亲,也就是数据源的第66列,可以分为0、1两类.我门首先须要
2、对ticdata2000.txt进行训练,生成model,再依据model进行预混。2、数搬清理代码中须要对轨据集诳行缩放的目的在于:a、盛开一些特征值范国过大而另一些特征值范围过小:b、避开在训练时为了计分核函数而计算内积的时候弓I起数值计算的国册。因此,通常将数据缩放到(-1,1)或者是(0,1)之间。二、数据疙掘的算法说明1、 svm舞法说期2、实现过程在源程序里面,主要由以下2个函数来实现;(1) structsvm_mode1*svm_train(conststructsvm_problem*prob,conststructsvm_parameter*param);该函数用来做训条.
3、拿数prob,是svm_prObIem类型数据.具体结构定义如下:structSVn1.PrOblem存储本次参与运算的全部样本(数据桀),及其所照类别。(intn;记录样本总88double*y;/指向样本所属尖别的数组structsvm_node*x;/指向一个存储内容为指针的数组);其中svm-node的结构体定义如下:structsvm11ode/用来存fi编入空间中的单个特征(intindex;/输入空间序号,铁没输入空间敢为mdoublevalue;该输入空间的值);所以,Prob也可以说是向渔的指针,它指向样本数据的类别和输入向.在内存中的具体结构图如下:的1.Ilibsvm训练
4、时,样本数据在内存中的存放结构只需在内存中申请n1)sizeof(auuct9um_node)大小的空间.并在甲面境入历个程本的每个输入空间的值,圆可在程序中完成Prob参数的设置。param.是svm_parameter数据结构,艮体结构定义如下:structsvm_parameter/训练W数(intsvm_type;svm类型,i11tkernel_type;核函数类型intdegree;forpoly/doublegamma;*forpoly/rbf/sigmoid*/doublecoef0;*forPOIy/sigmoid/*thesearefortrainingonly*/doub
5、leCaChe_size;*inmb制定训练所须要的内存”/doubleeps;*stoppingcriteria*/doublec;*forc_svcrepsilon-svrandn-svr惩处因子/intnr_weight;*forc_svc权至的数目*/int*weight_label;*forc_svc权王元素个数由njxwigh七确定/double*weight;*forc_svc*/doublenu;*fornu-svcjone_classrandnu_svr*/doublep;*forepsilon_svr*/intshrinking;*usetheshrinkingheuris
6、tics指明训练1程是否运用压缩A/intprobability;*doprobabilityestimates指明是否要做楫率估计*/其中.SVm类型和核函数类型如下:设定完这两个读数.就可以干脆在程序中调用训练西效进行训练了,该兵函数返回一个structsvm_model*svm馍型的指针,可以运用SVm_save_model(constchar*mode1_fi1e_namerconststructsvm_model/model)函效,把这个模型保存在这盘中。至此,训练函数的移植已好完成。(2) doublesvm-redict(conststructSUm_model*modelzco
7、nststruct3vmjode*7;尊效model.是一个SVm模型的指针,可以运用的数StrUCtsvzn_modelsvm_load_model(constcharmodelilejame),导入训练时保存好的SVm核型,此函数返回一个SVm模型的指针,可以干脆fitt给变量model。参数乂是COnStstructsvm_node结构体的指针.本意是一个输入空间的指针.但写实上,该函数执行的时候,是从参数X必计算输入空间,直到遇到单个样本数据结束标记-1才结束,也就是说,该函数拯处了单个样本中的全部输入空间数据。因此,在调用此理数时,必褚先把预料样本的致密按图3.4中的固定格式写入内存
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SVM 算法 实验 报告
