基于Python的支持向量机分类算法研究分析计算机科学与技术专业.docx
《基于Python的支持向量机分类算法研究分析计算机科学与技术专业.docx》由会员分享,可在线阅读,更多相关《基于Python的支持向量机分类算法研究分析计算机科学与技术专业.docx(27页珍藏版)》请在优知文库上搜索。
1、摘要在大数据盛行的时代背景下,机器学习这门学科的广泛应用。并且列举运用PythOn语言进行数据处理的优势,将其与传统语言进行对比,充分体现了PythOn语言在语言简洁,效率高等方面的优势。这也是本文最后选择PythOn语言实现SVM算法的主要原因。本文主体内容阐述了支持向量机算法(SVM)的基本内涵,并且用图示和数学方法形象具体讲解了SVM的基本原理。具体分析了SVM算法中线性可分数据、线性不可分数据和含有。Utlier点的数据集的分类方式。通过对偶问题求解法、核函数、及SMO算法等实现了对最优超平面的求解。并且完成了二分类问题向多标签分类问题的推广。文章通过,使用手写数字数据集在PythOn
2、上进行SVM模型的训练与测试,体会SVM算法如何解决实际问题。具体的表现了用Python语言实现SVM算法的优势,直观的展现了实验成果。关键字:机器学习PythonSVM最优超平而核函数AbstractIntheeraoftheprevalenceofbigdata,machinelearningiswidelyusedinthisdiscipline.AndenumeratetheadvantagesofusingPythonlanguagefordataprocessing,compareitwithtraditionallanguages,andfullyembodytheadvanta
3、gesofPythonlanguageintermsofsimplelanguageandhighefficiency.ThisisthemainreasonwhythisarticlechoosesthePythonlanguagetoimplementtheSVMalgorithm.ThemaincontentofthispaperexpoundsthebasicconnotationofSupportVectorMachine(SVM),andexplainsthebasicprincipleofSVMconcretelywithgraphicandmathematicalmethods
4、.TheclassificationOfIinearlyseparabledata,linearlyindivisibledata,anddatasetswithoutlierpointsintheSVMalgorithmisspecificallyanalyzed.Thesolutiontotheoptimalhyperplaneisachievedthroughthedualproblemsolvingmethod,kernelfunction,andSMOalgorithm.Andithascompletedthepromotionofthetwo-classificationprobl
5、emtothemulti-labelclassificationproblem.Passingtheendofthearticle,usingthehand-writtendigitaldatasettotrainandtesttheSVMmodelinPython,tounderstandhowtheSVMalgorithmsolvespracticalproblems.ThespecificperformanceoftheSVMalgorithmusingPythonlanguageadvantages,intuitivedisplayoftheexperimentalresults.Ke
6、ywords:machinelearning,Python,SVM,optimalhyperplane,kernelfunction第一章绪论1.1 机器学习随着互联网计算机技术的普及应用与发展,随处可见的数据信息数量日益庞大,数据与信息与人们的生活愈发的息息相关。数据量的不断扩大和信息获取方式的不断增多,带来了信息处理日益困难的问题。伴随着硬件性能的快速增长,人们寄希望于计算机可以帮助人类处理越来越庞大的数据。因此,机器学习在近年来得以迅速兴起与发展。机器学习(MaChineLeaming,ML)是集合了多种领域知识的一门学科,涵盖统计学、概率论、算法复杂度理论等多个领域。用于研究计算机通过
7、模拟人类的学习行为,并且由此去的新知识和技能的能力。机器学习是计算机人工智能的核心,被应用于人工智能的多个领域。顾名思义,机器学习是使用机器来模拟人类学习行为的一项技术。具体来说,机器学习是一门训练机器获取新知识或新技能,包括获取现有知识的学科。这里所说的“机器”,指的就是计算机、电子计算机、中子计算机、光子计算机或神经计算机等等。机器学习已经在很多领域进行了广泛应用,例如:计算机视觉、DNA序列测序、语音识别、手写识别、医学诊断。机器学习算法是一种能够从数据中进行持续学习的算法。MitChen(1997)为其提供了一个简洁的定义:对于某类任务T和性能度量P,一个计算机程序被认为可以从经验E中
8、学习是指,通过经验E改进后,它在任务T上由性能度量P衡量的性能有所提升。其中任务T指的是人们希望机器可以实现的功能。在分类、回归、异常检测、转录、机器翻译等任务上,机器学习已经有了广泛的应用。而获取经验E的过程可以分为无监督算法和有监督算法。两者的区别在于是否对数据集中的数据样本给予标签。1.2 支持向量机在监督学习中,支持向量机是影响力最大的机器学习方法之一。支持向量机由CorinnaCortes和Vapnik等人于1995年提出,其创新的核技术使其不再局限于对线性数据的处理,在对于非线性数据的分类上也有了良好的表现,并已被广泛应用于文本识别、手写字体识别、及时间序列预测等小型分类任务中。支
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 Python 支持 向量 分类 算法 研究 分析 计算机科学 技术 专业
