《基于机器学习的股票交易时机研究.docx》由会员分享,可在线阅读,更多相关《基于机器学习的股票交易时机研究.docx(43页珍藏版)》请在优知文库上搜索。
1、彳彦文1人孝毕业设计(论文)题目基于机器学习的股票交易时机研究专业信息与计算科学班级2006级1班学生余开勇指导教师韩逢庆重庆交通大学2()1()年6月摘要IABSTRACTII第一章前W11.1 研究背母11.2股市预测的发展概况11.3 支持向星机简介31.4 本文的主要内容3第二章股市知识的准备52.1引言52.1.1我国股票市场的发展52.1.2进行股票投资分析的必要性62.2股票的相关知识62 .2.1股票常用术语73 .2.2股票价值和股票指数72.3 企业财务指标92.4 股市技术指标简介9第三章股市预测问题研究方法123.1弓I言123.2投资分析法123.2.1技术分析法12
2、3.2.2基本面分析法123.2.3组合分析法133. 3时间序列分析法133.3 .1ARMA模型简介143.4 非线性系统分析法143.4.1 神经网络预测方法概述143.4.2 多层前做神经网络(Bp网络)15第四章统计学习理论与支持向量机174.1 理论背兔174.1.1 机器学习分类174.1.2 机器学习存在的基本问题174.2 统计学习理论184.2.1YC维194.2.2推广性的界194.2.3结构风险最小化(StTUCtUraIRiskMinimization.SRM)204.3支持向量机基本原理214. 3.1基本概念225. 3.2线性支持向量机236. 3.3非线性支持
3、向量机257. 3.4基于支持向量机的回归分析28第五章基于支持向量机的股市覆测315.1 基T支持向量机的股市预测流程315.2 基丁向量机的分析预测工具1.iB325.3实际预测结果与数据验证分析335.4股票交易时机的确定38结束语40致谢41片文献42股票市场是一个复杂的非线性动态系统,但由传统的预测技术并没有准确的揭示股票市场的内在规律,导致最终的预测结果并不十分理想,本文采用了支持向量机的方法对股市进行预测.支持向量机是数据挖掘中的项新技术,是借助于最优化方法解决机器学习问题的新工具。特别是近年来支持向量机在回归算法的研究方面也表现了极好的性能,但是将其应用到股市预测中却并不多。本
4、文介绍了股市的相关背景知识,然后对股市里的常用术语作了介绍以及对传统的股市预测的方法进行了介绍,特别详细介绍了基于神经网络的预测方法。接着全面介绍了统计学习理论和建立在其上的支持向量机方法,详细描述了支持向量机方法的基本原理。最后,对支持向量机方法用于股市预测问题进行了尝试。提出了使用支持向量机的方法进行股市预测的基本流程,然后通过使用实际的股市交易数据进行预测,在具体股价的预测都表现出很好的效果。关键词I股票,股市预测,支持向量机,核函数ABSTRACTStockmarketisacomplexnon-linearsystem,andisaectedbymanyfactors.Thetrad
5、itionalpredictiontechnologiescannotdisclosetheinherentruleofstockmarket.Inthispaper,anewprediction(ecnologybasedonSupportVec(orMachine(SVM)hasbeenproposed.Thesupportvectormachineisadataminingnewtechnology;itisanewtoolthatdrawssupporttheoptimizedmethodtosolutethemachinelearningquestions.Speciallyinre
6、centyears,supportedthevectormachinealsotodisplaytheextremelygoodperformanceinthereturnalgorithmresearchaspect,butappliedit(hestockmarkettoforecastcertainlywerenotactuallymany.Thispaperintroducethebackgroundknowledgeofstockmarket,thencommontermsonthestockmarketwasinixluccdandtraditionalpredictiontech
7、nologiesarcinlxluccdindetail,especiallythetechnologybasedonneuralnetwork,andthenthebasicprinciplesofSVMarediscussed.Finally,(hispaperusesSVMtopredictthepriceofstock,andproposeacommonIrainework(osolvestockmarketpredictionproblemsusingSVM.Datafromrealstockmarketisusedtoevaluatetheexactnessofthealgorit
8、hm.ResultshowsthatSVMisanetYectivemethod,andgetpreciseresult.KeyWords:Stock,PredictionofSlockmarket,SUPpOrlVectorMachine,Kenielfunction第一章前言1.1 研究背景股票是市场经济的产物,股票的发行和交易促进了市场经济的方展。自从股票1773年在英国率先发行以来,已有二百多年的历史。现在已经成为整个社会经济的“时雨表”和“报警器”,其对于经济发展的作用不可估量。随着股票市场的不断规范壮大和计算机技术的发展,越来越多的人进入到股票交易市场,也相应产生了很多股票分析和预
9、测系统。由于股市行情受经济政治等因素的影响,其内部规律非常复杂,变化周期无序,同时我国资本市场投资者结构具有特殊性,个人投资者的比例很高,投资者的心里状态不同,对股票交易的行为会产生直接的影响,导致股价波动.在信息爆炸的今天,迫切需要一种方法能从大量的数据信息中提取出有用的信息,数据挖掘技术在这种情况下诞生了。确切的说,数据挖掘(DataMining)是指从大型数据仓库中提取出隐含的、未知的、非平凡的及仃潜在的应用价值的信息或者模式.它是数据库研究中个很有应用价值的新领域.融合了数据库、人工智能、机器学习、统计学等多个领域的理论和技术。在最近十几年间,成熟的技术和高性能的关系数据库引擎以及广泛
10、的数据集成,使数据挖掘技术的研究工作取得了很大的发展,各种数据挖掘技术的应用极大的提高了分析、处理大量数据信息的能力,并为人们的生产生活带来了很大的经济效益,数据挖掘技术在股市预测中也具有很强的应用价值。1.2 股市预测的发展概况预测是指从已知事件测定未知事件。预测理论作为一种通用的方法论,既可以应用于研究自然现缴,也可以应用于研究社会现象。聘预测理论应用于各个领域,就产生了硕测的各个分支,如人口预测、经济预测、气象预测等等。在金融经济学的发展上,人们对金融预测作了大垃的探索,取得r丰硕的成果。典型的金融预测时是时间序列预测。时间序列是按照时间顺序取得的一系列观察值。时间序列的典型特征是相邻观
11、测值之间的依赖性.为研究这种依顺性,人们提出r许多时间序列模型,并对这模型的性痂及分析方法进行了深入的研究。传统的金港时间序列大致上有两种研究方法,一种方法是从基本的经济原理Hl发建立金滋时间序列服从的数学模型,像MarkOVitZ的投资组合理论,资本资产定价模型(CAPM)川、套利定价理论(APT)、期权定价模型川等。实际上,这部分成果就是确定金触时间序列的趋势项。另种方法是从统计角度对金融时间序列进行研究。这种方法直接从实际数据出发,应用概率统计推断出市场未来的变化规律。虽然这种方法从经济学角度来讲缺乏理论性,但是在实际应用中效果较好。而11,统计方法还可以对经济模型的好坏进行检验和评价。
12、二十世纪80年代以前,人们对时间序列的研究主要集中在一种线性模里,即自回归移动平均模型(AutoRcgressivcMovingAverageModcs.ARM/X).这种模里结构简雌,有着完善的统计推断技术,应用非常广泛。但是ARMA模型毕竟是一种线性模型,有些实际现象在模型中得不到反映。在这种情况下人们开始提出并研究非线性时间序列,最道要的就是R.F.Englc在八I年代初提出的自回归条件异方差模型(AutoRcgrcssivcConditionallyHctcrosccdasticMtxlcls,ARCH),由于ARCH模型将方差看作随时间变动的量,而不是一个常垃,从某种程度上克服J线性
13、模型的局限性。与实际情况更相符,从而得到了广泛的应用.股市预测,是金融经济预测的一个重要分支.它对股票市场所反映的各种资讯进行收集、整理、综合等工作,从股市的历史、现状和规律性出发,运用科学的方法,对股巾.未来发展前珏进行测定。股市预测般基于以下三点假设四:(1)有效市场假设:指股票市场会对每一条有可能影响股价的信息都会作出反映,而各种价格的变动正是这种反映的结果。(2)供求决定假设:指一切信息都会对股票市场的供求双方力量对比产生影峋,供求决定交易量和交易价格。(3)历史相似原则:指由历史资料所概括出来的规律已经包含了未来股票市场的一切变动趋势。股市预测按不同的标准可以有不同的分类.按涉及的范
14、围不同可分为:指数预测和个股预测:按预测时间长短不问可分为:长期预测、中期预测和短期预测:按预测方法的不同可分为:定性预测和定量预测等等。CharlesDOW在190()年到1902年,写了系列的评论来阐述他的市场观。SamNelson收集了他的评论并将他的观点发展为市场行为原则,这就是成为技术分析基础的道氏理论。RichardSchabacker第个将通用图表形态分类,研究出“缺口”理论,被称作技术分析科学之父。瑞夫N艾略特通过研究市场波动和循环的形态,提出了“波浪理论二W-DGann研究了时间要素的重要性,提出了“价格时间等价”的概念。随后,又出现了各种分析方法,包括K线图分析法、柱状图分
15、析法、点数图分析法、移动平均法、形态分析法、趋势分析法、角度分析法、神秘级数与黄金分割比螺旋历法、四度空间法等.这些分析方法主要依赖T图表,图表信息具有明显的直观化优点,但图表的分析与指标的选择却要依靠主观的判断.这是这些分析方法面临的主要问题。由于股票交易的模式和相关信息的笈杂性,这样种严重依靠经验的方法.其可器性在很大程度上是要受到痂疑的同。从60年代开始,人们尝试使用各种时间序列分析方法来预测股市。在时间序列分析中,线性模型的研究比较成熟。但是股市是一个非线性系统,用线性模里逼近容易丢失有用信息。为了更确切描述实际系统特性,又发展了阈值自回归模型、多项式自回归模型和指数自回归模型等,用这些方法对股市进行建模和预测也取得了比较好的结果。1.3 支持向量机简介支持向量机4F(SUPPortVCCtOrmaChinC,SVM)是数据挖掘中的一项新技术,是借助于最优化方法解决机器学习问题的新工具。它最初于20世纪90年代由VaPnik提出,近些年来在其理论研究和算法实现方面都取得了突破性进展,并开始成为克服“维数灾难”和“过学习”等传统困难的有利办法,虽然他还处在飞速发展的阶段,但它的理论基础和实现途径的基本框架已经形成。支持向量机目前主要来解决分类问题(模式识别,判别分析)和回