第七次数据挖掘实验——Apriori的R函数和应用.docx
《第七次数据挖掘实验——Apriori的R函数和应用.docx》由会员分享,可在线阅读,更多相关《第七次数据挖掘实验——Apriori的R函数和应用.docx(8页珍藏版)》请在优知文库上搜索。
1、学生实验报告课程名称数据挖掘实验名称Apriori的R函数和应用一、实验目的在r中掌握利用Apriori算法的找出数据库中隐藏的关联网,并能够对实验结果实现可视化和解释说明。二、实验环境R语言的集成平台Rstudio.三、实验原理1.Apriori算法(1)原理:Apriori算法主要包括搜索频繁项集和依据频繁项集产生关联规则两大部分。(2)在r中的实现:APriori算法的R函数在arules包中四、实验内容及步骤(一)实验内容用Apriori算法的R函数对事务原始数据搜索频繁项集,生成有效的简单关联规则并实现可视化。(二)实验步骤建立事务数据集对象;搜索频繁项集,生成有效的简单关联规则;筛
2、选关联规则;五、数据处理及实验结论setwd(C:UsersaaDesktopzz)library(arules)library(Matrix)MyTrans=read.transactions(file=事务原始数据.txt”,format=basket”,sep=,)MyRules=apriori(data=MyTrans,parameter=!ist(support=0.5,confidence=0.6,target=,frequentitemsets)#给出所有频繁项集inspect(MyRules)#浏览频繁项集TJ U U TJ TJ TJ TJ U TJ123456 7 89L
3、L L L Pi L L L L inspect(MyRules),工嬖界至美iteiassupportcountA0.502B0.753E0.753C0.753A,C)0.502B,E0.753B,C)0.502C,E)0.502B,C,E)0.502MyRules=apriori(data=MyTrans,parameter=!ist(support=0.5,confidence=0.6,target=zaximallyfrequentitemsets,z)inspect(MyRules) Inspea(MyRules)itensSUPPOrtcount1A,C0.5221B.C.El0.
4、52实验说明:指定最小支持度和最小置信度阈值分别为0.5和0.6o参数target设定为zzfrequentitemsets”。参数target设定为maximalIyfrequentitemsets,z0实验结论:利用inspect函数查看apriori函数返回结果,得到所有支持度大于0.5的频繁1-项集(4个)、频繁2-项集(4个)、频繁3-项集(1个);利用inspect函数查看apriori函数返回结果,得到最大频繁2-项集A,C)和最大频繁3-项集B,C,E)B,E,B,C,C,E不是最大频繁2-项集的原因是:它们均是最大频繁3-项集的子集,它们的超集不是非频繁项集。MyTrans=
5、read.transactions(file=事务原始数据.txt”,format=,zbasket,sep=,)MyRules=apriori(data=MyTrans,parameter=!ist(support=0.5,confidence=0.6,target=zruleszz)inspect(MyRules)size(x=MyRules)#查看各规则包含的项目数MyRules.sorted=sort(x=MyRules,by=zliftz,decreasing=T)inspect(MyRulcs.sorted)SlZe(X=MyRUleS)111122222222333 MyRule
6、s.sorted=sort(x=wyRules,by=,liff,decreasing=) nspec(MyRules.sorted)Ihsrhssupportconfidencecoverageliftcount1 A=C0.501.00000000.501.333333322 C=A0.500.66666670.751.333333323 B=E0.751.00000000.751.333333334 E-B0.751.00000000.751.333333335 BtC三E0.501.00000000.501.333333326 C,E=B0.501.0000.501.333333327
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第七 数据 挖掘 实验 Apriori 函数 应用