第七次数据挖掘实验——Apriori的R函数和应用.docx

资源ID：884535 资源大小：93.43KB 全文页数：8页
资源格式： DOCX 下载积分：5金币

快捷下载

账号登录下载

三方登录下载：

下载资源需要5金币

邮箱/手机：
温馨提示：	快捷下载时，如果您不填写信息，系统将为您自动创建临时账号，适用于临时下载。如果您填写信息，用户名和密码都是您填写的【邮箱或者手机号】（系统自动生成），方便查询和重复下载。如填写123，账号就是123，密码也是123。
支付方式：
验证码：	换一换

加入VIP,免费下载

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？

友情提示

1、下载资料失败解决办法

2、PDF文件下载后，可能会被浏览器默认打开，此种情况可以点击浏览器菜单，保存网页到桌面，就可以正常下载了。

3、本站不支持迅雷下载，请使用电脑自带的IE浏览器，或者360浏览器、谷歌浏览器下载即可。

4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩，下载后原文更清晰。

5、试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓。

网站客服

侵权投诉

第七次数据挖掘实验——Apriori的R函数和应用.docx

学生实验报告课程名称数据挖掘实验名称Apriori的R函数和应用一、实验目的在r中掌握利用Apriori算法的找出数据库中隐藏的关联网，并能够对实验结果实现可视化和解释说明。二、实验环境R语言的集成平台Rstudio.三、实验原理1.Apriori算法(1)原理：Apriori算法主要包括搜索频繁项集和依据频繁项集产生关联规则两大部分。(2)在r中的实现：APriori算法的R函数在arules包中四、实验内容及步骤(一)实验内容用Apriori算法的R函数对事务原始数据搜索频繁项集，生成有效的简单关联规则并实现可视化。(二)实验步骤建立事务数据集对象；搜索频繁项集，生成有效的简单关联规则；筛选关联规则；五、数据处理及实验结论setwd("C:UsersaaDesktopzz)library(arules)library(Matrix)MyTrans=read.transactions(file="事务原始数据.txt”,format="basket”,sep=,)MyRules=apriori(data=MyTrans,parameter=!ist(support=0.5,confidence=0.6,target=,frequentitemsets")#给出所有频繁项集inspect(MyRules)#浏览频繁项集TJ U U TJ TJ TJ TJ U TJ123456 7 89L L L L Pi L L L L> inspect(MyRules)，工£嬖界至美iteiassupportcountA0.502B0.753E0.753C0.753A,C)0.502B,E0.753B,C)0.502C,E)0.502B,C,E)0.502MyRules=apriori(data=MyTrans,parameter=!ist(support=0.5,confidence=0.6,target=zaximallyfrequentitemsets,z)inspect(MyRules)> Inspea(MyRules)itensSUPPOrtcount1A,C0.5221B.C.El0.52实验说明：指定最小支持度和最小置信度阈值分别为0.5和0.6o参数target设定为zzfrequentitemsets”。参数target设定为"maximalIyfrequentitemsets,z0实验结论：利用inspect函数查看apriori函数返回结果，得到所有支持度大于0.5的频繁1-项集(4个)、频繁2-项集(4个)、频繁3-项集(1个)；利用inspect函数查看apriori函数返回结果，得到最大频繁2-项集A,C)和最大频繁3-项集B,C,E)°B,E,B,C,C,E不是最大频繁2-项集的原因是:它们均是最大频繁3-项集的子集，它们的超集不是非频繁项集。MyTrans=read.transactions(file="事务原始数据.txt”,format=,zbasket,sep=,)MyRules=apriori(data=MyTrans,parameter=!ist(support=0.5,confidence=0.6,target=z"ruleszz)inspect(MyRules)size(x=MyRules)#查看各规则包含的项目数MyRules.sorted=sort(x=MyRules,by=z"liftz,decreasing=T)inspect(MyRulcs.sorted)>SlZe(X=MyRUleS)111122222222333> MyRules.sorted=sort(x=wyRules,by=',liff,decreasing=)> nspec(MyRules.sorted)Ihsrhssupportconfidencecoverageliftcount1 A=>C0.501.00000000.501.333333322 C=>A0.500.66666670.751.333333323 B=>E0.751.00000000.751.333333334 E->B0.751.00000000.751.333333335 BtC三>E0.501.00000000.501.333333326 C,E=>B0.501.0000.501.333333327 «>B0.750.7SOOO1.1.0000038 =>E0.750.75000001.1.0000039 >=AC0.7SO.75OOO工.001.000310 B=AC0.500.66666670.750.8888889211 C=>B0.500.66666670.750.8888889212 E«>C0.500.66666670.750.8888889213 C=>E0.500.66666670.750.8888889214 B,E=AC0.500.66666670.7S0.888S8892实验说明：IhsrhssupportconfidenceI=> B0.75O.75OOO2=> >0.75O.75OOO3O=> KJ0.750. 7500000UA=> c0.505仁»> A0.500.6G666676B"> 0.751.000007()-> B0.751.00000008B-> C0.500.66666679便=>同0.500.6G7二二=> C0.500.666666711KJ=> 0.500.6G6666712(S,E => C0.500.6G6666713(B.C -> E0.501.000(c,E "> B0.501.0000000> Inspect(MyRules)0005555555500VOOO5 7 77777ZZ55lift count1.OOOOO 31.OOO 31.OOOOO 3 1.3333333 21.3333333 21.3333333 31.3333333 3 0.8888889 20.8888889 2 O.8888889 2O.8888889 20.8888889 21.3333333 21.3333333 2指定最小支持度和最小置信度阈值分别为0.5和0.6o实验结论：生成了14条简单关联规则。前两列lhs,rhs分别为关联规则的前项和后项，后三列依次为规则的支持度、置信度和提升度。前项中存在的原因是：参数parameter中的minlen默认值为1,即允许规则中只包含一个项目。一B(S=0.75,C=O.75)表示B会以0.75的概率出现在事务中，与前项无关。size函数的返回结果表明：14条简单关联规则中有3条规则只包含1个项目，有8条包含2个项目，有3条包含3个项目。按规则提升度排序可方便看到，14条规则中有5条规则的提升度小于1,这些规则缺乏实用性，可以剔除。可见，apriori算法仅依据最小支持度和最小置信度给出有效的关联规则，对没有实用性的规则还需手工剔除。MyRules.D=subset(x=MyRules,SUbSet=SiZe(MyRUIeS)=2)#挑出包含2个项的目的规则inspect(MyRules.D)Utjuuuutju12 3 4 5 6 ，8L l L l L l l le XJ XJ XJ ZJ XJ XJ XJ XJ P h A C BEBCEC 5 1 l fl fl fl fl l 2l flC* ZJ XJ XJ J XJ XJ >1< t he A EBCBCE ftftfilcl50 0.0.50 0.50 0.so 0.confidence 1.0000000 0.6666667 1.0000000 1.0000000 0.6666667 0.66G6667 0.6666667 0.6666667so 仇r 7仇75675<575仇hCOUnr1.3333333 2 1.3333333 2 1.3333333 3 1.3333333 3 0.8888889 2 0.8888889 2 0.8888889 2 0,8888889 2MyRules.Dl=subset(x=MyRules,subset=slot(object=MyRules,name=quality挑出提升度大于i的规则inspect(MyRules.Dl)MyRules=apriori(data=MyTrans,parameter=!ist(support=0.5,confidence=0.6,target=z"ruleszz),appearance=!ist(lhs=c(z,Bzz),default=z*rhs,z)inspect(MyRules)>inspect(Mules.01)*ftr5XtlM!lIhsrhssupportconfidencecoverageliftc(1A三>C0.501.0000000o.so1.3333332L2C三>A0.500.666666：0.751.33333323B三>E0.751.00000000.751.33333334E三>B0.751.00000000.751.33333335B.O三>)0.501.0000000O.SO1.3333332C,E三>B0.501.0000000O.SO1.3333332>MyRules三apriori(data4yrranslparater三1ist(s)port三o.5,confidence三o.6,trget三"rules"),appearance三11st(lhs三c(nBl*)ldefault>"rhsw)APrioriParameterspecification:confidencenivalSnaXarwavaloriginalSupportnaxtinesupportninl

注意事项

本文（第七次数据挖掘实验——Apriori的R函数和应用.docx）为本站会员（p**）主动上传，第壹文秘仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知第壹文秘（点击联系客服），我们立即给予删除！

温馨提示：如果因为网速或其他原因下载失败请重新下载，重复下载不扣分。