欢迎来到第壹文秘! | 帮助中心 分享价值,成长自我!
第壹文秘
全部分类
  • 幼儿/小学教育>
  • 中学教育>
  • 高等教育>
  • 研究生考试>
  • 外语学习>
  • 资格/认证考试>
  • 论文>
  • IT计算机>
  • 法律/法学>
  • 建筑/环境>
  • 通信/电子>
  • 医学/心理学>
  • ImageVerifierCode 换一换
    首页 第壹文秘 > 资源分类 > DOCX文档下载
    分享到微信 分享到微博 分享到QQ空间

    第七次数据挖掘实验——Apriori的R函数和应用.docx

    • 资源ID:884535       资源大小:93.43KB        全文页数:8页
    • 资源格式: DOCX        下载积分:5金币
    快捷下载 游客一键下载
    账号登录下载
    三方登录下载: 微信开放平台登录 QQ登录
    下载资源需要5金币
    邮箱/手机:
    温馨提示:
    快捷下载时,如果您不填写信息,系统将为您自动创建临时账号,适用于临时下载。
    如果您填写信息,用户名和密码都是您填写的【邮箱或者手机号】(系统自动生成),方便查询和重复下载。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP,免费下载
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    第七次数据挖掘实验——Apriori的R函数和应用.docx

    学生实验报告课程名称数据挖掘实验名称Apriori的R函数和应用一、实验目的在r中掌握利用Apriori算法的找出数据库中隐藏的关联网,并能够对实验结果实现可视化和解释说明。二、实验环境R语言的集成平台Rstudio.三、实验原理1.Apriori算法(1)原理:Apriori算法主要包括搜索频繁项集和依据频繁项集产生关联规则两大部分。(2)在r中的实现:APriori算法的R函数在arules包中四、实验内容及步骤(一)实验内容用Apriori算法的R函数对事务原始数据搜索频繁项集,生成有效的简单关联规则并实现可视化。(二)实验步骤建立事务数据集对象;搜索频繁项集,生成有效的简单关联规则;筛选关联规则;五、数据处理及实验结论setwd("C:UsersaaDesktopzz)library(arules)library(Matrix)MyTrans=read.transactions(file="事务原始数据.txt”,format="basket”,sep=,)MyRules=apriori(data=MyTrans,parameter=!ist(support=0.5,confidence=0.6,target=,frequentitemsets")#给出所有频繁项集inspect(MyRules)#浏览频繁项集TJ U U TJ TJ TJ TJ U TJ123456 7 89L L L L Pi L L L L> inspect(MyRules),工£嬖界至美iteiassupportcountA0.502B0.753E0.753C0.753A,C)0.502B,E0.753B,C)0.502C,E)0.502B,C,E)0.502MyRules=apriori(data=MyTrans,parameter=!ist(support=0.5,confidence=0.6,target=zaximallyfrequentitemsets,z)inspect(MyRules)> Inspea(MyRules)itensSUPPOrtcount1A,C0.5221B.C.El0.52实验说明:指定最小支持度和最小置信度阈值分别为0.5和0.6o参数target设定为zzfrequentitemsets”。参数target设定为"maximalIyfrequentitemsets,z0实验结论:利用inspect函数查看apriori函数返回结果,得到所有支持度大于0.5的频繁1-项集(4个)、频繁2-项集(4个)、频繁3-项集(1个);利用inspect函数查看apriori函数返回结果,得到最大频繁2-项集A,C)和最大频繁3-项集B,C,E)°B,E,B,C,C,E不是最大频繁2-项集的原因是:它们均是最大频繁3-项集的子集,它们的超集不是非频繁项集。MyTrans=read.transactions(file="事务原始数据.txt”,format=,zbasket,sep=,)MyRules=apriori(data=MyTrans,parameter=!ist(support=0.5,confidence=0.6,target=z"ruleszz)inspect(MyRules)size(x=MyRules)#查看各规则包含的项目数MyRules.sorted=sort(x=MyRules,by=z"liftz,decreasing=T)inspect(MyRulcs.sorted)>SlZe(X=MyRUleS)111122222222333> MyRules.sorted=sort(x=wyRules,by=',liff,decreasing=)> nspec(MyRules.sorted)Ihsrhssupportconfidencecoverageliftcount1 A=>C0.501.00000000.501.333333322 C=>A0.500.66666670.751.333333323 B=>E0.751.00000000.751.333333334 E->B0.751.00000000.751.333333335 BtC三>E0.501.00000000.501.333333326 C,E=>B0.501.0000.501.333333327 «>B0.750.7SOOO1.1.0000038 =>E0.750.75000001.1.0000039 >=AC0.7SO.75OOO工.001.000310 B=AC0.500.66666670.750.8888889211 C=>B0.500.66666670.750.8888889212 E«>C0.500.66666670.750.8888889213 C=>E0.500.66666670.750.8888889214 B,E=AC0.500.66666670.7S0.888S8892实验说明:IhsrhssupportconfidenceI=> B0.75O.75OOO2=> >0.75O.75OOO3O=> KJ0.750. 7500000UA=> c0.505仁»> A0.500.6G666676B"> 0.751.000007()-> B0.751.00000008B-> C0.500.66666679便=>同0.500.6G7二二=> C0.500.666666711KJ=> 0.500.6G6666712(S,E => C0.500.6G6666713(B.C -> E0.501.000(c,E "> B0.501.0000000> Inspect(MyRules)0005555555500VOOO5 7 77777ZZ55lift count1.OOOOO 31.OOO 31.OOOOO 3 1.3333333 21.3333333 21.3333333 31.3333333 3 0.8888889 20.8888889 2 O.8888889 2O.8888889 20.8888889 21.3333333 21.3333333 2指定最小支持度和最小置信度阈值分别为0.5和0.6o实验结论:生成了14条简单关联规则。前两列lhs,rhs分别为关联规则的前项和后项,后三列依次为规则的支持度、置信度和提升度。前项中存在的原因是:参数parameter中的minlen默认值为1,即允许规则中只包含一个项目。一B(S=0.75,C=O.75)表示B会以0.75的概率出现在事务中,与前项无关。size函数的返回结果表明:14条简单关联规则中有3条规则只包含1个项目,有8条包含2个项目,有3条包含3个项目。按规则提升度排序可方便看到,14条规则中有5条规则的提升度小于1,这些规则缺乏实用性,可以剔除。可见,apriori算法仅依据最小支持度和最小置信度给出有效的关联规则,对没有实用性的规则还需手工剔除。MyRules.D=subset(x=MyRules,SUbSet=SiZe(MyRUIeS)=2)#挑出包含2个项的目的规则inspect(MyRules.D)Utjuuuutju12 3 4 5 6 ,8L l L l L l l le XJ XJ XJ ZJ XJ XJ XJ XJ P h A C BEBCEC 5 1 l fl fl fl fl l 2l flC* ZJ XJ XJ J XJ XJ >1< t he A EBCBCE ftftfilcl50 0.0.50 0.50 0.so 0.confidence 1.0000000 0.6666667 1.0000000 1.0000000 0.6666667 0.66G6667 0.6666667 0.6666667so 仇r 7仇75675<575仇hCOUnr1.3333333 2 1.3333333 2 1.3333333 3 1.3333333 3 0.8888889 2 0.8888889 2 0.8888889 2 0,8888889 2MyRules.Dl=subset(x=MyRules,subset=slot(object=MyRules,name=quality挑出提升度大于i的规则inspect(MyRules.Dl)MyRules=apriori(data=MyTrans,parameter=!ist(support=0.5,confidence=0.6,target=z"ruleszz),appearance=!ist(lhs=c(z,Bzz),default=z*rhs,z)inspect(MyRules)>inspect(Mules.01)*ftr5XtlM!lIhsrhssupportconfidencecoverageliftc(1A三>C0.501.0000000o.so1.3333332L2C三>A0.500.666666:0.751.33333323B三>E0.751.00000000.751.33333334E三>B0.751.00000000.751.33333335B.O三>)0.501.0000000O.SO1.3333332C,E三>B0.501.0000000O.SO1.3333332>MyRules三apriori(data4yrranslparater三1ist(s)port三o.5,confidence三o.6,trget三"rules"),appearance三11st(lhs三c(nBl*)ldefault>"rhsw)APrioriParameterspecification:confidencenivalSnaXarwavaloriginalSupportnaxtinesupportninl

    注意事项

    本文(第七次数据挖掘实验——Apriori的R函数和应用.docx)为本站会员(p**)主动上传,第壹文秘仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知第壹文秘(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2008-2023 1wenmi网站版权所有

    经营许可证编号:宁ICP备2022001189号-1

    本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。第壹文秘仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知第壹文秘网,我们立即给予删除!

    收起
    展开