《大数据平台与架构》教学大纲.docx
大数据平台与架构教学大纲适用葩围:2O2X版本科人才培养方案涕程代码:08150291课程性质:专业必修课学分:4学分学时:N学时(理论48学时,实验16学时)先修课程:1.inUX操作系统、JaVa程序设计后续课程:无适用专业:数据科学与大数据技术专业开课单位:计算机科学与技术学院一、课程说明4大数据平台4架内3课程是数据科学与大数据技术专业的专业必修深,通过对本课程的学习,让学生了解并学提大数据的起源及特征,了解并坐握大数据的系统架构设计及功能目标设计、大数据程序开发、企业大致掘案例分析等内容,同时通过使用HadOoP等大数据技术平台来提升学生对大数据开发的实践能力.二、课程目标通过本课程的学习,使学生达到如下目标:课程目标I:理解大数据时代数据的存储与处理技术;课程目标2:理解和掌握Hadoop大数据平台及相关项目软件的使用;课程目标3:能进行融会引通,能正确评价大数据处理架构对环境、社会可持续发展的影响:有正确的政治理想和政治道馅:三、课程目标与毕业要求彳大数据平台与架构3课程教学目标对数据科学与人数据技术务业毕业要求的支撑见表表1课程假学目标与毕业要求关系毕业要求指标点课程目标支撑M3.设计/开发解决方案3.3在解决方案设计中,具有铢合考虑社会、健康、安全、法律、文化及环境等因素的意识和创新意识。课程目标2:理解和掌握HadOOP大数据平台及相关项目软件的使用:课程目标3:能迸行融会更通,能正确评价人数据处理架构对环境、社会可持续发展的影响:有正确的政治理想和政治道德:H4.研究1.3能好根据实验方案选用或搭建实验环境开展实验,能膨对已获知的实验数据进行整理、分析,并能通过信息琮合得出有效结论.课程目标h理解大数据时代数物的存储与处理技术:课程目标2:理解和掌握HadooP大数据平台及相关项目软件的使用:H5.使用现代工具5.3能够针对大数据应用开发需要选择和使用合适的平台和开发工具,弁能好理解其局限性。课程目标2:理解和掌提HadOoP大数据平台及相关项目软件的使用:课程目标3:能进行融会物通,能正确评价大数据处理架构对环境、社会可持续发展的影响:有正确的政治理想和政治道他:H注:表中-H(MXM(中)"表示课程与相关毕业要求的关联度.四、教学内容,基本要求与学时分配I.理论部分理论部分的教学内容、基本要求与学时分配见表2。表2教学内容、苓本要求与学时分配教学内容教学要求,教学点魔点理论学时实验学时对应的课程目标1.MI½1. 1大数据时代1.2 大数据的概念1.3 大数据的影响与应用教学要求I了解什么是大数据时代及其代表特征:理解大数据的相关概念:了解大数据关谊技术的应用重点:大数据的概念2】、32.加第处理架构Hadoop2. 1概述2.2 HadoOP生态系统2.3 HadOOP的安装和使JI1.教学要求,在对Had。叩了解的基础上,埋解Hadoop生态系统每个项目元素的功能;掌握HadoOP的安装与配5S1.点:HadoOP生态系统渣点tHadoop的安装和使用841、2.33.分布式文件素嫌HDFS3.1 分布式文件系统3.2 HDFS相关概念3.3HDFS体系结构3.4HDFS存储原理3.5HDFS数据读写过程3.6HDFS编程实践教学要求I了解分布式文件系统:理解HDFS的相关概念:理解并掌握HDFS体系结构、存储原理和读写过程:理解并掌握HDFS编程实践:点I理解HDFS的相关概念:理解并掌握HDFS体系结构、存储屈理和读写过程:难点:埋解并拿提HDFS编程实践:1211、2、34.分布式数据庠HBaSe教学要求I1041、2、34.1 HBase概述4.2 HBaSI,访问接口4.3 HBaso数据模型4.4 IIBase实现原理4.5 HBaSe运行机制1.6HBase编程实践了解HBaSe的殂成架构、实现原理及运行机制:掌握HBaSe编程实践:点,HBaSS的数据模型、实现原理、运行机制:难点:HBaSe编程实践5.NOSQ1.数据席、云敷阵5. 1NoSQ1.数据库概述5.2WSQ1.与关系数据库比较5.3NoSQ1.的四种类型5.4NOSQ1.三大基石5.5云数据库概述教学要求,了解什么是NoSQ1.数据库,掌握NoSQ1.四种类型,了解WSQ1.三大法石;了解X数据摩:点IoSQ1.数据库四种类型、三大基石41、3S-MapReduce6.1概述6.2MapReduce工作流程6.3实例分析6.4MapReduce具体应用6.5MaPRedUCC编程实践校学要求,了解分布式并行编程:通过实例分析了解1.作流程:掌握编程实践:工点:MapReduce工作流程*点*MHPRCdUCC编程实践1241、2、348162.实验部分实验部分的教学内容、基本要求与学时分配见表3。实殴项目实验内容和央求喟学对应的课程目标1.大数据处理架构Haduop实验内容:掌握1.inUX的安装及场木命令,掌握HadoOP单机及伪分布式的安装与配商,实验要求I能绯熟练使用1.inUX相关命令,能正确进行Hadoop单机及伪分布式的安装与配11、2、32.分布式文件系统HDFS卖3内h掌握HDFS部署;掌握HDFSShe1.I命令和JaVaAPI编程实践:实验要求:能熟练掌握HDFSshe1.1.命令和进行JaYaAPI编程实践:41.2.33.分布式数据库HBase实Ift内容:HBaseshe1.1.命令方式和JaVaAPI编程实践:实验央求:能妫练掌握HBaSeShe1.1.命令创建衣及插入数据等操作和进行JaVaAPI编程实找:11、2、34.MapReduce架构原理实舱内容:进行MapReduce初级编程实践;实要求,能通过Mi1.P%数和RCdUCe函数进行MapReduce初级编程实践:41、2、316五、教学方法及手段本课程以课堂讲授并结合实践进行学习,结合课程讨论、案例、视笏资源共享.、实脸等教学手段完成课程教学任务和相关能力的培养。学生比较全面地理解大数据的起源及特征,并拿握大数据的系统架构设计及功能目标设计、大数据程序开发、企业大数据案例分析等内容,同时通过使用Hadoop等大数据技术平台来提升学生对大数据开发的实践能力,在实验教学环节中,通过比发式教学培养学生在了解和掌握大数据相关基本知识和基本技能基础上进行第程实践.培养学生自主学习能力、实际动手能力,激发学生的创新思维.六、课程资源1 .教材(I)林子雨,大数据技术原理与应用(笫三版)M.北京:人民邮电出版社,2021.2 .参考书(1)张伟洋Hadoop3x大数据开发实战(视城教学版)M.北京:清华大学出版社.2022.(2)唐世伟.田以大数据采集与预处理技术M.北京:清华大学出版社.2022.(3)迟战委.陈鹏程.Hadoop大数据分析技术(MJ.北京:清华大学出版社.2022.(4)王振武,大数据挖掘与应用M.北京:清华大学出版社,2017.3 .期刊(I)郑冬花,叶明珠.云计算环境中面向大数据的改进密使峰曲聚类算法J济南大学学报,2022,:85-89.(2)魏亮,林子机赖永炫.DFTS:而向大数据集的TopkSky1.inc查HU算法以计停机科学.2019.46(05):150-156.(3) NingWang,YangYang.1.iyuanFeng.SVM-BiisedIncrementa1.1.earningA1.gorithmfor1.arge-Sca1.eDaiaStreaminC1.oudComputingU.KSIITransac1.ioiisonInternetandInformationSystems.2014,8(10):3378-3393.(4)赵向兵,张景安.基于行业的“Hadoop应用开发”蝶合性实验案例设计以中国值息技术教育.2022.(21):111-114.(5)巫东来.扬仕茄.大数据及海量数据处理架构:HMOOPvsMPP(J).软件导刊.2020.19(10):218-222.4 .网络资源(I)近门大学大数据实脸室.hup:“db1ab.xmu.cdu.ciV.(2)大数据技术与原埋密深视.hups:,','WWW.icoursc1.63.oWeursc/XMUI002335W4.七'课程考核对课程目标的支撑课程成绩由过程性考核成绩和期末考核成绩两部分构成,具体考核/评价细则及对课程目标的支撑关系见表1.考模I占考核/评价细财课程目麻环节比123过果15(1)根据课堂出勤情况和课堂回答问题情况进行考J堂表现核,满分100分,(2)以平时考核成绩乘以其在总评成绩中所占的比例计入课程总评成绩。573验15(1)根据每个实验的实骁操作完成情况和实骆报告质量单独评分,满分100分:(2)每次实物单独评分.取各次实验成绩的平均值作为此环节的最终成绩.(3以实验成绩乘以其在总评成绩中所占的比例计入课程总评成绩,573作业15(1)主要考核学生对各然节知识点的复习、理解和掌握程度,满分IQO分:(2)每次作业单独评分,取各次成绩的平均值作为此环节的最终成绩。(3)以作业成绩乘以其在总评成绩中所占的比例计入课程总评成绩.663测试15(1主要考核学生对各章节知识点的更习、理解和安握程度.满分100分:(2)每次测试单独评分,取各次成绩的平均祖作为此环节的鼓终成绩.(3)以测试成绩柒以其在总评成绩中所占的比例it入课程总评成绩。663末核期考10(1)期末机试100分,以期末机试成绩乘以其在总评成缄中所占的比例计入课程总评成缄。(2)主要考核:大数据处理架构Hadoop1分布式文件系统HDFS:分布式数据库HBiJSe:MapReduce.(3)考核类型:期末机试.M1610合计:100分364222八、考核与成绩评定1 .考核方式及成绩评定考核方式:本课程主要以课堂衣现、实脸、作业、测试、期末机试考核等方式对学生进行考核评价。考核基本要求:考核总成绩由期末机试考核成绩和过程性考核成绩组成.其中:期末机试考核成缄为100分(权重40%),主要针对程序关键点进行个性化开发测试:课堂衣现、实脸、作业、测试等过程性考核成绩为100分(权理60%):过程性考核和期末机试考核分值分配与教学大纲各章节的学时基本成比例。2 .过程性考核成绩的标准过程性考核方式正点考核内容、评价标准、所占比HJ见表5.«5过程性考核方式评价标准考核方式所占比(%)100>x9090>x>8080>x7070>x>60x<6025里记完整,积极参与教学活动,踊氏回答问题,准确率大于90S。