《自然语言处理技术》——实训1 配置NLP环境.docx
目录项目I迸入自然语言处理世界1可.fNLP11 实训目标12 实训环境13 实训说明I4 实训步骤24.1 安装Pyihon环境24.2 安装NLP相关年104.3 下找数据集154.4 测试环境配置是否成功155 实训小结15项目1进入自然语言处理世界配置NLP环境1实训目标(1) 能覆安装Pylhon环境.(2) 健弊安装NLP相关库.(3) 能够下教数据集.(4) ffe筋测试环境配词是否成功,2实训环境环境Kt*说明WindowsIOM电脑掾作系统Pylhun3.&SPythonift皆版本pandas1.3.0主要用于数箱读取、清洗等操作NmPy1.21.6主宴川十PyIhOn中的数值计算jicha0.42.1主要用干文本分词Gensim4.2.0主要用于检索文本、计算文本相似度、加族词向术、建模主题殍Maiploilib3.3.0主要用于数IK可视化PuddIePaddIc2.4.2足个深度学习板架.搬供了高效的计口板架和优化算法PaAiIeSpcixh1.2.0主要用于语音和音领中的各种关Bt任务的开发Scikit-Icam1.0.2广泛地用于统计分析和机器学习建模等数据科学戳域Libr¼OKIEa用分析版的许然他号.足一个季常强大的Pyihon语音仙号处理的第三方保NLTK35是一个常用的自然i*处理工具包,可用于文本处理、好义分析.同性标注等SciPy1.73是一个科学计算工具包,可用于数学、科学.工程学等领域PynSX32.9.0主要用于将文本转换成语者3实训说明自然语言处理(NLP)是指利用计算也对自然语言的形、书、义等信息进行处理,即对字、闻、句、笈章的输入、1出、识别、分析、理解、生成等进行操作和加工的过程.NLP是计算机科学领域以及人工智能领域的一个无要的研究方向,是一门融语言学、计修机科学、数学、统计学于一体的科学.NLP的具体表现形式包括机满翻译、文本摘要、文本分类、文本校对、信息抽取、语音合成、语音识别等,诳入自然语言处理世界前需要配汽NLP环境。4实训步骤4.1 安装Python环境安装Atiaconda的基本步暇如下。卜或Anaconda安装包,由于AnaConda官网网站不提供历史版本,所以需要通过官方镜像或国内镜像源进行下教,本顶口将安装2020.07版本的AnaCOnda.此处将通过清华镜像源下软AnaConda安装包,即打开清华大学TUNA网站,并电击“开源镜像站”图标,如在镜像列表中找到“anaconda”选项,并单击进入.如图1-2所示.,O20233282036VSCoSumO20236281501EgI3dobc-fort5202382822:30Wm2O23O2909:29JrUlanCUQ2023052905:59411thcO202332911:2035p-*vcrtN20236291106JPAChe202362911:35>rch>Q202362910:44MCnu>Q3OS2913:23archinu11'Q2O23OS29O923rchir三xr202382914:13aW)Un20230S29048图1-2找到-anaconda"并单击进入在anaconda列表中,单击warchive/"进入Anaconda历史版本页面,如图1-3所示,*用3开EmlM04vwnKOQMMKOCAtf。Indexofnacod1UMU20116K8”raAA0»Arcftv/22I-MUSX7:15mm”八e*1rUcM/22J-MMW:W6:11MlM3c.t*n?217l>271:>?Sl1-3查看AnaConda历史版本在archive列表中,找到“AnaCOn由32O2O07”开头的文件,选拜与自己计分机对应的操作系统版本,并进行卜佛本项目以Windows操作系统为例,i'Anaconda3-2020.07-Windows-x86_64.exe"即可进行下敦,如图1-4所示,:g32eZ,"lVHnc0c64k.290.4HlB23"M9225M*c2432eZ.07lMH%,%h5S.1WB2920-07240:25Ancoftfla32e2.eyH*c(>6.64.p<462.3HlB22-7246:25AncoMa)2e2.e7McOSXxM.M.454.1HlB2e8724>2:25An*coG322.e7.MlMo*S6.x397.3KlB2e-0724«2:25A11cor>M3-2920.07>windowsM6>4.tie而5RlB22-7-2492:26图14选择对应版本下我AnaConda安装包下载完成后,双击已下栽好的安装包,单击“Nexi”按钮,如图15所示。OAnACOnda32020.07(645)SetupWdmetoknanda3202007<QZO0<z<(64-bit)SetupSetupMlguideyouthrouhtheCStafot×mofAnacon<to32020.07(6÷brt).it6recommendedthatyoudoselotherppk0o11sbeforeStAftrtgSetup.TheWimakeitPoefibietoupdaterelevantsystemIfcswthouthamgtorebootyourccx<xer.SckNexttocontinue.图1-5单击“Next”按钮单击“lAgm”按钮,同意相关协议并进入下一步,如图1-6所示.OAnaco<da32020.07(64-bit)SetupOANACONDALiceraeAonsonentPleasereviewNkensetermsbeforertfenAndCOnda32020.07(M¼t).PressPaeDowitoseetherestoftheagreement.ErxlUserUcemeAgreenent-AnKOnddIfdrvdalEdtwCopyrK2O1S2O2O,Andcondd4Inc.AlEhtSreservedunderthe3*dauseBSDLicense:ThsEndUserlicenseAgreement(the,AgreementTt$agagreem<ntbetweenyouardAnacondafInc.CAndcondaTandQOVefnSyouruseofAnacondandvddEdition(*dweformerlykn*n&sAnacondaOstnbutxxi).IfyouaccepttetermsoftheagreementdkkIAgreetocontinue.YoumustaccepttheAgreementtoratalAnaconda32020.07(64it).AncndalInc.<BackIAgreeCancel图1-6同意相关例议选择图1-7所示的“AllUsers(requiresadminprivileges>w,Yl-it11.并单击"NCXt"按钮进入下一步.OAnaConda32020.07(64bit)SetupSelectInftdlIdtiOnTypeJANACONDAFaseselectthetypeofrjtalabonyouBcetoperformforAacond32020.07(64t).Imtalfbr:OJustMe(recommended)OAlUsersSouresadnPrtVleg)<BackMext>CarxdE1-7送择所有用户管理权限单击Bg”按钮,选择合道的安装跖径,如图1-8所示(注:路径名称最好为全英文).选择完成后单击“Next”按钮进入下一步.OAnacondaJ20207(64bit)Setp-XChooeeInstdMLoCdtionJANACONDAChOOeethefoMernWHChtoredAnaCon<te32020.07(6÷M).SetuptratalAnaconda32020.07(64t)nthefolowngfoWer.ToInStalmadifferentfolder,dckBrowseandselectanolherfolder.CkcfcNexttoconbcue.DeehnabonFoIdefEAnacondBrovwe-SPKerCqUrp2.7GBSpaceavttbb:144.SG8AnMgdd,M<8ocfcNext>Cencd图18选择安装路径跳转到图-9所示的界面:第一个选项非示AnaConda自动添加环境变收,本项目将不做勾选,因为自动添加环境变量后,使用时有可能会出现问题,以致于后续需要手动添加环境变量:第二个选项表示Anaconda使用的Python版本为3.8.此处将勾选以配置Python3.8, 然后单击-Install"按钮,开始安装。OAnacondaB2020.07(64bit)SetupOANACONDAAdvancedknstallaticnOptionsCustomzehwAnaconddintegrateswithWrXbMAdvancedOpttonsOAddAconda3tothesystemPATHenvronmentvanableNotrecommended.InsteodfopenAnoCOnda3*wththeWndoWSStartmenuandMet'Anon<te(64-bt)*.IhsddtoPATH,OPgnmatesAnocondagetfoundbeforepre%oudnstaledSOftWOre,butmaycauseprobrequrrgyoutoUnnStalandrenstalAnaaxxfe.RegeterAndConda3asthesystemPython18ThewalMotherprograms,sucaRythgTooHforWsualStudoPyCharm,WngIDE,PyOev,andMSlbnaryPAdcagesrtoautomabcalydetectAnaconddasthePrmaryPytbonX8thesystem.<BddcInstolConcd(S1-9环境配置选项安装完成后,将会出现“InSIanatiOnCompdeie”提示,此时单击“NeXlz如图1-安所示.OAndCOrXfo32020.07(64bit)Setu