欢迎来到第壹文秘! | 帮助中心 分享价值,成长自我!
第壹文秘
全部分类
  • 幼儿/小学教育>
  • 中学教育>
  • 高等教育>
  • 研究生考试>
  • 外语学习>
  • 资格/认证考试>
  • 论文>
  • IT计算机>
  • 法律/法学>
  • 建筑/环境>
  • 通信/电子>
  • 医学/心理学>
  • ImageVerifierCode 换一换
    首页 第壹文秘 > 资源分类 > PPTX文档下载
    分享到微信 分享到微博 分享到QQ空间

    ETL工具研究报告.pptx

    • 资源ID:273864       资源大小:846.97KB        全文页数:22页
    • 资源格式: PPTX        下载积分:10金币
    快捷下载 游客一键下载
    账号登录下载
    三方登录下载: 微信开放平台登录 QQ登录
    下载资源需要10金币
    邮箱/手机:
    温馨提示:
    快捷下载时,如果您不填写信息,系统将为您自动创建临时账号,适用于临时下载。
    如果您填写信息,用户名和密码都是您填写的【邮箱或者手机号】(系统自动生成),方便查询和重复下载。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP,免费下载
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    ETL工具研究报告.pptx

    ETL研究报告1.Talend Open Studio for Big Data1.Talend Open Studio for Big Data是一款开源的数据集成软件包,用户能够使用该产品将数据在Hadoop集群以及企业内部系统(如关系型数据库或数据仓库)之间进行移动。该平台还允许用户创建相关技术的连接器,比如HBase、Pig、Sqoop和Hive等。Talend Open Studio for Big Data 还提供了针对各种数据库的连接器。适用的DB类型:输入(能读取)的文件类型: . csv,.arff,.txt,.ldif, . mail,.xml,.properties。效率:Oracle- Oracle间两千万条数据转移需要6个小时, Oracle- SQL Server间两千万条数据转移需要11个小时Oracle- Oracle转换工具图:Oracle- SQL Server转换工具图:Oracle- SQL Server 转移的时候Talend Open Studio for Big Data工具所在电脑性能:Oracle- SQL Server 转移的时候SQL Server所在电脑性能:Oracle- SQL Server 转移的时候Oracle所在电脑性能(服务器):按照以上图看不会影响导入数据的效率。按照以上图看不会影响导入数据的效率。2.Kettle2.Kettle:适用的DB类型:输入(能读取)的文件类型: 效率:Oracle- Oracle间两千万条数据转移需要8个小时, Oracle- SQL Server间两千万条数据转移需要12个小时费用问题: Kettle是免费的。 Talend Open Studio for Big Data分免费版和商业版,商业版是多线程操作,效率快,免费版相对慢,根据talend公司提供的数据,商业版的2000万条数据是36分钟,但是免费版的要用一个多小时。3.DataStage3.DataStage,这是IBM为其配套的DB2开发的ETL工具,也可以用于其它数据库数据的集成。最专业的ETL工具,价格不菲,使用难度一般。我们上网查了两天,网上提供的资源都不好用,装了好几个都没法打开,所以也没有办法看用这个工具转移两千万条数据所用的时间。从而没办法比较时间。4.SQL 4.SQL Server Integration Services Server Integration Services :适用的DB类型:SqlServer,Oracle,DB2,Access,。输入(能读取)的文件类型: Excel,xml,原始文件(是SSIS独有发文件存储机制,只能由Dataa Flow Destination创建)效率: SQL Server SQL Server间两千万条数据插入需要8分钟53秒, SQL Server SQL Server间两千万条数据插入更新需要1小时43分钟, Oracle- SQL Server间两千万条数据转移需要14分钟29秒。SQL Server SQL Server两千万条数据插入:SQL Server SQL Server两千万条数据插入更新:Oracle- SQL Server间两千万条数据插入:SQL Server Intergration Services优点速度快,缺点是类型转换存在问题,如果要用的话还需要仔细配置。支持的数据库类型不多。我说一下用SSIS的感受,一开始测试的时候很快,当时感觉真是个不错的ETI工具,但是后来连接oracle数据库时配置很麻烦,出很多问题也花费了大量的时间,好不容易才导成功了。如果不同库之间进行导入导出的时候要有数据类型转化会容易出问题。所以为了导入数据更方便效率,不建议用SQL Server Intergration Services。总结: 经过这些天的研究测试,我认为如果要进行数据转移可以这样分配: 当数据是在sqlserver库之间转化时用SQL Server Intergration Services。 而其他库之间的转化时用Talend Open Studio for Big Data。 kettle不是很稳定,所以不建议用这个。

    注意事项

    本文(ETL工具研究报告.pptx)为本站会员(p**)主动上传,第壹文秘仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知第壹文秘(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2008-2023 1wenmi网站版权所有

    经营许可证编号:宁ICP备2022001189号-1

    本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。第壹文秘仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知第壹文秘网,我们立即给予删除!

    收起
    展开