您当前的位置: 首页 >  数据仓库

数据仓库,纯开源 ETL 清洗、调度技术方案,高效稳定

蔚1 发布时间:2019-03-28 23:30:11 ,浏览量:2

随着大数据的发展,BI 应用越来越广泛,中小型 BI 项目,如何选型 ETL 技术困惑着众多程序猿。本文主讲技术干货,利用开源技术快速搭建高效稳定 ETL 平台。本文对于 ETL 原理及数据库仓库层次结构,不做具体描述,专谈技术。

本文主要分享以下内容:

  1. Kettle 如何做数据清洗,清洗规则脚本过多如何规划,清洗规则脚本如何跨平台跨数据库。
  2. 解决 Kettle(Pan 、 Kitchen)执行效率慢,占用大量内存问题;本文中采用 Kettle 内部 API 接口调用,支持高并发。
  3. 开源任务调度平台选型,自动化管理任务,任务执行结果报表,任务可视化定时策略选择器(失败重新执行、失败发送邮件短信),多节点服务器执行。
  4. 任务调度平台集成 ETL(KTR、 KJB)执行日志。

阅读全文: http://gitbook.cn/gitchat/activity/5c9485cdccb802448e6c01a0

您还可以下载 CSDN 旗下精品原创内容社区 GitChat App ,阅读更多 GitChat 专享技术内容哦。

FtooAtPSkEJwnW-9xkCLqSTRpBKX

关注
打赏
1688896170
查看更多评论

蔚1

暂无认证

  • 2浏览

    0关注

    4645博文

    0收益

  • 0浏览

    0点赞

    0打赏

    0留言

私信
关注
热门博文
立即登录/注册

微信扫码登录

0.0824s