您当前的位置: 首页 > 

杨林伟

暂无认证

  • 3浏览

    0关注

    3337博文

    0收益

  • 0浏览

    0点赞

    0打赏

    0留言

私信
关注
热门博文

FusionInsight概述

杨林伟 发布时间:2022-05-31 17:26:40 ,浏览量:3

文章目录
  • 01 引言
  • 02 FusionInsight概述
    • 2.1 数据湖
    • 2.2 FusionInsight为何物?
    • 2.3 FusionInsight架构
  • 03 文末

01 引言

最近可能会用到华为的FusionInsight产品,所以预先了解下。

02 FusionInsight概述

FusionInsight官网地址:https://e.huawei.com/cn/solutions/cloud-computing/big-data

2.1 数据湖

在了解FusionInsight之前,需要知道什么是数据湖。

数据湖:是一个集中式存储库,允许以任意规模存储所有结构化和非结构化数据。可以按原样存储数据(无需先对数据进行结构化处理),并运行不同类型的分析 , 从控制面板和可视化到大数据处理、实时分析和机器学习,以指导做出更好的决策。 在这里插入图片描述

数据仓库与数据湖的对比:

特性数据仓库数据湖数据来自事务系统、运营数据库和业务线应用程序的关系数据来自 IoT 设备、网站、移动应用程序、社交媒体和企业应用程序的非关系和关系数据Schema设计在数据仓库实施之前(写入型 Schema)写入在分析时(读取型 Schema)性价比更快查询结果会带来较高存储成本更快查询结果只需较低存储成本数据质量可作为重要事实依据的高度监管数据任何可以或无法进行监管的数据(例如原始数据)用户业务分析师数据科学家、数据开发人员和业务分析师(使用监管数据)分析批处理报告、BI 和可视化机器学习、预测分析、数据发现和分析

数据湖的价值:能够在更短的时间内从更多来源利用更多数据,并使用户能够以不同方式协同处理和分析数据,从而做出更好、更快的决策。

2.2 FusionInsight为何物?

在这里插入图片描述

总结:FusionInsight本质是一个分布式数据处理系统,是在Hadoop集群上又封装了一层,类似于开源的CDHHDP等大数据平台。

FusionInsight数据湖解决方案(下面是官网贴出来的):

  • 作用:政务数据治理和一网通办,金融实时风控,运营商BOM三域融合,大企业智慧园区、智慧城轨、智慧机场等。支撑政企客户全量数据的实时分析、离线分析、交互查询、实时检索、多模分析、数仓集市、数据接入治理、图计算等海量数据分析场景,加速释放数据价值,助力政企客户实现一企一湖、一城一湖!
  • 内容:MRS云原生数据湖、DWS云数据仓库、 DGC数据湖治理中心、 GES图引擎等云服务。
2.3 FusionInsight架构

Fusion Insight有4个子产品和1个操作运维系统:

  • Fusion Insight HD(大数据处理环境):使用的数据库是Hive和HBase
  • Fusion Insight MPPDB(并行处理关系型数据库):没有明确使用什么数据库,SQL是PostgreSql-FDW提供的,数据存储使用的HDFS
  • Fusion Insight Miner(数据分析平台):基于Fusion Insight HD
  • Fusion Insight Farmer(应用容器)
  • Fusion Insight Manager(操作运维系统)

在这里插入图片描述

在这里插入图片描述

FusionInsight学习路线图,以下贴图来自:https://www.zhihu.com/question/33570348 在这里插入图片描述

03 文末

FusionInsight的介绍到此为止了,其实该产品也没有看出什么亮点,实际就是Hadoop的包装,文档又不给下载,无法更进一步的去介绍了,本文完!

关注
打赏
1662376985
查看更多评论
立即登录/注册

微信扫码登录

0.1055s