Más contenido relacionado
La actualidad más candente (20)
Similar a Cloudera企业数据中枢平台 (20)
Cloudera企业数据中枢平台
- 2. 2© Cloudera, Inc. All rights reserved.
Apache Hadoop开启技术变⾰之⻔
©2014 Cloudera, Inc. All rights reserved.
Hadoop⽅式传统⽅式
3万美元/TB
昂贵且不可持续
• Scale Up,难以扩展
• ⺴络、I/O成为瓶颈
• 擅⻓处理结构化/关系型数据
• 难以处理新增的领域和数据类型
昂贵的专⽤的服务器+存储 / 昂贵的专⽤软件
Network
数据存储
(SAN, NAS)
计算
(RDBMS, EDW)
300-1000美元/TB
经济实⽤
• Scale out,易于扩展
• 近乎⽆限容量、超⾼效率
• 可以处理各种数据
• 结构化、半结构化、⾮结构化
标准商⽤x86服务器 / 开源软件
计算 内存 存储计算 内存 存储 计算 内存 存储
- 5. 5© Cloudera, Inc. All rights reserved.
Cloudera企业数据中心
数据治理 运维管理
CDH – 100% 开源 商业版
公有云
数据中心
所有X86服务器
部署
云应⽤迁移
Navigator
Optimizer
传统数据库
迁移到
Hadoop
Cloudera Data Science Workbench (CDSW)
R, Python, Scala
Data Science at Scale
PaaS
私有云
数据加⼯、处理 发现与分析 在线服务
统⼀数据服务
存储
批处理 流处理 SQL 全⽂检索 建模 在线
资源管理— YARN, Zookeeper
安全管理— SENTRY + Record Service
MR,
HIve, Pig
Spark
Streaming
Impala Solr Spark
MLLib
HBase
HDFS Kudu HBase
数据接⼊ — Sqoop, Flume, Kafka
分布式⽂件系统 关系数据 NoSQL
Cloudera
Navigator
安全
审计
溯源
加密
Cloudera
Manager
管理
监控
诊断
集成
Cloudera
Director
云上⼤数
据
- 6. 6© Cloudera, Inc. All rights reserved.
统⼀平台:⼀个平台,多种计算框架
•批处理
•流处理
•交互式分析
•端到端的分析流程
•访问更多的数据
•更多多用户放到到数据
•用户访问数据方式更多安全及管理
处理
接⼊
Sqoop, Flume
转换
MapReduce,
Hive, Pig, Spark
发现
分析
Impala
全⽂检索
Solr
建模
机器学习
SAS, R, Spark,
Mahout
服务
NoSQL
HBase
流处理
Spark Streaming
⽆限存储HDFS, HBase
YARN, Cloudera Manager,
Cloudera Navigator
- 16. 16© Cloudera, Inc. All rights reserved.
机器学习算法
• 逻辑回归
• 决策树
• 随机森林
• Gradient-boosted tree
• 神经网络
• 贝叶斯
分类
算法
• 线性回归
• 决策树
• 随机森林
• Gradient-boosted tree
• Survival regression
• Isotonic regression
回归
算法
•K-means
Gaussian mixture
Power iteration clustering (PIC)
Latent Dirichlet allocation (LDA)
Bisecting k-means
Streaming k-means
聚类算
法
•协同过滤
推荐算
法
•FP-Growth
关联规
则
- 19. 19© Cloudera, Inc. All rights reserved.
统一数据治理
审计 溯源 统一元数据 统一策略
Search
Define
Analyze
Profile
自服务探索及分析
快速查找相关数据集
Audit
Track
Encrypt
Manage Keys
满足监管要求的治
理及管控
保护敏感数据
Report
Optimize
Migrate
Maintain Models
活动数据优化
配置集群提高效率
Classify
Steward
Backup
Retain
数据生命周期管理
集群性能最大化
数据治理:Cloudera Navigator
- 20. 20© Cloudera, Inc. All rights reserved.
Full text search across HDFS
See file schema
Column Level
lineage
Table Level
lineage
Table metadata
with technical
description
Tags for easy
search and
sharing
Custom
key/values
Table metadata
with business
description
Download lineage
Who created it,
when, where