SlideShare una empresa de Scribd logo
1 de 16
Exadata在电商的应用
By louis liu @vmcd.org
在哪使用? 怎么使用?
结构化 vs 非结构化
事务
数据
结构化
元数据和
主数据 数据
仓库
数据
分析
数据
集成
日志、社交、行
为、多媒体
非结构化
机器生成
Map Reduce
分布式
文件系统
NoSQL
数据存储
数据
分析
1. 割裂 or 集成?
?
结构化 vs非结构化 割裂 or 集成 -- reloading?
元数据
非结构数据
结构数据
目前-Reloading操作
技术路线
• 数据分析可直接从MR汇总
至BI分析;
• 客户行为等数据分析要与已
有关系型数据关联, 需将
MR结果保存在RDBMS后再
统一进行BI;
架构决策
• 使用标准 BI 平台;
• 规划科学的数据流向;
• 优化不同类型数据关联;
1号店BI 数据现状与未来
2013 2014 2015
•BI业务数据当前-2013年:
•非结构化数据 – xx+节点Hadoop, 总存储300TB, 日
均增长1TB;
•结构化数据 - 两台Exadata互备且读写分离, 总存
储6TB(high compress) ;
•预计年均增长约200%+;
•现有架构数据容量远不能满足未来三年发展;
•需要升级、扩容现有架构;
关系数据
6TB
日志数据
200TB
日志数据
400TB
关系数据
15TB
日志数据
800TB
关系数据
30TB
目前的架构 X4 X2 分离 –两层结构 + Reloading
BI分析
平台
整合
流量/浏览统计
销售/财务/CRM
X4X2
Not online
1号店数据物理拓扑 2013年
利用成熟平台
X2-2 1/4
HDFS
• 业务数据中结构化部分由
RDBMS架构处理; 非结构化部
分由Hadoop平台处理;
• Hadoop结果集通过
Connectors同步至Exadata;
• 处理结果由统一的BI平台分
析;
销售
供应链
财务
结构化数据
店中店
CRM
关联查询
复杂计算
统计分析
Hadoop结果集
各类行为日志
非结构化数据
分布存储
MapReduce
Aggregation
1号店数据物理拓扑建议 Exadata –X4 资源分割 2014
利用成熟平台
X4-2 1/2
HDFS
• 应用分离 (线上Domain 分离)
• 资源隔离(两套XD集群互补)
• 利用hadoop+ X2 构造ODS数
据集市 X4 ;
销售
供应链
财务
结构化数据
店中店
CRM
关联查询
复杂计算
统计分析
Hadoop结果集
日志Tracking
非结构化数据
分布存储
MapReduce
Aggregation
DW
X2-集群
X4-集群
Hadoop集群
系统融合 – 共组DW集群系统
X4构造ODS + X2构造分级BI,
配合Hadoop的非结构化数
据组成了数据集市
非结构化
结构化
P-of-X2
1号店数据物理架构 两层数据, 两层BI
BI分析
平台
Hadoop
X4-2 1/2
ODS
InfiniBand
InfiniBand
X2-2 1/4
多活业务中心
财务
Hadoop
结果集
Hadoop
结果集
CRM..
供应链
商家
X2-2 1/4
Tracking
ETL Tool
…
未来的BI架构- ->脱离传统的约束
Text in here
截取Oracle的官方回复
性能提升
Exadata&Hadoop是
性能最佳结构化&
非结构化数据平台;
Oracle有最优的多
表Join, 集群,
Connector等技术;
成本节约
RDBMS是最成熟的
BIDW平台;CDH是
成熟的商用版本;
高效利用已有平台
能大大降低’新’数
据项目的资源投入;
灵活性增强
RDBMS&Hadoop组
成两层BI数据基础;
更多数据, 更多技
术手段灵活处理,
达到整体最优;
风险降低
RDBMS有更高的数
据安全性, 可管理
性;
两层架构使’新’数
据项目总体风险可
控;
参考案例 - XXX BI DW 架构
filesystem
Exadata所面临的问题
2. X4 所考虑的问题
3. 升级所遇到的问题
1. X2所遇到的问题1
Q & A

Más contenido relacionado

La actualidad más candente

2014 年十大商业智能趋势
2014 年十大商业智能趋势2014 年十大商业智能趋势
2014 年十大商业智能趋势Tableau Software
 
数据库设计方法、规范与技巧
数据库设计方法、规范与技巧数据库设计方法、规范与技巧
数据库设计方法、规范与技巧wensheng wei
 
Business intelligent 概論 棅易
Business intelligent 概論 棅易Business intelligent 概論 棅易
Business intelligent 概論 棅易Lawrence Huang
 
如何集中数据治理,摆脱安全性和合规性困扰
如何集中数据治理,摆脱安全性和合规性困扰如何集中数据治理,摆脱安全性和合规性困扰
如何集中数据治理,摆脱安全性和合规性困扰Denodo
 
Machine Learning, Big Data, Insights
Machine Learning, Big Data, InsightsMachine Learning, Big Data, Insights
Machine Learning, Big Data, InsightsJeff Chu
 
Dtcc ibm big data platform 2012-final_cn
Dtcc ibm big data platform 2012-final_cnDtcc ibm big data platform 2012-final_cn
Dtcc ibm big data platform 2012-final_cnyp_fangdong
 
博晓通企业介绍和典型客户201504 (完整版)
博晓通企业介绍和典型客户201504 (完整版)博晓通企业介绍和典型客户201504 (完整版)
博晓通企业介绍和典型客户201504 (完整版)Yu Zhang
 
分布式构架简介 草稿
分布式构架简介 草稿分布式构架简介 草稿
分布式构架简介 草稿guestd7133d1
 
database
databasedatabase
databases06283
 
How Enterprises Leverage Data to Overcome Business Challenges During Coronavirus
How Enterprises Leverage Data to Overcome Business Challenges During CoronavirusHow Enterprises Leverage Data to Overcome Business Challenges During Coronavirus
How Enterprises Leverage Data to Overcome Business Challenges During CoronavirusDenodo
 
大數據獲利模式 Ch 2
大數據獲利模式 Ch 2大數據獲利模式 Ch 2
大數據獲利模式 Ch 2Hans Shih
 
大數據的獲利模式
大數據的獲利模式大數據的獲利模式
大數據的獲利模式Chang Chiao Hui
 
Track C-2 洞見未來 - Tableau 創造大數據新價值
Track C-2 洞見未來 - Tableau 創造大數據新價值Track C-2 洞見未來 - Tableau 創造大數據新價值
Track C-2 洞見未來 - Tableau 創造大數據新價值Etu Solution
 
客戶數據分析四大難題一次解決: IBM 數據分析解決方案
客戶數據分析四大難題一次解決:  IBM 數據分析解決方案客戶數據分析四大難題一次解決:  IBM 數據分析解決方案
客戶數據分析四大難題一次解決: IBM 數據分析解決方案Randy Lin
 
数据的价值和灵魂
数据的价值和灵魂数据的价值和灵魂
数据的价值和灵魂学峰 司
 

La actualidad más candente (16)

2014 年十大商业智能趋势
2014 年十大商业智能趋势2014 年十大商业智能趋势
2014 年十大商业智能趋势
 
数据库设计方法、规范与技巧
数据库设计方法、规范与技巧数据库设计方法、规范与技巧
数据库设计方法、规范与技巧
 
Business intelligent 概論 棅易
Business intelligent 概論 棅易Business intelligent 概論 棅易
Business intelligent 概論 棅易
 
如何集中数据治理,摆脱安全性和合规性困扰
如何集中数据治理,摆脱安全性和合规性困扰如何集中数据治理,摆脱安全性和合规性困扰
如何集中数据治理,摆脱安全性和合规性困扰
 
Machine Learning, Big Data, Insights
Machine Learning, Big Data, InsightsMachine Learning, Big Data, Insights
Machine Learning, Big Data, Insights
 
Dtcc ibm big data platform 2012-final_cn
Dtcc ibm big data platform 2012-final_cnDtcc ibm big data platform 2012-final_cn
Dtcc ibm big data platform 2012-final_cn
 
博晓通企业介绍和典型客户201504 (完整版)
博晓通企业介绍和典型客户201504 (完整版)博晓通企业介绍和典型客户201504 (完整版)
博晓通企业介绍和典型客户201504 (完整版)
 
分布式构架简介 草稿
分布式构架简介 草稿分布式构架简介 草稿
分布式构架简介 草稿
 
database
databasedatabase
database
 
How Enterprises Leverage Data to Overcome Business Challenges During Coronavirus
How Enterprises Leverage Data to Overcome Business Challenges During CoronavirusHow Enterprises Leverage Data to Overcome Business Challenges During Coronavirus
How Enterprises Leverage Data to Overcome Business Challenges During Coronavirus
 
大數據獲利模式 Ch 2
大數據獲利模式 Ch 2大數據獲利模式 Ch 2
大數據獲利模式 Ch 2
 
大數據
大數據大數據
大數據
 
大數據的獲利模式
大數據的獲利模式大數據的獲利模式
大數據的獲利模式
 
Track C-2 洞見未來 - Tableau 創造大數據新價值
Track C-2 洞見未來 - Tableau 創造大數據新價值Track C-2 洞見未來 - Tableau 創造大數據新價值
Track C-2 洞見未來 - Tableau 創造大數據新價值
 
客戶數據分析四大難題一次解決: IBM 數據分析解決方案
客戶數據分析四大難題一次解決:  IBM 數據分析解決方案客戶數據分析四大難題一次解決:  IBM 數據分析解決方案
客戶數據分析四大難題一次解決: IBM 數據分析解決方案
 
数据的价值和灵魂
数据的价值和灵魂数据的价值和灵魂
数据的价值和灵魂
 

Destacado

Pakistan ordinance factories (pof)
Pakistan ordinance factories (pof)Pakistan ordinance factories (pof)
Pakistan ordinance factories (pof)Nauman khan
 
Finance today and tomorrow
Finance today and tomorrowFinance today and tomorrow
Finance today and tomorrowTimo Nurminiemi
 
Общая характеристика мировой литературы на рубеже 19 - 20 вв.
Общая характеристика мировой литературы на рубеже 19 - 20 вв. Общая характеристика мировой литературы на рубеже 19 - 20 вв.
Общая характеристика мировой литературы на рубеже 19 - 20 вв. Жанна Темникова-Однорал
 
поисковые системы
поисковые системыпоисковые системы
поисковые системыShelty2011
 

Destacado (8)

Announcement final
Announcement finalAnnouncement final
Announcement final
 
Pakistan ordinance factories (pof)
Pakistan ordinance factories (pof)Pakistan ordinance factories (pof)
Pakistan ordinance factories (pof)
 
5th newsletter gr
5th newsletter gr5th newsletter gr
5th newsletter gr
 
Finance today and tomorrow
Finance today and tomorrowFinance today and tomorrow
Finance today and tomorrow
 
Общая характеристика мировой литературы на рубеже 19 - 20 вв.
Общая характеристика мировой литературы на рубеже 19 - 20 вв. Общая характеристика мировой литературы на рубеже 19 - 20 вв.
Общая характеристика мировой литературы на рубеже 19 - 20 вв.
 
La Prehistòria
La PrehistòriaLa Prehistòria
La Prehistòria
 
06 evaluation
06 evaluation06 evaluation
06 evaluation
 
поисковые системы
поисковые системыпоисковые системы
поисковые системы
 

Similar a Exadata best practice on E-commerce area

逻辑数据编织 – 构建先进的现代企业数据架构
逻辑数据编织 – 构建先进的现代企业数据架构逻辑数据编织 – 构建先进的现代企业数据架构
逻辑数据编织 – 构建先进的现代企业数据架构Denodo
 
Big Data 101 一 一個充滿意圖與關聯世界的具體實現
Big Data 101 一 一個充滿意圖與關聯世界的具體實現Big Data 101 一 一個充滿意圖與關聯世界的具體實現
Big Data 101 一 一個充滿意圖與關聯世界的具體實現Fred Chiang
 
ActWeis Technology Inc. 艾格亞士科技 簡介產品及服務 (20121026)
ActWeis Technology Inc. 艾格亞士科技 簡介產品及服務 (20121026)ActWeis Technology Inc. 艾格亞士科技 簡介產品及服務 (20121026)
ActWeis Technology Inc. 艾格亞士科技 簡介產品及服務 (20121026)ActWeis Technology Inc.
 
淘宝数据可视化[2010 SD2.0]
淘宝数据可视化[2010 SD2.0]淘宝数据可视化[2010 SD2.0]
淘宝数据可视化[2010 SD2.0]KennyZ
 
阿里巴巴数据中台实践分享.pdf
阿里巴巴数据中台实践分享.pdf阿里巴巴数据中台实践分享.pdf
阿里巴巴数据中台实践分享.pdfmarkmind
 
浅谈伪分布式数据库架构
浅谈伪分布式数据库架构浅谈伪分布式数据库架构
浅谈伪分布式数据库架构mysqlops
 
借助Denodo实现数据网格架构和数据共享
借助Denodo实现数据网格架构和数据共享借助Denodo实现数据网格架构和数据共享
借助Denodo实现数据网格架构和数据共享Denodo
 
Greenplum技术
Greenplum技术Greenplum技术
Greenplum技术锐 张
 
Se shang hai_04_cloudybi
Se shang hai_04_cloudybiSe shang hai_04_cloudybi
Se shang hai_04_cloudybiTech2IPO
 
How to build data warehouse
How to build data warehouseHow to build data warehouse
How to build data warehousejasonfuoo
 
Big data, big deal ms it168文库
Big data, big deal ms it168文库Big data, big deal ms it168文库
Big data, big deal ms it168文库Accenture
 
Big data, big deal ms it168文库
Big data, big deal ms it168文库Big data, big deal ms it168文库
Big data, big deal ms it168文库Accenture
 
陈跃国:Sql on-hadoop结构化大数据分析系统性能评测
陈跃国:Sql on-hadoop结构化大数据分析系统性能评测陈跃国:Sql on-hadoop结构化大数据分析系统性能评测
陈跃国:Sql on-hadoop结构化大数据分析系统性能评测hdhappy001
 
对MySQL DBA的一些思考
对MySQL DBA的一些思考对MySQL DBA的一些思考
对MySQL DBA的一些思考mysqlops
 
%C2%c8 mysql dba%c1 %ca+%f0%ae-+++
%C2%c8 mysql dba%c1 %ca+%f0%ae-+++%C2%c8 mysql dba%c1 %ca+%f0%ae-+++
%C2%c8 mysql dba%c1 %ca+%f0%ae-+++Cofyc
 
Sequoia db 技术概述_sacc
Sequoia db 技术概述_saccSequoia db 技术概述_sacc
Sequoia db 技术概述_saccwangzhonnew
 
企业系统商务智能设计
企业系统商务智能设计企业系统商务智能设计
企业系统商务智能设计George Ang
 
民间秘方
民间秘方民间秘方
民间秘方dynasty
 
Sybase Analytic Appliance
Sybase Analytic ApplianceSybase Analytic Appliance
Sybase Analytic Appliancefocusbi
 

Similar a Exadata best practice on E-commerce area (20)

逻辑数据编织 – 构建先进的现代企业数据架构
逻辑数据编织 – 构建先进的现代企业数据架构逻辑数据编织 – 构建先进的现代企业数据架构
逻辑数据编织 – 构建先进的现代企业数据架构
 
Big Data 101 一 一個充滿意圖與關聯世界的具體實現
Big Data 101 一 一個充滿意圖與關聯世界的具體實現Big Data 101 一 一個充滿意圖與關聯世界的具體實現
Big Data 101 一 一個充滿意圖與關聯世界的具體實現
 
ActWeis Technology Inc. 艾格亞士科技 簡介產品及服務 (20121026)
ActWeis Technology Inc. 艾格亞士科技 簡介產品及服務 (20121026)ActWeis Technology Inc. 艾格亞士科技 簡介產品及服務 (20121026)
ActWeis Technology Inc. 艾格亞士科技 簡介產品及服務 (20121026)
 
淘宝数据可视化[2010 SD2.0]
淘宝数据可视化[2010 SD2.0]淘宝数据可视化[2010 SD2.0]
淘宝数据可视化[2010 SD2.0]
 
阿里巴巴数据中台实践分享.pdf
阿里巴巴数据中台实践分享.pdf阿里巴巴数据中台实践分享.pdf
阿里巴巴数据中台实践分享.pdf
 
浅谈伪分布式数据库架构
浅谈伪分布式数据库架构浅谈伪分布式数据库架构
浅谈伪分布式数据库架构
 
借助Denodo实现数据网格架构和数据共享
借助Denodo实现数据网格架构和数据共享借助Denodo实现数据网格架构和数据共享
借助Denodo实现数据网格架构和数据共享
 
Greenplum技术
Greenplum技术Greenplum技术
Greenplum技术
 
Se shang hai_04_cloudybi
Se shang hai_04_cloudybiSe shang hai_04_cloudybi
Se shang hai_04_cloudybi
 
How to build data warehouse
How to build data warehouseHow to build data warehouse
How to build data warehouse
 
传媒梦工场分享
传媒梦工场分享传媒梦工场分享
传媒梦工场分享
 
Big data, big deal ms it168文库
Big data, big deal ms it168文库Big data, big deal ms it168文库
Big data, big deal ms it168文库
 
Big data, big deal ms it168文库
Big data, big deal ms it168文库Big data, big deal ms it168文库
Big data, big deal ms it168文库
 
陈跃国:Sql on-hadoop结构化大数据分析系统性能评测
陈跃国:Sql on-hadoop结构化大数据分析系统性能评测陈跃国:Sql on-hadoop结构化大数据分析系统性能评测
陈跃国:Sql on-hadoop结构化大数据分析系统性能评测
 
对MySQL DBA的一些思考
对MySQL DBA的一些思考对MySQL DBA的一些思考
对MySQL DBA的一些思考
 
%C2%c8 mysql dba%c1 %ca+%f0%ae-+++
%C2%c8 mysql dba%c1 %ca+%f0%ae-+++%C2%c8 mysql dba%c1 %ca+%f0%ae-+++
%C2%c8 mysql dba%c1 %ca+%f0%ae-+++
 
Sequoia db 技术概述_sacc
Sequoia db 技术概述_saccSequoia db 技术概述_sacc
Sequoia db 技术概述_sacc
 
企业系统商务智能设计
企业系统商务智能设计企业系统商务智能设计
企业系统商务智能设计
 
民间秘方
民间秘方民间秘方
民间秘方
 
Sybase Analytic Appliance
Sybase Analytic ApplianceSybase Analytic Appliance
Sybase Analytic Appliance
 

Más de Louis liu

Tcpcopy benchmark
Tcpcopy benchmarkTcpcopy benchmark
Tcpcopy benchmarkLouis liu
 
JK Log-Center architect
JK Log-Center architectJK Log-Center architect
JK Log-Center architectLouis liu
 
JKDB BACKUP Introduction
JKDB BACKUP IntroductionJKDB BACKUP Introduction
JKDB BACKUP IntroductionLouis liu
 
Infiniflash benchmark
Infiniflash benchmarkInfiniflash benchmark
Infiniflash benchmarkLouis liu
 
MySQL Tokudb engine benchmark
MySQL Tokudb engine benchmarkMySQL Tokudb engine benchmark
MySQL Tokudb engine benchmarkLouis liu
 
Nvmfs benchmark
Nvmfs benchmarkNvmfs benchmark
Nvmfs benchmarkLouis liu
 
MySQL 5.7 milestone
MySQL 5.7 milestoneMySQL 5.7 milestone
MySQL 5.7 milestoneLouis liu
 
MySQL Oslayer performace optimization
MySQL  Oslayer performace optimizationMySQL  Oslayer performace optimization
MySQL Oslayer performace optimizationLouis liu
 
MySQL async message subscription platform
MySQL async message subscription platformMySQL async message subscription platform
MySQL async message subscription platformLouis liu
 
HBASE Performane Test
HBASE Performane TestHBASE Performane Test
HBASE Performane TestLouis liu
 
Jkcn MySQLDB 架构
Jkcn MySQLDB 架构Jkcn MySQLDB 架构
Jkcn MySQLDB 架构Louis liu
 
基于Mongodb的压力评测工具 ycsb的一些概括
基于Mongodb的压力评测工具 ycsb的一些概括基于Mongodb的压力评测工具 ycsb的一些概括
基于Mongodb的压力评测工具 ycsb的一些概括Louis liu
 
My sql fabric ha and sharding solutions
My sql fabric ha and sharding solutionsMy sql fabric ha and sharding solutions
My sql fabric ha and sharding solutionsLouis liu
 
NetApp ef540 SSD Storage Test
NetApp ef540 SSD Storage TestNetApp ef540 SSD Storage Test
NetApp ef540 SSD Storage TestLouis liu
 
MySQL 5.5&5.6 new features summary
MySQL 5.5&5.6 new features summaryMySQL 5.5&5.6 new features summary
MySQL 5.5&5.6 new features summaryLouis liu
 
Ssd gc review
Ssd gc reviewSsd gc review
Ssd gc reviewLouis liu
 
1号店数据库架构
1号店数据库架构1号店数据库架构
1号店数据库架构Louis liu
 
Architecture of YHD
Architecture of YHDArchitecture of YHD
Architecture of YHDLouis liu
 

Más de Louis liu (20)

Tcpcopy benchmark
Tcpcopy benchmarkTcpcopy benchmark
Tcpcopy benchmark
 
JK Log-Center architect
JK Log-Center architectJK Log-Center architect
JK Log-Center architect
 
Wdt Test
Wdt TestWdt Test
Wdt Test
 
JKDB BACKUP Introduction
JKDB BACKUP IntroductionJKDB BACKUP Introduction
JKDB BACKUP Introduction
 
Infiniflash benchmark
Infiniflash benchmarkInfiniflash benchmark
Infiniflash benchmark
 
MySQL Tokudb engine benchmark
MySQL Tokudb engine benchmarkMySQL Tokudb engine benchmark
MySQL Tokudb engine benchmark
 
Nvmfs benchmark
Nvmfs benchmarkNvmfs benchmark
Nvmfs benchmark
 
MySQL 5.7 milestone
MySQL 5.7 milestoneMySQL 5.7 milestone
MySQL 5.7 milestone
 
MySQL Oslayer performace optimization
MySQL  Oslayer performace optimizationMySQL  Oslayer performace optimization
MySQL Oslayer performace optimization
 
MySQL async message subscription platform
MySQL async message subscription platformMySQL async message subscription platform
MySQL async message subscription platform
 
HBASE Performane Test
HBASE Performane TestHBASE Performane Test
HBASE Performane Test
 
Jkcn MySQLDB 架构
Jkcn MySQLDB 架构Jkcn MySQLDB 架构
Jkcn MySQLDB 架构
 
基于Mongodb的压力评测工具 ycsb的一些概括
基于Mongodb的压力评测工具 ycsb的一些概括基于Mongodb的压力评测工具 ycsb的一些概括
基于Mongodb的压力评测工具 ycsb的一些概括
 
My sql fabric ha and sharding solutions
My sql fabric ha and sharding solutionsMy sql fabric ha and sharding solutions
My sql fabric ha and sharding solutions
 
NetApp ef540 SSD Storage Test
NetApp ef540 SSD Storage TestNetApp ef540 SSD Storage Test
NetApp ef540 SSD Storage Test
 
MySQL 5.5&5.6 new features summary
MySQL 5.5&5.6 new features summaryMySQL 5.5&5.6 new features summary
MySQL 5.5&5.6 new features summary
 
Ssd gc review
Ssd gc reviewSsd gc review
Ssd gc review
 
1号店数据库架构
1号店数据库架构1号店数据库架构
1号店数据库架构
 
Architecture of YHD
Architecture of YHDArchitecture of YHD
Architecture of YHD
 
Oracle dgha
Oracle dghaOracle dgha
Oracle dgha
 

Exadata best practice on E-commerce area