SlideShare a Scribd company logo
1 of 52
Download to read offline
商业智能简述
jeffjie@botwave.com
http://t.sina.com.cn/jeffjie
面向技术/非技术从业人员的BI扫盲课
Saturday, November 20, 2010
jeffjie@botwave.com
大纲
1.商业智能的概念
2.商业智能的技术
3.商业智能的工具
Saturday, November 20, 2010
jeffjie@botwave.com
何谓智能
Saturday, November 20, 2010
jeffjie@botwave.com
何谓智能
邻居大婶:明年前鸡还是鸭?
Saturday, November 20, 2010
jeffjie@botwave.com
何谓智能
邻居大婶:明年前鸡还是鸭?
大学生小白:当公务员还是去私企?
Saturday, November 20, 2010
jeffjie@botwave.com
何谓智能
邻居大婶:明年前鸡还是鸭?
大学生小白:当公务员还是去私企?
博汇Peter:加薪还是裁员?
Saturday, November 20, 2010
jeffjie@botwave.com
何谓智能
一起回忆一下止尿布的故事
邻居大婶:明年前鸡还是鸭?
大学生小白:当公务员还是去私企?
博汇Peter:加薪还是裁员?
Saturday, November 20, 2010
jeffjie@botwave.com
有决策就有智能
何谓智能
一起回忆一下止尿布的故事
邻居大婶:明年前鸡还是鸭?
大学生小白:当公务员还是去私企?
博汇Peter:加薪还是裁员?
Saturday, November 20, 2010
jeffjie@botwave.com
决策的依据
Saturday, November 20, 2010
jeffjie@botwave.com
决策的依据
Saturday, November 20, 2010
jeffjie@botwave.com
决策的依据
特定目标
Saturday, November 20, 2010
jeffjie@botwave.com
决策的依据
特定目标
具体度量
Saturday, November 20, 2010
jeffjie@botwave.com
决策的依据
特定目标
具体度量具体度量
Saturday, November 20, 2010
jeffjie@botwave.com
决策的依据
特定目标
具体度量
基础和反馈信息
具体度量
Saturday, November 20, 2010
jeffjie@botwave.com
• 它是:一套工具/解决方案
• 它能:将企业中现有的数据转化为知
识,帮助企业做出明智的业务经营决策
商业智能的定义
Saturday, November 20, 2010
jeffjie@botwave.com
商业智能模型
Text
Text 数据仓库
数据挖掘
报表
联机分析数据源
ETL
Saturday, November 20, 2010
jeffjie@botwave.com
大纲
1.商业智能的概念
2.商业智能的技术
3.商业智能的工具
Saturday, November 20, 2010
jeffjie@botwave.com
• ETL (数据抽取、转换、装载)
• 数据仓库
• OLAP--联机分析
• Cube--多维数据集与MDX
• 数据挖掘、等等。。。
商业智能的技术
Saturday, November 20, 2010
jeffjie@botwave.com
ETL
关系数据库
其他数据库
XML、文件
数据仓库
Extract
Transform
Load
Saturday, November 20, 2010
jeffjie@botwave.com
数据仓库
OLAP
报表
挖掘
Saturday, November 20, 2010
jeffjie@botwave.com
数据仓库
1.它是关系数据库
OLAP
报表
挖掘
Saturday, November 20, 2010
jeffjie@botwave.com
数据仓库
1.它是关系数据库
2.包含事实表与维度表
OLAP
报表
挖掘
Saturday, November 20, 2010
jeffjie@botwave.com
数据仓库
1.它是关系数据库
3.表结构范型:
星型结构
雪花型结构
2.包含事实表与维度表
OLAP
报表
挖掘
Saturday, November 20, 2010
jeffjie@botwave.com
OL(X)P哥俩好
OLAP = (联机分析)
OnLine Analytical Processing
OLTP = (联机事务)
OnLine Transaction Processing
E.F.Codd
(1960S ─)
(1993 ─)
Saturday, November 20, 2010
jeffjie@botwave.com
OLTP
T-SQL
select amount from sales where customer = 1
实时的
日常的
交易的
快速的
应用的
银行
系统
OA
订餐
系统
电子
商务关系数据库
Saturday, November 20, 2010
jeffjie@botwave.com
OLAP
MDX
SELECT [Product] ON COLUMS,[Location] ON ROWS
Cube
分析的
可延迟的
海量的
需求多变的
决策的
分析
系统
决策
系统
自助
报表
Saturday, November 20, 2010
jeffjie@botwave.com
凭什么选OLAP!!??
── OLTP愤愤不平地说
Saturday, November 20, 2010
jeffjie@botwave.com
凭什么选OLAP!!??
── OLTP愤愤不平地说
是马是骡
子拉出来
骝骝!
Saturday, November 20, 2010
jeffjie@botwave.com
凭什么选OLAP!!??
── OLTP愤愤不平地说
是马是骡
子拉出来
骝骝!
Saturday, November 20, 2010
jeffjie@botwave.com
任务背景
“真不少”连锁超市是全球5000强公司之一,每天全
球各地的超市有上百万次交易,将近年末了,大
老板想要看看今年的销售统计报表。
下面是精简后的销售数据历史表结构及示例:
ID 地区 产品 价格 时间
10909002 香港 口香糖 10.8 2010-10-20
今年销售数据历史表中有数据50亿条
Saturday, November 20, 2010
jeffjie@botwave.com
任务一
口香糖 洗发水 衣服 玩具 面包
亚太区
非洲
北美
1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000
1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000
1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000
我要今年每个地
区对应各种产品的销售额
报表!
Saturday, November 20, 2010
jeffjie@botwave.com
任务一之OLTP篇
1.select count(价格) ,地区,产品 from 销售历史
group by 地区,产品
2.执行!两个小时过去了。。。。。
地区 产品 销售额
香港 口香糖 1000000
香港 衣服 2000000
......... ......... ..........
3.哎哟,还得行转列!嗯,搞定!
Saturday, November 20, 2010
jeffjie@botwave.com
任务一之OLAP篇
小菜一碟,以产品为列,以地区为行输
出销售额嘛。
select [产品] on columns,[地区] on rows
from [销售历史仓库]
2秒不到,搞定!
口香糖 洗发水 衣服 玩具 面包
亚太区
非洲
北美
.......
1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000
1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000
1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000
....... ........ ........ ........ ........
Saturday, November 20, 2010
jeffjie@botwave.com
任务一总结
OLTP兄,
你动作慢不但止,查询时
还阻塞系统2小时!
OLAP兄,你动作非常快,
慢着,我好像看得懂你的查询
语句,有空教教我!
Saturday, November 20, 2010
jeffjie@botwave.com
任务二
香港 非洲 南美 新加坡 中国
春季
夏季
秋季
1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000
1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000
1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000
我要今年每个季
度对应各种地区的销售额
报表!
Saturday, November 20, 2010
jeffjie@botwave.com
任务二之OLTP篇
2.select count(价格) ,地区,求季度(时间) from 销售历史
group by 地区,求季度(时间)
地区 季度 销售额
香港 春季 1000000
香港 夏季 2000000
......... ......... ..........
4.哎哟,还得行转列!终于搞定!
3.执行!我了个去,8个小时过去了。
1.首先我得写一个求季度的函数哇。
Saturday, November 20, 2010
jeffjie@botwave.com
任务二之OLAP篇
没难度,以地区为列,以季度为行输出
销售额嘛。
select [地区] on columns,[时间].[季
度].children on rows from [销售历史仓库]
还是2秒不到,搞定!
香港 非洲 南美 新加坡 中国
春季
夏季
秋季
秋季
1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000
1,000,000,000 2,000,000,000 1,000,000,000 1,000,000,000 1,000,000,000
1,000,000,000 1,000,000,000 3,000,000,000 1,000,000,000 1,000,000,000
1,000,000,000 1,000,000,000 1,000,000,000 4,000,000,000 5,000,000,000
Saturday, November 20, 2010
jeffjie@botwave.com
任务二总结
OLTP兄,
一次比一次慢,我不敢再
拿系统阻塞冒险了
OLAP兄,一如往常的快,接
下来我还要看月份的报表。
Saturday, November 20, 2010
jeffjie@botwave.com
OLAP的秘密
多维数据库
数据仓库
各种数据源
Saturday, November 20, 2010
jeffjie@botwave.com
魔术发生的地方-Cube
T-Shit
hats
Clothes
Saturday, November 20, 2010
jeffjie@botwave.com
魔术发生的地方-Cube
维度(Dimension)
T-Shit
hats
Clothes
Saturday, November 20, 2010
jeffjie@botwave.com
魔术发生的地方-Cube
度量(Measure)
维度(Dimension)
T-Shit
hats
Clothes
Saturday, November 20, 2010
jeffjie@botwave.com
魔术发生的地方-Cube
度量(Measure)
维度(Dimension)
T-Shit
hats
Clothes
层次结构
(Hierarchy)
Saturday, November 20, 2010
jeffjie@botwave.com
魔术师的咒语-MDX
SELECT
{[维度成员],[维度成员]} ON 坐标,
FROM [多维数据集]
WHERE ([切片维度])
总坐标数为128
常用坐标常量:
COLUMNS(0),ROWS(1),
PAGES(2),SECTIONS(3),CHAPTERS(4)
语法
PS.
Saturday, November 20, 2010
jeffjie@botwave.com
数据挖掘
分类 | 回归 | 分割 | 关联 | 序列分析 | 概率预测
决策树
获得数据之间的关系
并做出预测
贝叶斯
聚合算法
关联算法
Saturday, November 20, 2010
jeffjie@botwave.com
大纲
1.商业智能的概念
2.商业智能的技术
3.商业智能的工具
Saturday, November 20, 2010
jeffjie@botwave.com
• ETL工具
• 数据仓库
• OLAP工具
• 报表工具
• 挖掘工具
工欲善其事
Saturday, November 20, 2010
jeffjie@botwave.com
商用BI工具
Saturday, November 20, 2010
jeffjie@botwave.com
开源BI工具
BIRT
开源免费
组件
开源免费
方案
开源商用
方案
Saturday, November 20, 2010
jeffjie@botwave.com
参考
一、Introduction to data cube http://www2.cs.uregina.ca/~dbd/cs831/notes/dcubes/dcubes.html
二、Rapid Miner http://rapid-i.com/content/view/181/90/
三、SpagoBI http://www.spagoworld.org/xwiki/bin/view/SpagoBI/
四、Jasperreports http://jasperforge.org/projects/jasperreports
五、pentaho商业智能解决方案 http://www.pentaho.com/
六、pentaho社区版商业智能解决方案 http://community.pentaho.com/projects/bi_platform/
七、Palo for Excel http://www.palo.net/en/
八、《MicroSoft SQL Server 2005商业智能实现》 http://book.douban.com/subject/3016243/
九、商业智能工具维基百科 http://en.wikipedia.org/wiki/Business_intelligence_tools
Saturday, November 20, 2010
jeffjie@botwave.com
讨论
Saturday, November 20, 2010
jeffjie@botwave.com
感谢聆听
Bio:
微勃&Twitter: @jeff_kit
jeff@fallever.com
Saturday, November 20, 2010

More Related Content

More from Gump Law

Location baseda rengine
Location baseda rengineLocation baseda rengine
Location baseda rengineGump Law
 
Android hw accelerated_2d_rendering
Android hw accelerated_2d_renderingAndroid hw accelerated_2d_rendering
Android hw accelerated_2d_renderingGump Law
 
翻译与写作技术图书那点事
翻译与写作技术图书那点事翻译与写作技术图书那点事
翻译与写作技术图书那点事Gump Law
 
我为何使用
我为何使用我为何使用
我为何使用Gump Law
 
深入PHP内核之路
深入PHP内核之路深入PHP内核之路
深入PHP内核之路Gump Law
 
Java桌面应用开发
Java桌面应用开发Java桌面应用开发
Java桌面应用开发Gump Law
 

More from Gump Law (6)

Location baseda rengine
Location baseda rengineLocation baseda rengine
Location baseda rengine
 
Android hw accelerated_2d_rendering
Android hw accelerated_2d_renderingAndroid hw accelerated_2d_rendering
Android hw accelerated_2d_rendering
 
翻译与写作技术图书那点事
翻译与写作技术图书那点事翻译与写作技术图书那点事
翻译与写作技术图书那点事
 
我为何使用
我为何使用我为何使用
我为何使用
 
深入PHP内核之路
深入PHP内核之路深入PHP内核之路
深入PHP内核之路
 
Java桌面应用开发
Java桌面应用开发Java桌面应用开发
Java桌面应用开发
 

BI 商业智能简述