SlideShare una empresa de Scribd logo
1 de 33
淘宝海量数据产品技术架构 张轩丞(朋春) 淘宝网-数据平台与产品部
关于 ,[object Object]
淘宝数据平台与产品部(杭州)
vi党,脚本语言爱好者
关注NodeJS,cnode社区组织者之一
pengchun@taobao.com
weibo.com:我是aleafs,[object Object]
一些数字 ,[object Object]
50G统计汇总结果
千万量级数据查询请求
平均20.8ms的响应时间(6月1日)
淘宝主站:
30亿店铺、宝贝浏览
10亿计的在线宝贝数
千万量级交易笔数,[object Object]
计算的速度
处理吞吐量
存储
存储是为了更方便地查询
硬盘、内存的成本
查询
“大海捞针”
全“表”扫描,[object Object]
今天的话题 ,[object Object]
NoSQL是SQL的有益补充
用中间层隔离前后端
缓存是系统化的工程,[object Object]
关系型数据库 SELECT IF(INSTR(f.keyword,' ') > 0, UPPER(TRIM(f.keyword)), CONCAT(b.brand_name,' ',UPPER(TRIM(f.keyword)))) AS f0, SUM(f.search_num) AS f1, ROUND(SUM(f.search_num) / SUM(f.uv), 2) AS f3, 	ROUND(AVG(f.uv),2) AS f4  FROM dm_fact_keyword_brand_d f INNER JOIN dim_brand b ON f.keyword_brand_id = b.brand_id WHERE f.keyword_type_id = 1 AND f.keyword != ''  	AND keyword_cat_id IN ('50002535')  	AND thedate <= '2011-07-09'  	AND thedate >= '2011-07-07'  GROUP BY f0 ORDER BY SUM(f.search_num) DESC LIMIT 0, 100 ,[object Object]
SQL有较强的表达能力
只存储中间状态的数据
查询时过滤、计算、排序
数据产品的本质
拉关系

Más contenido relacionado

Similar a 淘宝海量数据产品技术架构

阿里巴巴数据中台实践分享.pdf
阿里巴巴数据中台实践分享.pdf阿里巴巴数据中台实践分享.pdf
阿里巴巴数据中台实践分享.pdfmarkmind
 
淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座
淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座
淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座NTC.im(Notch Training Center)
 
05 杨志丰
05 杨志丰05 杨志丰
05 杨志丰锐 张
 
淘宝数据开放策略—唐柔
淘宝数据开放策略—唐柔淘宝数据开放策略—唐柔
淘宝数据开放策略—唐柔Smile
 
Data Analyse Black Horse - ClickHouse
Data Analyse Black Horse - ClickHouseData Analyse Black Horse - ClickHouse
Data Analyse Black Horse - ClickHouseJack Gao
 
大数据下的大表Join计算和优化
大数据下的大表Join计算和优化大数据下的大表Join计算和优化
大数据下的大表Join计算和优化huhai463127310
 
欧赛斯山丽网络整合营销提案
欧赛斯山丽网络整合营销提案欧赛斯山丽网络整合营销提案
欧赛斯山丽网络整合营销提案hpeter2002
 
电商优化新思路-城市掘金 By Boson
电商优化新思路-城市掘金 By Boson电商优化新思路-城市掘金 By Boson
电商优化新思路-城市掘金 By Bosonboson600
 
City nugget—城市掘金 v2
City nugget—城市掘金 v2City nugget—城市掘金 v2
City nugget—城市掘金 v2Darwin Marketing
 
If You Really Want It
If You Really Want ItIf You Really Want It
If You Really Want Itbridge38
 
网站数据分析
网站数据分析网站数据分析
网站数据分析Wang Jian
 
芳草集 大卖家的瓶颈和出路
芳草集   大卖家的瓶颈和出路芳草集   大卖家的瓶颈和出路
芳草集 大卖家的瓶颈和出路chaojiwangpu
 
Se shang hai_04_cloudybi
Se shang hai_04_cloudybiSe shang hai_04_cloudybi
Se shang hai_04_cloudybiTech2IPO
 
How to run an AI Project @pixnet
How to run an AI Project @pixnetHow to run an AI Project @pixnet
How to run an AI Project @pixnet晨揚 施
 
翟艳堂:腾讯大规模Hadoop集群实践
翟艳堂:腾讯大规模Hadoop集群实践翟艳堂:腾讯大规模Hadoop集群实践
翟艳堂:腾讯大规模Hadoop集群实践hdhappy001
 
翟艳堂:腾讯大规模Hadoop集群实践
翟艳堂:腾讯大规模Hadoop集群实践翟艳堂:腾讯大规模Hadoop集群实践
翟艳堂:腾讯大规模Hadoop集群实践hdhappy001
 
薛伟:腾讯广点通——大数据之上的实时精准推荐
薛伟:腾讯广点通——大数据之上的实时精准推荐薛伟:腾讯广点通——大数据之上的实时精准推荐
薛伟:腾讯广点通——大数据之上的实时精准推荐hdhappy001
 
张晓:大数据存储与访问测试基准
张晓:大数据存储与访问测试基准张晓:大数据存储与访问测试基准
张晓:大数据存储与访问测试基准hdhappy001
 

Similar a 淘宝海量数据产品技术架构 (20)

20171024 文化大學 2 big data ai
20171024 文化大學 2 big data ai20171024 文化大學 2 big data ai
20171024 文化大學 2 big data ai
 
阿里巴巴数据中台实践分享.pdf
阿里巴巴数据中台实践分享.pdf阿里巴巴数据中台实践分享.pdf
阿里巴巴数据中台实践分享.pdf
 
淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座
淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座
淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座
 
05 杨志丰
05 杨志丰05 杨志丰
05 杨志丰
 
淘宝数据开放策略—唐柔
淘宝数据开放策略—唐柔淘宝数据开放策略—唐柔
淘宝数据开放策略—唐柔
 
Data Analyse Black Horse - ClickHouse
Data Analyse Black Horse - ClickHouseData Analyse Black Horse - ClickHouse
Data Analyse Black Horse - ClickHouse
 
大数据下的大表Join计算和优化
大数据下的大表Join计算和优化大数据下的大表Join计算和优化
大数据下的大表Join计算和优化
 
欧赛斯山丽网络整合营销提案
欧赛斯山丽网络整合营销提案欧赛斯山丽网络整合营销提案
欧赛斯山丽网络整合营销提案
 
电商优化新思路-城市掘金 By Boson
电商优化新思路-城市掘金 By Boson电商优化新思路-城市掘金 By Boson
电商优化新思路-城市掘金 By Boson
 
City nugget—城市掘金 v2
City nugget—城市掘金 v2City nugget—城市掘金 v2
City nugget—城市掘金 v2
 
If You Really Want It
If You Really Want ItIf You Really Want It
If You Really Want It
 
网站数据分析
网站数据分析网站数据分析
网站数据分析
 
芳草集 大卖家的瓶颈和出路
芳草集   大卖家的瓶颈和出路芳草集   大卖家的瓶颈和出路
芳草集 大卖家的瓶颈和出路
 
Se shang hai_04_cloudybi
Se shang hai_04_cloudybiSe shang hai_04_cloudybi
Se shang hai_04_cloudybi
 
How to run an AI Project @pixnet
How to run an AI Project @pixnetHow to run an AI Project @pixnet
How to run an AI Project @pixnet
 
翟艳堂:腾讯大规模Hadoop集群实践
翟艳堂:腾讯大规模Hadoop集群实践翟艳堂:腾讯大规模Hadoop集群实践
翟艳堂:腾讯大规模Hadoop集群实践
 
翟艳堂:腾讯大规模Hadoop集群实践
翟艳堂:腾讯大规模Hadoop集群实践翟艳堂:腾讯大规模Hadoop集群实践
翟艳堂:腾讯大规模Hadoop集群实践
 
薛伟:腾讯广点通——大数据之上的实时精准推荐
薛伟:腾讯广点通——大数据之上的实时精准推荐薛伟:腾讯广点通——大数据之上的实时精准推荐
薛伟:腾讯广点通——大数据之上的实时精准推荐
 
张晓:大数据存储与访问测试基准
张晓:大数据存储与访问测试基准张晓:大数据存储与访问测试基准
张晓:大数据存储与访问测试基准
 
搜尋達人
搜尋達人搜尋達人
搜尋達人
 

Más de aleafs

Node cluster
Node clusterNode cluster
Node clusteraleafs
 
Node develop expirements
Node develop expirementsNode develop expirements
Node develop expirementsaleafs
 
分布式系统缓存设计
分布式系统缓存设计分布式系统缓存设计
分布式系统缓存设计aleafs
 
My fox 扩容与数据迁移
My fox 扩容与数据迁移My fox 扩容与数据迁移
My fox 扩容与数据迁移aleafs
 
海量统计数据的分布式MySQL集群——MyFOX
海量统计数据的分布式MySQL集群——MyFOX海量统计数据的分布式MySQL集群——MyFOX
海量统计数据的分布式MySQL集群——MyFOXaleafs
 
Myfox on NodeJS
Myfox on NodeJSMyfox on NodeJS
Myfox on NodeJSaleafs
 
助推宝工具介绍
助推宝工具介绍助推宝工具介绍
助推宝工具介绍aleafs
 

Más de aleafs (7)

Node cluster
Node clusterNode cluster
Node cluster
 
Node develop expirements
Node develop expirementsNode develop expirements
Node develop expirements
 
分布式系统缓存设计
分布式系统缓存设计分布式系统缓存设计
分布式系统缓存设计
 
My fox 扩容与数据迁移
My fox 扩容与数据迁移My fox 扩容与数据迁移
My fox 扩容与数据迁移
 
海量统计数据的分布式MySQL集群——MyFOX
海量统计数据的分布式MySQL集群——MyFOX海量统计数据的分布式MySQL集群——MyFOX
海量统计数据的分布式MySQL集群——MyFOX
 
Myfox on NodeJS
Myfox on NodeJSMyfox on NodeJS
Myfox on NodeJS
 
助推宝工具介绍
助推宝工具介绍助推宝工具介绍
助推宝工具介绍
 

淘宝海量数据产品技术架构