SlideShare una empresa de Scribd logo
1 de 32
Descargar para leer sin conexión
How to test Cloud Platform
商派电子商务云平台的回顾和反思
DennyZhang
上海商派

2012-10-24

DennyZhang (Shopex)

How to test Cloud Platform

2012-10-24

1 / 43
如何测试云平台
1

[背景介绍] 个人介绍,商派电子商务云介绍

2

[场景分析] 如何快速发现问题和缩小排查范围

3

[场景分析] 线下如何尽可能多地发现问题

4

[场景分析] 充分测试后,线上还是经常会有惊喜

5

[场景分析] 对于无法重现的用户报怨, 该咋办

6

[场景分析] 如何针对分布式服务设计测试用例

7

[总结概括] ECAE的质量控制体系

DennyZhang (Shopex)

How to test Cloud Platform

2012-10-24

2 / 43
个人介绍 I

DennyZhang (Shopex)

How to test Cloud Platform

2012-10-24

3 / 43
相关网页 I

DennyZhang (Shopex)

How to test Cloud Platform

2012-10-24

4 / 43
项目介绍: 商派云平台ECAE的定位 I
(E-Commerce Application Engine),电商行业云
运行平台
Web运行环境
定单转化
图片管理
Web性能检测
SaaS向PaaS无缝迁移
etc

DennyZhang (Shopex)

开发平台
在线开发
在线发布
a/b测试
分支发布
分布式服务
etc

How to test Cloud Platform

2012-10-24

5 / 43
项目介绍: ECAE的系统框架图 I

DennyZhang (Shopex)

How to test Cloud Platform

2012-10-24

6 / 43
如何测试云平台
1

[背景介绍] 个人介绍,商派电子商务云介绍

2

[场景分析] 如何快速发现问题和缩小排查范围

3

[场景分析] 线下如何尽可能多地发现问题

4

[场景分析] 充分测试后,线上还是经常会有惊喜

5

[场景分析] 对于无法重现的用户报怨, 该咋办

6

[场景分析] 如何针对分布式服务设计测试用例

7

[总结概括] ECAE的质量控制体系

DennyZhang (Shopex)

How to test Cloud Platform

2012-10-24

7 / 43
问题描述: 如何快速发现和定位问题 I

如何定位出故障的模块?

三堂会诊,通力合作?

如何确认系统没问题了?

各显神通,互相学习?

DennyZhang (Shopex)

How to test Cloud Platform

2012-10-24

8 / 43
借分治思想,服务提供自检 I

服务自检SanityCheck的难点:
所有服务自检通过 != 系统是好的
开发者在实现服务自检时, 存在盲点
对于异步服务的自检是复杂的
自检时,需要侵入性小,支持并发,内置测试数据
etc

DennyZhang (Shopex)

How to test Cloud Platform

2012-10-24

9 / 43
服务治理的规范化 I
SOA服务的统一接口
Name
Comment
string help()
帮助文档
int sanityCheck()
服务自检
bool initSystem(Options) 初始化集群
bool joinSystem(Options) 加入集群
bool upgrade(Options)
系统升级
bool backup(Path)
数据备份

DennyZhang (Shopex)

How to test Cloud Platform

2012-10-24

10 / 43
如何测试云平台
1

[背景介绍] 个人介绍,商派电子商务云介绍

2

[场景分析] 如何快速发现问题和缩小排查范围

3

[场景分析] 线下如何尽可能多地发现问题

4

[场景分析] 充分测试后,线上还是经常会有惊喜

5

[场景分析] 对于无法重现的用户报怨, 该咋办

6

[场景分析] 如何针对分布式服务设计测试用例

7

[总结概括] ECAE的质量控制体系

DennyZhang (Shopex)

How to test Cloud Platform

2012-10-24

11 / 43
问题描述: 线下如何尽可能多地发现问题 I

多想想, 多测测?

线下测什么,怎么测?
总会漏掉些不该有的问题

DennyZhang (Shopex)

How to test Cloud Platform

领导继续发话?

2012-10-24

12 / 43
ECAE的Hudson任务图 I

DennyZhang (Shopex)

How to test Cloud Platform

2012-10-24

13 / 43
如何测试云平台
1

[背景介绍] 个人介绍,商派电子商务云介绍

2

[场景分析] 如何快速发现问题和缩小排查范围

3

[场景分析] 线下如何尽可能多地发现问题

4

[场景分析] 充分测试后,线上还是经常会有惊喜

5

[场景分析] 对于无法重现的用户报怨, 该咋办

6

[场景分析] 如何针对分布式服务设计测试用例

7

[总结概括] ECAE的质量控制体系

DennyZhang (Shopex)

How to test Cloud Platform

2012-10-24

14 / 43
问题描述: 线上监控 I

线上为什么老是各种飞机?
排查线上问题时手忙脚乱。
监控靠运维专人行得通吗?

DennyZhang (Shopex)

How to test Cloud Platform

将线上流量导入到线下?
动作再快些,头脑再活些?
运维人员, 懂得再多一些?

2012-10-24

15 / 43
充足的监控 I

OS级别的监控
服务级别的监控
业务级别的监控

DennyZhang (Shopex)

How to test Cloud Platform

2012-10-24

16 / 43
zabbix监控示例图: 对结点进行细粒度监测 I

DennyZhang (Shopex)

How to test Cloud Platform

2012-10-24

17 / 43
zabbix监控示例图: 利用应用探针监测可用性 I

DennyZhang (Shopex)

How to test Cloud Platform

2012-10-24

18 / 43
zabbix监控示例图: 利用应用探针监测性能 I

DennyZhang (Shopex)

How to test Cloud Platform

2012-10-24

19 / 43
监控的注意事项 I

通过

自动更新

的监控项

当监控失败时,记录重要的现场状况
统一的出错码

DennyZhang (Shopex)

How to test Cloud Platform

2012-10-24

20 / 43
如何测试云平台
1

[背景介绍] 个人介绍,商派电子商务云介绍

2

[场景分析] 如何快速发现问题和缩小排查范围

3

[场景分析] 线下如何尽可能多地发现问题

4

[场景分析] 充分测试后,线上还是经常会有惊喜

5

[场景分析] 对于无法重现的用户报怨, 该咋办

6

[场景分析] 如何针对分布式服务设计测试用例

7

[总结概括] ECAE的质量控制体系

DennyZhang (Shopex)

How to test Cloud Platform

2012-10-24

21 / 43
问题描述: 线上用户体验分析 I

靠log,靠分析,靠感觉?
搞不定时,靠外交辞令?

用户报怨不能用了?
用户报怨太慢了?

DennyZhang (Shopex)

How to test Cloud Platform

2012-10-24

22 / 43
如何计算: 服务器响应时间以及网络时间 I

DennyZhang (Shopex)

How to test Cloud Platform

2012-10-24

23 / 43
基于网卡旁路侦听的Web请求分析 I

DennyZhang (Shopex)

How to test Cloud Platform

2012-10-24

24 / 43
分析每个Web请求的故障环节 I

DennyZhang (Shopex)

How to test Cloud Platform

2012-10-24

25 / 43
服务器在哪步出现问题,导到整体请求慢呢 I

DennyZhang (Shopex)

How to test Cloud Platform

2012-10-24

26 / 43
全局跟踪每一个具体的请求 I

DennyZhang (Shopex)

How to test Cloud Platform

2012-10-24

27 / 43
如何测试云平台
1

[背景介绍] 个人介绍,商派电子商务云介绍

2

[场景分析] 如何快速发现问题和缩小排查范围

3

[场景分析] 线下如何尽可能多地发现问题

4

[场景分析] 充分测试后,线上还是经常会有惊喜

5

[场景分析] 对于无法重现的用户报怨, 该咋办

6

[场景分析] 如何针对分布式服务设计测试用例

7

[总结概括] ECAE的质量控制体系

DennyZhang (Shopex)

How to test Cloud Platform

2012-10-24

28 / 43
以分布式存储为例, 分享测试用例设计 I

DennyZhang (Shopex)

How to test Cloud Platform

2012-10-24

29 / 43
如何测试云平台
1

[背景介绍] 个人介绍,商派电子商务云介绍

2

[场景分析] 如何快速发现问题和缩小排查范围

3

[场景分析] 线下如何尽可能多地发现问题

4

[场景分析] 充分测试后,线上还是经常会有惊喜

5

[场景分析] 对于无法重现的用户报怨, 该咋办

6

[场景分析] 如何针对分布式服务设计测试用例

7

[总结概括] ECAE的质量控制体系

DennyZhang (Shopex)

How to test Cloud Platform

2012-10-24

30 / 43
ECAE的质量控制体系 I

DennyZhang (Shopex)

How to test Cloud Platform

2012-10-24

31 / 43
Q&A I

DennyZhang (Shopex)

How to test Cloud Platform

2012-10-24

32 / 43

Más contenido relacionado

Similar a How to test cloud platform

2020 gops-旷视城市大脑私有云平台实践-刘天伟
2020 gops-旷视城市大脑私有云平台实践-刘天伟2020 gops-旷视城市大脑私有云平台实践-刘天伟
2020 gops-旷视城市大脑私有云平台实践-刘天伟
Tianwei Liu
 
虚拟桌面云 终端用户运算未来展望
虚拟桌面云  终端用户运算未来展望虚拟桌面云  终端用户运算未来展望
虚拟桌面云 终端用户运算未来展望
ITband
 
Top100summit 腾讯-周健-服务化与体系化解决大量定制小项目开发困境
Top100summit 腾讯-周健-服务化与体系化解决大量定制小项目开发困境Top100summit 腾讯-周健-服务化与体系化解决大量定制小项目开发困境
Top100summit 腾讯-周健-服务化与体系化解决大量定制小项目开发困境
drewz lin
 
51 cto linuxops_issue2
51 cto linuxops_issue251 cto linuxops_issue2
51 cto linuxops_issue2
Yiwei Ma
 
Top100summit前端的云时代支付宝前端平台架构 王保平
Top100summit前端的云时代支付宝前端平台架构  王保平Top100summit前端的云时代支付宝前端平台架构  王保平
Top100summit前端的云时代支付宝前端平台架构 王保平
drewz lin
 
Top100summit 游戏中的自动化测试 - 金山 - 白银祖
Top100summit 游戏中的自动化测试 - 金山 - 白银祖Top100summit 游戏中的自动化测试 - 金山 - 白银祖
Top100summit 游戏中的自动化测试 - 金山 - 白银祖
drewz lin
 
Ruby on rails部署
Ruby on rails部署Ruby on rails部署
Ruby on rails部署
Deng Peng
 

Similar a How to test cloud platform (20)

SRE CH12 - Effective Troubleshooting
SRE CH12 - Effective TroubleshootingSRE CH12 - Effective Troubleshooting
SRE CH12 - Effective Troubleshooting
 
海通证券金融云思考与实践(数据技术嘉年华2017)
海通证券金融云思考与实践(数据技术嘉年华2017)海通证券金融云思考与实践(数据技术嘉年华2017)
海通证券金融云思考与实践(数据技术嘉年华2017)
 
2020 gops-旷视城市大脑私有云平台实践-刘天伟
2020 gops-旷视城市大脑私有云平台实践-刘天伟2020 gops-旷视城市大脑私有云平台实践-刘天伟
2020 gops-旷视城市大脑私有云平台实践-刘天伟
 
虚拟桌面云 终端用户运算未来展望
虚拟桌面云  终端用户运算未来展望虚拟桌面云  终端用户运算未来展望
虚拟桌面云 终端用户运算未来展望
 
Top100summit 腾讯-周健-服务化与体系化解决大量定制小项目开发困境
Top100summit 腾讯-周健-服务化与体系化解决大量定制小项目开发困境Top100summit 腾讯-周健-服务化与体系化解决大量定制小项目开发困境
Top100summit 腾讯-周健-服务化与体系化解决大量定制小项目开发困境
 
51 cto linuxops_issue2
51 cto linuxops_issue251 cto linuxops_issue2
51 cto linuxops_issue2
 
Beyond rails server
Beyond rails serverBeyond rails server
Beyond rails server
 
Virtual Datacenter
Virtual DatacenterVirtual Datacenter
Virtual Datacenter
 
13 11-08
13 11-0813 11-08
13 11-08
 
未来网络技术发展探梦 - 开篇
未来网络技术发展探梦 - 开篇未来网络技术发展探梦 - 开篇
未来网络技术发展探梦 - 开篇
 
从运维系统的开发谈安全架构设计
从运维系统的开发谈安全架构设计从运维系统的开发谈安全架构设计
从运维系统的开发谈安全架构设计
 
Top100summit前端的云时代支付宝前端平台架构 王保平
Top100summit前端的云时代支付宝前端平台架构  王保平Top100summit前端的云时代支付宝前端平台架构  王保平
Top100summit前端的云时代支付宝前端平台架构 王保平
 
淺談系統監控與 AWS CloudWatch 的應用
淺談系統監控與 AWS CloudWatch 的應用淺談系統監控與 AWS CloudWatch 的應用
淺談系統監控與 AWS CloudWatch 的應用
 
The way to continuous delivery
The way to continuous deliveryThe way to continuous delivery
The way to continuous delivery
 
阿里巴巴运维团队的无状态运维思路
阿里巴巴运维团队的无状态运维思路阿里巴巴运维团队的无状态运维思路
阿里巴巴运维团队的无状态运维思路
 
Top100summit 游戏中的自动化测试 - 金山 - 白银祖
Top100summit 游戏中的自动化测试 - 金山 - 白银祖Top100summit 游戏中的自动化测试 - 金山 - 白银祖
Top100summit 游戏中的自动化测试 - 金山 - 白银祖
 
測試網在開發 因太區塊鏈 dApp 中的重要性.pdf
測試網在開發 因太區塊鏈 dApp 中的重要性.pdf測試網在開發 因太區塊鏈 dApp 中的重要性.pdf
測試網在開發 因太區塊鏈 dApp 中的重要性.pdf
 
work@baidu 2014
work@baidu 2014work@baidu 2014
work@baidu 2014
 
Ruby on rails部署
Ruby on rails部署Ruby on rails部署
Ruby on rails部署
 
Lenovo 桌面虛擬化最佳實踐分享
Lenovo 桌面虛擬化最佳實踐分享Lenovo 桌面虛擬化最佳實踐分享
Lenovo 桌面虛擬化最佳實踐分享
 

How to test cloud platform