SlideShare una empresa de Scribd logo
1 de 16
Descargar para leer sin conexión
UCloud云平台的内核实践
邱模炯 @ UCloud
2014-07-19
云主机常见问题
• 内核宕机
• 硬件宕机
• 甚至不明宕机
• 性能差(特别是IO)
每一台宿主机都是单点 宿主机内核
cpu mem disk nic
QEMU & KVM
云主机内核
业务程序
云主机内核
业务程序
• 远程快速拉起
• 万兆网络块存储
• Checkpoint & fault
tolerace
• 后台存储集群、SSD
• …
复杂、代价大
从平台设计上避免单点局限?
宿主机内核
QEMU &
KVM
云主机内核
业务程序
宿主机内核
QEMU &
KVM
• 内核故障
– 自主维护内核
– 免重启修复
• 硬件故障
– 隔离内存硬件缺陷
– 按情况提高容忍度
– 在线迁移予以规避
• 性能
– 磁盘IO加速
– 大页、网络路径优化等
UCloud优先从单点自身出发 —— 内核改进
UCloud内核优化例1 —— 免重启修复
运行中内核
(带缺陷)
运行中内核
(无缺陷)
热补丁模块
源码补丁
UCloud所有内核BUG均免重启修复
ksplice模
块生成
免重启修复:热补丁生成过程
• 成熟应用
– 所有内核BUG均免重启修复
– 累计数万台次
– 无性能损耗,业务中断时间十毫秒
• UCloud对开源Ksplice的修改
– 支持各种版本内核
– 中断时间百毫秒 -> 十毫秒
– 允许免重启修复关键路径(hrtimer, scheduler)
免重启修复:运营结果
UCloud内核优化例2 —— 内存硬件故障隔离
多少根内存条?
多数MCE错误可隔离
内存错误
可纠正
不可纠正
不可恢复
不可纠正
可恢复
内核 普通进程
隔离错误区域
并通知虚拟机
内核
kvm进程
普通进程
记录并报警 Kernel Panic 忽略错误
隔离错误区域
或杀死进程
隔离错误区域
或杀死进程
忽略错误
硬盘种类 随机IOPS
(4k size)
SATA/SAS 100~175
(< 1MB)
SSD 2万 ~ 40万
(80MB~1.6G
B)
UCloud内核优化例3 —— 磁盘IO加速
SATA + SSD ?
能否鱼和熊掌兼得?
 SATA的价格和数据可靠性
 SSD的性能
Key Observation
 业务关心随机写性能
 SATA顺序写可达140MB(3.5万 * 4K)
UCloud内核优化例3 —— 磁盘IO加速
原理
 加速模块接管所有IO
 写IO被顺序化至Cache盘组
 Cache盘组同步至真实盘组
效果
 随机写IOPS = 3.5万
 高可靠、低成本
Block I/O层
IO加速模块
Cache盘组
(RAID 10)
真实盘组
(RAID10)
内核改进
• 内核故障
– 自主维护内核
– 免重启修复
• 硬件故障
– 隔离硬件缺陷
– 按情况提高容忍度
– 在线迁移予以规避
• 性能
– 磁盘IO加速
– 大页、网络路径优化等
内核改进的价值
对于用户
• 可用性
– 无需关心软硬件缺陷
– 关键BUG免重启修复
• 性能
– “价廉物美”
对于平台设计
• 复杂方案可用于其它目的
• 宿主机内核和QEMU、KVM引入
额外故障
• 提升可用性
– 软件故障:热补丁修复
– 硬件故障:内存缺陷隔离
– 不可避免故障:迁移规避
• 最终虚拟机可用性可以高于物理机!
思考:云主机可用性低于物理机?
宿主机内核
cpu mem disk nic
QEMU & KVM
云主机内核
业务程序
云主机内核
业务程序
• CPU和内存
• 磁盘IO
• 网络IO
思考:云主机性能低于物理机?
UCloud内核数据分享
• 修复10+个上游原生BUG
• 累计避免数万次宿主机重启
• IO性能10+倍于同类产品
• 在线迁移无一例失败
内核是云平台的关键基础
邱模炯 @ UCloud
新浪微博 qiumojiong
微信&QQ 16267081

Más contenido relacionado

La actualidad más candente

关于服务器虚拟化的测试汇报
关于服务器虚拟化的测试汇报关于服务器虚拟化的测试汇报
关于服务器虚拟化的测试汇报
博 孟
 
無線Ap
無線Ap無線Ap
無線Ap
nilfish
 
淘宝商品库MySQL优化实践
淘宝商品库MySQL优化实践淘宝商品库MySQL优化实践
淘宝商品库MySQL优化实践
Feng Yu
 
Ch3 basic command(2013 ncu-nos_nm)
Ch3   basic  command(2013 ncu-nos_nm)Ch3   basic  command(2013 ncu-nos_nm)
Ch3 basic command(2013 ncu-nos_nm)
Kir Chou
 
MySQL和IO(下)
MySQL和IO(下)MySQL和IO(下)
MySQL和IO(下)
Feng Yu
 
Linux 系統管理實務期末報告
Linux 系統管理實務期末報告Linux 系統管理實務期末報告
Linux 系統管理實務期末報告
群宇 賴
 
Kvmopt osforce
Kvmopt osforceKvmopt osforce
Kvmopt osforce
meecheng
 
多IDC的数据分布
多IDC的数据分布多IDC的数据分布
多IDC的数据分布
jackbillow
 

La actualidad más candente (20)

关于服务器虚拟化的测试汇报
关于服务器虚拟化的测试汇报关于服务器虚拟化的测试汇报
关于服务器虚拟化的测试汇报
 
美团技术团队 - KVM性能优化
美团技术团队 - KVM性能优化美团技术团队 - KVM性能优化
美团技术团队 - KVM性能优化
 
無線Ap
無線Ap無線Ap
無線Ap
 
全新 Veeam Availability Suite v9包括 Veeam Backup & Replication 和 Veeam ONE 備份解決方...
全新 Veeam Availability Suite v9包括 Veeam Backup & Replication 和 Veeam ONE 備份解決方...全新 Veeam Availability Suite v9包括 Veeam Backup & Replication 和 Veeam ONE 備份解決方...
全新 Veeam Availability Suite v9包括 Veeam Backup & Replication 和 Veeam ONE 備份解決方...
 
Open cdn快速部署你的私有cdn集群
Open cdn快速部署你的私有cdn集群Open cdn快速部署你的私有cdn集群
Open cdn快速部署你的私有cdn集群
 
Cinder snapshot and backup
Cinder snapshot and backupCinder snapshot and backup
Cinder snapshot and backup
 
Cinder isaci 实现原理详解
Cinder isaci 实现原理详解Cinder isaci 实现原理详解
Cinder isaci 实现原理详解
 
如何针对业务做DB优化
如何针对业务做DB优化如何针对业务做DB优化
如何针对业务做DB优化
 
淘宝商品库MySQL优化实践
淘宝商品库MySQL优化实践淘宝商品库MySQL优化实践
淘宝商品库MySQL优化实践
 
Ch3 basic command(2013 ncu-nos_nm)
Ch3   basic  command(2013 ncu-nos_nm)Ch3   basic  command(2013 ncu-nos_nm)
Ch3 basic command(2013 ncu-nos_nm)
 
Skywatch 多據點監控最佳選擇
Skywatch 多據點監控最佳選擇Skywatch 多據點監控最佳選擇
Skywatch 多據點監控最佳選擇
 
MySQL压力测试经验
MySQL压力测试经验MySQL压力测试经验
MySQL压力测试经验
 
MySQL和IO(下)
MySQL和IO(下)MySQL和IO(下)
MySQL和IO(下)
 
Joomla CMS 效能調校
Joomla CMS 效能調校Joomla CMS 效能調校
Joomla CMS 效能調校
 
租用雲端監控服務與自建監控系統之比較表
租用雲端監控服務與自建監控系統之比較表租用雲端監控服務與自建監控系統之比較表
租用雲端監控服務與自建監控系統之比較表
 
Linux 系統管理實務期末報告
Linux 系統管理實務期末報告Linux 系統管理實務期末報告
Linux 系統管理實務期末報告
 
Vitualbox
VitualboxVitualbox
Vitualbox
 
服务器基准测试-叶金荣@CYOU-20121130
服务器基准测试-叶金荣@CYOU-20121130服务器基准测试-叶金荣@CYOU-20121130
服务器基准测试-叶金荣@CYOU-20121130
 
Kvmopt osforce
Kvmopt osforceKvmopt osforce
Kvmopt osforce
 
多IDC的数据分布
多IDC的数据分布多IDC的数据分布
多IDC的数据分布
 

Similar a UCloud

运维安全 抵抗黑客攻击_云络安全沙龙4月上海站主题分享
运维安全 抵抗黑客攻击_云络安全沙龙4月上海站主题分享运维安全 抵抗黑客攻击_云络安全沙龙4月上海站主题分享
运维安全 抵抗黑客攻击_云络安全沙龙4月上海站主题分享
ChinaNetCloud
 
华为 余洲 定制化服务器
华为 余洲 定制化服务器华为 余洲 定制化服务器
华为 余洲 定制化服务器
colderboy17
 
利用统一存储获得无与伦比的速度,简化系统,并节省更多
利用统一存储获得无与伦比的速度,简化系统,并节省更多利用统一存储获得无与伦比的速度,简化系统,并节省更多
利用统一存储获得无与伦比的速度,简化系统,并节省更多
ITband
 
Nodejs & NAE
Nodejs & NAENodejs & NAE
Nodejs & NAE
q3boy
 
Track2 -刘继伟--openstack in gamewave
Track2 -刘继伟--openstack in gamewaveTrack2 -刘继伟--openstack in gamewave
Track2 -刘继伟--openstack in gamewave
OpenCity Community
 
阿里云技术实践
阿里云技术实践阿里云技术实践
阿里云技术实践
drewz lin
 
Lvs在大规模网络环境下的应用pukong
Lvs在大规模网络环境下的应用pukongLvs在大规模网络环境下的应用pukong
Lvs在大规模网络环境下的应用pukong
Michael Zhang
 
20110625.【打造高效能的cdn系统】.易统
20110625.【打造高效能的cdn系统】.易统20110625.【打造高效能的cdn系统】.易统
20110625.【打造高效能的cdn系统】.易统
锐 张
 
低功耗服务器定制与绿色计算——章文嵩(淘宝)
低功耗服务器定制与绿色计算——章文嵩(淘宝)低功耗服务器定制与绿色计算——章文嵩(淘宝)
低功耗服务器定制与绿色计算——章文嵩(淘宝)
drewz lin
 

Similar a UCloud (20)

寫出高性能的服務與應用 那些你沒想過的事
寫出高性能的服務與應用 那些你沒想過的事寫出高性能的服務與應用 那些你沒想過的事
寫出高性能的服務與應用 那些你沒想過的事
 
运维安全 抵抗黑客攻击_云络安全沙龙4月上海站主题分享
运维安全 抵抗黑客攻击_云络安全沙龙4月上海站主题分享运维安全 抵抗黑客攻击_云络安全沙龙4月上海站主题分享
运维安全 抵抗黑客攻击_云络安全沙龙4月上海站主题分享
 
华为 余洲 定制化服务器
华为 余洲 定制化服务器华为 余洲 定制化服务器
华为 余洲 定制化服务器
 
华为 余洲 定制化服务器
华为 余洲 定制化服务器华为 余洲 定制化服务器
华为 余洲 定制化服务器
 
賽門鐵克 NetBackup 7.5 完整簡報
賽門鐵克 NetBackup 7.5 完整簡報賽門鐵克 NetBackup 7.5 完整簡報
賽門鐵克 NetBackup 7.5 完整簡報
 
Symantec System Recovery 2011_0320
Symantec System Recovery 2011_0320Symantec System Recovery 2011_0320
Symantec System Recovery 2011_0320
 
Ssr2011 for 三心二益
Ssr2011 for 三心二益Ssr2011 for 三心二益
Ssr2011 for 三心二益
 
Double take 6.0 實機體驗營
Double take 6.0 實機體驗營Double take 6.0 實機體驗營
Double take 6.0 實機體驗營
 
Symantec system recovery 2011產品技術訓練
Symantec system recovery 2011產品技術訓練Symantec system recovery 2011產品技術訓練
Symantec system recovery 2011產品技術訓練
 
利用统一存储获得无与伦比的速度,简化系统,并节省更多
利用统一存储获得无与伦比的速度,简化系统,并节省更多利用统一存储获得无与伦比的速度,简化系统,并节省更多
利用统一存储获得无与伦比的速度,简化系统,并节省更多
 
Emc存储培训
Emc存储培训Emc存储培训
Emc存储培训
 
Nodejs & NAE
Nodejs & NAENodejs & NAE
Nodejs & NAE
 
Track2 -刘继伟--openstack in gamewave
Track2 -刘继伟--openstack in gamewaveTrack2 -刘继伟--openstack in gamewave
Track2 -刘继伟--openstack in gamewave
 
阿里云技术实践
阿里云技术实践阿里云技术实践
阿里云技术实践
 
StackOps step by-step guide
StackOps step by-step guideStackOps step by-step guide
StackOps step by-step guide
 
Lvs在大规模网络环境下的应用pukong
Lvs在大规模网络环境下的应用pukongLvs在大规模网络环境下的应用pukong
Lvs在大规模网络环境下的应用pukong
 
20110625.【打造高效能的cdn系统】.易统
20110625.【打造高效能的cdn系统】.易统20110625.【打造高效能的cdn系统】.易统
20110625.【打造高效能的cdn系统】.易统
 
MySQL设计、优化、运维
MySQL设计、优化、运维MySQL设计、优化、运维
MySQL设计、优化、运维
 
低功耗服务器定制与绿色计算
低功耗服务器定制与绿色计算低功耗服务器定制与绿色计算
低功耗服务器定制与绿色计算
 
低功耗服务器定制与绿色计算——章文嵩(淘宝)
低功耗服务器定制与绿色计算——章文嵩(淘宝)低功耗服务器定制与绿色计算——章文嵩(淘宝)
低功耗服务器定制与绿色计算——章文嵩(淘宝)
 

UCloud