SlideShare una empresa de Scribd logo
1 de 40
Descargar para leer sin conexión
打造高效能的CDN系统
    任卿 (易统)
  淘宝核心系统研发部




              1
议程


一、淘宝CDN系统介绍

二、CDN系统效能优化
  CDN系统效能优化
三、低功耗服务器定制
四、小结
什么是CDN
                               内容 发
• CDN(Content Delivery Network)内容分发
  网络 简单的说就是在不同地点缓存内容
  网络,简单的说就是在不同地点缓存内容
  ,然后通过负载均衡等技术将用户请求定
  向到最合适的缓存服务器上获取内容,提
  向到最合适的缓存服务器上获取内容 提
  高用户访问网站的响应速度。
• 通过C 服务提高网站的访问性能及稳定
  通过CDN服务提高网站的访问性能及稳定
  性,保障网站服务品质。
淘宝CDN的一些数字
     系统的规模
• CDN系统的规模
 – 500T容量的原图 + 500T容量的缩略图
 – 约700亿左右的缓存图片数 平均图片大小约20KB
   约700亿左右的缓存图片数,平均图片大小约20KB
 – 18KB以内的对象数量占总数量的80%
• CDN部署的规模
 –   近100个节点,部署在网民相对密集的主要中心城市
 –   每个节点目前处理能力在10G左右
 –   CDN部署的总处理能力800G左右
 –   目前承载淘宝流量高峰时近400G流量
     目前承载淘宝流量高峰时近     流量
CDN系统总览
淘宝CDN系统体系结构
           淘宝   系统体系结构
                                   Global Load Balancing
                                   Gl b l L d B l    i


              Cache               Cache                Cache                    Cache
L1-Cache
L1 C h        Cluster             Cluster              Cluster                  Cluster   ~30T


                        Cache                Cache                    Cache
L2-Cache                Cluster              Cluster                  Cluster             ~100T


                             Image Server          Image Server
Application                     Cluster               Cluster                      ~200 Servers


Storage                                                                            2000T Used /
                                    TFS                      TFS
                                   Cluster                  Cluster             3000T Deployed
                                                                                              6
软件负载均衡节点部署架构
CDN节点逻辑架构
                           CDN缓存节点逻辑
用户响应   缓存服务器
                Haproxy
       Squid
        q
                七层负载
       缓存服务
                均衡




                Haproxy      LVS
       Squid
        q
                七层负载         四层负载
       缓存服务                            用户请求
                均衡           均衡




                 Haproxy
                   p y
        Squid
                 七层负
        缓存服务
                 载均衡
议程


一、淘宝CDN系统介绍

二、CDN系统效能优化
  CDN系统效能优化
三、低功耗服务器定制
四、小结
CDN系统效能优化
• 负
  负载均衡优化
     衡优
• 网络层优化
• 存储优化
Haproxy软件优化
      优  提高效率 消除短
• hash优化,提高效率、消除短板
 – servers=128 nodes=128 stdvar=3.010755e+06 stdvar/avg=0.08973
 – servers=128 nodes=256 stdvar=1.974319e+06 stdvar/avg=0.05884

• 精确的调度和数据清理
 – 基于一致性哈希调度请求
 – 基于调度历史做精确清理,避免全量清理操作
• 支持Cache功能
 – 将最热的内容缓存在
   将最热的内容缓存在haproxy中
                   中
 – 改善性能,应对访问的热点
基于 致性哈希的调度算法
基于一致性哈希的调度算法
Haproxy长链接支持
• 长链接的作用
   链接的作
  • 对客户端的keepalive,提高用户响应速度
  • 对服务端的keepalive,提高服务器处理能力
• TCP拥塞控制
Haproxy长链接效果
• 挖掘淘宝访问的业务特点,平衡系统开销和加速
  效果
• 提升用户体验,响应时间最多提升50%+
动态内容加速
•   针对不能被缓存的动态内容做加速
        能被缓存的 态内容做加
•   基于TCP协议原理,优化网络通讯
•   内核协议栈调优
•   充分利用CDN节点和中心站点之间的”高速
    公路
    公路”
动态内容加速效果
• 性能提升15%左右
• 目前已经有两个应用上线测试
CDN节点存储优化
•   充分了解缓存内容特点
    充   缓存内容特点
•   充分了解存储介质特点
•   资源合理组合配置
•   优化缓存处理逻辑
120.00%
120 00%
          CDN缓存对象的特性
          累计个数比例   累计容量比例

100.00%



80.00%



60.00%
60 00%



40.00%



20.00%



 0.00%
 0 00%




          102
          105
          108
          111
          114
          117
          120
          123
          126
            0
            3
            6
            9
           12
           15
           18
           21
           24
           27
           30
           33
           36
           39
           42
           45
           48
           51
           54
           57
           60
           63
           66
           69
           72
           75
           78
           81
           84
           87
           90
           93
           96
           99
• 0 18KB的对象数量占总数量的80% 而存储量只有不到
  0~18KB的对象数量占总数量的80%,而存储量只有不到
  40%
• 80%被访问到的对象 其存储占用只有不到20%
  80%被访问到的对象,其存储占用只有不到20%
• 访问的局部性,决定分层次的对象存储
IO存储介质

          内存        Sata固态硬盘      Sata机械硬盘

IO能力      6.4Gbps   <10000 iops   <160iops

存储容量      4~16GB    80 ~160GB     500~1000GB

单价(每G的成
          150
          1 0       20            2
本)
存储系统优化思路
• 充 利
  充分利用访问局部性 性
• 通过控制将热点内容存储在内存和SSD,
  降低对Sata机械盘的访问
• 服务器IO的瓶颈在S t 机械盘
  服务器IO的瓶颈在Sata机械盘
• 增加Sata机械硬盘提高存储能力,降低存
  储成本
存储系统优化实践
•   改进Squid的COSS文件
•   根据对象大小和访问特点切分,分级存储
•   支持热点迁移的TCOSS文件系统
•   用sendfile来发送缓存在硬盘上的对象
•   Squid内存优化, 台Squid服务器若有
    Squid内存优化 一台Squid服务器若有一
    千万对象,大约节省400M内存,更多的内
    存可以用作Squid Memory C h
    存可以用作S id M       Cache
存储系统优化效果
•   缓存字节命中率:97%以上
    缓存字 命中率
•   缓存请求命中率:97%以上
•   缓存响应时间:10ms以内
•   单台服务器缓存对象数:6000万以上
议程


一、淘宝CDN系统介绍

二、CDN系统效能优化
  CDN系统效能优化
三、低功耗服务器定制
四、小结
CDN缓存服务特点
• 请求-响应的服务模型
 – 请求的处理
   • 基本上是通过hash(URL)对响应内容进行查询
   • 逻辑简单,消耗CPU较少
 – 响应的处理
   • 命中--》磁盘--》内存缓冲--》网卡--》网络--》用户
   • 不命中 》网卡 》网络 》网卡 》内存缓冲 》网卡 》网络
     不命中--》网卡--》网络--》网卡--》内存缓冲--》网卡--》网络
     --》用户
• I/O密集型服务
 – CPU处理少
 – 绝大部分是IO操作
 – 容量越大,命中率越高,目标:98%
为什么考虑低功耗服务器
                                                 降低CPU的峰值功率比动态调整功率
•   不断增大的CPU与IO之间的差距                              使用更能减低系统能耗
    – 对于IO密集型服务,硬盘、网卡是瓶颈                            芯片的泄露电流随频率变化很小
                                                       片的泄露电流随频率变化很小
    – 在消耗<30%CPU时,硬盘IO已满                            性能强的CPU,外围组件(如网
                                                     卡、总线等)能力都较强,因此
                                                     耗电也相对高
      功耗的增加快于处理速度的增长
    CPU功耗的增加快于处理速度的增长
                                                 传统CPU峰值功耗高限制了IDC服务
                                                  器的密度
                                                    IDC中每个机柜都有额定的功率
                                                    虽然空间上可以放置几十台服务
                                                     器,但是由于传统服务器的功耗
                                                     高,使得整个机架只能放置几台
                                                     高 使得整个机架只能放置几台
                                                     服务器,造成空间浪费
                                                 在成本和功耗不增加的情况下,将原
                                                  有单台高性能服务器承载的流量分摊
                                                  到多台低功耗服务器上,降低单台服
                                                  务器故障带来的影响
                                                 更高密度的存储能力
     来源: FAWN - A Fast Array of Wimpy Nodes
低功耗定制原则
• 低功耗
 – 单位服务器满载功耗控制在20~30Watts
• 高密度
 – 单位空间放置尽可能多的服务器和存储
• 兼容性
 – 通用的硬件方案
• 高性价比
 – 单位服务能力的成本及功耗为衡量标准
 – 成本包括:投入成本和运营成本
• 可运维性
ATOM低功耗服务器
1. 2U的机箱,集成8个单独的服
   务器硬件系统,每两个服务器
   系统集成在 个板卡上;每个
   系统集成在一个板卡上;每个
   服务器间只共享电源
2. 每个服务器系统配置:
    • Dual Core Intel® Atom™
      D525(1.8GHz
      D525(1 8GH
      13W)processor + Intel®      (背面)
      ICH9R Chipset
    • 4GB Non-ECC DDR3
           Non ECC
      1333MHz SO-DIMMs
      (per node) support
    • 3x 2.5” Hot-swap SATA
      HDD (RAID 0, 1)
                  0
    • 2GE with Intel 82574L
                               一个板卡集成两个服务器系统
3. 可热插拔硬盘与主板分离,共
   提供 个盘位支持
   提供24个盘位支持
4. 内置BMC支持IPMI
5. 720W 冗余高效金牌电源,支持PMbus
                                (正面,24个可插拔硬盘)
方案对比:存储IO配置对比
 •     服务器
                         Atom低功耗             Xeon偏低功耗                Xeon服务器
CPU                 Atom D525                Intel L3406             Intel E5620
                    -1*2 cores               -1*2cores               -1*4Cores
                    - 1.80Ghz                -2.26Ghz                -2.66GHz
                    - 1MB cache              -4MB cache              -12MB cache
内存                  2*2GB                    4*4GB                   3*4GB
SSD                 1*80GB                   1*160GB                 2*160GB
SAS                 NA                       NA                      6*600GB
Sata                2*500GB rpm7200 HyBrid   3*500GB rpm7200 EN      NA

      机械硬盘
               机械硬盘                                  容量(G)                   单盘IOPS
           Seagate SATA混合盘                              500                    120
               SAS硬盘                                    600                    180
              SATA企业盘                                   500                    130

      节点存储与IO
           单机SSD   单机SATA       单机SAS Cache服      机械盘总         节点SSD总 节点硬盘总 节点总容量
             数       数           数    务器数目         IOPS        容量(G) 容量(G)   (G)
Xeon偏低功耗       1            3                22         8580      3520       33000    36520
Atom低功耗        1            2                64        15360      5120       64000    69120
Xeon服务器        2                     6       10        10800      3200       36000    39200
服务器功耗估算对比
                          单位功耗(瓦)    数量   功耗小计(瓦)
            ATOM D525          13    1      13
            西数混合盘              2.2   2      4.4
               SSD             2     1       2
Atom低功耗
               网卡              1.9   1      1.9
               内存              2     2       4
                          合计                25


            Intel L3406        30    1      30
          西数企业盘RPM7200         3.2   3      9.6
               SSD             2     1       2
Xeon低功耗
               网卡              1.9   1      1.9
               内存              4     4      16
                          合计                60


            Intel E5620        80    1      80
               SAS             9     6      54
               SSD             2     2       4
Xeon服务器
               网卡              1.9   1      1.9
               内存              10    4      40
                          合计                180
节点服务能力、功耗预估
                               机械盘 单位请求消                                            节点服务
            机械盘总 机械盘最大 内存和SSD                                     估算 平均访问对
                              COSS命 耗机械盘                                             能力
             IOPS 利用率   命中率                                       QPS 象大小(KB)
                                中率  IOPS数                                           (Gps)

Atom低功耗     15360     80%        ~92%          5.5%       2.14   104401        18     15.5

Xeon偏低功耗     8580     80%        ~91%          5.0%       2.14   64150         18     9.5

Xeon服务器     10800     80%        ~90.8%        5.2%       2.14   77642         18     11.5


             缓存服务器                  LVS服务器                                交换机数
                   cahe数量                         LVS数量      交换机功耗             总功耗(瓦)
              功耗                      功耗                                    量

  Atom低功耗       25          64          150           2          80        2        2060

 Xeon偏低功耗       60          22            58          2          80        1        1516

  Xeon服务器       180         10          150           2          80        1        2180
节点性价比与功耗比预估

           服务能力性价比     存储性价比     服务能力性耗比
            (kbps/元)    (MB/元)    (Mbps/瓦)




Atom低功耗       1.72        2         7.7


Xeon偏低功耗    1 (基准值)    1 (基准值)      6.42


Xeon服务器       1.3        1.15       5.41
低功耗CDN 级缓存节点方案
  低功耗CDN一级缓存节点方案
       LVS服务器




 交换机



                           Rack
8台64个低功耗服务器
                 出口路由器



                Internet
节点机架布局

         2U*2 低功耗服务器



              1U 交换机



         2U *2低功耗服务器


            1U 负载均衡服务器
机架
          2U*2 低功耗服务器
          2U 2


             1U 交换机




          2U*2 低功耗服务器


            1U 负载均衡服务器
利用率




           0
               10
                    20
                         30
                                              40
                                                   50
                                                        60
                                                                     70
                                                                          80
                                                                               90
       1
       7
      13
      19
      25
      31
      37
      43
      49
      55
      61
      67
      73
      79
      85
      91
      97
     103
     109
     115
     121
     127
     133
     139
     145
     151
     157
                                                                                    低功耗服务器




     163
     169
     175
     181
     187
     193
     199
     205
     211
                                                        CPU, 56.8%




     217
     223
     229
     235
                                                                                             低功耗服务器运行状态




     241
     247
                              IOUtil 24 6%
                              IOUtil, 24.6%




     253
     259
     265
     271
     277
     283
34
CDN低功耗服务器性能



                             3000QPS
                   1700QPS   非低功耗服
                             务器
                   低功耗服务
                   器+系统级、
         1300QPS
                   应用级优化
         低功耗服务器
         +应用级优化
900QPS
低功耗服务
器优化前

                                       35
低功耗后续的工作计划

•   功耗优化
    功耗优
•   成本优化
•   性能优化
•   定制方案开源
低功耗项目的开源策略
                                     开源社区
处理器和芯片
  提供商
                发起
主板ODM厂商
                            需求建议
电源机箱ODM   加入    低功耗服务器
厂商               开源项目

 服务器OEM                产出
厂商
                                        发布

其他企业用户
               服务器设计   应用性能   应用优化
                 规范     测试     配置
议程


一、淘宝CDN系统介绍

二、CDN系统效能优化
  CDN系统效能优化
三、低功耗服务器定制
四、小结
小结
• 速度是网站的根本,CDN是优化网站速度
   度    的 本    优    度
  的利器
• 系统优化是多层次的,软硬件结合
• 用数字说话
• 从关注性能到关注效能
Q&A
易统@淘宝
yitong@.taobao.com
yitong@ taobao com

Más contenido relacionado

La actualidad más candente

Ceph Day Shanghai - Ceph in Chinau Unicom Labs
Ceph Day Shanghai - Ceph in Chinau Unicom LabsCeph Day Shanghai - Ceph in Chinau Unicom Labs
Ceph Day Shanghai - Ceph in Chinau Unicom LabsCeph Community
 
Traffic server 管理员指南v1.0
Traffic server 管理员指南v1.0Traffic server 管理员指南v1.0
Traffic server 管理员指南v1.0qianshi
 
我对后端优化的一点想法
我对后端优化的一点想法我对后端优化的一点想法
我对后端优化的一点想法mysqlops
 
Couchbase introduction - Chinese
Couchbase introduction - Chinese Couchbase introduction - Chinese
Couchbase introduction - Chinese Vickie Zeng
 
Hbase运维碎碎念
Hbase运维碎碎念Hbase运维碎碎念
Hbase运维碎碎念haiyuan ning
 
Pm 04 华胜天成openstack实践汇报-20120808
Pm 04 华胜天成openstack实践汇报-20120808Pm 04 华胜天成openstack实践汇报-20120808
Pm 04 华胜天成openstack实践汇报-20120808OpenCity Community
 
Exadata training
Exadata trainingExadata training
Exadata trainingLouis liu
 
應用Ceph技術打造軟體定義儲存新局
應用Ceph技術打造軟體定義儲存新局應用Ceph技術打造軟體定義儲存新局
應用Ceph技術打造軟體定義儲存新局Alex Lau
 
Key value store
Key value storeKey value store
Key value storexuanhan863
 
利用统一存储获得无与伦比的速度,简化系统,并节省更多
利用统一存储获得无与伦比的速度,简化系统,并节省更多利用统一存储获得无与伦比的速度,简化系统,并节省更多
利用统一存储获得无与伦比的速度,简化系统,并节省更多ITband
 
美团点评技术沙龙010-美团Atlas实践
美团点评技术沙龙010-美团Atlas实践美团点评技术沙龙010-美团Atlas实践
美团点评技术沙龙010-美团Atlas实践美团点评技术团队
 
淘宝图片存储与Cdn系统
淘宝图片存储与Cdn系统淘宝图片存储与Cdn系统
淘宝图片存储与Cdn系统Dai Jun
 

La actualidad más candente (12)

Ceph Day Shanghai - Ceph in Chinau Unicom Labs
Ceph Day Shanghai - Ceph in Chinau Unicom LabsCeph Day Shanghai - Ceph in Chinau Unicom Labs
Ceph Day Shanghai - Ceph in Chinau Unicom Labs
 
Traffic server 管理员指南v1.0
Traffic server 管理员指南v1.0Traffic server 管理员指南v1.0
Traffic server 管理员指南v1.0
 
我对后端优化的一点想法
我对后端优化的一点想法我对后端优化的一点想法
我对后端优化的一点想法
 
Couchbase introduction - Chinese
Couchbase introduction - Chinese Couchbase introduction - Chinese
Couchbase introduction - Chinese
 
Hbase运维碎碎念
Hbase运维碎碎念Hbase运维碎碎念
Hbase运维碎碎念
 
Pm 04 华胜天成openstack实践汇报-20120808
Pm 04 华胜天成openstack实践汇报-20120808Pm 04 华胜天成openstack实践汇报-20120808
Pm 04 华胜天成openstack实践汇报-20120808
 
Exadata training
Exadata trainingExadata training
Exadata training
 
應用Ceph技術打造軟體定義儲存新局
應用Ceph技術打造軟體定義儲存新局應用Ceph技術打造軟體定義儲存新局
應用Ceph技術打造軟體定義儲存新局
 
Key value store
Key value storeKey value store
Key value store
 
利用统一存储获得无与伦比的速度,简化系统,并节省更多
利用统一存储获得无与伦比的速度,简化系统,并节省更多利用统一存储获得无与伦比的速度,简化系统,并节省更多
利用统一存储获得无与伦比的速度,简化系统,并节省更多
 
美团点评技术沙龙010-美团Atlas实践
美团点评技术沙龙010-美团Atlas实践美团点评技术沙龙010-美团Atlas实践
美团点评技术沙龙010-美团Atlas实践
 
淘宝图片存储与Cdn系统
淘宝图片存储与Cdn系统淘宝图片存储与Cdn系统
淘宝图片存储与Cdn系统
 

Destacado

Updating_PHP_on_OS_X_Server
Updating_PHP_on_OS_X_ServerUpdating_PHP_on_OS_X_Server
Updating_PHP_on_OS_X_Servertutorialsruby
 
Big pipe backend2
Big pipe backend2Big pipe backend2
Big pipe backend2锐 张
 
Cibank arch-zhouweiran-qcon
Cibank arch-zhouweiran-qconCibank arch-zhouweiran-qcon
Cibank arch-zhouweiran-qconYiwei Ma
 
数据库设计方法、规范与技巧
数据库设计方法、规范与技巧数据库设计方法、规范与技巧
数据库设计方法、规范与技巧wensheng wei
 
Baidu keynote-wubo-qcon
Baidu keynote-wubo-qconBaidu keynote-wubo-qcon
Baidu keynote-wubo-qconYiwei Ma
 
G416 世博开幕式焰火
G416 世博开幕式焰火G416 世博开幕式焰火
G416 世博开幕式焰火LINWEIYUAN
 

Destacado (7)

Updating_PHP_on_OS_X_Server
Updating_PHP_on_OS_X_ServerUpdating_PHP_on_OS_X_Server
Updating_PHP_on_OS_X_Server
 
Big pipe backend2
Big pipe backend2Big pipe backend2
Big pipe backend2
 
Cibank arch-zhouweiran-qcon
Cibank arch-zhouweiran-qconCibank arch-zhouweiran-qcon
Cibank arch-zhouweiran-qcon
 
GNURAdioDoc-8
GNURAdioDoc-8GNURAdioDoc-8
GNURAdioDoc-8
 
数据库设计方法、规范与技巧
数据库设计方法、规范与技巧数据库设计方法、规范与技巧
数据库设计方法、规范与技巧
 
Baidu keynote-wubo-qcon
Baidu keynote-wubo-qconBaidu keynote-wubo-qcon
Baidu keynote-wubo-qcon
 
G416 世博开幕式焰火
G416 世博开幕式焰火G416 世博开幕式焰火
G416 世博开幕式焰火
 

Similar a 20110625.【打造高效能的cdn系统】.易统

低功耗服务器定制与绿色计算——章文嵩(淘宝)
低功耗服务器定制与绿色计算——章文嵩(淘宝)低功耗服务器定制与绿色计算——章文嵩(淘宝)
低功耗服务器定制与绿色计算——章文嵩(淘宝)drewz lin
 
淘宝软件基础设施构建实践
淘宝软件基础设施构建实践淘宝软件基础设施构建实践
淘宝软件基础设施构建实践lovingprince58
 
Taobao海量图片存储与cdn系统
Taobao海量图片存储与cdn系统Taobao海量图片存储与cdn系统
Taobao海量图片存储与cdn系统智杰 付
 
Taobao海量图片存储与cdn系统
Taobao海量图片存储与cdn系统Taobao海量图片存储与cdn系统
Taobao海量图片存储与cdn系统Wensong Zhang
 
Taobao 海量图片存储与CDN系统02
Taobao 海量图片存储与CDN系统02Taobao 海量图片存储与CDN系统02
Taobao 海量图片存储与CDN系统02lovingprince58
 
Taobao海量图片存储与cdn系统
Taobao海量图片存储与cdn系统Taobao海量图片存储与cdn系统
Taobao海量图片存储与cdn系统Michael Zhang
 
淘宝对象存储与Cdn系统到服务
淘宝对象存储与Cdn系统到服务淘宝对象存储与Cdn系统到服务
淘宝对象存储与Cdn系统到服务drewz lin
 
Lvs在大规模网络环境下的应用pukong
Lvs在大规模网络环境下的应用pukongLvs在大规模网络环境下的应用pukong
Lvs在大规模网络环境下的应用pukongMichael Zhang
 
硬件体系架构浅析
硬件体系架构浅析硬件体系架构浅析
硬件体系架构浅析frogd
 
开源+自主开发 - 淘宝软件基础设施构建实践
开源+自主开发  - 淘宝软件基础设施构建实践开源+自主开发  - 淘宝软件基础设施构建实践
开源+自主开发 - 淘宝软件基础设施构建实践Wensong Zhang
 
Ocean base 千亿级海量数据库-日照
Ocean base 千亿级海量数据库-日照Ocean base 千亿级海量数据库-日照
Ocean base 千亿级海量数据库-日照Shaoning Pan
 
利用新硬件提升数据库性能
利用新硬件提升数据库性能利用新硬件提升数据库性能
利用新硬件提升数据库性能Feng Yu
 
阿里云技术实践
阿里云技术实践阿里云技术实践
阿里云技术实践drewz lin
 
构建基于Lamp的网站架构
构建基于Lamp的网站架构构建基于Lamp的网站架构
构建基于Lamp的网站架构Cosey Lee
 
Exadata那点事
Exadata那点事Exadata那点事
Exadata那点事freezr
 
Hacking Nginx at Taobao
Hacking Nginx at TaobaoHacking Nginx at Taobao
Hacking Nginx at TaobaoJoshua Zhu
 
优酷 Web网站架构案例分析
优酷   Web网站架构案例分析优酷   Web网站架构案例分析
优酷 Web网站架构案例分析George Ang
 
Youku arch qcon2009_beijing
Youku arch qcon2009_beijingYouku arch qcon2009_beijing
Youku arch qcon2009_beijingdrewz lin
 

Similar a 20110625.【打造高效能的cdn系统】.易统 (20)

低功耗服务器定制与绿色计算——章文嵩(淘宝)
低功耗服务器定制与绿色计算——章文嵩(淘宝)低功耗服务器定制与绿色计算——章文嵩(淘宝)
低功耗服务器定制与绿色计算——章文嵩(淘宝)
 
Taobao base
Taobao baseTaobao base
Taobao base
 
淘宝软件基础设施构建实践
淘宝软件基础设施构建实践淘宝软件基础设施构建实践
淘宝软件基础设施构建实践
 
Taobao海量图片存储与cdn系统
Taobao海量图片存储与cdn系统Taobao海量图片存储与cdn系统
Taobao海量图片存储与cdn系统
 
Taobao海量图片存储与cdn系统
Taobao海量图片存储与cdn系统Taobao海量图片存储与cdn系统
Taobao海量图片存储与cdn系统
 
Taobao 海量图片存储与CDN系统02
Taobao 海量图片存储与CDN系统02Taobao 海量图片存储与CDN系统02
Taobao 海量图片存储与CDN系统02
 
Taobao海量图片存储与cdn系统
Taobao海量图片存储与cdn系统Taobao海量图片存储与cdn系统
Taobao海量图片存储与cdn系统
 
淘宝对象存储与Cdn系统到服务
淘宝对象存储与Cdn系统到服务淘宝对象存储与Cdn系统到服务
淘宝对象存储与Cdn系统到服务
 
Lvs在大规模网络环境下的应用pukong
Lvs在大规模网络环境下的应用pukongLvs在大规模网络环境下的应用pukong
Lvs在大规模网络环境下的应用pukong
 
硬件体系架构浅析
硬件体系架构浅析硬件体系架构浅析
硬件体系架构浅析
 
开源+自主开发 - 淘宝软件基础设施构建实践
开源+自主开发  - 淘宝软件基础设施构建实践开源+自主开发  - 淘宝软件基础设施构建实践
开源+自主开发 - 淘宝软件基础设施构建实践
 
Ocean base 千亿级海量数据库-日照
Ocean base 千亿级海量数据库-日照Ocean base 千亿级海量数据库-日照
Ocean base 千亿级海量数据库-日照
 
利用新硬件提升数据库性能
利用新硬件提升数据库性能利用新硬件提升数据库性能
利用新硬件提升数据库性能
 
阿里云技术实践
阿里云技术实践阿里云技术实践
阿里云技术实践
 
构建基于Lamp的网站架构
构建基于Lamp的网站架构构建基于Lamp的网站架构
构建基于Lamp的网站架构
 
Exadata那点事
Exadata那点事Exadata那点事
Exadata那点事
 
Hacking Nginx at Taobao
Hacking Nginx at TaobaoHacking Nginx at Taobao
Hacking Nginx at Taobao
 
优酷 Web网站架构案例分析
优酷   Web网站架构案例分析优酷   Web网站架构案例分析
优酷 Web网站架构案例分析
 
Youku arch qcon2009_beijing
Youku arch qcon2009_beijingYouku arch qcon2009_beijing
Youku arch qcon2009_beijing
 
Metrics
MetricsMetrics
Metrics
 

Más de 锐 张

长尾理论(The longtail)版
长尾理论(The longtail)版长尾理论(The longtail)版
长尾理论(The longtail)版锐 张
 
Openstack starter-guide-diablo
Openstack starter-guide-diabloOpenstack starter-guide-diablo
Openstack starter-guide-diablo锐 张
 
基于My sql的分布式数据库实践
基于My sql的分布式数据库实践基于My sql的分布式数据库实践
基于My sql的分布式数据库实践锐 张
 
Redis中文入门手册
Redis中文入门手册Redis中文入门手册
Redis中文入门手册锐 张
 
Redis学习笔记
Redis学习笔记Redis学习笔记
Redis学习笔记锐 张
 
Redis内存存储结构分析
Redis内存存储结构分析Redis内存存储结构分析
Redis内存存储结构分析锐 张
 
淘宝前端优化
淘宝前端优化淘宝前端优化
淘宝前端优化锐 张
 
Sun jdk 1.6内存管理 -实现篇 -毕玄
Sun jdk 1.6内存管理 -实现篇 -毕玄Sun jdk 1.6内存管理 -实现篇 -毕玄
Sun jdk 1.6内存管理 -实现篇 -毕玄锐 张
 
Sun jdk 1.6内存管理 -调优篇-毕玄
Sun jdk 1.6内存管理 -调优篇-毕玄Sun jdk 1.6内存管理 -调优篇-毕玄
Sun jdk 1.6内存管理 -调优篇-毕玄锐 张
 
Sun jdk 1.6内存管理 -使用篇-毕玄
Sun jdk 1.6内存管理 -使用篇-毕玄Sun jdk 1.6内存管理 -使用篇-毕玄
Sun jdk 1.6内存管理 -使用篇-毕玄锐 张
 
Sun jdk-1.6-gc
Sun jdk-1.6-gcSun jdk-1.6-gc
Sun jdk-1.6-gc锐 张
 
Redis介绍
Redis介绍Redis介绍
Redis介绍锐 张
 
Redis深入浅出
Redis深入浅出Redis深入浅出
Redis深入浅出锐 张
 
Green plum培训材料
Green plum培训材料Green plum培训材料
Green plum培训材料锐 张
 
Greenplum技术
Greenplum技术Greenplum技术
Greenplum技术锐 张
 
新时代的分析型云数据库 Greenplum
新时代的分析型云数据库 Greenplum新时代的分析型云数据库 Greenplum
新时代的分析型云数据库 Greenplum锐 张
 
服务器端性能优化 提升Qps、rt
服务器端性能优化 提升Qps、rt服务器端性能优化 提升Qps、rt
服务器端性能优化 提升Qps、rt锐 张
 
新浪云计算公开课第二期:Sae平台的灵活应用(吕毅、魏世江)
新浪云计算公开课第二期:Sae平台的灵活应用(吕毅、魏世江)新浪云计算公开课第二期:Sae平台的灵活应用(吕毅、魏世江)
新浪云计算公开课第二期:Sae平台的灵活应用(吕毅、魏世江)锐 张
 
新浪云计算公开课第一期:Let’s run @ sae(丛磊)
新浪云计算公开课第一期:Let’s run @ sae(丛磊)新浪云计算公开课第一期:Let’s run @ sae(丛磊)
新浪云计算公开课第一期:Let’s run @ sae(丛磊)锐 张
 
Lamp高性能设计
Lamp高性能设计Lamp高性能设计
Lamp高性能设计锐 张
 

Más de 锐 张 (20)

长尾理论(The longtail)版
长尾理论(The longtail)版长尾理论(The longtail)版
长尾理论(The longtail)版
 
Openstack starter-guide-diablo
Openstack starter-guide-diabloOpenstack starter-guide-diablo
Openstack starter-guide-diablo
 
基于My sql的分布式数据库实践
基于My sql的分布式数据库实践基于My sql的分布式数据库实践
基于My sql的分布式数据库实践
 
Redis中文入门手册
Redis中文入门手册Redis中文入门手册
Redis中文入门手册
 
Redis学习笔记
Redis学习笔记Redis学习笔记
Redis学习笔记
 
Redis内存存储结构分析
Redis内存存储结构分析Redis内存存储结构分析
Redis内存存储结构分析
 
淘宝前端优化
淘宝前端优化淘宝前端优化
淘宝前端优化
 
Sun jdk 1.6内存管理 -实现篇 -毕玄
Sun jdk 1.6内存管理 -实现篇 -毕玄Sun jdk 1.6内存管理 -实现篇 -毕玄
Sun jdk 1.6内存管理 -实现篇 -毕玄
 
Sun jdk 1.6内存管理 -调优篇-毕玄
Sun jdk 1.6内存管理 -调优篇-毕玄Sun jdk 1.6内存管理 -调优篇-毕玄
Sun jdk 1.6内存管理 -调优篇-毕玄
 
Sun jdk 1.6内存管理 -使用篇-毕玄
Sun jdk 1.6内存管理 -使用篇-毕玄Sun jdk 1.6内存管理 -使用篇-毕玄
Sun jdk 1.6内存管理 -使用篇-毕玄
 
Sun jdk-1.6-gc
Sun jdk-1.6-gcSun jdk-1.6-gc
Sun jdk-1.6-gc
 
Redis介绍
Redis介绍Redis介绍
Redis介绍
 
Redis深入浅出
Redis深入浅出Redis深入浅出
Redis深入浅出
 
Green plum培训材料
Green plum培训材料Green plum培训材料
Green plum培训材料
 
Greenplum技术
Greenplum技术Greenplum技术
Greenplum技术
 
新时代的分析型云数据库 Greenplum
新时代的分析型云数据库 Greenplum新时代的分析型云数据库 Greenplum
新时代的分析型云数据库 Greenplum
 
服务器端性能优化 提升Qps、rt
服务器端性能优化 提升Qps、rt服务器端性能优化 提升Qps、rt
服务器端性能优化 提升Qps、rt
 
新浪云计算公开课第二期:Sae平台的灵活应用(吕毅、魏世江)
新浪云计算公开课第二期:Sae平台的灵活应用(吕毅、魏世江)新浪云计算公开课第二期:Sae平台的灵活应用(吕毅、魏世江)
新浪云计算公开课第二期:Sae平台的灵活应用(吕毅、魏世江)
 
新浪云计算公开课第一期:Let’s run @ sae(丛磊)
新浪云计算公开课第一期:Let’s run @ sae(丛磊)新浪云计算公开课第一期:Let’s run @ sae(丛磊)
新浪云计算公开课第一期:Let’s run @ sae(丛磊)
 
Lamp高性能设计
Lamp高性能设计Lamp高性能设计
Lamp高性能设计
 

20110625.【打造高效能的cdn系统】.易统

  • 1. 打造高效能的CDN系统 任卿 (易统) 淘宝核心系统研发部 1
  • 3. 什么是CDN 内容 发 • CDN(Content Delivery Network)内容分发 网络 简单的说就是在不同地点缓存内容 网络,简单的说就是在不同地点缓存内容 ,然后通过负载均衡等技术将用户请求定 向到最合适的缓存服务器上获取内容,提 向到最合适的缓存服务器上获取内容 提 高用户访问网站的响应速度。 • 通过C 服务提高网站的访问性能及稳定 通过CDN服务提高网站的访问性能及稳定 性,保障网站服务品质。
  • 4. 淘宝CDN的一些数字 系统的规模 • CDN系统的规模 – 500T容量的原图 + 500T容量的缩略图 – 约700亿左右的缓存图片数 平均图片大小约20KB 约700亿左右的缓存图片数,平均图片大小约20KB – 18KB以内的对象数量占总数量的80% • CDN部署的规模 – 近100个节点,部署在网民相对密集的主要中心城市 – 每个节点目前处理能力在10G左右 – CDN部署的总处理能力800G左右 – 目前承载淘宝流量高峰时近400G流量 目前承载淘宝流量高峰时近 流量
  • 6. 淘宝CDN系统体系结构 淘宝 系统体系结构 Global Load Balancing Gl b l L d B l i Cache Cache Cache Cache L1-Cache L1 C h Cluster Cluster Cluster Cluster ~30T Cache Cache Cache L2-Cache Cluster Cluster Cluster ~100T Image Server Image Server Application Cluster Cluster ~200 Servers Storage 2000T Used / TFS TFS Cluster Cluster 3000T Deployed 6
  • 8. CDN节点逻辑架构 CDN缓存节点逻辑 用户响应 缓存服务器 Haproxy Squid q 七层负载 缓存服务 均衡 Haproxy LVS Squid q 七层负载 四层负载 缓存服务 用户请求 均衡 均衡 Haproxy p y Squid 七层负 缓存服务 载均衡
  • 10. CDN系统效能优化 • 负 负载均衡优化 衡优 • 网络层优化 • 存储优化
  • 11. Haproxy软件优化 优 提高效率 消除短 • hash优化,提高效率、消除短板 – servers=128 nodes=128 stdvar=3.010755e+06 stdvar/avg=0.08973 – servers=128 nodes=256 stdvar=1.974319e+06 stdvar/avg=0.05884 • 精确的调度和数据清理 – 基于一致性哈希调度请求 – 基于调度历史做精确清理,避免全量清理操作 • 支持Cache功能 – 将最热的内容缓存在 将最热的内容缓存在haproxy中 中 – 改善性能,应对访问的热点
  • 13. Haproxy长链接支持 • 长链接的作用 链接的作 • 对客户端的keepalive,提高用户响应速度 • 对服务端的keepalive,提高服务器处理能力 • TCP拥塞控制
  • 14. Haproxy长链接效果 • 挖掘淘宝访问的业务特点,平衡系统开销和加速 效果 • 提升用户体验,响应时间最多提升50%+
  • 15. 动态内容加速 • 针对不能被缓存的动态内容做加速 能被缓存的 态内容做加 • 基于TCP协议原理,优化网络通讯 • 内核协议栈调优 • 充分利用CDN节点和中心站点之间的”高速 公路 公路”
  • 17. CDN节点存储优化 • 充分了解缓存内容特点 充 缓存内容特点 • 充分了解存储介质特点 • 资源合理组合配置 • 优化缓存处理逻辑
  • 18. 120.00% 120 00% CDN缓存对象的特性 累计个数比例 累计容量比例 100.00% 80.00% 60.00% 60 00% 40.00% 20.00% 0.00% 0 00% 102 105 108 111 114 117 120 123 126 0 3 6 9 12 15 18 21 24 27 30 33 36 39 42 45 48 51 54 57 60 63 66 69 72 75 78 81 84 87 90 93 96 99 • 0 18KB的对象数量占总数量的80% 而存储量只有不到 0~18KB的对象数量占总数量的80%,而存储量只有不到 40% • 80%被访问到的对象 其存储占用只有不到20% 80%被访问到的对象,其存储占用只有不到20% • 访问的局部性,决定分层次的对象存储
  • 19. IO存储介质 内存 Sata固态硬盘 Sata机械硬盘 IO能力 6.4Gbps <10000 iops <160iops 存储容量 4~16GB 80 ~160GB 500~1000GB 单价(每G的成 150 1 0 20 2 本)
  • 20. 存储系统优化思路 • 充 利 充分利用访问局部性 性 • 通过控制将热点内容存储在内存和SSD, 降低对Sata机械盘的访问 • 服务器IO的瓶颈在S t 机械盘 服务器IO的瓶颈在Sata机械盘 • 增加Sata机械硬盘提高存储能力,降低存 储成本
  • 21. 存储系统优化实践 • 改进Squid的COSS文件 • 根据对象大小和访问特点切分,分级存储 • 支持热点迁移的TCOSS文件系统 • 用sendfile来发送缓存在硬盘上的对象 • Squid内存优化, 台Squid服务器若有 Squid内存优化 一台Squid服务器若有一 千万对象,大约节省400M内存,更多的内 存可以用作Squid Memory C h 存可以用作S id M Cache
  • 22. 存储系统优化效果 • 缓存字节命中率:97%以上 缓存字 命中率 • 缓存请求命中率:97%以上 • 缓存响应时间:10ms以内 • 单台服务器缓存对象数:6000万以上
  • 24. CDN缓存服务特点 • 请求-响应的服务模型 – 请求的处理 • 基本上是通过hash(URL)对响应内容进行查询 • 逻辑简单,消耗CPU较少 – 响应的处理 • 命中--》磁盘--》内存缓冲--》网卡--》网络--》用户 • 不命中 》网卡 》网络 》网卡 》内存缓冲 》网卡 》网络 不命中--》网卡--》网络--》网卡--》内存缓冲--》网卡--》网络 --》用户 • I/O密集型服务 – CPU处理少 – 绝大部分是IO操作 – 容量越大,命中率越高,目标:98%
  • 25. 为什么考虑低功耗服务器  降低CPU的峰值功率比动态调整功率 • 不断增大的CPU与IO之间的差距 使用更能减低系统能耗 – 对于IO密集型服务,硬盘、网卡是瓶颈  芯片的泄露电流随频率变化很小 片的泄露电流随频率变化很小 – 在消耗<30%CPU时,硬盘IO已满  性能强的CPU,外围组件(如网 卡、总线等)能力都较强,因此 耗电也相对高  功耗的增加快于处理速度的增长 CPU功耗的增加快于处理速度的增长  传统CPU峰值功耗高限制了IDC服务 器的密度  IDC中每个机柜都有额定的功率  虽然空间上可以放置几十台服务 器,但是由于传统服务器的功耗 高,使得整个机架只能放置几台 高 使得整个机架只能放置几台 服务器,造成空间浪费  在成本和功耗不增加的情况下,将原 有单台高性能服务器承载的流量分摊 到多台低功耗服务器上,降低单台服 务器故障带来的影响  更高密度的存储能力 来源: FAWN - A Fast Array of Wimpy Nodes
  • 26. 低功耗定制原则 • 低功耗 – 单位服务器满载功耗控制在20~30Watts • 高密度 – 单位空间放置尽可能多的服务器和存储 • 兼容性 – 通用的硬件方案 • 高性价比 – 单位服务能力的成本及功耗为衡量标准 – 成本包括:投入成本和运营成本 • 可运维性
  • 27. ATOM低功耗服务器 1. 2U的机箱,集成8个单独的服 务器硬件系统,每两个服务器 系统集成在 个板卡上;每个 系统集成在一个板卡上;每个 服务器间只共享电源 2. 每个服务器系统配置: • Dual Core Intel® Atom™ D525(1.8GHz D525(1 8GH 13W)processor + Intel® (背面) ICH9R Chipset • 4GB Non-ECC DDR3 Non ECC 1333MHz SO-DIMMs (per node) support • 3x 2.5” Hot-swap SATA HDD (RAID 0, 1) 0 • 2GE with Intel 82574L 一个板卡集成两个服务器系统 3. 可热插拔硬盘与主板分离,共 提供 个盘位支持 提供24个盘位支持 4. 内置BMC支持IPMI 5. 720W 冗余高效金牌电源,支持PMbus (正面,24个可插拔硬盘)
  • 28. 方案对比:存储IO配置对比 • 服务器 Atom低功耗 Xeon偏低功耗 Xeon服务器 CPU Atom D525 Intel L3406 Intel E5620 -1*2 cores -1*2cores -1*4Cores - 1.80Ghz -2.26Ghz -2.66GHz - 1MB cache -4MB cache -12MB cache 内存 2*2GB 4*4GB 3*4GB SSD 1*80GB 1*160GB 2*160GB SAS NA NA 6*600GB Sata 2*500GB rpm7200 HyBrid 3*500GB rpm7200 EN NA  机械硬盘 机械硬盘 容量(G) 单盘IOPS Seagate SATA混合盘 500 120 SAS硬盘 600 180 SATA企业盘 500 130  节点存储与IO 单机SSD 单机SATA 单机SAS Cache服 机械盘总 节点SSD总 节点硬盘总 节点总容量 数 数 数 务器数目 IOPS 容量(G) 容量(G) (G) Xeon偏低功耗 1 3 22 8580 3520 33000 36520 Atom低功耗 1 2 64 15360 5120 64000 69120 Xeon服务器 2 6 10 10800 3200 36000 39200
  • 29. 服务器功耗估算对比 单位功耗(瓦) 数量 功耗小计(瓦) ATOM D525 13 1 13 西数混合盘 2.2 2 4.4 SSD 2 1 2 Atom低功耗 网卡 1.9 1 1.9 内存 2 2 4 合计 25 Intel L3406 30 1 30 西数企业盘RPM7200 3.2 3 9.6 SSD 2 1 2 Xeon低功耗 网卡 1.9 1 1.9 内存 4 4 16 合计 60 Intel E5620 80 1 80 SAS 9 6 54 SSD 2 2 4 Xeon服务器 网卡 1.9 1 1.9 内存 10 4 40 合计 180
  • 30. 节点服务能力、功耗预估 机械盘 单位请求消 节点服务 机械盘总 机械盘最大 内存和SSD 估算 平均访问对 COSS命 耗机械盘 能力 IOPS 利用率 命中率 QPS 象大小(KB) 中率 IOPS数 (Gps) Atom低功耗 15360 80% ~92% 5.5% 2.14 104401 18 15.5 Xeon偏低功耗 8580 80% ~91% 5.0% 2.14 64150 18 9.5 Xeon服务器 10800 80% ~90.8% 5.2% 2.14 77642 18 11.5 缓存服务器 LVS服务器 交换机数 cahe数量 LVS数量 交换机功耗 总功耗(瓦) 功耗 功耗 量 Atom低功耗 25 64 150 2 80 2 2060 Xeon偏低功耗 60 22 58 2 80 1 1516 Xeon服务器 180 10 150 2 80 1 2180
  • 31. 节点性价比与功耗比预估 服务能力性价比 存储性价比 服务能力性耗比 (kbps/元) (MB/元) (Mbps/瓦) Atom低功耗 1.72 2 7.7 Xeon偏低功耗 1 (基准值) 1 (基准值) 6.42 Xeon服务器 1.3 1.15 5.41
  • 32. 低功耗CDN 级缓存节点方案 低功耗CDN一级缓存节点方案 LVS服务器 交换机 Rack 8台64个低功耗服务器 出口路由器 Internet
  • 33. 节点机架布局 2U*2 低功耗服务器 1U 交换机 2U *2低功耗服务器 1U 负载均衡服务器 机架 2U*2 低功耗服务器 2U 2 1U 交换机 2U*2 低功耗服务器 1U 负载均衡服务器
  • 34. 利用率 0 10 20 30 40 50 60 70 80 90 1 7 13 19 25 31 37 43 49 55 61 67 73 79 85 91 97 103 109 115 121 127 133 139 145 151 157 低功耗服务器 163 169 175 181 187 193 199 205 211 CPU, 56.8% 217 223 229 235 低功耗服务器运行状态 241 247 IOUtil 24 6% IOUtil, 24.6% 253 259 265 271 277 283 34
  • 35. CDN低功耗服务器性能 3000QPS 1700QPS 非低功耗服 务器 低功耗服务 器+系统级、 1300QPS 应用级优化 低功耗服务器 +应用级优化 900QPS 低功耗服务 器优化前 35
  • 36. 低功耗后续的工作计划 • 功耗优化 功耗优 • 成本优化 • 性能优化 • 定制方案开源
  • 37. 低功耗项目的开源策略 开源社区 处理器和芯片 提供商 发起 主板ODM厂商 需求建议 电源机箱ODM 加入 低功耗服务器 厂商 开源项目 服务器OEM 产出 厂商 发布 其他企业用户 服务器设计 应用性能 应用优化 规范 测试 配置
  • 39. 小结 • 速度是网站的根本,CDN是优化网站速度 度 的 本 优 度 的利器 • 系统优化是多层次的,软硬件结合 • 用数字说话 • 从关注性能到关注效能