Enviar búsqueda
Cargar
Track1dongsiying4
•
0 recomendaciones
•
1,064 vistas
D
drewz lin
Seguir
Denunciar
Compartir
Denunciar
Compartir
1 de 24
Descargar ahora
Descargar para leer sin conexión
Recomendados
选型指南:Cdn系统中dns的设计与研发
选型指南:Cdn系统中dns的设计与研发
SpeedyCloud
Nosql三步曲
Nosql三步曲
84zhu
硬件体系架构浅析
硬件体系架构浅析
frogd
SRE 讀書會 Round 4 #37 - DNS 時快時慢,我該怎麼辦
SRE 讀書會 Round 4 #37 - DNS 時快時慢,我該怎麼辦
HanLing Shen
Oracle rac资源管理算法与cache fusion实现浅析
Oracle rac资源管理算法与cache fusion实现浅析
frogd
Dbabc.net 利用heartbeat + drbd搭建my sql高可用环境
Dbabc.net 利用heartbeat + drbd搭建my sql高可用环境
dbabc
InnoDB Transaction Lock and MVCC
InnoDB Transaction Lock and MVCC
frogd
C1000K高性能服务器构建技术
C1000K高性能服务器构建技术
Feng Yu
Recomendados
选型指南:Cdn系统中dns的设计与研发
选型指南:Cdn系统中dns的设计与研发
SpeedyCloud
Nosql三步曲
Nosql三步曲
84zhu
硬件体系架构浅析
硬件体系架构浅析
frogd
SRE 讀書會 Round 4 #37 - DNS 時快時慢,我該怎麼辦
SRE 讀書會 Round 4 #37 - DNS 時快時慢,我該怎麼辦
HanLing Shen
Oracle rac资源管理算法与cache fusion实现浅析
Oracle rac资源管理算法与cache fusion实现浅析
frogd
Dbabc.net 利用heartbeat + drbd搭建my sql高可用环境
Dbabc.net 利用heartbeat + drbd搭建my sql高可用环境
dbabc
InnoDB Transaction Lock and MVCC
InnoDB Transaction Lock and MVCC
frogd
C1000K高性能服务器构建技术
C1000K高性能服务器构建技术
Feng Yu
MySQL查询优化浅析
MySQL查询优化浅析
frogd
My sql 5.6新特性深入剖析——innodb引擎
My sql 5.6新特性深入剖析——innodb引擎
frogd
淘宝图片存储与Cdn系统
淘宝图片存储与Cdn系统
Dai Jun
Sth About SSD
Sth About SSD
XueZhang Wu
淘宝软件基础设施构建实践
淘宝软件基础设施构建实践
Wensong Zhang
美团点评技术沙龙010-Redis Cluster运维实践
美团点评技术沙龙010-Redis Cluster运维实践
美团点评技术团队
Cephfs架构解读和测试分析
Cephfs架构解读和测试分析
Yang Guanjun
Key value store
Key value store
xuanhan863
Oda安装 恢复步骤
Oda安装 恢复步骤
n-lauren
應用Ceph技術打造軟體定義儲存新局
應用Ceph技術打造軟體定義儲存新局
Alex Lau
Dnsse cv9
Dnsse cv9
itsuki810
Ceph中国社区9.19 Ceph FS-基于RADOS的高性能分布式文件系统02-袁冬
Ceph中国社区9.19 Ceph FS-基于RADOS的高性能分布式文件系统02-袁冬
Hang Geng
Memcached vs redis
Memcached vs redis
qianshi
Dns
Dns
Yiwei Ma
【诗檀软件 郭兆伟-技术报告】跨国企业级Oracle数据库备份策略
【诗檀软件 郭兆伟-技术报告】跨国企业级Oracle数据库备份策略
maclean liu
dbdao.com 汪伟华 my-sql-replication复制高可用配置方案
dbdao.com 汪伟华 my-sql-replication复制高可用配置方案
maclean liu
优酷 Web网站架构案例分析
优酷 Web网站架构案例分析
George Ang
Youku arch qcon2009_beijing
Youku arch qcon2009_beijing
drewz lin
HDFS與MapReduce架構研討
HDFS與MapReduce架構研討
Billy Yang
Google LevelDB Study Discuss
Google LevelDB Study Discuss
everestsun
HDFS元数据的独立服务和 独立持久化存储 -hadoop2011-淘宝
HDFS元数据的独立服务和 独立持久化存储 -hadoop2011-淘宝
miaojian430
大规模数据处理
大规模数据处理
Kay Yan
Más contenido relacionado
La actualidad más candente
MySQL查询优化浅析
MySQL查询优化浅析
frogd
My sql 5.6新特性深入剖析——innodb引擎
My sql 5.6新特性深入剖析——innodb引擎
frogd
淘宝图片存储与Cdn系统
淘宝图片存储与Cdn系统
Dai Jun
Sth About SSD
Sth About SSD
XueZhang Wu
淘宝软件基础设施构建实践
淘宝软件基础设施构建实践
Wensong Zhang
美团点评技术沙龙010-Redis Cluster运维实践
美团点评技术沙龙010-Redis Cluster运维实践
美团点评技术团队
Cephfs架构解读和测试分析
Cephfs架构解读和测试分析
Yang Guanjun
Key value store
Key value store
xuanhan863
Oda安装 恢复步骤
Oda安装 恢复步骤
n-lauren
應用Ceph技術打造軟體定義儲存新局
應用Ceph技術打造軟體定義儲存新局
Alex Lau
Dnsse cv9
Dnsse cv9
itsuki810
Ceph中国社区9.19 Ceph FS-基于RADOS的高性能分布式文件系统02-袁冬
Ceph中国社区9.19 Ceph FS-基于RADOS的高性能分布式文件系统02-袁冬
Hang Geng
Memcached vs redis
Memcached vs redis
qianshi
Dns
Dns
Yiwei Ma
【诗檀软件 郭兆伟-技术报告】跨国企业级Oracle数据库备份策略
【诗檀软件 郭兆伟-技术报告】跨国企业级Oracle数据库备份策略
maclean liu
dbdao.com 汪伟华 my-sql-replication复制高可用配置方案
dbdao.com 汪伟华 my-sql-replication复制高可用配置方案
maclean liu
La actualidad más candente
(16)
MySQL查询优化浅析
MySQL查询优化浅析
My sql 5.6新特性深入剖析——innodb引擎
My sql 5.6新特性深入剖析——innodb引擎
淘宝图片存储与Cdn系统
淘宝图片存储与Cdn系统
Sth About SSD
Sth About SSD
淘宝软件基础设施构建实践
淘宝软件基础设施构建实践
美团点评技术沙龙010-Redis Cluster运维实践
美团点评技术沙龙010-Redis Cluster运维实践
Cephfs架构解读和测试分析
Cephfs架构解读和测试分析
Key value store
Key value store
Oda安装 恢复步骤
Oda安装 恢复步骤
應用Ceph技術打造軟體定義儲存新局
應用Ceph技術打造軟體定義儲存新局
Dnsse cv9
Dnsse cv9
Ceph中国社区9.19 Ceph FS-基于RADOS的高性能分布式文件系统02-袁冬
Ceph中国社区9.19 Ceph FS-基于RADOS的高性能分布式文件系统02-袁冬
Memcached vs redis
Memcached vs redis
Dns
Dns
【诗檀软件 郭兆伟-技术报告】跨国企业级Oracle数据库备份策略
【诗檀软件 郭兆伟-技术报告】跨国企业级Oracle数据库备份策略
dbdao.com 汪伟华 my-sql-replication复制高可用配置方案
dbdao.com 汪伟华 my-sql-replication复制高可用配置方案
Similar a Track1dongsiying4
优酷 Web网站架构案例分析
优酷 Web网站架构案例分析
George Ang
Youku arch qcon2009_beijing
Youku arch qcon2009_beijing
drewz lin
HDFS與MapReduce架構研討
HDFS與MapReduce架構研討
Billy Yang
Google LevelDB Study Discuss
Google LevelDB Study Discuss
everestsun
HDFS元数据的独立服务和 独立持久化存储 -hadoop2011-淘宝
HDFS元数据的独立服务和 独立持久化存储 -hadoop2011-淘宝
miaojian430
大规模数据处理
大规模数据处理
Kay Yan
大规模数据处理
大规模数据处理
airsex
Hacking Nginx at Taobao
Hacking Nginx at Taobao
Joshua Zhu
大型视频网站单点分析与可用性提升-Qcon2011
大型视频网站单点分析与可用性提升-Qcon2011
Yiwei Ma
Cdc@ganji.com
Cdc@ganji.com
Tailor Cai
Pegasus: Designing a Distributed Key Value System (Arch summit beijing-2016)
Pegasus: Designing a Distributed Key Value System (Arch summit beijing-2016)
涛 吴
百度系统部分布式系统介绍 马如悦 Sacc2010
百度系统部分布式系统介绍 马如悦 Sacc2010
Chuanying Du
Bypat博客出品-服务器运维集群方法总结2
Bypat博客出品-服务器运维集群方法总结2
redhat9
浅谈电商网站数据访问层(DAL)与 ORM 之适用性
浅谈电商网站数据访问层(DAL)与 ORM 之适用性
Xuefeng Zhang
使用Dsl改善软件设计
使用Dsl改善软件设计
mingjin
大规模网站架构
大规模网站架构
drewz lin
賽門鐵克 Storage Foundation 6.0 簡報
賽門鐵克 Storage Foundation 6.0 簡報
Wales Chen
Bypat博客出品-服务器运维集群方法总结
Bypat博客出品-服务器运维集群方法总结
redhat9
Heartbeat+my sql+drbd构建高可用mysql方案
Heartbeat+my sql+drbd构建高可用mysql方案
cao jincheng
分布式系统缓存设计
分布式系统缓存设计
zhujiadun
Similar a Track1dongsiying4
(20)
优酷 Web网站架构案例分析
优酷 Web网站架构案例分析
Youku arch qcon2009_beijing
Youku arch qcon2009_beijing
HDFS與MapReduce架構研討
HDFS與MapReduce架構研討
Google LevelDB Study Discuss
Google LevelDB Study Discuss
HDFS元数据的独立服务和 独立持久化存储 -hadoop2011-淘宝
HDFS元数据的独立服务和 独立持久化存储 -hadoop2011-淘宝
大规模数据处理
大规模数据处理
大规模数据处理
大规模数据处理
Hacking Nginx at Taobao
Hacking Nginx at Taobao
大型视频网站单点分析与可用性提升-Qcon2011
大型视频网站单点分析与可用性提升-Qcon2011
Cdc@ganji.com
Cdc@ganji.com
Pegasus: Designing a Distributed Key Value System (Arch summit beijing-2016)
Pegasus: Designing a Distributed Key Value System (Arch summit beijing-2016)
百度系统部分布式系统介绍 马如悦 Sacc2010
百度系统部分布式系统介绍 马如悦 Sacc2010
Bypat博客出品-服务器运维集群方法总结2
Bypat博客出品-服务器运维集群方法总结2
浅谈电商网站数据访问层(DAL)与 ORM 之适用性
浅谈电商网站数据访问层(DAL)与 ORM 之适用性
使用Dsl改善软件设计
使用Dsl改善软件设计
大规模网站架构
大规模网站架构
賽門鐵克 Storage Foundation 6.0 簡報
賽門鐵克 Storage Foundation 6.0 簡報
Bypat博客出品-服务器运维集群方法总结
Bypat博客出品-服务器运维集群方法总结
Heartbeat+my sql+drbd构建高可用mysql方案
Heartbeat+my sql+drbd构建高可用mysql方案
分布式系统缓存设计
分布式系统缓存设计
Más de drewz lin
Web security-–-everything-we-know-is-wrong-eoin-keary
Web security-–-everything-we-know-is-wrong-eoin-keary
drewz lin
Via forensics appsecusa-nov-2013
Via forensics appsecusa-nov-2013
drewz lin
Phu appsec13
Phu appsec13
drewz lin
Owasp2013 johannesullrich
Owasp2013 johannesullrich
drewz lin
Owasp advanced mobile-application-code-review-techniques-v0.2
Owasp advanced mobile-application-code-review-techniques-v0.2
drewz lin
I mas appsecusa-nov13-v2
I mas appsecusa-nov13-v2
drewz lin
Defeating xss-and-xsrf-with-my faces-frameworks-steve-wolf
Defeating xss-and-xsrf-with-my faces-frameworks-steve-wolf
drewz lin
Csrf not-all-defenses-are-created-equal
Csrf not-all-defenses-are-created-equal
drewz lin
Chuck willis-owaspbwa-beyond-1.0-app secusa-2013-11-21
Chuck willis-owaspbwa-beyond-1.0-app secusa-2013-11-21
drewz lin
Appsec usa roberthansen
Appsec usa roberthansen
drewz lin
Appsec usa2013 js_libinsecurity_stefanodipaola
Appsec usa2013 js_libinsecurity_stefanodipaola
drewz lin
Appsec2013 presentation-dickson final-with_all_final_edits
Appsec2013 presentation-dickson final-with_all_final_edits
drewz lin
Appsec2013 presentation
Appsec2013 presentation
drewz lin
Appsec 2013-krehel-ondrej-forensic-investigations-of-web-exploitations
Appsec 2013-krehel-ondrej-forensic-investigations-of-web-exploitations
drewz lin
Appsec2013 assurance tagging-robert martin
Appsec2013 assurance tagging-robert martin
drewz lin
Amol scadaowasp
Amol scadaowasp
drewz lin
Agile sdlc-v1.1-owasp-app sec-usa
Agile sdlc-v1.1-owasp-app sec-usa
drewz lin
Vulnex app secusa2013
Vulnex app secusa2013
drewz lin
基于虚拟化技术的分布式软件测试框架
基于虚拟化技术的分布式软件测试框架
drewz lin
新浪微博稳定性经验谈
新浪微博稳定性经验谈
drewz lin
Más de drewz lin
(20)
Web security-–-everything-we-know-is-wrong-eoin-keary
Web security-–-everything-we-know-is-wrong-eoin-keary
Via forensics appsecusa-nov-2013
Via forensics appsecusa-nov-2013
Phu appsec13
Phu appsec13
Owasp2013 johannesullrich
Owasp2013 johannesullrich
Owasp advanced mobile-application-code-review-techniques-v0.2
Owasp advanced mobile-application-code-review-techniques-v0.2
I mas appsecusa-nov13-v2
I mas appsecusa-nov13-v2
Defeating xss-and-xsrf-with-my faces-frameworks-steve-wolf
Defeating xss-and-xsrf-with-my faces-frameworks-steve-wolf
Csrf not-all-defenses-are-created-equal
Csrf not-all-defenses-are-created-equal
Chuck willis-owaspbwa-beyond-1.0-app secusa-2013-11-21
Chuck willis-owaspbwa-beyond-1.0-app secusa-2013-11-21
Appsec usa roberthansen
Appsec usa roberthansen
Appsec usa2013 js_libinsecurity_stefanodipaola
Appsec usa2013 js_libinsecurity_stefanodipaola
Appsec2013 presentation-dickson final-with_all_final_edits
Appsec2013 presentation-dickson final-with_all_final_edits
Appsec2013 presentation
Appsec2013 presentation
Appsec 2013-krehel-ondrej-forensic-investigations-of-web-exploitations
Appsec 2013-krehel-ondrej-forensic-investigations-of-web-exploitations
Appsec2013 assurance tagging-robert martin
Appsec2013 assurance tagging-robert martin
Amol scadaowasp
Amol scadaowasp
Agile sdlc-v1.1-owasp-app sec-usa
Agile sdlc-v1.1-owasp-app sec-usa
Vulnex app secusa2013
Vulnex app secusa2013
基于虚拟化技术的分布式软件测试框架
基于虚拟化技术的分布式软件测试框架
新浪微博稳定性经验谈
新浪微博稳定性经验谈
Track1dongsiying4
1.
Facebook开发的 HDFS和HBase新特性 董思颖,软件工程师, Facebook数据基础设施组 siying.d@fb.com
2.
Facebook对HDFS及Hbase的使用 数据仓储
实时随机读写 实时 连续 Web Workflow 读写 语言 工具 Job Scheduling Hive Facebook Tool Shell 消息 Hive … 监控工具 PUMA … Peregrine MapReduce … HBase Scribe … HDFS
3.
代码 GitHub! Hadoop: https://github.com/facebook/hadoop-20 Hadoop稳定版: https://github.com/facebook/hadoop-20/tree/production HBase: https://github.com/apache/hbase/tree/0.89-fb
4.
HDFS的新特性
5.
HDFS广泛的新需求和新挑战
数据仓 HBas Scribe 数据备份和 储 e 恢复 NameNode 不停机升级 高 高 中 低 NameNode自动故障转移 中 高 中 低 文件数量多 高 低 低 高 数据容量大 高 低 低 低 文件客户端永久存在 低 高 高 低 大量随机读 低 高 低 低 节省存储空间 高 中 低 中 减少高延迟读写 低 高 中 低 DataNode存储大量Block 高 低 低 中 隔离不同应用 中 低 低 低 远程客户端 中 低 中 低
6.
HDFS Scalability 如何使用密度更高的机器,存储更多的数据和更多的文件?
7.
NameNode Scalability –
Federation (1) 什么是Federation NN1 NN2 NN3 DN1 DN2 DN3
8.
NameNode Scalability –
Federation (2) 在不同NameNode之间移动文件?FastCopy! Hive表格 NN1 NN2 File1 File2 Block1 Block1’ Block2 Block2’ 硬链接 硬链接 Disk Disk File1 File2 DN1 DN2
9.
HDFS不停机升级 NameNode升级是造成服务不可用的首要原因,它一定需要停机吗?
10.
NameNode不停机升级 Client
Primary Last Transaction ID Zookeeper Host2 Host1 id 副NameNode 主NameNode Transaction Logs (Host2) (Host1) Blocks DataNodes (Data)
11.
NameNode不停机升级——遇到的问题 • 如何验证正确性? • 确认Transaction
ID • 确认Block数量 • 暂停时间用在哪里? • 等待主NameNode退出 • 副NameNode读取剩余记录 • 副NameNode等待Block报告
12.
HDFS节省存储空间
13.
节省存储空间——―RAID‖ Reed Solomon校正码
容忍2个丢失的备份,需要3倍空间 1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10 容忍4个丢失的备份,需要1.4倍空间 1 2 3 4 5 6 7 8 9 10 Source blocks P1 P2 P3 P4 Parity blocks
14.
节省存储空间——―RAID‖ 运维中遇到的问题 • “Decommission”:一台机器存储TB级别的数据,需要多长时间全
部复制到别的机器? • 数据重建:如果一台机器完全失效,需要多少系统资源重建TB级别 的数据? 需要在不更换机器的情况下更换硬盘! • 文件太小?定期将旧数据合并成大文件 • 无法直接生成RAID文件,需再次扫描数据生成校验数据 • 随机读数据重建:线程模型影响性能
15.
HDFS性能和可靠性
16.
提高随机读数据的吞吐量 ―Inline Checksum‖
… … 头信息 … … … …
17.
数据读写的稳定性 读写稳定性 • 调整DataNode的锁(FSDataset.lock): • 不必要的操作不加锁 •
尽量将I/O操作移到锁外 • 修补写操作容错的bug • 改进写操作的超时检测
18.
HBase的新特性
19.
Hbase的层次存储
应用程序缓存 应用程序管理 HBase HBlock缓存 Hbase管理 操作系统的HDFS文件缓存 操作系统管理的 HDFS数据文件 在磁盘上的HDFS文件
20.
改进容错 交换机重启 • 交换机重启只需几分钟,我们不希望region server等待 •
修复使region server过快自动退出的一些路径 • Master智能检测是某一region server失效还是交换机重启,以此 决定超时的时间 • 保证交换机重启后立刻恢复运行
21.
数据编码
• more KVs per block in cache • on-disk savings too • seeking done on encoded format • pluggable framework KV1,KV2,KV3,KV4 KV5,KV6,KV7,KV8 KV1,KV2,KV3,KV4, KV9,KV10,KV11,KV1 Block Cache KV5,KV6,KV7,KV8. 2, KV13,KV14,KV15,KV 16 1.1x – 5x savings Uncompressed, But Encoded Blocks Uncompressed Blocks DataBlockEncoding e.g. PrefixCompression, Fast_Diff, etc. File1 File2 File1 File2 On Disk 1.1x – 2x savings Encoded + Compressed HFiles Compressed HFiles
22.
针对Hbase的数据块放置算法 Region #1
Blocks Pros: Region #2 Blocks • locality-aware ―region‖ load-balancing/failover • avoids network spikes on server failures Region #3 Blocks • facilitates ―smooth‖ cluster expansion 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 4 1 1 1 1 2 2 2 2 3 3 3 3 3 4 4 4 4 1 1 1 1 2 2 2 3 3 3 4 4 4 4 4
23.
其他改进简述 •
可靠性 • 重写Master故障转移代码 • 加速region重新分配 • RPC优化 • 批量删除优化 • Per-request profiling • 客户端优化
Descargar ahora