SlideShare a Scribd company logo
1 of 16
基于波动贡献度的多维监测指标异常定位
--bocoiops 亿阳信通 技术架构部
1 团队介绍及竞赛成绩
目 录
4 总结与展望
2 挑战及应对方案
3 详细方案
1 团队介绍与竞赛成绩
陈晓峰 总体设计 亿阳信通CTO
北京邮电大学 硕士 计算机应用
李 杰 数据分析 AI架构师
2007年 国防科技大学 硕士 软件工程
崔世彬 数据分析、算法设计与实现 数据架构师
2004年 吉林大学 硕士 软件工程
于海鹏 数据分析、算法设计 AI算法工程师
2017年 北京科技大学 硕士 控制科学与工程
亿阳信通
成立于1995年,是国家科技部首批认定的全国重点高新技
术企业和全国创新型企业,主要从事OSS系统、企业IT运
营支撑系统、信息安全等方面的行业应用软件开发、解决
方案提供和技术服务。经过二十多年的自主创新和技术积
累,已发展为中国最大的应用软件开发商和行业解决方案
提供商之一,在OSS领域居于龙头地位,解决方案和市场
占有率均排名第一
技术架构部
作为公司技术核心部门,主要有以下职责:
1. 研究行业最新技术发展趋势,规划公司技术发展路线
2. 制定和实施公司重大技术决策和技术方案
3. 负责新技术的预研、创新及在试点产品中的落地、推广
4. 对各事业部项目中的关键问题和技术难题提供技术保障
目前,主导的云化架构,大数据方案及多款AIOps产品:
故障预测、告警关联、根因分析等均已在运营商多省成功
实施
1 团队介绍与竞赛成绩
队伍名称:bocoiops
预赛成绩: 0.9401 预赛排名:1
决赛成绩: 0.9593 决赛排名:1
不同数据集,算法表现稳定一致,泛化能力强
0.9401
0.9593
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
预赛
决赛
竞赛得分
分数
1 团队介绍及竞赛成绩
目 录
4 总结与展望
2 挑战及应对方案
3 详细方案
2 挑战及应对方案
数据过滤:筛选有价值数据
波动评价:提高评价函数的敏感性
预测算法:多种预测策略比较,选最佳方案。
搜索算法:数据层级多,结构复杂,重合度高
计算
效率
定位
精度
2 挑战及应对方案
挑战1:现有的评价函数不适合:异常表现有上升有下降,父子根因区分困难
方案1:参考Revenue debugging in advertising systems中的Surprise值
对波动特征的表达弱
方案2:参考KL散度
对数值下降的波动特征表达不明显
方案3:波动贡献度(Fluctuation Contribution)
提出了一个波动贡献度FC的概念和公式
1、更好地表达了指标下降趋势的特征
2、满足父子根因判定
2 挑战及应对方案
挑战2:数据预测:计算波动值时,必须要有该时间点的预测值。
方案:使用加权均值方式
N和权重使用超参搜索方法得到
同周期预测
LSTM预测
前N加权均值
2 挑战及应对方案
挑战3:计算数据量大,有异常数据,1分钟完成计算
数据集共4032个时间点,每个时间点组合累计:3175199
i e c p l
139 13 8 35 4
方案:根据奥卡姆剃刀原则进行数据过滤
经过异常数据处理、绝对差值贡献度过滤后,大幅降低数据计算量
原始数据
异常数据处理
解决unknown问题
绝对差值贡献
度过滤
滤掉大部分无价值点
根因判定
2 挑战及应对方案
• 将所有成员分组,得到参与根因判定的组
维度组合分组
• 组内相对差值过滤
• topN过滤
组内根因判定
• 汇总组成员的fc值,求max,得出根因
组间根因判定
优势:
1、降低搜索复杂度
2、快速区分父子根因
3、全量分组计算不易遗漏根因
挑战4:数据层级多,结构复杂,重合度高
方案:基于分组的两级根因定位算法
由于竞赛要求,一个时刻的异常根因只存在于同一个维度(或交叉维度中)
我们采用先按维度组合进行分组,再进行组内、组间两级根因判定的方案
1 团队介绍及竞赛成绩
目 录
4 总结与展望
2 挑战及应对方案
3 详细方案
3 详细方案-算法流程图
异常数据处理
数据预测
维度值汇聚
计算根因
输出结果
绝对差值贡献度过滤
维度分组
组内计算FC值
组内根因判定
组间根因判定
1 团队介绍及竞赛成绩
目 录
4 总结与展望
2 挑战及应对方案
3 详细方案
4 总结与展望
1、进一步提升数据预测准确性和泛化能力,达到工程应用的标准
2、考虑使用半监督学习、强化学习等算法,自动发现最优参数
3、用集成方法结合其他根因定位方法,提升定位准确度
参考资料
序号 参考文献 参考内容
1
R. Bhagwan, R. Kumar, and R. o.
Ramjee, “Adtributor: Revenue
debugging in advertising
systems,” NSDI, 2014, pp. 43–
55.
参考kl散度,衡量相关性
2
Q. Lin, J. Lou, H. Zhang, and D.
Zhang, “idice: problem
identification for emerging
issues,” ICSE, 2016, ACM,, pp.
214–224.
奥卡姆剃刀原则,数据剔除
3
Yongqian Sun, Youjian Zhao, Ya
su, et al., “HotSpot:Anomaly
Localization for Additive KPIs
withMulti-Dimensional
Attributes”, IEEE Access, 2018.
定义量化的指标,描述根因对KPI总量变化的影响
程度
Q & A

More Related Content

Similar to 第一名 1st Bocoiops

HR-012-如何成為職場達人
HR-012-如何成為職場達人HR-012-如何成為職場達人
HR-012-如何成為職場達人
handbook
 
功能演示 规划档案
功能演示 规划档案功能演示 规划档案
功能演示 规划档案
fairyzero
 
系列專題報導 廠商報導 泰富科技_技術導向專業至上
系列專題報導 廠商報導 泰富科技_技術導向專業至上系列專題報導 廠商報導 泰富科技_技術導向專業至上
系列專題報導 廠商報導 泰富科技_技術導向專業至上
jbcinvest
 
mix taiwan臺中智慧城市論壇 吳騰彥總經理 -智慧城市之眼 用科技打造未來生活圈
mix taiwan臺中智慧城市論壇 吳騰彥總經理 -智慧城市之眼 用科技打造未來生活圈mix taiwan臺中智慧城市論壇 吳騰彥總經理 -智慧城市之眼 用科技打造未來生活圈
mix taiwan臺中智慧城市論壇 吳騰彥總經理 -智慧城市之眼 用科技打造未來生活圈
Mix Taiwan
 
金蝶 Togaf 企业架构培训方案
金蝶 Togaf 企业架构培训方案金蝶 Togaf 企业架构培训方案
金蝶 Togaf 企业架构培训方案
pdffile
 
暨大資管 碩士班招生宣傳簡報
暨大資管 碩士班招生宣傳簡報暨大資管 碩士班招生宣傳簡報
暨大資管 碩士班招生宣傳簡報
b691124636
 
加速學習 LabVIEW 之十大密技
加速學習 LabVIEW 之十大密技加速學習 LabVIEW 之十大密技
加速學習 LabVIEW 之十大密技
sharkera
 

Similar to 第一名 1st Bocoiops (20)

文思业务介绍
文思业务介绍文思业务介绍
文思业务介绍
 
HR-012-如何成為職場達人
HR-012-如何成為職場達人HR-012-如何成為職場達人
HR-012-如何成為職場達人
 
長庚大學資訊工程學系簡介
長庚大學資訊工程學系簡介長庚大學資訊工程學系簡介
長庚大學資訊工程學系簡介
 
AOI智慧升級─AI訓練師在地養成計畫_台灣人工智慧學校
AOI智慧升級─AI訓練師在地養成計畫_台灣人工智慧學校AOI智慧升級─AI訓練師在地養成計畫_台灣人工智慧學校
AOI智慧升級─AI訓練師在地養成計畫_台灣人工智慧學校
 
数据采集中间件技术交流
数据采集中间件技术交流数据采集中间件技术交流
数据采集中间件技术交流
 
資料科學的第一堂課 Data Science Orientation
資料科學的第一堂課 Data Science Orientation資料科學的第一堂課 Data Science Orientation
資料科學的第一堂課 Data Science Orientation
 
功能演示 规划档案
功能演示 规划档案功能演示 规划档案
功能演示 规划档案
 
網頁爬蟲入門 Python web crawler at 淡江大學 20170930
網頁爬蟲入門 Python web crawler at 淡江大學 20170930網頁爬蟲入門 Python web crawler at 淡江大學 20170930
網頁爬蟲入門 Python web crawler at 淡江大學 20170930
 
心電圖的研究和實作
心電圖的研究和實作心電圖的研究和實作
心電圖的研究和實作
 
IT Management Framework Development
IT Management Framework DevelopmentIT Management Framework Development
IT Management Framework Development
 
吳鳳科技大學資訊工程系招生簡報
吳鳳科技大學資訊工程系招生簡報吳鳳科技大學資訊工程系招生簡報
吳鳳科技大學資訊工程系招生簡報
 
系列專題報導 廠商報導 泰富科技_技術導向專業至上
系列專題報導 廠商報導 泰富科技_技術導向專業至上系列專題報導 廠商報導 泰富科技_技術導向專業至上
系列專題報導 廠商報導 泰富科技_技術導向專業至上
 
mix taiwan臺中智慧城市論壇 吳騰彥總經理 -智慧城市之眼 用科技打造未來生活圈
mix taiwan臺中智慧城市論壇 吳騰彥總經理 -智慧城市之眼 用科技打造未來生活圈mix taiwan臺中智慧城市論壇 吳騰彥總經理 -智慧城市之眼 用科技打造未來生活圈
mix taiwan臺中智慧城市論壇 吳騰彥總經理 -智慧城市之眼 用科技打造未來生活圈
 
金蝶 Togaf 企业架构培训方案
金蝶 Togaf 企业架构培训方案金蝶 Togaf 企业架构培训方案
金蝶 Togaf 企业架构培训方案
 
Gdsz feb2011
Gdsz feb2011Gdsz feb2011
Gdsz feb2011
 
暨大資管 碩士班招生宣傳簡報
暨大資管 碩士班招生宣傳簡報暨大資管 碩士班招生宣傳簡報
暨大資管 碩士班招生宣傳簡報
 
What is data engineer?資料工程師是什麼?
What is data engineer?資料工程師是什麼?What is data engineer?資料工程師是什麼?
What is data engineer?資料工程師是什麼?
 
加速學習 LabVIEW 之十大密技
加速學習 LabVIEW 之十大密技加速學習 LabVIEW 之十大密技
加速學習 LabVIEW 之十大密技
 
加速學習 LabVIEW 之十大密技
加速學習 LabVIEW 之十大密技加速學習 LabVIEW 之十大密技
加速學習 LabVIEW 之十大密技
 
Data & AI Driven Digital Transformation
Data & AI Driven Digital TransformationData & AI Driven Digital Transformation
Data & AI Driven Digital Transformation
 

More from Leo Zhou

1.4 go在数据存储上面的应用—毛剑
1.4 go在数据存储上面的应用—毛剑1.4 go在数据存储上面的应用—毛剑
1.4 go在数据存储上面的应用—毛剑
Leo Zhou
 
1.2 刘奇 go在分布式数据库中的应用
1.2 刘奇 go在分布式数据库中的应用1.2 刘奇 go在分布式数据库中的应用
1.2 刘奇 go在分布式数据库中的应用
Leo Zhou
 
Protocol libraries the right way
Protocol libraries the right wayProtocol libraries the right way
Protocol libraries the right way
Leo Zhou
 
特卖场景下的大数据平台和机器学习实践
特卖场景下的大数据平台和机器学习实践特卖场景下的大数据平台和机器学习实践
特卖场景下的大数据平台和机器学习实践
Leo Zhou
 
The net is dark and full of terrors - James Bennett
The net is dark and full of terrors - James BennettThe net is dark and full of terrors - James Bennett
The net is dark and full of terrors - James Bennett
Leo Zhou
 

More from Leo Zhou (20)

第三名 3rd zhyict
第三名 3rd zhyict第三名 3rd zhyict
第三名 3rd zhyict
 
异常检测在苏宁的实践
异常检测在苏宁的实践异常检测在苏宁的实践
异常检测在苏宁的实践
 
第四名 4th H3C AI Institute
第四名 4th H3C AI Institute第四名 4th H3C AI Institute
第四名 4th H3C AI Institute
 
第六名 6th Aurora
第六名 6th Aurora第六名 6th Aurora
第六名 6th Aurora
 
AI使能网络自动驾驶 AI Building Autonomous Driving Network
AI使能网络自动驾驶 AI Building Autonomous Driving NetworkAI使能网络自动驾驶 AI Building Autonomous Driving Network
AI使能网络自动驾驶 AI Building Autonomous Driving Network
 
2.2 go在阿里云cdn系统的应用
2.2 go在阿里云cdn系统的应用2.2 go在阿里云cdn系统的应用
2.2 go在阿里云cdn系统的应用
 
1.6 米嘉 gobuildweb
1.6 米嘉 gobuildweb1.6 米嘉 gobuildweb
1.6 米嘉 gobuildweb
 
1.4 go在数据存储上面的应用—毛剑
1.4 go在数据存储上面的应用—毛剑1.4 go在数据存储上面的应用—毛剑
1.4 go在数据存储上面的应用—毛剑
 
1.2 刘奇 go在分布式数据库中的应用
1.2 刘奇 go在分布式数据库中的应用1.2 刘奇 go在分布式数据库中的应用
1.2 刘奇 go在分布式数据库中的应用
 
Protocol libraries the right way
Protocol libraries the right wayProtocol libraries the right way
Protocol libraries the right way
 
美团数据库运维平台介绍
美团数据库运维平台介绍美团数据库运维平台介绍
美团数据库运维平台介绍
 
特卖场景下的大数据平台和机器学习实践
特卖场景下的大数据平台和机器学习实践特卖场景下的大数据平台和机器学习实践
特卖场景下的大数据平台和机器学习实践
 
我的互联网运维理论与实践
我的互联网运维理论与实践我的互联网运维理论与实践
我的互联网运维理论与实践
 
如何选择 Docker 监控方案
如何选择 Docker 监控方案如何选择 Docker 监控方案
如何选择 Docker 监控方案
 
美团数据库运维平台介绍
美团数据库运维平台介绍美团数据库运维平台介绍
美团数据库运维平台介绍
 
The net is dark and full of terrors - James Bennett
The net is dark and full of terrors - James BennettThe net is dark and full of terrors - James Bennett
The net is dark and full of terrors - James Bennett
 
Hypothesis randomised testing for django
Hypothesis randomised testing for djangoHypothesis randomised testing for django
Hypothesis randomised testing for django
 
NoSQL@VIP — 唯品会NoSQL平台⾃动化发展及运维经验分享
NoSQL@VIP — 唯品会NoSQL平台⾃动化发展及运维经验分享NoSQL@VIP — 唯品会NoSQL平台⾃动化发展及运维经验分享
NoSQL@VIP — 唯品会NoSQL平台⾃动化发展及运维经验分享
 
动静态混合网站或 APP的CDN优化方法
动静态混合网站或 APP的CDN优化方法动静态混合网站或 APP的CDN优化方法
动静态混合网站或 APP的CDN优化方法
 
MySQL运维那些事
MySQL运维那些事 MySQL运维那些事
MySQL运维那些事
 

第一名 1st Bocoiops