SlideShare a Scribd company logo
Data Driven Ops 
@超⼤大杯摩卡星冰乐 
2014-11-08
Agenda 
• Ops/Biz Data in VIP 
• How to Debug 
• Maths-Driven Ops
Ops Data in VIP
What We have Done
2014 Hpocon 姚仁捷   唯品会 - data driven ops
2014 Hpocon 姚仁捷   唯品会 - data driven ops
What We are Doing now 
• Full Nginx Data Into HBase for searching
Metrics Layer 
• System:Linux 
• App:Java,PHP,tomcat… 
• Biz:things about Money…
数据可视化的重要性 
• 单⼀一的⼀一个数据点不说明任何意义 
• 数据的趋势才是我们需要关注的
2014 Hpocon 姚仁捷   唯品会 - data driven ops
• 皇上---------Boss 
• 太监说的事---------数据说明的问题
太监是什么?
太监是把裸露的枯燥的数据变 
成⽼老板愿意看的,能从中看出 
内容的⼯工具——数据可视化
How to Debug
⾼高性能意味着什么 
• ⼤大量服务器 
• 分布式系统 
• ⼤大量的错误
What is Maths 
• ⾼高中数学——解⽅方程,⼏几何 
• ⼤大学数学——微积分
⼀一道题 
• ⼩小明有⼀一天想测试⼀一下⾛走路快还是骑⾃自⾏行⻋车快。如果 
你是⼩小明,你怎么测试?
控制变量法
Rule: 
Changes makes issues
纵向,横向分析问题 
• 分布式集群中某个节点出了问题
横向 
• 出问题的节点和同⼀一个集群中其他节点⽐比较
纵向 
• 出问题的节点在出问题的时间点和之前有什么区别
⽐比较什么 
• Linux Metrics 
• App Metrics 
• Log⽇日志
怎么去看⽇日志 
• 出问题的时间点附近,有没有异常 
• 灵活使⽤用awk,sort,cut,uniq。。。
数学在容量规划上的⽤用 
处
• 这次⼤大促,要⽤用多⼤大的机器才能顶得住
解⼀一个⼀一元⼆二次⽅方程 
• f(x)=ax+b 
• f(1)=3 
• f(2)=4
类线性系统的容量预测 
• ⼤大促需要多少服务器,就是寻找服务器数量和流量之 
间的关系 
• 我们使⽤用线性模型进⾏行预测
为什么是线性模型
2014 Hpocon 姚仁捷   唯品会 - data driven ops
⺫⽬目标
2014 Hpocon 姚仁捷   唯品会 - data driven ops
原理 
• 最⼩小⼆二乘拟合 
• 对于线性模型,有现成公式套
2014 Hpocon 姚仁捷   唯品会 - data driven ops
2014 Hpocon 姚仁捷   唯品会 - data driven ops
⽤用途 
• 根据现有机器的运⾏行状况,去预测未来将要碰到的问 
题
智能化报警
• 当我们看到trend,⼈人类是怎么分辨是否出问题的? 
• 能不能⽤用计算机语⾔言来表⽰示? 
• 这就是报警条件 
• 如何⾃自动⽣生成报警条件
Etsy Kale 
• skyline:extendible algorithms automatically detect 
what it means for each metric to be anomalous 
• oculus:Once you’ve identified an interesting or 
anomalous metric, Oculus will find all of the other 
metrics in your systems which look similar.
2014 Hpocon 姚仁捷   唯品会 - data driven ops
2014 Hpocon 姚仁捷   唯品会 - data driven ops
Further 
• Andrew-NG在Cousera的课程——Machine Learning
回顾 
• 数据可视化重要性 
• 横向,纵向debug问题 
• 线性模型的容量规划 
• 智能报警
Q&A
Thanks all!

More Related Content

PDF
刘昌钰:阿里大数据应用平台
PDF
俞晨杰:Linked in大数据应用和azkaban
PDF
杨少华:阿里开放数据处理服务
PDF
Lvs在大规模网络环境下的应用pukong
PDF
2014 GITC 帶上數據去創業 talkingdata—高铎
PDF
HKIX Upgrade to 100Gbps-Based Two-Tier Architecture
PDF
Q con shanghai2013-[刘海锋]-[京东文件系统简介]
PDF
Cuda 6 performance_report
刘昌钰:阿里大数据应用平台
俞晨杰:Linked in大数据应用和azkaban
杨少华:阿里开放数据处理服务
Lvs在大规模网络环境下的应用pukong
2014 GITC 帶上數據去創業 talkingdata—高铎
HKIX Upgrade to 100Gbps-Based Two-Tier Architecture
Q con shanghai2013-[刘海锋]-[京东文件系统简介]
Cuda 6 performance_report

Similar to 2014 Hpocon 姚仁捷 唯品会 - data driven ops (20)

PDF
Data Analyse Black Horse - ClickHouse
PDF
ClickHouse北京Meetup ClickHouse Best Practice @Sina
PDF
唯品会大数据实践 Sacc pub
PPTX
淘宝双11双12案例分享
PDF
用Python实现hadoop任务调度管理
PDF
Greenplum技术
PDF
「大數據之路:阿里巴巴大數據實戰」 讀書心得
PDF
淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座
PDF
Hadoop con 2015 hadoop enables enterprise data lake
PDF
淘宝数据可视化[2010 SD2.0]
PDF
Big Data 101 一 一個充滿意圖與關聯世界的具體實現
PPTX
数据挖掘理论与实践
PDF
分布式流数据实时计算平台 Iprocess
PDF
张松国 腾讯微博架构介绍08
PDF
Se shang hai_04_cloudybi
PPTX
大型电商的数据服务的要点和难点
PDF
自助工具助Dba提升效率
PPTX
PPTX
從統計到資料科學
PPTX
How do we manage more than one thousand of Pegasus clusters - engine part
Data Analyse Black Horse - ClickHouse
ClickHouse北京Meetup ClickHouse Best Practice @Sina
唯品会大数据实践 Sacc pub
淘宝双11双12案例分享
用Python实现hadoop任务调度管理
Greenplum技术
「大數據之路:阿里巴巴大數據實戰」 讀書心得
淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座
Hadoop con 2015 hadoop enables enterprise data lake
淘宝数据可视化[2010 SD2.0]
Big Data 101 一 一個充滿意圖與關聯世界的具體實現
数据挖掘理论与实践
分布式流数据实时计算平台 Iprocess
张松国 腾讯微博架构介绍08
Se shang hai_04_cloudybi
大型电商的数据服务的要点和难点
自助工具助Dba提升效率
從統計到資料科學
How do we manage more than one thousand of Pegasus clusters - engine part
Ad

More from Michael Zhang (20)

PPTX
廣告系統在Docker/Mesos上的可靠性實踐
PDF
Fastsocket Linxiaofeng
PPTX
Spark sql meetup
PDF
2014 Hpocon 李志刚 1号店 - puppet在1号店的实践
PDF
2014 Hpocon 高驰涛 云智慧 - apm在高性能架构中的应用
PDF
2014 Hpocon 黄慧攀 upyun - 平台架构的服务监控
PDF
2014 Hpocon 吴磊 ucloud - 由点到面 提升公有云服务可用性
PDF
2014 Hpocon 周辉 大众点评 - 大众点评混合开发模式下的加速尝试
PPTX
The Data Center and Hadoop
PDF
Hadoop Hardware @Twitter: Size does matter.
PDF
Q con shanghai2013-[ben lavender]-[long-distance relationships with robots]
PDF
Q con shanghai2013-[韩军]-[超大型电商系统架构解密]
PDF
Q con shanghai2013-[jains krums]-[real-time-delivery-archiecture]
PDF
Q con shanghai2013-[黄舒泉]-[intel it openstack practice]
PDF
Q con shanghai2013-罗婷-performance methodology
PDF
Q con shanghai2013-赵永明-ats与cdn实践
PDF
Q con shanghai2013- 荣先乾-qzone_touch跨终端优化_v2.0
PDF
Q con shanghai2013-黄慧攀-又拍云cdn技术探秘
PDF
Hive tuning
PDF
Jedex stec DRAM Module Market Overview
廣告系統在Docker/Mesos上的可靠性實踐
Fastsocket Linxiaofeng
Spark sql meetup
2014 Hpocon 李志刚 1号店 - puppet在1号店的实践
2014 Hpocon 高驰涛 云智慧 - apm在高性能架构中的应用
2014 Hpocon 黄慧攀 upyun - 平台架构的服务监控
2014 Hpocon 吴磊 ucloud - 由点到面 提升公有云服务可用性
2014 Hpocon 周辉 大众点评 - 大众点评混合开发模式下的加速尝试
The Data Center and Hadoop
Hadoop Hardware @Twitter: Size does matter.
Q con shanghai2013-[ben lavender]-[long-distance relationships with robots]
Q con shanghai2013-[韩军]-[超大型电商系统架构解密]
Q con shanghai2013-[jains krums]-[real-time-delivery-archiecture]
Q con shanghai2013-[黄舒泉]-[intel it openstack practice]
Q con shanghai2013-罗婷-performance methodology
Q con shanghai2013-赵永明-ats与cdn实践
Q con shanghai2013- 荣先乾-qzone_touch跨终端优化_v2.0
Q con shanghai2013-黄慧攀-又拍云cdn技术探秘
Hive tuning
Jedex stec DRAM Module Market Overview
Ad

2014 Hpocon 姚仁捷 唯品会 - data driven ops