夏洛克·福尔摩斯,一直以来柯南道尔笔下的福尔摩斯形象在人们的脑海中都栩栩如生。敏锐的观察力,缜密的推理思路,丰富的专业知识,一切扑朔迷离的刑事案件在他手中都能迎刃而解,一切的竞争对手在他面前都如此的黯然失色。他有一双能够看穿世界的眼睛,被他关注的人都好像身体上被安装了监控,所有的行动他都了如指掌。在福尔摩斯的领域中,任何的异动都掌握在他的手中,并且这些异动信息会第一时间到达他的手中。福尔摩斯教会了我们,善于使用工具,能够让工作事半功倍。 《血字的研究》一案中,一把直尺,一个放大镜等等都成为了破案的重要工具,一群野孩子提供的信息的效率远远高于警方所能提供的信息。再加上福尔摩斯全面的专业知识,最终将谜题解开。 如何利用简单实用的工具,再加上过硬的专业知识找到事实的真相呢?又如何成为运维界的福尔摩斯呢?运维的基本工作就是保障公司网站服务的可用性,服务器运行的稳定性。那么如何对网站可用性、对服务器的运行状态了如指掌?出现问题如何能够接收到精准的告警消息呢? 请 mark 下面三款工具: Ct (Cloud Test) 主要是通过分布在全国各地的服务器对网站进行持续的监控,Ct 产品的价值在于网站管理员可以借此在终端用户或顾客发现问题之前发现问题,知道网站或 web 应用是否运行缓慢,甚至宕机。Ct 产品不涉及真实的网站流量,因此可以实现 7x24 小时的监控,或在正式发布 web 应用之前进行测试。通过 Ct 产品可以实时的了解网站在各个地域,运营商的性能表现,结合真实用户监控产品 Browser Insight,能深入了解应用的健康状况。 通过 Cloud Test,你可以:
既然有了实时的网站可用性监控,那么对服务器的基础组件监控需求也是必不可少的。我推荐一些还在观望 Zabbix 和 Nagios 的初创团队,可以试一试 Cloud Insight。 Ci(Cloud Insight) 集监控、管理、协作、计算、可视化于一身,减少在系统监控上的人力和时间成本投入,让运维工作变得更加高效、简单。使用 Cloud Insight 操作简单,40s完成安装,再配置上数据库中间件监控即可,其它的就直接在 Web 上查看,操作。
有了强大的监控工具还不够,完善的报警通知体系也是至关重要的。OneAlert 作为国内首家云告警平台,能够轻松集成 Ct,Ci 产品,提供更合理的告警方式(当然 zabbix,nagios,阿里云等监控工具都可以集成)。 通过 OneAlert ,你可以: 合理的通知体系:
合适的时间选择合适的通知方式:
健全的告警分析体系:
从 Ct 对网站可用性的实时监控,再到 Ci 对服务器基础组件的实时监控,出现问题有 OneAlert 健全的报警机制,通知必达,网站服务有问题及时监控发现,告警消息多方式通知到位,服务器这点小事,你还怕什么?总有一款适合你。 本文转自 OneAPM 官方博客 |
|