分享

我与阿里云的一千零一夜-007-当好水手和舵手(其二)

 偏扁豆 2021-11-17

0x0 前言

一旦我们有了不受控的自动机械或者程序,我们想到的第一件事就是:

监控它。

0x1 关于监控

监控是运维人员做的最多的事情,可以说7*24小时不是在监控就是在处置监控过程中的问题。

云时代能够给我们提供的最显著作用就是无处不在的监控。

阿里云服务器你想监控它,监控上面的程序,监控上面的容器该怎么做呢?

服务器层面:

1、通过阿里云控制台,在Web端或者是APP端,web端监控内容十分丰富。(其实这也是依赖内置于虚拟机的agent达到的效果)


2、通过远程SSH登录,自己登录服务器,使用top或者是docker top <hash_id>命令自行查看系统状态,当然可选的命令有很多。

freedf vmstatlsofnetstatiostat

如果遇到复杂问题,那必须动用一些非常规的监控手段,比如抓包。

这里列出经典的一图流Linux性能工具图。


3、使用统一监控平台,例如zabbix、prometheus、nagios等。他们一般可以采用agent,snmp,模拟人登录使用第2点里的命令,访问平台接口等,达成监控的目的。

统一监控平台的目的就是便于企业分层管理,实现运维与开发的独立,降低企业成本,个人使用也能够感受到统一监控平台对于监控可视化、多厂商集成监控、混合计算设备监控的巨大作用。


当然,越来越多的云服务厂商正将统一监控平台移入他们的控制台,也借用这些统一监控平台的思想和技术,实现统一纳管。

0x2 小结

对于开发者而言,熟练使用各类监控工具是十分必要的。

人无完人,发现问题解决问题才是人强大的魂。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多