分享

农业银行:研发运营一体化下的数字化IT运营的实践与思考

 东奔西跑5099 2019-12-12

作者: 徐佳琦

      当前,行业数字化转型需求让运维变革迫在眉睫,运维逐渐从零散、人肉方式走向自动化、数字化运维,并不断向运营延伸,联动研发、测试形成研发运营一体化(DevOps)的产品研发闭环。因此,在研发运营一体化的大背景下,探索实践数字化运营十分必要。
      数字化时代是数据为王的时代,运维场景下的数字化运营,即通过对运维数据的自动化采集、建模处理,以及对人工智能、机器学习算法等大数据技术的应用,实现对运营数据的有效利用。从而帮助运维从局部的抽样管理向全局性的整体管理、从事件驱动的因果型管理向兼容性强的相关联性管理、从被动式过程管理向主动的预测管理进行转变。
       对此,我们依托研发中心研发运营一体化机制及智能化运维平台建设基础,在数字化运营方面做了一些探索,并就这方面的问题挑战和发展方向进行了一些思考。
      从行业运维领域数字化运营的实践来看,我们在研发运营一体化下深入探索数字化运营及其应用,需要努力突破以下障碍的制约:
 团队数字化意识待增强
1
     当前应用运维正在经历从“活着”向“活得好”的蜕变升级,我们亟需主动转变,从“人肉式操作运维”走向“运维开发型运营”,从“被动救火式”走向“主动运营”,依靠数字化运营实现提升应用运维管理质效。
现有数据价值驱动力待提升
2
     海量运维数据存在大量的信息孤岛,无法“一口对外”式的迅速整合数据信息资源,运维数据价值很难为业务发展提供强驱动力;现有的数据应用场景,多为问题驱动的统计分析类应用,无法满足日益复杂的对智能化要求越来越高的运维分析场景需要。

运维服务质量待升级

3
     金融变革推动下,业务需求迭代加速,需要配以更高的应用交付速率、也要求系统配以更优秀的高并发处理能力,如何实现科技资源的“自助”按需分配、提升“自动”部署效力、让日常运维操作“固化”到流程中去,这都对运维服务的数字化能力提出了高要求。
      今年,研发中心结合业界优秀实践和DevOps相关配套制度,形成了研发中心推进研发运营一体化的工作方案,结合应用运维自动化建设工作实际,我们认为开展数字化运营应着力推动以下三个方面:
1.主动精细化方向发展

      从星星之火到全面开花,研发运营一体化变革一路走来,数字化运营已深刻融入其中。从研发运营一体化(DevOps)落地实施进程来看,需要将研发运营一体化理念聚焦到数字化运营上,在实现各流程之间的互联互通、信息共享、组织联动的同时,流程中的专业化分工驱动运维数据主动建模分析、操作运维驱动运维开发,将数字化根植到日常工作中,从而降低运维成本、提升运维质量与效率。

2.运营可视化方向发展

      研发运营一体化的引入让运维逐渐成为业务发展的助手,透过运维数据先于业务洞察用户,实现主动经营之道。依托一体化生产运维平台体系,搭建可以深入挖掘数据价值、支持运维转型的数据分析体系,让海量运维数据通过平台输出价值。可视化的运营之道可以让我们快速捕捉到系统运行态势,获取拟合预测和辅助决策信息,解决生产稳定、IT资源效率、技术革新和用户体验等多方面诉求,数字化辅助经营与管理,实现传统运维在数字化进程中的同步转型。

3.运维智能化方向发展

      应用运维的角色在行业数字化转型的大浪潮下,正在发生根本性转变,从默默无闻的支撑者变成业务运行不可或缺的赋能者。而智能运维(AIOps)作为AI、大数据技术与IT运维融合的产物,也成为传统企业数字化转型的必然选择。基于此,加大运维数据化、运营数字化建设为智能运维提供数据依据、数据计算能力,为原有的运维监控、管理平台和自动化运维产品赋能,实现运维操作的感知、决策、执行闭环,“无人值守”不再遥不可及。

      围绕研发运营一体化,运维平台建设团队着力探索数字化运营,主要体现在“三个赋能”:

管理赋能,推动运维工作升级

1
      管理赋能,让应用运维从被动救火式运维走向主动精细化运营。
      一是构建立体化的运营机制,打造用户优化意见到形成需求落地实施的运营闭环。在运维平台中,用户可以通过平台首页“意见反馈”入口、谛听发布工单、回声发帖等线上渠道,专题交流、用户访谈、问卷调查等线下方式向平台运营团队提出意见与建议。而平台运营团队则主动站在用户视角想问题,限定时间内反馈意见并提炼形成优化需求落地实施,以开放的姿态倾听来自用户的不同声音,形成了运营的正向反馈。
      二是建立健全运营工作体系,打造运营管理生态圈。首先树立标准先行的指导思想,在做好运营工作整体规划的同时,努力营造数据意识全员化,让建设团队的每一个成员都去主动关注产品体验,不局限于“产品好用”;研究各应用运维自动化工具模块数字化运营场景,量身定制数据分析模型,通过运营指标的动态计算,了解并分析运营指标的升降,不断促进平台各模块产品提质增效。

科技赋能,探索运维向运营转型

2
       数字化转型的核心是数据的高效利用,而数据技术正是数字化运营的核心动力。在这里,数据技术包括对数据的管理和应用。
      一是集成运维数据资源,搭建具有商业银行本地特色的运维数据集市,结构化应用运维领域一切数据,连接一切系统多源数据,数据驱动业务。
      二是挖掘数据价值,自动化规范采集运维各专业数据,逐步建立健全运营指标体系,让多元运维数据在其中互为价值、和谐共存、共同驱动应用运维健康发展。
      三是面向特定运维场景,建立运维数据模型,构建数据驱动、面向场景的智能化运维服务组件,揭示生产运维和对客服务的现象和规律,实现运维领域的数字化运营。

平台赋能,推进运维全面化保障

3
     应用运维以服务为中心,通过数字化手段建立“全面覆盖、主动运维、智能高效”的研发运营一体化运维平台,正是提供运维全面化保障的必备利器。
      一是多维数据透过平台形成合力,通过自动化、大数据、机器学习等AI技术,盘活日志、指标等类别的运维观察数据,以及事件单、变更单等运维记录数据,以实现异常检测、故障定位等智能运维场景。
      二是各专业和流程通过平台实现有序串联,让运维活动通过平台数字化、标准化、规范化,在统一的运维平台架构下实现协作共赢。
     后续,应用支持团队可以在行内一体化生产运维平台建设思路的指引下,开展应用运维领域数字化运营的场景探索。尝试基于高效可靠大数据技术,形成面向运维场景的、集应用数据接入、处理、分析为一体的运营数据分析组件与服务。
1
知识图谱助力数字化运营
     在应用运维领域,可以对来自监控、日志等渠道的运维数据通过数据提取、关联和融合等流程,构建领域性知识图谱,通过数据处理技术和机器学习算法进行技术抽象化。构建完整的知识图谱,在海量数据赋能时,可以应用到系统链路画像、告警智能分类、故障定位等智能运维场景中。
2
日志离线分析辅助实现智能运维
     在应用运维过程中,逐渐积累出包括交易日志、应用日志、系统日志、运维日志及网络日志等类别的海量日志数据,基于离线日志开展基于文本的聚类分析,可以辅助实现智能运维:一是能够帮助系统快速定位到故障,对多类日志进行特征提取,结合监控指标建立预测模型,可以帮助系统实时故障检测。二是反哺到自动化运维平台中来,通过对应用运维自动化工具健康检查日志进行信息汇聚、特征提取,监测工具运行健康情况、业务使用情况、异常故障频率等,完善自身系统,可以为应用运维自动化工作提供运营决策支持。
     随着数字化转型的车轮滚滚向前,无论是研发还是运维都在不断革新,主动走出舒适区,不仅要让系统“活着”,而且要“活得好”、“活得精彩”。研发运营一体化机制下,应用运维数字化运营已经在路上,我们将顺应数字化转型的浪潮,与各领域同仁一起,齐心协力、精益求精,不断探索实践数字化运营,为业务发展提供更强的数字支撑。

(来自:我们的开心)


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多