运维监控中心调研报告

运维监控中心调研报告

问:如何做好运维监控?
  1. 答:现在大势所趋的AIOps智能运维对于现在的传统监控工具就起到很好的赋能作用。
    对于已经构建集中监控的企业,新建立的AIOps智能告警系统可以和既有的系统协同工作,这里会有一个并存的过程;在第二阶段,就可以随着智能监控的日益成熟逐步完成转型,也就是将主要的工作舞台迁移到智能集中监控系统;
    对于还未构建集中监控的企业,完全可以换道超车,直接建立具备智能运维能力的集中监控系统。
    我们下面以擎创科启哗技的夏洛克AIOps告警辨析中心为例,来展开分析这种AI赋能的几种方式:
    1. 对既有的完全基于经验早如进行规则梳理的处理方式的智慧赋能
    夏洛克AIOps首先可以通过算法甄别重复性、相似性、相关性事件来进行告警事件的自动化抑制,从而使运维人员无须费心费力总结这些规则就能够达到很高的降噪压缩比,而同时,既有的规则仍然可以同时运行,因此夏洛克AIOps能够有效结合机器学习的洞察能力和既有运维经验所梳理的规则,充分提升了告警质量。
    2. 对事件的精细化分析能力的智慧赋能
    仅仅是在告警处理时降低噪声是远远不够的,传统监控往往是败在告警的分析能力不足上,看似监控是实时性更重要,但对于已发生的事件是否能进行有效的分析,直接关系到未来类似事件的处理能力是否能够提升,这一点往往在管理上重视度不够,任悄睁行何事件发生,都应该以这样一种管理思路去分析。
    3. 通过建立人工和智能相融合的迭代反馈机制促使监控持续优化
    人不是万能的,有其局限性,但AI同样也有其局限性。因此关键在于如何利用AI的洞察力结合人的经验迭代反馈。在夏洛克AIOps告警辨析中心,告警的处理机制就是人机融合的典型例证。
  2. 答:监控的目的就是防患于未然。
    通过监控,运维人员能够及时了解到企业网络的运行状态。一旦出现安全隐患,可以及时预警或者是以其他方式通知运维人员,让运维监控人员有时间处理判盯和解决,避免影响业务系统的正常使用,将一切问题的根源扼杀在摇篮当中。现在的监控工具可以在监控指标触发时,自动修复一些故障,慎或但是它最多掘孝和帮你做些简单的自动化任务,更高阶的自动化任务需要运维人员具备较深的脚本和系统知识。
    从事运维要随时升级自己的技术知识,了解云计算、大数据、AI、自动化运维、智能运维等新技术趋势是很有必要的。比如现在有不少运维转型做云计算IT运维,就需要掌握云产品、云技术、云管理。但是万变不离其宗,运维最重要的工作就是维护系统的稳定性。最后,熟悉运用各种提高运维效率的工具辅助工作,云资源费用管理、安全管理、监控等,都需要耗费不少精力和时间。
    可以下一个App叫王教授,绑定云账号,会自动检测各项指标运行情况,个人觉得现在是比较好用的一款运维支持工具App。运维监控不是一朝一夕,以上只是个人总结的一点经验,希望可以帮到你。
问:如何提高生产安全视频监控运维工作
  1. 答: 
    1、理顺管理体制,落实管理责任
     
    围绕“党政领导、综治牵头、公安负责、部门配合、社会参与”的工作目标,积极探索完善公共安全视频监控安全运维管理的新模式,推进公共安全视频监控运维管理工作的规范化,进一步完善各级视频监控管理组织机构,实行统一归口管理,全面负责视频监控的发展规划、选型采购、管理维护、应用创新等项工作,明晰事权、明确责任,保障公共安全视频监控管理工作逐步走向规范化管理轨道。握尘
     
    2、健全工作机制,保障良性运行
     
      从加强制度建设入手,健全管理规范。把视频监控运维管理工作纳入队伍正规划管理工作,紧密结合实际,研制一套科学合理、系统全面、操作性强的管理规章,明确各级部门相应的管理内容和标准,实施目标管理。
     
      推行视频监控管理责任制。按照“谁使用谁管理,谁主管谁负责哗皮闭”的原则,各单位设置视频监控系统管理员,实行专人专管,进一步区分、细化管理内容,明晰各级管理人员的责任分工,从根本上解决“谁来管、管什么”的问题,真正将公共安全视频监控系统管理工作落到实处。
     
    3、加强科技创新,提高运维效能
     
      严格遵循国家标准、行业标准和公安部制定的技术要求与规范开展建设管理,注重其实用性、适宜性和可操作性,坚决防止重建设轻运维、重数量轻质量的问题。
     
      升级运维平台,逐步提高运维平台的科技含量,实现视频监控运维管理智能化,提高运维效能,构建乱裂稳定可靠、功能强大的公共安全视频监控安全运维管理体系
  2. 答:统一监控平台,说到底本质上也是一个监控系统,碧侍迟监控的基本能力是必不可少的,回归到监控的本质,先梳理下整个监控体系:
    ① 监控系统的本质是通过发现故障、解决故障、预防故障来为了保障业务的稳定。
    ② 监控体系一般来说包括数据采集、数据检测、告警管理、故障管理、视图管理和监控管理6大模块。而数据悔李采集、数据检测和告警处理是监控的最小闭环,但如果想要真正把监控系统做好,那故障谈弊管理闭环、视图管理、监控管理的模块也缺一不可。
问:如何做好运维工作
  1. 答:提起数据运维,大部启缺拍分人的第一印象都是:
    运维=修电脑+接网线+连监控+打扫机房卫生+背锅
    其实这都是圈外人对运维的刻板印象,无论你是个刚入职没几个月的行业新人,还是在行业里摸爬打滚了好几年的“老鸟”。
    你都面对着同样残酷的一个现实:这是一个悄羡高速发展的行业,任何肚子里没有实货的技术人员都会被这个圈子所淘汰。
    但任何一种职业,没有学习能力都会被落在后面。
    IT行扮袭业永远都是流行技术为王,假如你面对不断涌现的新技术、新框架没有学习欲望,一直将自己技术停留在5年前,你不但眼下不太可能拿到高薪,将来也不会。
    在这样一个快速变化的时代,只有不断地学习才不会被抛弃。
    因此,如果想让自己的工资不断攀升,就要不断学习,可从以下几方面入手:
    找准职业定位,步步进阶
    保持学习能力,厚积薄发
    保持技术热情,制定学习计划
    提升个人综合素质能力
运维监控中心调研报告
下载Doc文档

猜你喜欢