择维士服务性能监控(SPM):Why & How
-
择维士在其数象智云中推出了服务性能监控,简称SPM(Service Performance Monitoring), 很多客户对这个新出现的概念都很迷惑:到底什么是SPM?它和传统的APM,NPM,DEM,ITIM等之类的监控服务又什么区别?我们为什么需要一个全新的SPM?
这篇文章将帮助客户理解择维士数象智云SPM的概念和使用场景,帮助客户回答上述问题。
什么是服务性能监控
要了解服务性能监控,我们需要对现在的监控做个初步的了解及分类。从我们的公司及产品简介中可见,监控是一个复杂且专业的领域;一个监控系统涉及到与不同的数据源打交道(数据采集),需要对从数据源获取的数据做各种计算处理(数据整理与归集),需要对它们做保存以备查询和展示(数据存储、数据查询,数据展示),并实时对数据中的异常进行侦测和通知(告警通知);此外为了让数据发挥更大的作用,监控系统往往还需要集成各种大数据处理能力和人工智能处理能力,用于更智能的异常探测,模式识别及趋势预测等等,帮助用户更好的维护或改进自身业务。
按照用户使用场景和采集数据的特征,目前市面上常见的监控产品可以大致分为一下几类:
- 业务数据监控(BI):通过采集各种业务关键指标,方便用户了解业务状况并进行业务决策。
- 应用性能监控(APM):一般通过注入方式获得应用运行状况的详细指标,方便用户定位问题或优化应用。
- 网络性能监控(NPM):通过标准或私有的网络协议或接口对网络使用和流量进行监测,以便用户了解网络性能和状况,对网络进行管理或优化等。
- IT基础设施监控(ITIM):通过标准或私有接口对企业IT基础设施及其上运行的操作系统及基础服务采集性能数据,便于用户了解系统瓶颈,定位系统问题及资源优化与扩展等。
- 日志事件监控(包括IAM、SIEM等):这类监控产品一般与上面产品有较大差异,它通过采集无结构或半结构化的文本、事件数据,用来辅助问题定位(如应用日志)或完成特定任务(如安全管理、安全漏洞探测等)
无论哪一类产品,它们往往具有如下问题:
- 使用成本很高或较高:由于监控的专业性和复杂性,用户往往需要供应商进行定制或拥有较专业的运维团队才能正确使用。
- 面向功能单一:每一类产品都尝试解决特定类型问题,在真实的应用场景中意味着用户需要同时拥有有多个产品才能满足使用需求,从而间接提升了用户使用难度和成本。
- 与业务系统的割裂:一些产品(如APM)需要对系统进行注入,这对用户的老旧系统来说会是一个巨大的挑战;此外这些产品往往独立于企业业务系统,让企业客户无法完全拥有监控或拥有成本较高。
- 不合理的监测角度和抽象:企业越来越多的功能通过服务暴露给企业客户或合作伙伴,但现有产品往往是站在内部,从开发人员或运维人员的角度来监测系统,导致普通客户,尤其是中小企业客户很难对自身服务有个全面综合的了解,无法充分发挥监控系统的作用和价值。
正是基于上述问题,择维士在数象智云中提出了首个正真真意义上面向服务的监控解决方案,即择维士数象智云***服务性能监控***(Service Performance Monitoring,简称SPM)。择维士数象智云服务性能监控让企业客户能:
- 无需安装任何插件或组件,快捷方便的将自己的重要企业服务纳入监控
- 可全方位对服务的可用性,可靠性及性能进行监测
- 可从多位置模拟不同类型设备对企业服务的访问,让企业能直观感受客户使用其服务的体验
- 能对服务所提供的核心业务进行探测和巡检,及时发现问题以避免影响客户体验和使用
- 可帮助客户对其服务的服务等级协议(SLA)进行管理和监测,避免违背服务水平协议,保障客户权益
- 结合数象智云一揽子监控解决方案,完全监控,企业客户可以全方位无死角完成整个业务系统的监控,进一步简化系统运维。
下图可以直观的看出择维士服务性能监控和其它监控产品的定位和区别。
服务性能监控要解决的问题
和所有的监控产品一样,择维士提出数象智云服务性能监控(SPM)是为了帮助企业客户解决特定的问题。如前所述,在数字化,服务逐步成为企业对外输出信息和产品的最重要,甚至是唯一的方式。然而,企业服务除了保证提供特定业务功能外,还需要关注并解决诸多问题,如
- 访问服务的域名系统是否稳定正常(地址是否可达)
- 提供服务访问的网络是否随时畅通(链路是否可用)
- 服务传输的数据信息是否安全可靠(内容是否安全)
- 服务功能发布或更新是否正确完整(维护是否无感)
- 等等。
此外,在排除掉各种技术问题之后,企业还需了解自身服务给其客户的体验,体现为
- 服务能否快速获取(如网站加载时间)
- 服务是否可靠可用(如请求成功率的变化)
- 服务功能是否完整(如异常访问的保护、核心功能的可用性)
- 等等
面对如此复杂的问题,一般中小型企业只能完全依赖自身服务供应商(如IDC或云主机提供商,从而对自身服务的状态无感)或依靠市面上现有的产品或工具(如一些云拨测产品或网站监测工具)部分的了解自身服务的状态或功能(如是否可用,简单的网络速度等)。
随着择维士SPM的推出,客户可以用一个产品来全方位从外部了解自身服务的状态和性能:
- 服务的各项访问技术性能指标:如域名解析,访问速度,加载速度等
- 服务的网络安全状况:如预防域名劫持,证书安全及实效性检测等等
- 服务的用户访问体验:模拟真实客户的访问,了解客户使用服务的体验状况
- 服务的功能巡检和保障:及时发现系统功能的变化,甚至其细微的性能参数变化,确保服务各项功能可用可靠
- 服务的用户等级协议(SLA):基于对服务的外部全面监测,可以帮助客户管理、保证服务等级协议
此外,择维士SPM还具备强大的定制能力,让企业客户能根据自身的业务需要进行各种灵活的功能扩展、自定义监测点等。如想进一步了解择维士服务性能监控,可马上免费试用并获得帮助!
最后需要再次强调的是,择维士SPM是站在企业外部用户和企业管理、运维人员的角度监测企业服务,它并不能从内部理解和感知企业服务状态;如果企业客户需要更全面的内部服务监测能力,则客户直接使用择维士数象智云所提供的完全监控服务。