系统运维遇上了大救星,是什么让IT效率提高48%

在企业信息化建设的过程中我们经常会遇到以下场景:

场景一 无法整体感知使用情况

领导:帆软的报表系统上线这么长时间了,不知道咱们是不是真正用起来了啊?平时大概有多少人能用到?访问频次怎么样?花大量人力开发的那些模板有多少用起来了?

业务人员:这个......之前还没统计过,我去查一下,也许后台会有这些数据的......

场景二 无法前置暴露性能问题

领导:现在我们报表系统内存怎么样?够不够用?CPU整体什么水平?需要换个性能更优的CPU吗?

业务人员:额,总体上应该是够的吧,好像偶尔会内存较高、CPU持续暴涨,之后我们记录下这些情况呢......

领导:现在报表有没有什么明显问题,都是新招的年轻人开发的,质量不一定有保证。

业务人员:这个现在也很难衡量,只有说出现问题了再去回溯,确实做不到预见性的判断......

场景三 缺乏排查宕机问题条件

生产报表使用者:信息部,报表系统宕机了,赶紧重启,整条生产线都停了!

业务人员:好的,正在重启,稍后我问一下帆软的技术支持看看什么原因......

帆软技术支持:您好,请问宕机之后有导出dump文件吗?还是直接重启了啊?

业务人员:没时间,都是生产一线,不可用时间越短越好,不能等导完dump再重启。

帆软技术支持:是这样,排查下来应该是内存溢出的问题,但是没有dump文件无法分析具体是哪张报表导致的,很抱歉。

(于是宕机的问题很难等得到有效解决,陷入一旦宕机、立即重启、无法分析的死循环......)

场景四 无法快速获得系统基本数据

业务人员:你好,想问一下,这个XX插件为啥在我们的服务器上用不起来啊,我看在我本地是可以的。

帆软技术支持:您好,请问您的jdk版本是多少?现在的jar版本是多少啊?

业务人员:稍等哈,我去查查......

 

系统运维遇上了大救星,是什么让IT效率提高48%

 

以上问题在很多企业中都会遇到,给企业运维人员造成一定的困扰。能不能有一个完整的运维报告,一下子解决上述场景的所有问题呢?

在帆软面前,答案是肯定的。

众所周知,系统的稳定和高效是业务成功使用的基础,要达到这样的效果离不开专业的运维团队,但往往运维有着较高的技术门槛和人力要求,并且传统的人工运维有着周期长、无法24小时工作的局限。

但无需担心,这些困难都可以通过帆软云端运维解决——上传云端运维数据,经云端计算就可以获得完整、全面的系统健康检查分析报告!

云端是指帆软为客户提供的云中心分析计算引擎,云端运维相比于本地运维具有大计算、零成本、低门槛、高成长等等优势,帆软希望通过云端运维和本地运维两种方式丰富运维功能,发挥各自优势,为系统的稳定可用保驾护航,目前已有327个客户加入了云端运维的大家庭。

系统运维遇上了大救星,是什么让IT效率提高48%

 

看得见的新功能开发 ,我们在努力做

1、访问次数&用户数

想感知有多少用户访问了系统、频次如何?

 

系统运维遇上了大救星,是什么让IT效率提高48%

 

2、访问模板数

不清楚开了那么多模板当中有多少是能被用到的?

系统运维遇上了大救星,是什么让IT效率提高48%

 

3、内存走势

想确认是否有内存溢出的危险时刻?

系统运维遇上了大救星,是什么让IT效率提高48%

 

4、CPU走势

想了解系统压力最大时的稳定运行风险?

系统运维遇上了大救星,是什么让IT效率提高48%

 

5、运维指标

和技术人员定位、确认问题时,连系统的基本信息都无法快速提供?

 

系统运维遇上了大救星,是什么让IT效率提高48%

 

6、业务指标

想对比一些新模板上线后,系统使用的月度指标是否有提升?

系统运维遇上了大救星,是什么让IT效率提高48%

 

 

系统运维遇上了大救星,是什么让IT效率提高48%

 

看不见的老功能优化,我们在持续做

在已经上线一段时间的模板性能风险分析&宕机情况分析这两个功能上面,我们也未满足于现有的成绩,依然不断验证准确性、改进算法,力求为用户提供更可靠的数据。

1、整体概览

  • 得分量化,横向比较系统月度稳定性波动情况
  • 关键指标(宕机次数、重启次数)一目了然,重中之重优先展示

系统运维遇上了大救星,是什么让IT效率提高48%

 

2、宕机情况分析

分析宕机时间、问题模板、数据量、耗时、问题数据集、可能存在的问题等

系统运维遇上了大救星,是什么让IT效率提高48%

 

3、模板性能风险分析

分析问题模板及数据集,不仅仅在宕机发生后补救,出现不良苗头就及时处理

 

系统运维遇上了大救星,是什么让IT效率提高48%

 

4、效果验证

通过对部分有条件导出dump文件的客户进行判断结果对比,云端运维的宕机、模板分析准确性已有了可观的提升(案例过多,不做全部展示,且保护用户隐私,对模板、数据集信息打码)

dump分析结果:

系统运维遇上了大救星,是什么让IT效率提高48%

 

云端运维报告分析结果:

系统运维遇上了大救星,是什么让IT效率提高48%

 

现今我们已经取得了这样的成果,但我们仍在为提升哪怕一个百分点而努力

  • 是否宕机及宕机时间判断准确率(所有宕机场景):76%
  • 是否宕机及宕机时间判断准确率(算法覆盖的内存异常、CPU异常场景):87%
  • 内存异常场景宕机模板判断准确率(报告所推荐的不多于三张可能造成宕机问题的模板覆盖到dump分析定位到模板的概率):73%

这一切努力为的只是真正帮到客户解决问题(不做全部展示,保护用户隐私,不公布客户信息)

系统运维遇上了大救星,是什么让IT效率提高48%

 

 

系统运维遇上了大救星,是什么让IT效率提高48%

 

不易察觉的小细节,我们在用心做

除功能以外,在您不易感知的交互、操作等细节问题上,我们也在默默提升......

  • 更直观的说明图——一张流程图让您了解云端运维的含义
  • 更贴心的报告demo预览——方便您快速了解报告提供的内容、信息
  • 更便捷的多月范围选择——批量操作时无需多次操作,一步搞定
  • 更快速的一键上传——无需繁琐步骤,一键点击直接生成报告
  • 更省心的上传——取消了勾选以后还需保存的操作,不再因为交互的问题增加困扰

系统运维遇上了大救星,是什么让IT效率提高48%

注:此优化在12.04及以后jar版本

 

系统运维遇上了大救星,是什么让IT效率提高48%

 

摆脱数据安全困扰,无后顾之忧

在功能优势的同时,帆软对于云端的特性也兼顾了数据安全方面的考虑,确保使用没有后顾之忧。

系统运维遇上了大救星,是什么让IT效率提高48%

 

  • 数据脱敏——只涉及产品改良和应用运维所需数据,绝不涉及业务数据
  • 数据披露——用户可以随时看到上传了哪些数据
  • 保密协议——如有需求,可以签署保密协议(支持线上签署)
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章