网络性能指标为了解IT基础架构的运行状况和效率提供了关键信息,帮助实时发现问题。通过收集和分析这些指标,可以获得有价值的见解,以保持网络的平稳运行和用户的满意。
网络停机会中断对云应用的互联网访问,导致远程工作人员无法访问,从而使业务陷入停顿。可靠的网络不是奢侈品,而是业务连续性的必需品。但您如何确保网络性能最佳?这时,性能指标和传感器数据就变得无价了。
让我们深入了解并了解有关性能指标、传感器的更多信息以及如何使用它们以获得更好的结果。
什么是性能指标?
性能指标充斥着冷冰冰的数字,告诉我们事情是否进展顺利,或者是否会遇到麻烦。它们还使我们能够对网络未来的性能做出有根据的猜测。以下是一些重要指标的简要介绍:
1.可用性指标
正常运行时间:网络实际执行其工作并保持正常运行的时间百分比
平均故障间隔时间(MTBF):此指标显示设备在发生故障之前可以正常运行多长时间。
平均修复时间(MTTR):当设备发生故障时,可以多快让设备恢复正常。
2.可靠性指标
数据包丢失:传输过程中丢失的数据的百分比。
抖动:信号抖动和波动的程度。这对于语音和视频通话非常重要,因为延迟是影响通话质量的重要因素。
错误率:数据在传输过程中出现混乱的频率。
3.吞吐量指标
带宽利用率:实际使用了多少网络管道,这对于了解传输容量非常有用。
数据传输速率:将数据从A推送到B的速度有多快。
每秒交易次数:在给定的时间范围内完成了多少个操作?
4.延迟指标
往返时间(RTT):数据从源到目的地再返回源的往返时间。
网络延迟:数据在网络中传输所需的时间。
应用响应时间:应用响应用户请求的速度有多快,响应迟缓的应用会带来糟糕的用户体验。
这些指标中的每一个都反映了网络性能的一部分,高可用性意味着网络是可靠的。低延迟意味着它快速且响应迅速。稳定的吞吐量意味着正在高效利用资源。
什么是性能传感器?
我们之前提到过这些,但没有详细介绍。性能传感器是监控网络的真实代理。它们是实际收集我们刚刚讨论的所有指标数据的工具,主要有两种类型:
有源传感器
这些都是干劲十足的。他们会主动探测网络,发送测试数据包或模拟用户活动。他们会提供实时性能数据,并能在问题爆发为严重故障之前发现它们。
无源传感器
这些是安静的观察者。它们会查看实际网络流量,而不会增加流量。它们提供有关用户体验和应用性能的真正独家新闻。
通过部署无源传感器,可以全面了解网络的健康和性能。通过实时监控,不仅可以解决问题,还可以预防问题。如果负责企业的网络基础设施,那么则需要尽可能多的有用信息来发现问题。
实施网络可用性性能指标和传感器
制定有效的监控策略并非易事,但值得付出努力。以下是完成此操作的方法:
1.选择指标和传感器
并非所有数据都是平等的,如果将精力集中在关键任务连接上,则并非所有数据都需要收集。以下是一些指南,可帮助从特定传感器中选择正确的指标。
弄清楚网络性能的哪些方面真正重要,目标不是收集每一条数据,追求的是相关信息。
选择符合业务目标和用户需求的指标。如果主要应用托管在云中,那么互联网连接将需要特别注意。
选择可以实际收集这些指标数据的传感器,并将不太重要的日志和统计数据保存在不同的数据存储中。
2.整理好监控工具
一旦了解了需要收集的数据,就应该考虑将监视工具标准化。在决定使用这些工具时,需要记住以下几点:
使用中央集线器进行数据收集,当需要从所有传感器获取大量数据时,最好将其存储在可访问的位置。集中数据可让监控体验更加轻松。
确保选择的工具与现有的网络设置兼容,不会想为了数据收集而对基础设施做太多改动。
如果它对设置有意义,那么基于云的选项可以提供一个易于从任何地方扩展和管理的平台。
3.设置警报系统
当事情没有按计划进行时,需要了解情况。要了解不良指标是什么样的,需要确定一些基准测量值。
要定义基准,需要衡量网络上每个指标的“正常”状态。当这些阈值被突破时,需要自动发出警报,以便在情况失控时通知。
当灾难来临时,必须有一个应对关键问题的计划。这包括标准操作程序(SOP)、灾难恢复和故障转移程序。自动化的优点在于,当通信中断时,可以自动处理诸如故障转移到备用互联网连接之类的问题。
如果遵循这些基本步骤来帮助入门,那么将拥有一个不仅可以收集数据,而且还可以提供可视性的监控系统,以便在需要时可以立即采取行动。
从性能指标和传感器中获取价值的最佳实践
如果想最大限度地利用监控资金,那么可以遵循以下一些简单的建议。
定期检查
不要只是设置它然后就忘记监控解决方案。需要定期检查性能数据,并随着环境的变化做出更改。
一旦有了数据,就必须利用它做些什么。寻找可能带来麻烦的趋势,并构建仪表板以帮助直观地了解网络的当前状态。如果操作正确,使用Grafana等工具的图形和图表可以实时指出问题。
使用历史数据预测未来需求。如果注意到带宽限制或性能随时间下降,那么可以在业务运营受到影响之前提前规划。
始终保持优化
让性能数据指导优化工作。基于数据做出的决策总是比升级可能不需要它的系统带来更好的回报。当发现瓶颈时,请修复它。让问题堆积起来只会自找麻烦,所以看到问题时要及时处理。还需要随着环境的变化,保持监控工具和阈值的更新。
组织共享
在整个组织内共享性能指标。创建可见性有助于决策者了解网络正在做什么。如果有内部软件开发人员,那么与应用团队合作优化端到端性能可以大大提高性能。
使用这些数据来激发对容量规划和升级及网络扩展预算的需求。如果能以易于理解的格式显示数据,那么就更容易证明下一个项目的预算合理性。
坚持这些做法,指标和传感器将会发挥巨大的价值。
挑战和注意事项
性能指标和传感器是强大的工具,但它们也存在挑战。在深入研究下一个网络监控解决方案之前,请考虑这些重要事项。
扩大规模
确保监控能够跟上网络的增长,选择的解决方案应该考虑到网络的未来,注意可能减慢网络速度的监控活动。
规划需要的更多数据存储和处理,需要确定数据保留策略并确定保留这些数据的时间。
与现有设置兼容
检查传感器和工具是否与现有设置兼容,实施解决方案时,需要尽量减少干扰。注意监控工具和安全措施之间的冲突。某些监控工具有时会有点激进,因此在部署之前必须测试配置。
提前考虑未来的升级和技术变革,这样就不会在几年后发现自己需要再次升级或工具迁移。
确保安全
像保护其他敏感信息一样保护性能数据。提前规划并创建访问和安全列表,以便妥善保护敏感数据。确保监控不会在安全方面产生新的薄弱环节。免费工具很棒,但始终要确保它们针对企业环境进行了适当的强化。
密切关注数据保护法规和行业标准,尤其是如果您在受监管的行业中运营。直面这些挑战将使监控工作步入正轨,并避免日后出现不必要的麻烦。
总结
我们已经介绍了网络性能监控领域的很多内容,但这些只是基础知识。如果要实施一个收集数据并在出现问题时向您发出警报的解决方案,还需要考虑更多技术问题。
如果遵循这些指导原则,将走上正确的轨道,构建一个不仅能对问题做出反应,还能帮助预防问题的监控系统。
来源:千家网