系统监控和故障排除

整个生态系统的数据价值. One unified view.

IT运营充满了应该做的事情 should be tracking asset data. I should be logging in-app events. 但我们知道,你收集的每一层数据都增加了监控生态系统每一微米的看似不可逾越的任务, 所以事情就从裂缝中掉了出来. 不幸的是,这些裂缝只会随着团队的发展而变得越来越大、越来越深.

而像NIST和ITIL这样的框架可以为系统监控和故障排除提供指导, 这些标准通常会留下很大的解释空间. 大多数IT运营团队都知道,拥有适当的系统监视策略是最佳实践, 但是,实际实现监视和故障排除策略可能会令人望而生畏. 下面的部分包括关于什么的建议, how, 以及何时监控您的IT环境, and how Rapid7 InsightIDR 能帮助你的团队集中和相互关联吗.

What to monitor

Data types to monitor

简化和澄清如何考虑监控的一种方法是将数据分为三个主要类别:

  • Log data
  • Asset data
  • Network data

而监控每一种数据类型都是成熟的基础 IT operations,系统监控通常侧重于对日志数据和资产数据的分析.

System types to monitor

需要监控的系统包括(但不限于)以下内容:

  • Servers
  • Databases
  • Applications
  • Cloud services
  • Containers
  • Employee workstations

要监视的事件和指标

需要监控的事件和指标包括(但不限于)以下内容:

  • Errors
  • CRUD Events
  • Transactions
  • 访问请求和权限更改
  • System metrics

(正如你在上面看到的)信息过载很容易成为IT团队的职业危害——我们理解你的痛苦. 无需使用搜索查询就可以实时流记录日志并与可视化交互, InsightOps将改变您对日志管理的看法.

When to monitor

In short, 如果您的系统需要保持持续的可用性,系统监控应该是24/7的. 通常,监视可以在后台进行,而不需要您持续关注. With that said, 以下是一些你应该积极关注你的系统数据的情况:

  • System updates
  • 应用程序部署和回滚
  • Migrations
  • Peak transition times

作为一个基于云的解决方案,专注于将所有这些活动统一到一个视图中, InsightOps提供对IT环境中每个资产和系统的实时访问. 其结果是无与伦比的能见度. 

How to monitor

Traditionally, IT运营团队依赖于日志管理解决方案来收集, 集中并组织您的日志和单独的IT资产搜索解决方案,以监视单个IT资产. 进入insighttidr:我们的解决方案为IT运营团队提供了一种新型的系统监控和故障排除解决方案. 通过将日志管理与实时IT资产搜索相结合, 您可以跟踪从发现到解决的问题,而无需中途切换工具. Best of all, InsightOps将IT资产数据合成为结构化日志数据,可以轻松地与其他日志数据一起分析.

考虑到在任何IT团队的日常操作中已经存在的复杂性, InsightOps将易用性放在首位, 设置简单,不需要持续维护.