# 产品简介

# 产品概述

云服务监控(Cloud Service Monitor) 为云上用户提供开箱即用的企业级开放型一站式监控解决方案。

云服务监控涵盖 IT 基础设施监控,基于事件、自定义指标、日志的业务监控。为您全方位提供更高效、更全面、更省钱的监控服务。通过提供跨产品、跨地域的指标分类模型和报警模板,帮助您快速构建支持几十种云产品、管理数万实例的高效监控报警管理体系。通过提供自定义仪表盘,帮助您快速构建自定义业务监控大盘。使用云服务监控,不但可以帮助您提升您的系统服务可用时长,还可以降低企业 IT 运维监控成本。

云服务监控服务为用户提供一个针对弹性云服务器、带宽等资源的立体化监控平台。使您全面了解云上的资源使用情况、业务的运行状况,并及时收到异常告警做出反应,保证业务顺畅运行。

# 产品架构图

云服务监控架构图

# 主要功能

云服务监控服务主要具有以下功能:

  • 云监控总览:通过总览的界面,用户可以看到同一类型资源的不同维度的资源消耗对比,以此来调整产品的部署布局,以及告警的总览统计,迅速帮用户查看最新的告警情况。
  • 自定义仪表盘:为用户提供在一个监控面板跨服务、跨维度查看监控数据,将用户关注的重点服务监控指标集中呈现,既能满足您总览云服务的运行概况,又能满足排查故障时查看监控详情的需求。
  • 指标管理:云服务监控的指标管理功能为您提供自定义查看监控数据的功能。您可以在一张监控大盘中跨产品、跨实例查看监控数据,将相同业务的不同产品实例集中展现。
  • 云服务管理:提供跨云厂商、跨地域的云产品资源分组管理功能,支持您从业务角度集中管理业务线涉及到的集群、节点、网络、负载均衡、存储等资源。从而按业务线来管理报警规则、查看监控数据,可以迅速提升运维效率。
  • 告警管理:云服务监控为您提供监控数据的报警功能。您可以通过设置报警规则来定义报警系统如何检查监控数据,并在监控数据满足报警条件时发送报警通知。您对重要监控指标设置报警规则后,便可在第一时间得知指标数据发生异常,迅速处理故障。
  • 日志管理:云服务监控日志管理,用于收集来自主机和云服务的日志数据,通过海量日志数据的分析与处理,可以将云服务和应用程序的可用性和性能最大化,为您提供一个实时、高效、安全的日志处理能力,帮助您快速高效地进行实时决策分析、设备运维管理、用户业务趋势分析等。

# 使用限制

需要在集群内开通运维服务。

# 云服务监控总览介绍

云服务监控总览 界面提供了资源、应用、应用用户体验的全链路、多层次、一站式运维界面。分别展示了告警统计、集群监控列表、节点监控列表、负载监控列表 4 种数据信息卡片,下面分别介绍各卡片内容及操作:

告警统计卡片

此卡片主要统计展示七天内未处理告警趋势图的数据。右边展示各个级别告警的数量,左边展示所有告警的趋势曲线。

集群监控卡片

此卡片主要展示了集群各个指标信息

  • 统计最新时间前 1 分钟内的集群的 CPU 使用率、CPU 总量、内存使用率、内存使用量、内存总量、网络发送速率、网络接受速率、存储使用率、存储使用量的集群信息。
  • 可点击每一个指标标题的上下箭头进行升降排序。
  • 右上角刷新按钮可实时刷新。

节点监控卡片

此卡片主要展示了节点各个指标信息

  • 统计最新时间前 1 分钟内的节点的 CPU 使用率、CPU 总量、内存使用率、内存使用量、内存总量、网络发送速率、网络接受速率、存储使用率、存储使用量的节点信息。
  • 可点击每一个指标标题的上下箭头进行升降排序。
  • 右上角刷新按钮可实时刷新。

负载监控卡片

此卡片主要展示了负载各个指标信息

  • 统计最新时间前 1 分钟内的负载的 CPU 请求量、CPU 限制量、CPU 使用量、内存请求量、内存使用量、内存限制量、网络发送速率、网络接受速率的负载信息。
  • 可点击每一个指标标题的上下箭头进行升降排序。
  • 右上角刷新按钮可实时刷新。

界面如下

云服务监控总览