• [统一运维] 【自动化巡检】场景描述和开发巡检脚本
    场景描述业务主机已经接入运维平台后(详细接入步骤参考新增业务主机接入运维、监控、日志平台),假设需要每天对该主机的业务进行巡检,检查该主机的系统内存占用率是否超过80%。开发巡检脚本1、使用admin用户登录OPS运维平台。2、选择“运维中心 > 运维任务 > 脚本管理”。说明:非Cube场景下菜单路径为“自动化任务 > 脚本管理”。“脚本名称”:自定义,例如test_mem_check。“脚本类型”:选择“巡检脚本”“指定管理员”:选择“user:admin()”“是否审批”:选择“是”编辑脚本(shell):配置巡检的shell脚本#!/bin/bash ################################################################################### # Function : write_result() # Description : Writing Inspection Results # Params : # $1: inspect_item : Inspection Item Name; # $2: expect_result : Expected Value; # $3: real_result : Actual Value; # $4: inspect_result : Inspection Results,T/F; # check_result.log : Result file name. The value is fixed; ################################################################################### function write_result(){ echo "$1 || $2 || $3 || $4" >> check_result.log } ######################## Inspection Script Example ################################# function check_mem_usage(){ mem_total=`free -m | awk -F '[ :]+' 'NR==2{print $2}'` mem_used=`free -m | awk -F '[ :]+' 'NR==2{print $3}'` #计算统计内存使用率 mem_used_persent=`awk 'BEGIN{printf "%.0f\n",('$mem_used'/'$mem_total')*100}'` if (( "80" < "$mem_used_persent" )) then result="F" else result="T" fi write_result "HI1500101B: MEM_USAGE_RATE_Check" "less than 80%" "${mem_used_persent}%" ${result} } function main(){ check_mem_usage } main
  • [统一运维] 【自动化巡检】创建巡检任务
    1、以admin用户登录OPS运维台。2、选择“运维中心 > 运维任务 > 周期任务”。说明:非Cube场景下菜单路径为“自动化任务 > 周期任务”。3、单击“定时计划”页签后单击“新增”4、创建按天的定时计划。分钟、小时:根据项目实际配置,建议选择业务闲时运行。其他参数:配置为*。5、单击“周期任务”页签后单击“新增”创建周期任务。a、“选择脚本”页面设置以下参数后单击“下一步”。任务名称:自定义,例如:HealthCheckByDay。调度类型:选择“定时”。定时:选择4创建好的定时计划。描述:周期任务的描述信息,自定义。是否启用:选择“启用”。过期时间:根据实际项目要求设置定时任务的过期时间。站点:选择系统接入的站点名称:默认为“abc_site”。脚本文件:选择需要执行定时任务的脚本文件“test_mem_check”。b、“选择主机”的页面,需要勾选所有主机后单击“下一步”。c、点击“提交”。
  • [统一运维] 【自动化巡检】(可选)配置工单审批组
    工单审批组只需要配置一次即可,如果已配置过审批组,无需重复配置。1、使用admin用户登录OPS运维平台。2、选择“运维中心 > 运维任务 > 工单配置”。说明:非Cube场景下菜单路径为“工单 > 工单配置”。3、设置审批组站点:选择“全局默认”审批组:选择“user:admin()”
  • [统一运维] 【告警开发示例】查看监控
    查看问题1、登录Zabbix前端Portal。2、选择“Monitoring > Problems”,按照问题名称在Problem输入“记录数大于5”并单击“Apply”按钮查看问题。查看监控项1、登录Zabbix前端Portal。2、选择“Monitoring > Dashboard”,打开创建模板页面查看监控问题。
  • [统一运维] 【告警开发示例】后台配置
    查看数据库1、登录MySQL,红色的字段根据实际情况修改:mysql -h 192.168.50.201 -u root -P 3306 -p密码:输入密码2、创建数据库(若已存在则不创建):CREATE DATABASE test;3、查看数据库:SHOW DATABASES;4、选择数据库:use test;5、创建表(若已存在则不创建):CREATE TABLE testtable ( `userid` bigint unsigned NOT NULL, `alias` varchar(100) DEFAULT '' NOT NULL, `name` varchar(100) DEFAULT '' NOT NULL );6、插入数据(仅作示例使用):insert into testtable (`userid`,`alias`,`name`) values (1,'a','aa'),(2,'b','bb'),(3,'c','cc'),(4,'d','dd'),(5,'e','ee'),(6,'f','ff');7、查看表:select * from testtable;通过在表中创建数据来触发告警监控创建脚本1、以sysomc用户登录Zabbix主机,登录后切换到root用户(这里的主机为关联主机中选择的主机)。2、切换目录。cd /home/zabbix_cust/3、创建脚本(若已存在则不创建):touch check_records.sh4、编辑脚本:vi check_records.sh脚本内容,脚本中红色的内容根据实际情况填写:export MYSQL_PWD=Hu******3 line_nums=`/usr/local/bin/mysql -h 10.168.50.201 -P 3306 -u root -e "USE test;select count(*) from testtable\G;"|grep count|awk -F ": " '{print $2}'|grep -v '^s' | tr '\n' ' ' | sed 's/[ \t]*$//g'` echo ${line_nums}保存退出::wq5、修改权限:chmod 550 check_records.sh6、修改属主:chown zabbix:zabbix check_records.sh7、退出root用户。# exit执行脚本1、切换zabbix用户:su - zabbix -s /bin/bash2、切换目录:cd /home/zabbix_cust/3、执行脚本:./check_records.sh4、记录数为6,已超过告警监控设定指标。配置文件1、回到安装zabbix的主机。2、切换目录:cd /home/zabbix_cust/etc/3、创建配置:touch zabbix_agent2_records.conf4、编辑配置:vi zabbix_agent2_records.conf配置内容:UserParameter=records.num, cd /home/zabbix_cust && bash ./check_records.sh5、保存退出::wq6、修改权限:chmod 640 zabbix_agent2_records.conf7、修改属主:chown zabbix:zabbix zabbix_agent2_records.conf8、查询进程:ps -ef | grep agentd | grep -v zabbixdps -ef | grep agent2 | grep -v zabbixd9、重启进程(重启zabbix的进程):kill 225030
  • [统一运维] 【告警开发示例】前台配置
    配置模板1、登录zabbix。图1 登录zabbix2、选择“Configuration > Templates”,单击右上角“Create template”,新增模板。图2 新增模板3、填写模板的参数,单击“Add”。Template name(模板名称):Template_recordsGroups(群组):Templates/ABC/Application图3 填写模板参数4、新增完模板之后,使用创建的模板名称:“Template_records”搜索刚才新建的模板。图4 搜索模板配置监控项1、单击模板的名称,如图4所示。2、单击“Items”切换到监控页签,然后单击“Create item”按钮,新增一个监控项。3、在监控项页面填入相应配置项并单击“Add”按钮来新建一条监控项。Name(名称):records_num(配置项的名称)Key(键值:需要唯一):records.num(用于匹配后台执行的配置文件)Update interval(更新间隔):10s(查询后台数据的时间间隔)History storage period(历史数据保留时长):7dTrend storage period(趋势存储时间):30d配置触发器1、配置完成监控项后,单击“Triggers”页签,单击右上角“Create trigger”按钮,新增一个触发器。2、在触发器页面填入响应配置项。Name(名称):DB_100001_ {HOST.IP}_The number of records in the testtable table is greater than 5 ! [数据库表testtable记录数大于5]DB:数据库100001:为自定义的触发器IDHOST.IP:为产生告警的机器IPThe number of records in the testtable table is greater than 5 ! [数据库表testtable记录数大于5]:为触发问题名称3、填写名称后,单击“Expression”后的“Add”按钮配置表达式条件,并单击“insert”按钮进行添加。Item(上一步创建的监控项):Template_records: records_numFunction(监控项执行的功能):count()Last of (T)(检查最近的次数): 2 CountV(数量):5O(大于):gtResult(最近次数中满足条件的次数):2表达式(自动导出):{Template_records:records.num.count(#2,5,gt)}=24、“Severity”类型选择“Warning”,然后单击“Add”按钮完成触发器的添加。关联主机1、登录Zabbix前端Portal。2、单击“Configuration > Hosts”,进入查看目标主机(可在Name或IP处填写目标主机的信息,点击“Apply”快速查询主机),点击Name列的主机名进入主机配置页面。3、在“Hosts”页面,单击“Templates”进入Hosts添加模板页面。4、单击“Select”,选择此次需要关联的模板组。找到此次需要关联的模板(Template_records),勾选前面的框,点击下方“Select”。5、在下方Link new templates可以看到新添加的模板,单击“Update”。在上方Linked templates可以看到刚刚选择的模板名称,即关联模板成功。6、单击“Items”切换到监控项页签,输入Name“records_num”,单击“Apply”按钮可以查到新建的监控项。7、单击“Triggers”切换到触发器页签,输入Name“数据库用户数大于5”,单击“Apply”按钮可以查到新建的触发器。
  • [内容拦截申诉] 这个帖子是什么问题?可以恢复吗?
    https://bbs.huaweicloud.com/blogs/396728这个帖子是什么问题?可以恢复吗?而且审核不通过但是有25阅读量,广告营销内容具体指哪部分?
  • [统一运维] 【告警项开发示例】场景描述
    前提条件主机已经接入运维、监控、日志平台,详细步骤参考新增业务主机接入运维、监控、日志平台。在目标主机执行如下两个命令:grep ^Include /home/zabbix/etc/zabbix_agentd.confgrep ^Include /home/zabbix/etc/zabbix_agent2.conf命令返回的Include即为监控配置文件的存放位置。说明查询监控配置文件的存放位置,如上图所示,选择新建配置文件的目录为“/home/zabbix_cust/etc/*.conf”,因为执行升级时,会重置“/home/zabbix/etc/”目录的文件。场景描述本示例演示了test数据库中testtable表的记录数大于5时,就会触发zabbix中配置的监控项、触发器,最终触发告警并展示在zabbix的Monitoring界面上。告警的开发流程如下:1、首先进行前台配置:配置模板、配置监控项、配置触发器、关联主机。2、然后进行后台配置:创建脚本、查看数据库、配置文件、执行脚本。3、最后查看监控:查看问题、查看监控项。
  • [统一运维] 【告警项开发流程】查看数据
    查看上报数据1、登录Zabbix前端Portal。2、选择“Monitoring > Latest data”,在Hosts输入目标主机名称,Application填入模板的application名称,点击“Apply”。可快速查询到上报的数据。查看告警1、登录Zabbix前端Portal。2、选择“Monitoring > Problems”,根据hosts选择自己的主机,触发告警会需要一个或几个上报数据的周期。在下方就会有告警。
  • [统一运维] 【告警项开发流程】开发监控脚本
    以zabbix_sender方式主动上报监控数据为例。多条数据以文件形式通过zabbix sender一次上报(同一脚本需要上报多条数据时推荐这种方式,相较调用多次zabbix_sender更高效)。# /home/zabbix/bin/zabbix_sender -z server(要向其发送数据的Zabbix服务器或代理的主机名或IP地址) -p 端口 -i 文件路径及文件名 -vv -T(上报的数据中带有时间戳则需要-T)例如/home/zabbix/bin/zabbix_sender -z 192.168.17.6 -p 31152 -i /home/zabbix/logs/metric_label_trapper.txt -vv –T文件内数据格式:hostname key值 时间戳 值文件内数据样例:test_hostname test_key 1583998373 34.393一条数据类型的数据zabbix sender上报。# /home/zabbix/bin/zabbix_sender -z server -p 端口 -s hostname -k key值 -o 值 –vv例如/home/zabbix/bin/zabbix_sender -z 192.168.17.6 -p 31152 -s test_hostname -k test_key -o 34.393 -vv上报正常sender返回值如下图。以zabbix_agent方式被动上报监控数据为例。在目标主机执行grep ^Include /home/zabbix/etc/zabbix_agent.conf,命令返回的Include即为监控配置文件的存放位置。调试自定义脚本和配置文件。将配置文件放入由步骤1得到的Include的路径下。配置文件格式和参考如下:格式:UserParameter="key值", 需要执行的脚本(可带参数)示例:UserParameter=ops_health_agent, sh /home/zabbix/scripts/ops_health_check.sh将自定义脚本放在配置文件中指定的路径下。脚本直接输出需要上报的值,参考值如下图:将配置文件和脚本文件的属主改为zabbix。chown -R zabbix:zabbix 配置文件路径/脚本路径更改脚本文件的读写权限。在脚本目录执行以下命令。chmod 750 *.shchmod 750 *.py重启zabbix agent。切换zabbix用户,查询zabbix agent进程。su zabbix -s "/bin/bash"cat /home/zabbix/logs/zabbix_agent2.pid结束zabbix agent进程。kill (zabbix_agentd的pid)重启zabbix agent进程。/home/zabbix/sbin/zabbix_agent2 &在目标主机上用zabbix_get验证拿到的上报数据的值。如果可以拿到key对应的返回值则进行下一步,如果拿不到则跳转到常见问题进行解决。/home/zabbix/bin/zabbix_get -s 目标主机ip -k 配置文件中的key值
  • [统一运维] 【告警项目开发流程】在主机上关联模板
    1、登录Zabbix前端Portal。2、单击“Configuration > Hosts”,进入查看目标主机(可在Name或IP处填写目标主机的信息,点击“应用”快速查询主机),点击Name列的主机名进入主机配置页面。3、在“Hosts”页面,单击“Templates”进入Hosts添加模板页面。4、单击“Select”,选择此次需要关联的模板组。找到此次需要关联的模板,勾选前面的框,点击下方“Select”。在上方Linked templates可以看到刚刚选择的模板名称后点击“Update”。即关联模板成功。
  • [统一运维] 【告警项开发流程】在主机上关联模板
    1、登录Zabbix前端Portal。2、单击“Configuration > Hosts”,进入查看目标主机(可在Name或IP处填写目标主机的信息,点击“Apply”快速查询主机),点击Name列的主机名进入主机配置页面。3、在“Hosts”页面,单击“Templates”进入Hosts添加模板页面。4、单击“Select”,选择此次需要关联的模板组。找到此次需要关联的模板,勾选前面的框,点击下方“Select”。在上方Linked templates可以看到刚刚选择的模板名称后点击“Update”。即关联模板成功。
  • [统一运维] 【告警项开发流程】创建告警触发器
    1、登录Zabbix前端Portal。2、单击“Configuration > Templates”,选择进入对应模板页面。3、进入“Triggers”页签。4、单击“Create triggers”新建触发器。填写下表中的信息点击左下角的“Add”。表1 Triggers参数说明触发器项目含义示例值Name触发器名称102078_{HOST.IP}_nfs is down! [nfs进程数量<1]Severity告警级别HighProblem expression/expression告警条件表达式{Template_NFS_ABC:proc.num[nfsd,,,].max(#2)}<1OK event generation(可省略)OK事件生成选项:\\表达式 -OK事件是基于与问题事件相同的表达式生成的;恢复表达式 -如果恢复表达式的评估结果为TRUE,而问题表达式的评估结果为FALSE,则将生成OK事件。无 -在这种情况下,触发器将永远不会自行返回OK状态Recovery expressionRecovery expression(可省略)恢复条件表达式{Template_NFS_ABC:proc.num[nfsd,,,].min(#2)}>0Tags标签每个产品在Zabbix上触发的告警都要打上两个Tag,以便支持园区Cube的分平台监控视图:一级标签:Tag Name:MonitoringLayerTag Value:DigitalPlatform、BusinessApp(固定值)(二选一)二级标签:Tag Name: DigitalPlatform、BusinessApp(同一级标签的Tag Value)Tag Value:XXX(数字平台或应用APP的名称,比如IOT、GIS、Allcam等第三方Name)其中Tags在第二个页签。其它字段及作用请参考zabbix官方文档:cid:link_1补充:Problem expression填写方式(Recovery expression同)点击Problem expression后面的Add进入添加表达式的页面,点击select,选择需要触发告警的监控项。Function可参照官方文档:cid:link_0
  • [统一运维] 【告警项开发流程】在zabbix前端创建监控项
    1、登录Zabbix前端Portal。2、单击“Configuration > Templates”,选择进入对应模板页面。3、进入“Items”页签4、单击“Create item”,开始创建新的Item模板。表1 Item参数说明关键字段含义示例值name需要增加的item名字。Zabbixproxy_tcp_port_listen_10051type此处选择zabbix agent类型上报数据。Zabbix agentkey监控项key。可支持的监控项的key,能够在各个监控项类型中找到。这个key在单个主机中必须是唯一的。常用key:net.tcp.listen[<port>]<port>目标主机端口的健康检查,net.tcp.port[<ip>,port](检查是否可以与指定端口建立TCP连接。返回0-无法连接;1-可以连接)等等。net.tcp.listen[10051],其中10051为目标监控端口号,按实际需要填写。Type of information选择上报数据的类型。Numeric(unsigned)Update interval上报数据的周期(单位是s,m,d)。30sHistory storage period在数据库中保留详细历史记录的天数,housekeeper将删除较旧的数据。数据库中还设置了定期清理的存储过程,默认值是30天。因此即使此处填的是90天,最多也只能查看30天的历史记录。7d/90dTrend storage period在数据库中保留N天的详细历史记录(小时最小,最大,平均值,计数)。 housekeeper将删除较旧的数据。数据库中还设置了定期清理的存储过程,默认值是30天。因此即使此处填的是90天,最多也只能查看30天的历史记录。365dShow value将值映射应用于此监控项。值映射不会改变收到的值,仅用于显示数据。它只适用于整数项。As isNew application新建应用集。Ops|Zabbix|HealthcheckApplications应用集。Ops|Zabbix|HealthcheckDescription添加对此item的描述。{"offering":"OPS", "type":"应用健康检查", "description":"zabbixproxy健康检查"}
  • [统一运维] 【告警项开发流程】在zabbix前端创建应用集
    1、登录Zabbix前端Portal。2、单击“Configuration > Templates”,选择进入对应模板页面。3、进入“Application”页签。4、单击“Create application”创建应用。
总条数:119 到第
上滑加载中