-
案例简介:XX成立于1984年,是土耳其本土最大的企业软件公司,也是最大的公共软件公司之一,为各类企业提供应用软件解决方案。迄今为止,XX在X个不同国家的X个地区拥有X多名员工和X多个业务伙伴。与AAG均有合作。迁移方案描述:Ø信息调研:客户PostgreSQL数据库,其中SAAS实例单库最大对象数超过90W+,PAAS实例逻辑库超过600+。Ø方案设计:SAAS实例共25个逻辑库,使用DRS全量迁移,总共分6批迁移完成,割接窗口是每天6小时。因为DRS只支持单库迁移,所以PAAS实例使用shell脚本迁移。输出Runbook初版。Ø测试验证:使用DRS迁移客户备份的真实数据,验证准备时间、迁移时间、数据对比时间、系统切换时间、遗留问题、实施顺序等项,并完善Runbook。Ø迁移实施:按照Runbook一步步标准化实施迁移,数据比对一致。Ø系统割接:正式割接后,业务验证正常。迁移成功。Ø保障移交:监控与巡检,并进行一周的业务重点保障,配合客户完成项目验收,培训与赋能。异地容灾方案描述: 华为云伊斯坦布尔Region两个AZ组成主备高可用,在距伊斯坦布尔400KM的安卡拉与VDF共建HCSO,采用Postgres数据库原生的流复制技术,组成公 有云伊斯坦布尔的异地灾备中心。流复制技术原理:流复制是基于 wal 日志传送技术实现同步,主节点(master)启用 walsender 进程持续发送 wal 日志流,备节点(standby)通过 walreceiver 进程实时接受从主传过的 wal 日志流,并且通过 walreceiver 进程调用内部函数write() 和 fsync() 将 wal 数据全部写入wal segment 和刷新到 wal segment,并通知 starup 进程回放已经写入wal segment 的 wal 数据。
-
比赛太卷了,想问问除开区域三等奖外,有没有类似于成功参赛奖或者参赛证明啊
-
Hi,What does the wrong message mean by "wrong output format expect integer but "ok"" in problem 2?
-
公有云解决方案-全栈方案
-
A卷一、计算题1、CPU计算没有什么特别,机框里有6个刀片,计算核数时,要把6个刀片的加起来;2、有个国产化的服务器,用鲲鹏架构,但镜像里有个特殊的操作系统 slack ware什么的,公共镜像里找不到,填的是“私有镜像”3、核心业务不能上云的担忧和建议答:核心业务难以上云的痛点:1.核心业务对运行环境性能要求极为严苛;2.核心业务在虚拟化环境下运行效能不够稳定;3.核心业务数据一般具有敏感性、隐私性;4.上云业务安全性及安全机制设计不完善;核心业务公有云应对方案:作为一名客户经理我们可以向客户简单赋能并提出相关公有云应对核心业务上云的解决方案:1.选配ECS高配性能版-若客户的核心业务对于虚拟化环境运行无特殊要求,仅仅是性能要求较高,这是一个可用的选择;2.若客户担忧公有云隔离性、数据隐秘性问题,可推DEH专属主机服务;3.若客户核心业务不可兼容虚拟化环境,则可推荐BMS裸金属服务;作为一名客户经理,应从实际和客户角度出发,若客户核心业务不建议异地迁移上云,也可更换思维向其赋能推广公有云灾备类服务;二、网络部分1、三个应用,有两个VPN,VPN1和VPN2,需要填三行表格,主要是安全组和策略,就根据题目填5个策略就行了,出方向放开,入方向根据要求填,有一个是http80端口,还有一个好像是24端口。2、画图题,和复习的双平面图一样,一个region,一个AZ,一个VPC,两个subnet做双平面的图;(可能需要做子网规划,子网地址题干中有,注意云上云下地址不重复)3、需要访问海外网站的解决方案答: 1. https://support.huaweicloud.com/bestpractice-cc/cc_04_0007.html基于云连接、Web代理NAT、网关(DNAT)实现跨区域访问海外网站加速(图中把国外和国内方向反过来画)本方案是HTTP代理方案,仅适用基于浏览器的Web类访问。Proxy-Client:用户windows主机配置Web代理功能,代理地址配置为国内的EIP公网地址。NAT网关:配置DNAT规则,国内的EIP公网地址映射到海外的代理服务器ETH1网卡地址。海外Region与国内Region通过云连接互通。用户实现通过代理服务器访问海外网站加速。2.从华为云开云专线至香港站点的服务器,香港服务器上部署vpn软件,本地登录ssl vpn访问国外网站。3.国外网站上CDN全球加速服务三、存储部分算容量时要注意raid5和raid10,raid5那台设备,要减去一块盘,raid10利用率50%,raid5利用率n-1/noceanstore ,4台存储(每台12块,一块冷备,做raid5),加一个级联的存储机框(24块盘,不做raid),问一共多少容量。算容量时建议分开算,4台设备算raid后加起来,机框里的24块没有做raid,直接乘以利用率后,两部分加起来算总容量;下方有个多少块盘有多少热备冷备盘的表格可以查询。计算可用容量。存储1存储2存储3OBS三副本,要除以3上云规划数据迁移工具,怎么迁移上云EVS一、迁移工具1.SMS主机迁移2.镜像导入/导出二、步骤:(以SMS为例)SFShttps://support.huaweicloud.com/bestpractice-sfs/sfs_03_0006.html一、迁移工具1.SMS主机迁移2.镜像导入/导出3.(1)通过mount方式挂载访问SFS Turbo,将本地NAS存储中的数据迁移至SFS Turbo。通过云专线迁移(rclone工具)、通过云专线迁移(rsync工具)(2)无法打通网络直接挂载,可以通过公网访问华为云ECS绑定的EIP,也可进行传输迁移。使用公网迁移(rclone工具)4.英方工具I2NAS二、步骤:(以云专线迁移rclone工具为例)1.登录弹性云服务器管理控制台。2.登录已创建好的Linux系统云服务器,用于同时访问本地NAS存储和云上SFS Turbo文件系统。3.输入挂载命令,用于访问本地NAS存储。4.在Linux云服务器中执行以下命令安装rclone工具。5.进行数据同步(以云专线迁移rsync工具为例)1.登录已创建好的Linux系统云服务器,用于同时访问本地NAS存储和SFS Turbo文件系统。2.输入挂载命令,用于访问本地NAS存储。3.输入挂载命令,用于访问SFS Turbo文件系统。4.在Linux云服务器中执行以下命令安装rsync工具。5.安装完成后,可以输入以下命令查询rsync工具的安装和版本情况。6.执行命令,将源端服务器/mnt/src目录中的数据全量同步迁移至目的端服务器/mnt/dst目录(文件系统)中。OBShttps://support.huaweicloud.com/obs_faq/obs_faq_0131.htmlhttps://support.huaweicloud.com/bestpractice-obs/obs_05_0220.html一、迁移工具搬迁本地数据至OBS:OMS、OBS工具、CDM、DES、DES Teleport、云专线还可以使用工具流:swift、英方I2DTO二、步骤:(以对象存储迁移服务OMS为例)1.创建源端和目的端的访问密钥(AK/SK)。源端:参见源端云服务提供商的相关资料。目的端:参见创建访问密钥(AK/SK)。2.在对象存储服务中创建用于存放迁移数据的桶。3.在对象存储迁移服务中创建迁移任务,开始迁移。4.在对象存储迁移服务中检查迁移任务的结果。3、三大存储的区别和应用场景https://support.huaweicloud.com/obs_faq/obs_faq_0006.html•SAN存储提供给应用的是一个LUN或者是一个卷,LUN和卷是面向磁盘空间的一种组织方式,上层应用要通过FC或者ISCSI协议访问SAN。SAN存储处理的是管理磁盘的问题,适用于实时读写场景;•NAS存储提供给应用的是一个文件系统或者是一个文件夹,上层应用通过NFS和CIFS协议进行访问,利用FTP+TFTP协议进行上传下载,此外,文件系统要维护一个目录树,适用于企业组织内部共享场景,提升办公效率和存储空间利用率(减少同类型数据复存)•对象存储更加适合web类应用,基于URL访问地址提供一个海量的桶存储空间,能够存储各种类型的文件对象,对象存储是一个扁平架构,无需维护复杂的文件目录。无需考虑存储空间的限制,一个桶支持近乎无限大的存储空间。(适用于离线、冷数据、归档数据、作为后端存储为客户打造的离线存储系统,性价比高)四、数据库1、mysql 、SQLserver、oracle的迁移工具和迁移方法(要求写两种),除了工具流的,还有DRS,然后论坛里找一下迁移流程,缩写填进去方法;2、mysql和SQLserver的公有云版本需要和题目对应一下,具体记不起来了;mysql的里边我选了集群版,一主一备5只读的,为提升读写性能,不知道对不对。3、小题目是三个数据库迁移的方法和步骤迁移工具、方法和步骤MySQL一、mysqldump步骤:1.使用mysqldump导出自建数据库的数据2.将导出的两个文件上传到ECS实例上3.将导出的文件导入到目标RDS中4.导入成功后登录RDS实例数据库中查看数据是否正常。二、数据复制DRS步骤:(以本地mysql迁移至RDS为例)1.在“实时迁移管理”页面,单击“创建迁移任务”,进入创建迁移任务页面。2.在“迁移实例”页面,填选区域、任务名称、描述、迁移实例信息。3.在“源库及目标库”页面,迁移实例创建成功后,填选源库信息和目标库信息,单击“源库和目标库”处的“测试连接”,分别测试并确定与源库和目标库连通后,勾选协议。4.在“迁移设置”页面,设置迁移用户和迁移对象.5.在“预检查”页面,进行迁移任务预校验,校验是否可进行迁移。6.进入“参数对比”页面,进行参数对比。7.在“任务确认”页面,设置迁移任务的启动时间、任务异常通知设置、SMN主题、时延阈值、任务异常自动结束时间,并确认迁移任务信息无误后,单击“启动任务”,提交迁移任务。SQLserver工具1 使用SQLserver导入导出功能将本地SQL Server数据库迁移到RDS for SQL Server二、步骤:(以本地sqlserver迁移至RDS为例)1.登录控制台,选择“数据库 > 云数据库 RDS”“实例管理”页面,选择目标实例,单击实例名称,进入实例的“基本信息”页签。2.在“基本信息”页签下单击“绑定”,在弹出框选择对应的弹性IP。3.在本地安装SQL Server客户端管理工具,通过弹性IP进行连接4.通过SQL Server自带的脚本生成工具,生成ECS上的数据库结构脚本5.在SSMS客户端中打开生成的脚本SQL文件,连接到RDS对应实例上。6.完成以上步骤后通过SQL Server自带的导入导出功能完成数据迁移。工具2 DRS备份迁移步骤 https://support.huaweicloud.com/backupmig-drs/drs_02_0009.html工具3 Golden GateOracle一、工具1.若采用工具流至云下或云上自建oracle:Oracle Golden Gate/Data guard/Always On/数据库自带迁移工具等2.若采用公有云服务至云数据库postgre:UGO+DRS二、Oracle数据库迁移上云的流程• 迁移上云流程(以GoldenGate为例)Oracle GoldenGate 数据复制过程如下:• 利用抽取进程(Extract Process)在源端数据库中读取Online Redo Log或者Archive Log,然后进行解析,只提取其中数据的变化信息,比如DML操作——增、删、改操作• 将抽取的信息转换为GoldenGate自定义的中间格式存放在队列文件(trail file)中• 再利用传输进程将队列文件(trail file)通过TCP/IP传送到目标系统。• 目标端有一个进程叫Server Collector,这个进程接受了从源端传输过来的数据变化信息• 把信息缓存到GoldenGate 队列文件(trail file)当中,等待目标端的复制进程读取数据。• GoldenGate 复制进程(replicat process)从队列文件(trail file)中读取数据变化信息,并创建对应的SQL语句,通过数据库的本地接口执行,提交到目标端数据库,提交成功后更新自己的检查点,记录已经完成复制的位置,数据的复制过程最终完成。4、单个数据库独立部署,每个服务器规格。规划数据库上云规格,多少C多少G? 本地服务器的规格,乘以利用率,和上云1:1,规格 看题干五、大题目某学校有三个系统:选课系统、高考查分系统、职业生涯规划系统。(题干可参考B考卷)1、题目里有个PV值和云服务对应的表格,建议先算应用的几个PV,根据PV值选择需要的公有云模块(ELB、CDN、AS等等)。基本上根据表格里的服务名称,倒过来画的系统图(无需两地三中心,做个数据备份即可,具体看题干)2、同时查分网站和职业生涯规划的两个应用,都是对外服务,有高并发,用ELB,职业生涯规划的部分应该用了CDN产品。3、高可用:数据库灾备、主备、数据库异地备份、VBS、云硬盘备份、CDN、ELB拓扑图不保证正确,仅供参考(EVS不能连接OBS,SFS改成Region内, 可以画上SDRS,注意网站三层架构,三层架构如下图)
-
摘要:误执行了 rm -rf /* 之后,除了跑路还能怎么办?本文分享自华为云社区《拯救被 rm -rf 伤到的小伙》,作者:Gauss 松鼠会。灵魂画师再次上线在开饭前我们先了解下两个关键的配置文件数据目录下的postgresql.conf比对一下主备节点的postgresql.conf,应该有以下几个参数不一致listen_addresses 远程客户端连接使用的数据库主节点ip或者主机名 local_bind_address 当前节点连接openGauss其他节点时绑定的本地IP地址 replconninfo1 设置本端侦听和鉴权的第一个节点信息,如果备机有2个,就会有replconninfo2 log_directory 决定存放服务器日志文件的目录,om初始化安装时命名跟实例id相关 audit_directory 审计文件的存储目录,om初始化安装时命名跟实例id相关 application_name 连接请求时所使用的客户端名称,om初始化安装时命名跟实例id相关来自踩坑者的warning:根据某一个节点生成例外一个节点的postgresql.conf文件,俗手请按参数逐个修改,不可全量替换,容易改错ip等$GAUSSHOME/bin/cluster_static_config俗称静态配置文件,OM工具的核心,记录了当前节点和集群的基本信息,二进制结构化文件可以通过gs_om -t view 来查看可以通过gs_om -t generateconf -X XMLFILE --distribute 重新生成有静态配置文件,就有动态配置文件cluster_static_config动态配置文件最大的作用就是记录了当前节点状态,标记节点主备角色,这样重启的时候知道节点的启动方式可以通过gs_om -t refreshconf生成 只有进行过主备切换才有必要执行这个命令开胃菜拼盘之备机的数据目录丢失建立postgresql.conf文件后build即可postgresql.conf可以从主机拷贝后修改,如果日常养成了备份的习惯那就更方便了gs_om -t status --detail scp xb01:/data1/zxbog/openGauss/data/dn1/postgresql.conf ./data1/zxbog/openGauss/data/dn2/ gs_ctl build -D /data1/zxbog/openGauss/data/dn2开胃菜拼盘之主机的数据目录丢失按修复备机的方式肯定是不行滴,需要先备升主,然后按备机方式修复,最后再主备切换主机down的时候,需要在备机failover来实现备升主主机normal的时候,需要在备机switchover来实现备升主gs_ctl failover -D /data1/zxbog/openGauss/data/dn2 gs_ctl switchover -D /data1/zxbog/openGauss/data/dn1开胃菜拼盘之GPHOME/GAUSSHOME目录丢失GPHOME下主要是OM脚本(数据库运维工具),python语言如果丢失,可以从其他节点直接cp(推荐),或者安装包直接解压覆盖,也可以重新执行一遍gs_preinstallGAUSSHOME下主要存放数据库内核可执行文件,C/C++语言编译如果丢失,可以从同集群其他节点cp(推荐)或者解压安装包中的bz压缩包,由于GAUSSHOME/bin目录下存放了各自的静态配置文件,需要修改为啥我都是推荐从其他节点cp呢,通过om安装的数据库会产生证书在每个节点,解压包是不会产生这些的,如果用到了openssl,需要手动生成正菜之节点替换与修复节点替换与修复一般有两种场景机器损坏,需要重新搭建一台,配置比如ip都不变机器被征用,需要换一台新的机器,ip地址也变更了这种情况可以先用gs_dropnode删除老的节点,然后通过gs_expansion扩新的节点这两个命令都是要求在主节点下执行,如果要修改主节点,请先主备切换,并刷新静态/动态配置文件gs_dropnode 需要在普通用户下执行,gs_expansion需要在root用户下执行[xb0608@xb01 ~]$ gs_dropnode -U xb0608 -G xb0608 -h 192.168.0.26 [root@xb01 script]# /opt/software/script/gs_expansion -U xb0608 -G xb0608 -X ../double.xml -h 192.168.0.26在执行扩节点之前,为减少不必要的麻烦,请确保新的节点足够干净,邪 恶代码如下,谨慎使用ps -ef|grep ^xb0608|awk '{print $2}'|xargs kill -9 && userdel -r xb0608 rm -rf /data1/zxbog/openGauss/ groupadd xb0608 && useradd xb0608 -g xb0608 passwd xb0608 传说中的甜点如果整个集群都被 干掉了咋办~~既然有主备节点,就可以有主备集群啦OM重磅功能支持主备集群-流式容灾搭建即将上线,敬请期待
-
灵魂画师再次上线在开饭前我们先了解下两个关键的配置文件数据目录下的postgresql.conf比对一下主备节点的postgresql.conf,应该有以下几个参数不一致listen_addresses 远程客户端连接使用的数据库主节点ip或者主机名 local_bind_address 当前节点连接openGauss其他节点时绑定的本地IP地址 replconninfo1 设置本端侦听和鉴权的第一个节点信息,如果备机有2个,就会有replconninfo2 log_directory 决定存放服务器日志文件的目录,om初始化安装时命名跟实例id相关 audit_directory 审计文件的存储目录,om初始化安装时命名跟实例id相关 application_name 连接请求时所使用的客户端名称,om初始化安装时命名跟实例id相关来自踩坑者的warning:根据某一个节点生成例外一个节点的postgresql.conf文件,俗手请按参数逐个修改,不可全量替换,容易改错ip等$GAUSSHOME/bin/cluster_static_config俗称静态配置文件,OM工具的核心,记录了当前节点和集群的基本信息,二进制结构化文件可以通过gs_om -t view 来查看可以通过gs_om -t generateconf -X XMLFILE --distribute 重新生成有静态配置文件,就有动态配置文件cluster_static_config动态配置文件最大的作用就是记录了当前节点状态,标记节点主备角色,这样重启的时候知道节点的启动方式可以通过gs_om -t refreshconf生成 只有进行过主备切换才有必要执行这个命令开胃菜拼盘之备机的数据目录丢失建立postgresql.conf文件后build即可postgresql.conf可以从主机拷贝后修改,如果日常养成了备份的习惯那就更方便了gs_om -t status --detail scp xb01:/data1/zxbog/openGauss/data/dn1/postgresql.conf ./data1/zxbog/openGauss/data/dn2/ gs_ctl build -D /data1/zxbog/openGauss/data/dn2开胃菜拼盘之主机的数据目录丢失按修复备机的方式肯定是不行滴,需要先备升主,然后按备机方式修复,最后再主备切换主机down的时候,需要在备机failover来实现备升主主机normal的时候,需要在备机switchover来实现备升主gs_ctl failover -D /data1/zxbog/openGauss/data/dn2 gs_ctl switchover -D /data1/zxbog/openGauss/data/dn1开胃菜拼盘之GPHOME/GAUSSHOME目录丢失GPHOME下主要是OM脚本(数据库运维工具),python语言如果丢失,可以从其他节点直接cp(推荐),或者安装包直接解压覆盖,也可以重新执行一遍gs_preinstallGAUSSHOME下主要存放数据库内核可执行文件,C/C++语言编译如果丢失,可以从同集群其他节点cp(推荐)或者解压安装包中的bz压缩包,由于GAUSSHOME/bin目录下存放了各自的静态配置文件,需要修改为啥我都是推荐从其他节点cp呢,通过om安装的数据库会产生证书在每个节点,解压包是不会产生这些的,如果用到了openssl,需要手动生成正菜之节点替换与修复节点替换与修复一般有两种场景机器损坏,需要重新搭建一台,配置比如ip都不变机器被征用,需要换一台新的机器,ip地址也变更了这种情况可以先用gs_dropnode删除老的节点,然后通过gs_expansion扩新的节点这两个命令都是要求在主节点下执行,如果要修改主节点,请先主备切换,并刷新静态/动态配置文件gs_dropnode 需要在普通用户下执行,gs_expansion需要在root用户下执行[xb0608@xb01 ~]$ gs_dropnode -U xb0608 -G xb0608 -h 192.168.0.26 [root@xb01 script]# /opt/software/script/gs_expansion -U xb0608 -G xb0608 -X ../double.xml -h 192.168.0.26在执行扩节点之前,为减少不必要的麻烦,请确保新的节点足够干净,邪 恶代码如下,谨慎使用ps -ef|grep ^xb0608|awk '{print $2}'|xargs kill -9 && userdel -r xb0608 rm -rf /data1/zxbog/openGauss/ groupadd xb0608 && useradd xb0608 -g xb0608 passwd xb0608 传说中的甜点如果整个集群都被 干掉了咋办~~既然有主备节点,就可以有主备集群啦OM重磅功能支持主备集群-流式容灾搭建即将上线,敬请期待
-
双机热备包括双机热备、主备备份、负载分担、VRRP、vgmp、hrp、心跳线、抢占等1、双机热备 为了避免网关单点故障的风险,可以在网络的节点处同时部署两台设备,形成双机热备网。 当其中一台设备故障时可以平滑地切换到备用设备上。2、主备备份 在正常情况下仅用主用设备处理业务,备份设备空闲;当朱永设备接口、链路或整机故障时,备份设备切换为主用设备。 这种方式可以有效的防止设备单点故障导致的为了中断。通常用于重点业务的入口或接入点上。3、负载分担 所谓的负载分担也可以称为互为主备。两台设备同时处理业务。当一台设备发送故障的时候另一台设备会继承处理的业务。 两台设备共同处理业务链路,提高网络的转发效率降低主备发生的故障几率。3、VGMP VGMP的基本观念如下 (1)接口集中监控 将系统中的所有VRRP主备组都加入到VGMP管理组中,由VGMP管理组统一监控组内所有的VRRP组的状态。 将系统的业务接口加入到VGMP管理组中,由VGMP管理组统一接组内所有接口状态(HRP track) (2)设备状态统一管理 USG是提高VGMP管理组来进行设备状态管理的。VGMP管理组的主备状态决定了双机热备组网中设备的主备状态,决定了VGMP管理组内的成员接口和VRRP备份组的状态。 当一台设备的VFMP管理组状态为master时,组内所有成员的接口状态统一为master,该设备变成组设备。另一台设备的VGMP状态为slave。则该设备为备用设备。 每台设备的VGMP管理组的初始状态由用户决定(master或slave),master优先级为65001。slave的优先级为65000。当VGMP管理组通过VRRP组或者直接监视到接口down时,会重新技术VGMP管理组优先级,计算公式如下:VGMP优先级=VGMP初始设定-N*2(N为即可数量)。4、VRRP 在双机热备中VRRP的主要在于是检测三层接口故障并通知VGMP管理组,触发VGMP优先级变化。5、HRP USG是状态防火墙,对于每一个动态生成的回话连接,都有一个会话表项对应。主用设备主力业务的过程创建了很多会话表项;而备用设备没有流量经过,因此没有创建会话表项。 如果发生主备切换则要重新建立会话,正在进行的会话会因为没有表项导致会话中断。 为了实现主要设备出现故障能平滑的切换到备用设备,需要在主备之间备份关系配置命令和会话表的状态信息。 启动HRP备份功能后,关键配置命令和会话表状态信息会实时同步到备份设备上。6、心跳线 心跳线是指主设备和备用设备之间的直连网线,主备设备通过心跳线小虎报文了解对方的状态,以及实现配置命令和状态信息的备份。心跳线两端的接口为心跳接口。7、抢占 当主用设备恢复正常后,重新切换成主用设备处理业务的过程。 如果取消了抢占功能的配置,则原主用设备恢复后,仍是备用设备处理业务。双机热备使用限制 硬件限制 只支持两台设备进行热备。 型号和版本相同。 接口卡位置、类型和数量相同。 如果使用二层接口作为心跳线,需要将二层接口加入到vlan,创建vlanif并配置IP地址。然后将vlanif接口作为心跳接口,配置remote参数来指定对端心跳接口的IP地址。 软件限制 软件版本相同。 bootrom版本相同。 运行模式相同,级都是防火墙模式或UTM模式。 禁用主备设备的配置文件均为初始文件。否则,可能由于两台设备的配置冲突导致设备切换后出现问题。 主备设备的虚拟防火墙的名称,数量和配置顺序必须一致 主备设备的对应接口必须加入到相同的安全区域。比如主设备的G0/0/1加入了trust区域,备份设备的G0/0/1也要加入trust区域 心跳接口配置必须一致 主备设备业务即可IP地址固定,因此双机热备特性不能于pppoe拨号、dhcp Client、3g或xdsl等自动获得IP地址的特性结合使用。 与NAT结合使用的限制 双机热备与NAT结合时,主备设备的上下行业务接口必须为三层接口 配置vrrp组时,需要将NAT地址池或者NAT server与vrrp组绑定。 与IPSec结合使用限制 主备备份场景主从与IPSec结合使用,负载分担场景不支持 双机热备与IPSec结合时,主备设备的上下行业务接口必须为三层接口 双机热备和IPSec的配置与单独使用时没有区别 只需要在主用设备上配置IPSec策略,在备用设备上不需要配置IPSec策略。主用设备的IPSec策略会备份到备用设备上,因此只需要子啊备用设备的出接口上应用备份过来的IPSec策略。 作为IPSec隧道的发起方,则必须要指向命令local-address [ip-address],设置本段发起协商的地址为VRRP组的虚拟地址。 配置流程1、完成业务接口的基本配置2、配置VGMP管理组(三选一) (1)三层业务接口连接交换机 通过vrrp备份组检测三层业务接口 (2)三层业务接口来连接路由器 通过HRP track检测三层业务接口 (3)二层业务接口 通过HTP Track检测vlan3、配置心跳口4、启动HRP备份4、(可选项)配置HRP备份方式5、配置主备防火墙的配置一致性6、验证配置结果6、(可选项)关键组网需求配置其他业务7、ENDEVRRP配置命令FW1:interface gigabitethernet 0/0/1ip address 10.0.0.1 24vrrp vrid 1 virtual-ip 10.0.0.254 24 activeFW2:interface gigabitethernet 0/0/1ip address 10.0.0.2 24vrrp vrid 1 virtual-ip 10.0.0.254 24 active !在配置vrrp的时候发现,当接口shutdown后,vrrp组进入初始化状态,USG6000的抢占延迟为60s。master在同一个设备上时是可以进行通讯,如果master在不同设备上时测试通讯失败。vrrp可能是VGMP没有进行统一管理。在USG5000型号上配置vrrp时需要使用命令vrrp virtual-mac enable,不然会不能ping通虚拟地址的情况。!配置HRP trackinterface gigabitethernet 0/0/0hrp track {master|slave} #配置状态为master或slave的VGMP管理监测口状态 #主备场景下,主用设备的上下行接口上配置master,备用设备配置slave。 #负载分担场景下,主备设备的上下行接口都配置master和slave。hrp ospf-cost adjust-enable [slave-cost] #区域HRP状态调整ospf相关cost值system-viewhrp preempt delay [ interval ] #配置VGMP管理组的抢占延迟hrp enable #启动HRP hrp configuration check [hrp|acl] #检测hrp两端配置一致性hrp interface [interface-type] [interface-number] remote [ip-address] #配置心跳线(加入接口需要完成基本配置,例如IP地址防火墙区域)hrp switch active #设置设备为主用设备hrp auto-sync [config|connection-status] #启动命令与状态自动备份hrp auto-sync #启动命令与状态自动备份 hrp sync [config|connection-status] #区域命令与状态手动批量备份bhrp mirror session enable #启用快速会话备份试验NAT+VRRP+HRP(基于USG 6000):hrp enablehrp interface gigabitethernet 1/0/1 remote 10.0.0.1hrp mirror session enable #hrp nat resource primary-gourp|secondary-group 在负载均衡情况下使用nat是需要在主备设备配置该命令interface gigabitethernet 1/0/2ip address 200.0.0.1 24vrrp vrid 2 virtual-address 200.0.0.3 activenat address-group 'all' 1 section 200.0.0.5 200.0.0.254 quitsecurity-policy rule name nat source-zone trust destination-zone untrust action permit quitnat-policy rule name nat source-zone trust destination-zone untrust action source-nat quit
-
已重装
-
# 一、问题现象 某个线下环境DN发生主备切换 # 二、问题影响 DN实例很频繁发生切换,业务出现断链情况 # 三、问题定位 ## 1.根据“由现象看问题本质”的原则,先看DN实例的日志 ``` source /opt/huawei/Bigdata/mppdb/.mppdbgs_profile cd $GAUSSLOG/pg_log/dn_6003 ll -thr vi postgres-xxx.log ``` 看到DN日志报:Too many open file in systems ## 2.查看OS日志 ``` cd /var/log tail -500f messages ``` 看到OS日志很多行报:VFS:file-max limit 640000 reached ## 3.进一步监控 ``` lsof -n|awk '{print $2}'|sort|uniq -c|sort -nr|more|head -n 20 ``` 本次处理打印了最多的20个文件句柄的进程,打印出结果的第二列为进程ID,可以观察是那个进程打开的文件过过多 ``` lsof -u omm |awk '{print $2}'| sort | uniq -c | sort -nr | head ``` 观察用户打开的文件句柄数 ``` ps -ef|grep 46905 ``` 也可以使用一下脚本监控: ``` #!/bin/bash while true do for PID in `lsof -u omm|awk '{print $2}'|sort|uniq -c|sort -nr| head | awk '{print $2}' | head -n 1` do date +'%Y-%m-%d %H:%M:%S' >> /home/omm/pid-2022-01-26.txt echo $PID >> /home/omm/pid-2022-01-26.txt lsof -p $PID >> /home/omm/pid-2022-01-26.txt sleep 1800 done done ``` ## 4.经确认文件句柄数达到阈值与近期新上的业务语句有关 好多表union all 和 join ## 5.调整omm用户文件句柄数 一般默认是1000000(100W),不建议改动,因为跟主机的综合性能有关,此处改为500W观察。
-
问题现象:manager页面显示 ldapserver和 krbserver异常,但后台查看这两个服务是正常的版本信息:纯软8.1.1问题影响:页面显示服务异常,影响用户使用排查过程:1.页面显示备oms节点 ldapserver和 krbserver异常,后台执行 sh /opt/huawei/Bigdata/om-server/om/sbin/status-oms.sh 主备oms状态均显示正常2.页面显示备oms节点ldap服务启动失败尝试手动启动ldap sh /opt/huawei/Bigdata/om-server/om/ldapserver/ldapserver/local/script/ldapserver_start.sh,启动失败3.重开窗口,重启nodeagent进程 /opt/huawei/Bigdata/om-agent_6.5.1/nodeagent/bin/stop-agent.sh(start-agent.sh)重新启动ldap服务,启动成功4.页面重启 ldapserver和 krbserver服务,启动成功问题原因:现场source了mppdb的环境变量,导致启动manager的服务失败,环境变量污染解决方法:重开一个窗口,不source环境变量,重启nodeagent进程,重启异常服务
-
验证触发mgr主备切换时,对集群性能是否有影响先给集群打上背景流量:ceph -s状态:停掉node3的mgr(active mgr)服务:systemctl stop ceph-mgr@node3ceph -s 观察,完成mgr@node3到mgr@node1的倒换,集群健康状态正常,client流量无明显波动。
-
当某一地区故障而导致业务不可用,可以使用数据复制服务DRS推出的灾备场景,为业务连续性提供数据库的同步保障。本节小课为您介绍RDS for MySQL实例通过DRS服务搭建异地单主灾备的过程。实现原理RDS跨Region容灾实现原理说明:在两个数据中心独立部署RDS for MySQL实例,通过DRS服务将生产中心MySQL库中的数据同步到灾备中心MySQL库中,实现RDS for MySQL主实例和跨Region灾备实例之间的实时同步。更多关于MySQL实例灾备须知请单击这里了解。一、生产中心RDS for MySQL实例准备创建MySQL业务实例,选择已规划的业务实例所属VPC,并为实例绑定EIP。1. 登录华为云控制台。2. 单击管理控制台左上角的,选择区域“华北-北京一”。3. 单击左侧的服务列表图标,选择“数据库 > 云数据库 RDS”。4. 单击“购买数据库实例”。5. 填选实例信息后,单击“立即购买”。 选择引擎版本信息。选择规格信息。选择已规划的网络信息。设置管理员密码。6. 为创建的RDS实例绑定弹性公网IP。二、灾备中心RDS for MySQL实例准备创建MySQL灾备实例,选择已规划的灾备实例所属VPC。1. 单击管理控制台左上角的,选择区域“华北-北京四”。2. 单击左侧的服务列表图标,选择“数据库 > 云数据库 RDS”。3. 单击“购买数据库实例”。4. 填选实例信息后,单击“立即购买”。选择灾备实例引擎版本信息选择灾备实例规格信息选择灾备实例已规划的网络信息设置灾备实例管理员密码三、搭建容灾关系创建DRS灾备实例,创建时选择灾备中心创建的RDS for MySQL实例。1. 在“华北-北京四”区域,单击左侧的服务列表图标,选择“数据库 > 数据复制服务 DRS”。2. 选择左侧“实时灾备管理”,单击右上角“创建灾备任务”。3. 灾备类型选择“单主灾备”,灾备关系选择“本云为备”,灾备数据库实例选择在“华北-北京四”新创建的MySQL灾备实例,单击“下一步”,开始创建灾备实例。设置基本信息设置灾备实例信息4. 返回“实时灾备管理”页面,可以看到新创建的灾备实例。创建完成5. 在灾备实例上,单击“编辑”。6. 根据界面提示,将灾备实例的弹性公网IP加入生产中心MySQL实例所属安全组的入方向规则,选择TCP协议,端口为生产中心MySQL实例的端口号。添加安全组规则 源库信息中的“IP地址或域名”填写生产中心MySQL实例绑定的EIP,“端口”填写生产中心MySQL实例的端口号。测试通过后,单击“下一步”,直到任务启动,任务状态为“灾备中”。编辑灾备任务灾备中四、容灾切换生产中心数据库故障时,需要手动将灾备数据库实例切换为可读写状态。切换后,将通过灾备实例写入数据,并同步到源库。1. 生产中心源库发生故障,例如:源库无法连接、源库执行缓慢、CPU占比高。2. 收到SMN邮件通知。邮件通知3. 查看灾备任务时延异常。时延异常4. 用户自行判断业务已经停止。具体请参考如何确保业务数据库的全部业务已经停止。5. 选择“批量操作 > 主备倒换”,将灾备实例由只读状态更改为读写状态。主备倒换倒换完成6. 在应用端修改数据库连接地址后,可正常连接数据库,进行数据读写。
-
伴随着信息技术的高速发展,数据和信息在现代企业中扮演着越来越重要的角色,信息数据的丢失和损坏将对企业造成难以估量的损失。如何抵御大规模的灾难事件受到人们越来越多的关注,现阶段而言,容灾是较好的解决方案。关键数据的备份与恢复操作已经成为系统日常运行维护的一个重要组成部分。华为云云数据库服务的双AZ高可用实例,可以满足同城级别的灾备。数据复制服务提供的多活灾备功能具有跨区域、跨云灾备的能力,分为单主灾备和双主灾备。单主灾备单主灾备即使用一主一备的架构,当灾难发生时原灾备数据库作为业务数据库保证业务正常运行。DRS的主备倒换功能可以实现主备切换,主备倒换前,业务正常运行在业务数据库,并且将数据实时同步至灾备数据库。此时,灾备数据库不可写入数据。主备倒换后,原灾备数据库为可读写状态,可将业务切换到原灾备数据库运行,原业务数据库不可写 。双主灾备双主灾备多用于灾备双方互为主备,共同承担业务流量的场景。其角色分为主1、主2,使用之前需要首先确立本云(本区)RDS的角色,才可以更好的完成多活灾备的搭建。完整的双主灾备是由正、反两条链路构成的,其创建顺序有着严格的要求。开始时,主1为可读写状态、主2为只读状态,正向灾备将初始化数据全量同步到主2后,方可启动反向灾备。此时,主1、主2均为可读写状态,正/反向灾备分别向主2、主1持续同步增量数据。特点及使用约束· 重要! 双主灾备是对环境要求比较高的架构,实施部署双主灾备前请务必阅读约束和设计思考。· 双主灾备的搭建过程对步骤是有严格要求的,请按照以下步骤进行部署,以确保双主任务顺利部署。创建正向灾备任务,具体操作步骤请参见创建灾备任务。创建完成后,会生成两个子任务,即正向灾备和反向灾备任务,此时反向灾备任务为配置状态。当正向灾备任务进入“灾备中”状态时(反向任务操作列出现编辑),配置并启动反向任务。 在“多活灾备管理”页面,选择该灾备任务的反向任务,单击操作列的编辑,进入“创建灾备任务”页面,继续完成创建反向任务。建议您在主2进行验证,满足预期后,启动反向任务。更多内容,猛戳>>>
-
IT圈有个“大病”谈之色变,却又不能不谈带不来经济效益,又必须投入技术眼花缭乱,却没有一个让客户真的省心省力学名:容灾天有不测风云设备就有故障维修政府和大企业用户的业务上云关乎社会的稳定,企业的发展容灾能力抗不抗造成为每一个CIO日常回味的问题如今,能搞云容灾的厂商比比皆是但是进入终极PK赛道,用户给出了极为苛刻的挑选条件选对一款,化险为夷华为云Stack承诺:上云即容灾,全栈可防护不啰嗦,直接上大招大招1:业务无改造,上云即容灾01 挑战 云原生业务生于云、长于云,容器、分布式数据库、应用中间件、大数据等云原生组件将代替原来传统的烟囱式架构;政企客户在探索云原生双活时,要强依赖ISV设计开发从而实现容灾,而ISV的能力参差不齐,业务改造挑战很大。华为云Stack提供从IaaS到高阶服务的云原生应用所需的全栈组件,并支持组件的容灾能力。客户无需端到端改造业务,上云即可轻松实现云原生双活以及跨地域的容灾,匹配政企从0到1、1到N的容灾建设节奏,满足不同的业务连续性需求。02 获益点 1.平台级全栈容灾,业务上云更可靠2.业务不改造,成本节省50%3.数据0丢失,业务永在线大招2:实例级双活,无感知切换01 挑战在传统灾备方案设计中,往往是以数据中心的基础设施为中心,应对的都是数据中心的故障场景;这是因为由于上层应用的依赖访问关系复杂,很难拆分清楚,无法再做到更细粒度的切换。尤其在每年的灾备演练时,需要全部切换过去才敢做验证,这个一直都是做灾备运维管理者的噩梦。 针对上述情况,华为云Stack提供了实例级双活自动切换能力,不论是网络、数据库、中间件都可以做到实例级的跨DC自动切换。实例切换后对外访问的IP地址都不会改变,不影响应用之前的访问关系,从而减少局部故障对整体服务的影响,不论在家还是在公司,都可以做到心里无忧。02 获益点 1.从IaaS、数据库、中间件、大数据、高阶服务全栈高可用2.实例级、细粒度主备双活3.业务无感知,自动切换大招3:匹配政企,租户化管理01 挑战 业务云化部署,需要以应用为中心实现容灾,而非传统灾备以IT为中心的集中式管理架构。云内租户对业务管控需求增加,若依旧按照传统方式线下填写灾备申请,转嫁给IT部门的管理成本和沟通成本越来越高,这不利于一朵云的健康运营。通过华为云Stack提供的租户向导式自助服务,针对关键业务,云上一键式容灾申请,做到灾备管理可量化、可视化,实现“灾备即服务”的按需申请,避免IT管理员对灾备资源集中式低效管理,一定程度降低成本。同时,租户可通过容灾管理平台定期演练,防患于未然。02 获益点 1.租户按需自助申请2.一键容灾,一键演练3.统一灾备管理,恢复效率提升100%看得到的服务,全方位的保护从咨询到交付演练,专业服务保驾护航给你最省心可靠的政企上云容灾方案转自华为云公众号
推荐直播
-
全面解析华为云EI-API服务:理论基础与实践应用指南
2024/11/29 周五 18:20-20:20
Alex 华为云学堂技术讲师
本期直播给大家带来的是理论与实践结合的华为云EI-API的服务介绍。从“主要功能,应用场景,实践案例,调用流程”四个维度来深入解析“语音交互API,文字识别API,自然语言处理API,图像识别API及图像搜索API”五大场景下API服务,同时结合实验,来加深开发者对API服务理解。
去报名 -
企业员工、应届毕业生、在读研究生共探项目实践
2024/12/02 周一 19:00-21:00
姚圣伟 在职软件工程师 昇腾社区优秀开发者 华为云云享专家 HCDG天津地区发起人
大神带你一键了解和掌握LeakyReLU自定义算子在ONNX网络中应用和优化技巧,在线分享如何入门,以及在工作中如何结合实际项目进行学习
即将直播 -
昇腾云服务ModelArts深度解析:理论基础与实践应用指南
2024/12/03 周二 14:30-16:30
Alex 华为云学堂技术讲师
如何快速创建和部署模型,管理全周期AI工作流呢?本期直播聚焦华为昇腾云服务ModelArts一站式AI开发平台功能介绍,同时结合基于ModelArts 的实践性实验,帮助开发者从理论到实验更好地理解和使用ModelArts。
去报名
热门标签