• [实践系列] GaussDB(DWS) 【视图依赖的表名发生rename后DWS与ORACLE的不同表现】
    1.GaussDB For DWS中测试结果:(1)定义一个表t1及视图v1,t1表插入数据:create table t1(a int);create view v1 as select * from t1;insert into t1 values(1);(2)t1表rename为t2表alter table t1 rename to t2;(3)查询视图v1定义及数据select * from v1;select pg_get_viewdef('v1');如上图,在DWS中,视图依赖的表发生rename后,变更的表名会同步至视图定义。1.Oracle中测试结果:(1)定义一个表t1及视图v1,t1表插入数据create table t1(a int);create view v1 as select * from t1;insert into t1 values(1);(2)t1表rename为t2表alter table t1 rename to t2;(3)查询视图v1定义及数据select * from v1;select dbms_metadata.get_ddl('VIEW','V1') from dual;如上图,在Oracle中,视图依赖的表发生rename后,变更的表名不会同步至视图定义。
  • [其他] 【安装】安装双机OMS,主OMS成功,备启动时提示NTP超时
    问题背景与现象安装双机oms,主oms安装成功,安装备oms时报启动ntp超时。原因分析在主备oms上分别执行sh /opt/huawei/Bigdata/om-0.0.1/sbin/status-oms.sh,如果看不到对端oms状态信息,基本可以确认是HA证书过期导致。可通过下面命令查看证书的有效时间以及系统当前时间(GMT时间可以等效于UTC时间)。openssl x509 -in /opt/huawei/Bigdata/om-0.0.1/security/certHA/root-ca.crt -noout –dates。可以看到系统当前时间已经超过证书有效期,可以确定是HA证书过期导致。解决办法使用omm用户在主OMS节点上执行以下命令生成证书私钥(安装场景root安装可以使用root用户执行,非root安装则该步骤可放在执行preset之后):openssl genrsa -aes256 -passout pass:$password -out $path/root-ca.pem 2048其中$password为证书密码,$path为存放私钥和证书文件的路径,下同。例如:openssl genrsa -aes256 -passout pass:Changeme_123 -out /home/omm/root-ca.pem 2048生成root-ca.pem(如果是升级/新安装场景,务必保证 $password是FI证书的默认密码Changeme_123)。使用omm用户在主OMS节点上执行以下命令生成证书(安装场景root安装可以使用root用户执行,非root安装则该步骤可放在执行preset之后):openssl req -passin pass:$password -new -x509 -days $days -key $path/root-ca.pem -sha256 -out $path/root-ca.crt -subj "/C=$country/ST=$state/L=$city/O=$company/OU=$organize/CN=$commonname/emailAddress=$email"其中,$password为生成私钥时传入的密码,$days为证书的有效期天数,$path为临时存放证书的路径,均可根据实际需要进行配置。例如:生成证书openssl req -passin pass:Changeme_123 -new -x509 -days 36500 -key /home/omm/root-ca.pem -sha256 -out /home/omm/root-ca.crt -subj /C=CN/ST=guangdong/L=shenzhen/O=huawei/OU=IT/CN=HADOOP.COM/emailAddress=FI@huawei.com这样,就在 /home/omm目录下生成了root-ca.crt和root-ca.pem两个文件。使用安装/升级用户进入到升级/安装包解压后的安装目录(假定用户已经将升级/安装包解压);cd升级(安装)包所在目录/FusionInsight/software/om/package解压缩om-0.0.1.tar.gz,执行下列命令:tar -zxvf om-0.0.1.tar.gz替换预置的HA证书。手工将上面步骤1中生成的root-ca.crt和root-ca.pem拷贝到解压缩后的om-0.0.1/security/certHA/目录下,替换掉目录下原有文件,注意文件权限不变。替换完成后,重新压缩om-0.0.1.tar.gz,注意重新压缩后权限不变。cd升级包(安装包)所在目录/FusionInsight/software/om/packagerm -f om-0.0.1.tar.gztar -czvf om-0.0.1.tar.gz om-0.0.1rm -rf om-0.0.1操作完成以后,可以按照正常的流程进行升级或安装操作。
  • [其他] 【安装】安装OMS失败,报错安装logman失败
    问题背景与现象安装OMS失败,提示Failed to install logman。原因分析查看安装日志“/var/log/Bigdata/controller/scriptlog/install.log”,报如下错误:[2016-06-17 09:58:35] DEBUG configDiskManager end [install.sh(configDiskManager):1997](113506)[2016-06-17 09:58:35] INFO Start oms. [install.sh(start_oms):843](113506)start HA successfully.[2016-06-17 09:59:30] DEBUG Config crontab. [install.sh(config_crontab):348](113506)[2016-06-17 09:59:30] INFO Succeed to start oms. [install.sh(start_oms):864](113506)[2016-06-17 09:59:30] INFO The script to install logman. [install.sh(install_logman):1367](113506)You (omm) are not allowed to use this program (crontab)See crontab(1) for more informationget crontab file failed.You (omm) are not allowed to use this program (crontab)See crontab(1) for more informationget crontab file failed.[2016-06-17 09:59:30] ERROR Failed to install logman. [install.sh(main):1832](113506)ERROR:Failed to install logman.[2016-06-17 09:59:30] ERROR Installation failed. For details about the error, see the log file /var/log/Bigdata/controller/scriptlog/install.log. [install.sh(post_install):443](112780)cron配置文件被修改,导致没权限修改crontab文件,导致logman安装失败。解决办法修改“cron.deny.bak”为“cron.deny”,卸载后重新安装。 
  • [其他] 【安装】操作系统shared_buffers参数的值大于kernel.shmmax
    问题背景与现象安装OMS失败。原因分析查看gaussDB安装日志“/var/log/gaussdbinstall.log”。操作系统shared_buffers参数的值大于kernel.shmmax。解决办法编辑“/etc/sysctl.conf”文件,设置“kernel.shmmax”的值,格式如下。kernel.shmmax = value建议将shmmax的值设置为物理内存大小的一半。可用如下命令查看本机的物理内存:grep MemTotal /proc/meminfo显示类似如下的信息:MeMTotal: 6088240 kB则kernel.shmmax的大小可设置为6088240*1024/2=3117178880。kernel.shmmax = 3117178880执行如下命令,使SUSE Linux启动时自动读取内核参数。/sbin/chkconfig boot.sysctl on执行如下命令使内核参数生效。/sbin/sysctl -p 
  • [其他] 【安装】root用户属组不对导致安装gaussdb失败
    问题背景与现象安装OMS失败。原因分析查看“/var/log/Bigdata/omm/oms/install_oms.log”。手动执行报错的命令:可以看出是root用户的属组不对。解决方法修改root用户属组id为0,重新安装OMS。
  • [其他] 【安装】系统信号量不足导致安装gaussdb失败
    问题背景与现象安装OMS失败。原因分析查看gaussDB安装日志(/var/log/gaussdbinstall.log),发现是初始化db失败,进而查看初始化db日志(/home/ommdba/gs_initdb-2016-06-13_162302.log):日志中显示创建信号量失败,原因为超过了操作系统信号量资源的使用限制。【检查方法】:执行如下命令,查看操作系统信号量资源的限制参数:sysctl kernel.semkernel.sem = 2500 32000 1000 128其中第4个数据对应系统内核的SEMMNI参数,该参数用于控制整个Linux系统中信号集的最大数量。就GaussDB而言,这个参数至少应该为(max_connections / 16 + 1)。解决办法增大操作系统信号量资源的限制参数值(具体大小需要业务根据自己的资源使用来确定):修改内核配置文件"/etc/sysctl.conf",在此文件的任意位置增加如下参数:kernel.sem = 2500 32000 1000 1280Suse系统执行如下命令,使SUSE Linux启动时自动读取内核参数。(Red Hat系统可忽略)/sbin/chkconfig boot.sysctl on执行如下命令使内核参数生效。/sbin/sysctl -p修改后重新安装OMS即可。
  • [其他] 【安装】"/etc/hosts”配置不对导致安装OMS失败
    问题背景与现象安装OMS失败,查看安装日志,提示could not translate host name "localhost" to address。原因分析查看安装日志“/var/log/Bigdata/controller/scriptlog/install.log”,报如下错误:从日志中可以看出是无法解析localhost的IP地址导致连接数据库失败,进而导致安装OMS失败。这是因为“/etc/hosts”中没有配置localhost 127.0.0.1。解决办法在“/etc/hosts”中增加一行localhost 127.0.0.1,卸载后重新安装。
  • [其他] 【安装】安装备OMS时启动ntp失败
    问题背景与现象主OMS已安装成功,安装备OMS时启动ntp失败,提示Wait for ntp to startup timeout。===================================Welcome================================================== STEP 1 Preparing components...The ws_float_ip (10.103.100.106) already exists on the network.  Is it used on the active OMS HA? (y/n):yThe om_float_ip (10.103.100.104) already exists on the network. Is it used on the active OMS HA? (y/n):y=== STEP 2 Install packages. It may take several minutes. Please wait...    Waiting for ntp to satrtup.............................................................ERROR:Wait for ntp to startup timeout.ERROR:Installation failed.            Please run the following script to delete useless files:           /opt/huawei/Bigdata/om-0.0.1/inst/uninstall.sh原因分析分析NTP日志(/var/log/ntp.log),发现端口不同拒绝连接,提示connect refused。检查防火墙设置:chkconfig -lst | grep fire。解决办法先卸载已安装的备OMS。关闭防火墙设置。chkconfig SuSEfirewall2_setup offchkconfig SuSEfirewall2_init off重新安装备OMS,安装成功。
  • [其他] 【安装】安装OMS提示解密失败
    问题背景与现象安装OMS失败,报Failed to get omm db password。原因分析查看安装日志(/var/log/Bigdata/controller/scriptlog/install.log),报如下错误:java.security.InvalidKeyException: Illegal key size or default parameters        at javax.crypto.Cipher.checkCryptoPerm(Cipher.java:1011)        at javax.crypto.Cipher.implInit(Cipher.java:786)        at javax.crypto.Cipher.chooseProvider(Cipher.java:849)        at javax.crypto.Cipher.init(Cipher.java:1213)        at javax.crypto.Cipher.init(Cipher.java:1153)        at org.wcc.framework.util.encrypt.PasswordUtil.decryptByAes256(PasswordUtil.java:180)        at org.wcc.framework.util.encrypt.PasswordUtil.decryptByAes256(PasswordUtil.java:146)        at com.omm.encrypt.DecryptCommandMain.decryptCommandLine(DecryptCommandMain.java:71)        at com.omm.encrypt.DecryptCommandMain.main(DecryptCommandMain.java:130)[2014-12-09 10:58:47] ERROR Failed to get omm db password. [installcontroller.sh(main):788](12851)2.解密失败的原因最常见的就是JDK的版本不匹配,大数据FusionInsight系统会在omm用户下安装JDK。如果在安装以前root用户下已经有JDK或者JAVA_HOME环境变量,可能会导致安装FusionInsight失败。解决办法请卸载root用户下的JDK和JAVA_HOME。可以通过在root用户下执行env |grep JAVA_HOME查看。如果存在,请在“/root/.bash_profile”文件中去除JAVA相关环境变量,或者彻底删除安装的JDK,或者清除“/etc/profile”中的JAVA_HOME相关变量。
  • [其他] 【安装】安装Ldap错误导致OMS安装失败
    问题背景与现象OMS安装失败。原因分析查看日志,提示Failed to install ldap,具体内容如下:[2014-12-10 05:52:56] ERROR cleanUpCMD=/opt/huawei/Bigdata/om-0.0.1//ldapserver/ldapserver/ldapserver_wrap.sh [installLdap.sh(cleanup):173](31064)ERROR:cleanUpCMD=/opt/huawei/Bigdata/om-0.0.1//ldapserver/ldapserver/ldapserver_wrap.sh[2014-12-10 05:52:56] ERROR Failed to install ldap.scriptName=/ldapserver/ldapserver/ldapserver_wrap.sh,postinstallCMD=/opt/huawei/Bigdata/om-0.0.1//ldapserver/ldapserver/ldapserver_wrap.sh [installLdap.sh(postinstall):212](31064)ERROR:Failed to install ldap.scriptName=/ldapserver/ldapserver/ldapserver_wrap.sh,postinstallCMD=/opt/huawei/Bigdata/om-0.0.1//ldapserver/ldapserver/ldapserver_wrap.sh[2014-12-10 05:52:56] ERROR The input parameter is incorrect. [installLdap.sh(install):256](31064)ERROR:The input parameter is incorrect.[2014-12-10 05:52:56] ERROR install server failed [installLdap.sh(main):296](31064)ERROR:install server failed[2014-12-10 05:52:56] ERROR Failed to install the ldap [installLdap.sh(main):331](31064)2.查看“/var/log/Bigdata/oldapserver/ldapserver_install.log”,发现如下异常。2014-12-10 05:52:56 566 linux-126 SlapdServer ERROR ldap server rpm is not installed!2014-12-10 05:52:56 569 linux-126 SlapdServer ERROR ldap server rpm is not installed!解决办法缺少Ladp的相关rpm包,需要执行preinstall来进行包的添加。
  • [其他] 【安装】文件权限不对导致Preinstall执行失败
    问题背景与现象使用omm用户进行扩容,在执行preinstall的时候出现如下错误,报Permission denied。Connection to 182.218.146.10/ closed.Error: Execute failed on 182.218.146.107 (1)[Mon May 14 15:23:13 CST 2018] Error: Gen workspace failede on 182.218.146.107mkdir: cannot create directory '/opt/fi-preinstall': Permission denied原因分析分析preinstall日志(/tmp/fi-preinstall.log),日志中的打印和截图反馈中的相同,没有权限。查看 /opt/FusionInsight_SetupTool文件属组,发现是root:root执行preinstall的节点是oms节点,查看该节点omm用户并没有执行提权脚本preset.sh。解决办法修改属组在opt目录下执行chown omm:wheel FusionInsight_SetupTool -R在oms节点上也执行sh /opt/preset/preset.sh提权命令。如果存在root属组的/tmp/fi-preinstall.log文件先mv掉,避免omm用户没有权限写入日志。重新执行preinstall,问题解决。
  • [其他] 【安装】磁盘空间不足导致RPM安装失败
    问题背景与现象执行Preinstall,发现Add Package Failed导致PreInstall失败。原因分析分析preinstall日志(/tmp/fi-preinstall.log)。Preparing...                ###Preparing...                ############xorg-x11-libICE             ##################################################xorg-x11-libSM              ##################################################xorg-x11-libxcb             #####################################################xorg-x11-libX11             ##############################################################################installing package xorg-x11-libXau-7.4-1.15.x86_64 needs 20KB on the / filesysteminstalling package xorg-x11-libICE-7.4-1.15.x86_64 needs 132KB on the / filesysteminstalling package xorg-x11-libSM-7.4-1.18.x86_64 needs 176KB on the / filesystemError: Execute failed on 192.168.29.32 (17) ###[Mon Jun  8 15:51:38 CST 2015] Info: Run ./script//function/remote.sh -i 192.168.29.32 -P 22 -u root -a /tmp/fi-preinstall-ctrl/preinstall-p.bin -t 300 -m ssh-cmd -c rpm -ivh /tmp/fi-preinstall/192.168.29.32_rpms_dir/*.rpm failed, ret code:17[Mon Jun  8 15:51:38 CST 2015] Error: Install [ xorg-x11-libICE xorg-x11-libSM xorg-x11-libX11 xorg-x11-libXau xorg-x11-libXext xorg-x11-libXfixes xorg-x11-libXmu xorg-x11-libXp xorg-x11-libXpm xorg-x11-libXprintUtil xorg-x11-libXrender xorg-x11-libXt xorg-x11-libXv xorg-x11-libfontenc xorg-x11-libs xorg-x11-libxcb xorg-x11-libxkbfile ] on 192.168.29.32 failed. Please check rpm packages version.[Mon Jun  8 15:51:38 CST 2015] Info: Add packages failed on 192.168.29.322.根目录磁盘空间不足,导致安装失败。解决办法清理根目录磁盘空间或者扩容。执行preinstall。
  • [其他] 【安装】版本过高导致RPM安装失败
    问题背景与现象执行Preinstall,Add Package Failed导致PreInstall失败。原因分析分析Preinstall日志(/tmp/fi-preinstall.log)。[Thu Apr  9 18:16:17 CST 2015] Info: Run ./script//function/remote.sh -i 192.168.17.33 -P 22 -u root -a /tmp/fi-preinstall-ctrl/preinstall-p.bin -k /tmp/fi-preinstall-ctrl/known_hosts -t 300 -m ssh-cmd -c rpm -ivh /tmp/fi-preinstall/192.168.17.33_rpms_dir/*.rpm failed, ret code:16[Thu Apr  9 18:16:17 CST 2015] Debug: [/opt/patch/packages/squid-3.1.10-19.el6_4.x86_64.rpm] Leave [get_rpm_file:77][Thu Apr  9 18:16:17 CST 2015] Error: rpm -ivh /tmp/fi-preinstall/192.168.17.33_rpms_dir/*.rpm failed on 192.168.17.33[Thu Apr  9 18:16:17 CST 2015] Error: Add packages failed on 192.168.17.33 [Thu Apr  9 18:16:16 CST 2015] Debug: Leave [exec_cmd_r:60][Thu Apr  9 18:16:16 CST 2015] Debug: Leave [check_rpms_dir:86][Thu Apr  9 18:16:16 CST 2015] Error: [192.168.17.39] Setup os failed2.OS在安装完成后,又安装了OS补丁,有些RPM被升级到高版本了,导致有些有依赖关系的RPM包安装失败。解决办法            方法一:卸载OS补丁后,再重新执行preinstall。 方法二:下载高版本的RPM包,手动安装RPM包。
  • [其他] 【安装】文件权限导致OS优化失败
    问题背景与现象执行Preinstall,发现OS优化失败导致PreInstall失败,提示Operation not permitted。原因分析分析Preinstall日志(“/tmp/fi-preinstall.log”)。Modify /etc/sysctl.conf failed for kernel.sysrq.sed: cannot rename /etc/sedEVdcVQ: Operation not permitted[192.168.17.39]Error: run /tmp/fi-preinstall/modules/050.setup/centos-6.x/setup.sh failed[192.168.17.39]Error: run setup_main 050.setup in [/tmp/fi-preinstall/modules/050.setup] failed[Thu Apr  9 18:16:16 CST 2015] Debug: [/opt/patch/packages:m2crypto.x86_64:0] Enter [get_rpm_file:23]Debug: Missing:bind.x86_64[192.168.17.39]Error: install failedError: Execute failed on 192.168.17.39 (50) [Thu Apr  9 18:16:16 CST 2015] Debug: [/opt/patch/packages:python-simplejson.x86_64:0] Enter [get_rpm_file:23][Thu Apr  9 18:16:16 CST 2015] Info: Run ./script//function/remote.sh -i 192.168.17.39 -P 22 -u root -a /tmp/fi-preinstall-ctrl/preinstall-p.bin -k /tmp/fi-preinstall-ctrl/known_hosts -t 18000 -m ssh-cmd -c bash /tmp/fi-preinstall/modules/install.sh -i "192.168.17.39" -p "0"        -c "" -s "1" -d "1" -k "1" -o "redhat-6.3;redhat-6.4;redhat-6.5;suse-11.1;suse-11.2;centos-6.4;centos-6.5" failed, ret code:50[Thu Apr  9 18:16:16 CST 2015] Debug: Leave [exec_cmd_r:60][Thu Apr  9 18:16:16 CST 2015] Debug: Leave [check_rpms_dir:86][Thu Apr  9 18:16:16 CST 2015] Error: [192.168.17.39] Setup os failed“/etc/sysctl.conf”这个文件添加了隐藏权限(i权限),导致文件修改失败。解决办法执行lsattr -a /etc/sysctl.conf查看文件隐藏权限。执行chattr -i /etc/sysctl.conf删除文件隐藏权限(i权限)。
  • [其他] 【安装】swap分区不一致导致磁盘格式化失败
    问题背景与现象执行Preinstall,发现磁盘格式化失败导致PreInstall失败,提示Disk format failed。原因分析分析PreInstall日志(“/tmp/fi-preinstall.log”)。[Fri Jun  5 11:04:04 CST 2015] [ERROR] [check_swap:1058] sys swap and fstab swap are different.^M[Fri Jun  5 11:04:04 CST 2015] [ERROR] [check_system:622] check swap failed.^M[Fri Jun  5 11:04:04 CST 2015] [ERROR] [main:3216] check system failed.^M[Fri Jun  5 11:04:04 CST 2015] [INFO] [rollback_mount:2943] rollback no mount any yet.^M[Fri Jun  5 11:04:04 CST 2015] [ERROR] [none:3527] execute autopart.sh failed.^M[192.10.10.10]Error: run /tmp/fi-preinstall/modules/070.autopart/autopart/autopart.sh failed^M[192.10.10.10]Error: run autopart_main 070.autopart in [/tmp/fi-preinstall/modules/070.autopart] failed^M/tmp/fi-preinstall/modules/install.sh: line 249:  6036 Terminated              bash ${gc_mian_path}/${path}/schedule.sh "${gc_p_sched_file}" "${gc_sched_file}"^M[192.10.10.10]Error: install failed^MError: Execute failed on 192.10.10.10 (70)2.系统中的swap分区和“/etc/fstab”中的swap分区不一致。解决办法            1.执行swapon -s查看系统是否存在中swap分区。如果存在,请关闭(swapoff -a)。 2.检查“/etc/fstab”文件中是否包含swap分区记录信息,如果存在,请删除。