• [技术干货] 基于 PTS 压测轻松玩转问题诊断
    为什么要做压测的问题定位?性能测试 PTS(Performance Testing Service)是具备强大的分布式压测能力的 SaaS 压测平台,可模拟海量用户的真实业务场景,全方位验证业务站点的性能、容量和稳定性。在不断的对被压服务端水位进行摸高的过程中,我们可以从压测视图或者压测报告中看到较为全面的压测指标,例如 QPS、RT、TPS 等,但是单纯从这些指标上,是不能很快的定位到服务端具体问题所在的,例如,我们从全场景错误信息中心可以看到错误码对应的接口的响应体,但是具体在下游的哪一环节出错,以及错误的堆栈是什么,这里单纯从报告中是看不到的,而接口下游具体是哪里出错,错误堆栈是什么,正是用户所关心的问题。借助问题诊断,我们可以明确被压接口的上下游的调用情况,同时,从链路视图上,我们可以看到整条链路所经过的消息组件(Kafka、RocketMQ 等)、缓存(Redis、MongoDB 等)、数据库(MySQL、Oracle 等)、RPC 调用(Feign、Dubbo、HttpClient 等),例如,某个接口出现状态码异常或者其他的错误,那么,我们可以从调用链上看到到底是 Rpc 调用出现问题,还是数据库读写出现问题,并且能够从调用链上看到对应的报错堆栈,在这些信息的基础上,问题应该去哪里定位也就比较明确了。问题诊断基本介绍和核心优势基本介绍谈到问题诊断,用户主要关心接入问题诊断是否需要对应用侧代码做一系列的改造,是否需要进行繁杂的配置等等。PTS 提供的问题诊断是基于 JavaAgent 的,无需用户侧做业务代码改造,对于基于 Tomcat 的部署方式,用户只需在启动脚本中添加一些必要的参数即可接入问题诊断;对于 Kubernetes 用户,用户只需在 Yaml 配置文件中添加一些必要的注解即可接入问题诊断。对于链路的采集规则,PTS 会提供默认的配置,用户也可根据自己的需要自行更改。PTS 集成的问题诊断在压测过程中,针对每条请求,会在施压引擎端生成 TraceId,通过 TraceId 将该条请求所涉及到的上下游链路关联起来,用户可以看到从该条请求作为入口到本条请求结束所涉及到的完整调用链,同时,问题诊断会针对该调用链生成相应的应用拓扑视图,可以让用户清晰地看到应用之间的调用关系。针对异常的接口,我们可以在调用链中看出对应的错误原因,同时,用户可以根据具体的报错堆栈对服务端的问题进行排查和优化。压测过程中用户可以实时的查看指定请求的调用链,同时,压测结束之后,也可以从压测报告中对问题进行回溯。核心优势1、零代码侵入: 针对 Java 类型的服务,用户侧无需进行业务侧代码改造即可完成问题诊断的探针接入。2、集成度高: 压测、监控、问题诊断,集成在同一控制台,用户理解和操作成本相对较低。3、监控指标全: 在压测过程中,除了较为基础的监控指标外,同时针对每个服务,提供接口、机器、应用级别的监控。 4、门槛低: 仅需要简单配置参数即可完成问题诊断探针接入,同时该探针还具备多协议 Mock、全链路压测等功能。快速玩转问题诊断接入问题诊断的基本流程图如下所示:接入探针,并查看是否接入成功首先,我们将被压场景所涉及到的应用梳理出来,将涉及到的所有应用按照【问题诊断】->【探针接入 [1] 】文档中的步骤进行问题诊断探针接入。我们可以在 PTS 控制台的应用配置或者应用监控、接口监控、机器监控中任选一个来查看应用探针是否接入成功。我们本次演示的压测场景涉及到五个应用,分别是 petstore-web、petstore-user、petstore-order、petstore-catalog、petstore-cart,这以应用监控举例来查看应用是否成功接入。依次点击 PTS 控制台的【问题诊断】->【应用监控 [2] 】->选择我们配置的 Region 以及 Namespace,如果看到压测场景涉及到的所有应用均在该页面,则代表应用接入成功。在压测场景中打开问题诊断开关然后,我们在 PTS 控制台的【压测中心】->【创建场景 [3] 】中创建压测场景,这里可以选择 PTS 场景或者 JMeter 场景等,这里以 PTS 场景为例,因为本次演示主要是验证问题诊断的能力,所以需要在场景配置中的【高级设置】中打开问题诊断开关。具体的监控采集规则,PTS 会为用户推送默认采集开关打开的配置,同时,将采样率设置为千分之一,用户也可根据自己的需要进行自定义。开始压测,查看应用监控完成了以上步骤,我们的压测场景即具备了问题诊断的能力。当我们点击开始压测之后,可以到应用监控、接口监控、机器监控中选择我们关心的服务查看对应的监控情况,这里以应用监控 [2] 为例,其他类型的监控操作步骤类似,我们选择 petstore-user 这个服务来查看应用监控,如下图所示:压测结束后,查看全场景错误信息压测结束后,我们需要从压测报告中针对被压服务端的问题进行排查,打开对应场景的压测报告,具体步骤:PTS 控制台->【压测中心】->【报告列表 [4] 】,选择对应的压测报告,可以从概览页中看到全场景的信息,具体如下图所示:选择探针采样,查看具体调用链情况点击【查看采样日志】,采样类型选择”探针采样“即可过滤出问题诊断探针所采集到的调用链,具体如下图所示:查看调用链具体错误堆栈信息,定位服务端问题所在筛选出来探针端采集的调用链之后,即可对存在问题的接口进行调用链分析,例如,商品列表的接口返回的状态码为 500,点击查看详情看下具体原因,如下图所示:从调用栈中可以看到具体的报错原因,从而对服务端代码进行优化和修复。同时,可以通过应用拓扑视图和数据库视图查看服务之间的调用情况以及数据库使用情况,这里以应用拓扑视图举例,如下图所示:压测报告常见错误码总结问题诊断错误码总结问题诊断调用链路中的常见错误码进行总结,具体如下:java.lang.NullPointerException:服务端空指针,具体可根据调用链中的错误堆栈对服务端的代码进行排查。com.microsoft.sqlserver.jdbc.SQLServerException:服务端 SQL 报错,可根据调用链采集的堆栈信息对服务端 SQL 语法等进行检查。压测报告错误码总结这里针对压测报告中常见的错误进行列举,我们可以从全场景错误信息中看到相关的错误信息,具体如下:class java.net.SocketTimeoutException:null 表示请求在等待响应或者读取中途(idle)超时。请检查服务端健康状况或者 PTS 的压测 API 超时时间的设置是否合理,另外还有可能是服务端处理能力出现瓶颈。class java.net.ConnectException:null 表示请求在与远端(被压测端)建立 TCP 连接时就出现失败或者被远端拒绝。请检查服务端健康状况,或者是网络连接层是否有瓶颈。class java.util.concurrent.TimeoutException:null 表示请求在与远端(被压测端)建立 TCP 连接时就出现失败或者被远端拒绝。请检查服务端健康状况,或者是网络连接层是否有瓶颈。class org.apache.http.ConnectionClosedException:Connection closed 表示连接异常关闭,服务端主动关闭了连接。class java.io.IOException:Connection reset by peer 表示连接被重置。若使用了 SLB,请查看 SLB 的配置是否有问题。class org.apache.http.ConnectionClosedException:Connection closed unexpectedly 表示数据尚未接收完毕,连接就已关闭。可能服务端未及时响应或者提前终止调试或压测。class java.lang.RuntimeException:java.net.UnknownHostException 表示域名信息无法解析。请检查域名是否已经正常注册并可以解析、未注册的域名是否已进行域名绑定。class org.apache.hc.core5.http.ProtocolException:Header 'key: value' is illegal for HTTP/2 messages 表示在服务端优先使用 HTTP2 协议的情况下,场景配置了 HTTP2 协议不支持的 Header,请移除相应Header后重试。HTTP2 不支持的常见 Header 有:Connection、Keep-Alive、Proxy-Connection、Transfer-Encoding、Host、Upgrade。
  • [整体安全] 【漏洞通告】 H2 控制台 JNDI 远程代码执行漏洞 CVE-2021-42392
    漏洞名称 : H2 控制台 JNDI 远程代码执行漏洞 组件名称 : H2影响范围:1.1.100 <= h2 <= 2.0.204漏洞类型:远程代码执行利用条件:1、用户认证:不需要用户认证2、前置条件:打开允许远程访问开关3、触发方式:远程综合评价:<综合评定利用难度>:一般,打开允许远程访问开关即可远程代码执行。<综合评定威胁等级>:严重,能造成远程命令执行。漏洞分析:1、组件介绍H2 是一个用 Java 编写的关系数据库管理系统。它可以嵌入 Java 应用程序中,也可以在客户机-服务器模式下运行。该软件以开源软件 Mozilla Public License 2.0 或原始Eclipse Public License 的形式提供。2、漏洞描述近日,监测到一则 H2 Console 组件存在远程代码执行漏洞的信息,漏洞编号:CVE-2021-42392,漏洞威胁等级:严重。该漏洞是由于 H2 控制台可以通过 JNDI 从远程服务器加载自定义类,攻击者可利用该漏洞在未授权的情况下,构造恶意数据执行远程代码执行攻击,最终获取服务器最高权限。影响范围:H2 Console 几乎可以运行在所有计算机平台上,由于其跨平台和安全性被广泛使用。暴露在公网的 H2 Console 主要分布在中、韩两国。目前受影响的H2 Console版本:1.1.100 <= h2 <= 2.0.204解决方案:1、如何检测组件版本搜索项目文件夹下 h2-xxxx.jar:在 Linux 下使用 find 命令:2、官方修复建议当前官方已发布最新版本,建议受影响的用户及时更新官方的最新版本。链接如下:https://github.com/h2database/h2database/releases参考链接:https://github.com/h2database/h2database/security/advisories/GHSA-h376-j262-vhq6
  • [交流吐槽] 时间字段更新问题
    【功能模块】【操作步骤&问题现象】1、插入数据 0001-01-01 00:00:00 会自动变成 0000-00-00 00:00:00 即使是使用控制台输入sql语句也会自动变2、修改时间字段  当前时间  也会自动变成 0000-00-00 00:00:00    语言是.net   只有在代码里会自动变  在控制台里是正常的 不过控制台是字符串拼接方式  代码里是参数方式【截图信息】【日志信息】(可选,上传日志内容或者附件)
  • [问题求助] 如果您是站长,您可以前往WAF控制台进行误报屏蔽设置,让您的访问不再被拦截
  • [问题求助] 使用PuTTY注册HiLens Kit至云侧管理控制台步骤出错
    【功能模块】注册HiLens Kit至云侧管理控制台【操作步骤&问题现象】1{"error_msg""The API does not exist or has not been published in the environment","error_code":"APIGW.0101","request_id":"60673fad7dc278bb31210a5d15de7481"}2、【截图信息】【日志信息】(可选,上传日志内容或者附件)
  • [问题求助] 【ROMA】【导出】管理控制台导出多个应用时失败
    【功能模块】您好,从上午开始我导出就一直失败,请问这是什么原因?【操作步骤&问题现象】1、2、【截图信息】【日志信息】(可选,上传日志内容或者附件)
  • [问题求助] 华为云控制台怎样将一个产品从一个资源空间转移到另一个资源空间
    【功能模块】【操作步骤&问题现象】1、2、【截图信息】【日志信息】(可选,上传日志内容或者附件)
  • [问题求助] 【AppCube产品】【开发功能】一控制台没有进入开发环境控件
    如何解决。打开页面就没有。
  • [行业资讯] RHEL 9 Beta版发布
    Red Hat Enterprise Linux (RHEL) 9 Beta现已推出,提供了一些新功能和改进,包括从网络控制台应用内核实时补丁。RHEL 9 Beta版本更新内容如下:简化自动化和管理 ,增强的Web控制台性能指标;增强安全性和合规性,默认情况下禁用SSH root密码登录等。除此之外RHEL 9 Beta还附带GCC 11和最新版本的LLVM、Rust和Go编译器,而且Python 3.9也将成为RHEL 9生命周期的默认版本。
  • [问题求助] 【devcloud产品】【控制台功能】如何修改默认控制台的区域定位,想修改成上海一
  • [交流分享] 【Atlas 800-3000/3010 04】BIOS/IBMC/CPLD升级指导
    1、取对应的升级包取包链接:https://support.huawei.com/enterprise/zh/ascend-computing/a800-3000-pid-250743608/software2、解压压缩包,解压后用hpm格式3、登录IBMC>选择固件升级4、IBMC单独升级。5、BIOS和CPLD 可以同时上传,再点升级,在进入虚拟控制台选择第一个“HTML5集成远程控制台(独占)”。进入控制台后,进行下电,上电操作。6、上电完成后,进入固件升级界面,观察升级后的版本。
  • [交流分享] 【Atlas 800-3000/3010 03】泰山服务器修改NUMA配置方法
    1、BMC登陆物理主机2、选择系统管理3、选择BIOS配置——启动项设置——单次有效——BIOS设置,然后点击保存4、首页——虚拟控制台——远程控制——HTML5集成远程控制台(独占)5、点击“关机”图标——强制重启6、等待几分钟左右,在提示输入密码的长方形框中输入“Admin@9000”,然后输入两次Enter7、进入Advanced —— Memory  Config —— One Numa Per Socket选项设置成Enabled,按F10键进行保存及退出。
  • [技术干货] 服务器 物联网 技术 标准 IPMI
    智能平台管理接口(Intelligent Platform Management Interface)原本是一种Intel架构的企业系统的周边设备所采用的一种工业标准。IPMI亦是一个开放的免费标准,用户无需支付额外的费用即可使用此标准。用户可以利用IPMI监视服务器的物理健康特征,如温度、电压、风扇工作状态、电源状态等。而且更为重要的是IPMI是一个开放的免费标准,用户无需为使用该标准而支付额外的费用。自1998年,IPMI论坛创建了IPMI标准以来,其已经得到了170 多家供应商的支持,这使得其逐渐成为了一个完整地包括服务器和其他系统(如存储设备、网络和通信设备)的硬件管理规范,该标准最新版本为IPMI 2.0,该版本在原有基础上有了不少的改进,包括可以通过串口、Modem以及Lan等远程环境管理服务器系统(包括远程开关机),以及在安全、VLAN 和刀片支持等方面的提高。IPMI针对大量监控、控制和自动回复服务器的作业,提供了智能型的管理方式。此标准适用于不同的服务器拓扑学,以及Windows、Linux、 Solaris、Mac或是混合型的操作系统。此外,由于IPMI可在不同的属性值下运作,即使服务器本身的运作不正常,或是由于任何原因而无法提供服务,IPMI仍可正常运作。IPMI 能够横跨不同的操作系统、固件和硬件平台,可以智能的监视、控制和自动回报大量服务器的运作状况,以降低服务器系统成本。IPMI的核心是一个专用芯片/控制器(叫做服务器处理器或基板管理控制器(BMC)),其并不依赖于服务器的处理器、BIOS或操作系统来工作,可谓非常地独立,是一个单独在系统内运行的无代理管理子系统,只要有BMC与IPMI固件其便可开始工作,而BMC通常是一个安装在服务器主板上的独立的板卡,也有服务器主板提供对IPMI支持的。IPMI良好的自治特性便克服了以往基于操作系统的管理方式所受的限制,例如操作系统不响应或未加载的情况下其仍然可以进行开关机、信息提取等操作。在工作时,所有的IPMI功能都是向BMC发送命令来完成的,命令使用IPMI规范中规定的指令,BMC接收并在系统事件日志中记录事件消息,维护描述系统中传感器情况的传感器数据记录。在需要远程访问系统时,IPMI新的LAN上串行(SOL)特性很有用。SOL改变IPMI会话过程中本地串口传送方向,从而提供对紧急管理服务、Windows专用管理控制台或Linux串行控制台的远程访问。BMC通过在LAN上改变传送给串行端口的信息的方向来做到这点,提供了一种与厂商无关的远程查看启动、操作系统加载器或紧急管理控制台来诊断和维修故障的标准方式。当需要对系统文本控制台进行远程访问时,Serial Over LAN (SOL) 功能将非常有用。SOL 通过 IPMI 会话重定向本地串行接口,允许远程访问Windows 的紧急事件管理控制台 (EMS) 特殊管理控制台 (SAC),或访问 LINUX 串行控制台。这个过程的步骤是 IPMI固件截取数据,然后通过局域网重新发送定向到串行端口的信息。 这就提供了远程查看BOOT、OS 加载器或紧急事件管理控制台以诊断并修复服务器相关问题的标准方法,而无需考虑供应商。它允许在引导阶段配置各种组件。而在命令传输的安全性方面,用户也无需担心,IPMI增强的认证(基于安全哈希算法1和基于密钥哈希消息认证)和加密(高级加密标准和Arcfour)功能有助于实现安全的远程操作。对VLAN的支持更是为设置管理专用网络提供了方便,并且可以以通道为基础进行配置。一般来说,BMC具有以下功能:1.通过系统的串行端口进行访问2. 故障日志记录和 SNMP 警报发送3.访问系统事件日志 (System Event Log ,SEL) 和传感器状况4.控制包括开机和关机5.独立于系统电源或工作状态的支持6.用于系统设置、基于文本公用程序和操作系统控制台的文本控制台重定向而通过IPMI ,用户可以主动监测组件的状况,以确保不超出预置阈值,例如服务器温度。这样,通过避免不定期的断电,协助维护了 IT 资源的运行时间。 IPMI的预告故障能力也有助于 IT 周期的管理。通过检查系统事件日志 (SEL),可以更轻松的预先判定故障组件。
  • [问题求助] 【linux弹性服务器UOS20系统】【VNC,远程登录】华为云控制台无法通过VNC登录且无法使用ssh命令启动远程登录的VNC
    【功能模块】【操作步骤&问题现象】1.华为云服务器的远程登录VNC登录方式,可以登录但是无法显示内容,有时候连接状态会显示连接失败。2.华为云服务器的远程登录CloudShell登录方式,可以正常登录但是输入启动VNC服务的命令,即:sudo x11vnc -display :0 -auth /var/run/lightdm/root/:0 -forever -bg -o /var/log/x11vnc.log -rfbauth /etc/x11vnc.pass -shared -noxdamage -xrandr "resize" -rfbport 5900,无作用,无法通过桌面的VNC Viewer登录;其他的一些日常使用的命令都正常,如:ls,vi,cd等,不清楚是否存在某些命令无法执行。3.服务器可以正常通过WinSCP传输文件,也可以ping通。4.之前所有功能都是正常的,图形化界面也已安装。试过重启,依旧无法解决。【截图信息】【日志信息】(可选,上传日志内容或者附件)
  • [互动交流] 控制台管理对象数据只能select的嘛,各位大佬是怎么想的
    不行搞个一键生成crud也行啊
总条数:187 到第
上滑加载中