• [介绍/入门] 三亿用户量的微服务化改造 华为云是如何做到的?
    本帖最后由 橘色祥云楼楼主 于 2018-6-5 15:57 编辑序:华为智能助手是华为在手机终端中推出的智能应用服务,在手机负一屏中聚合用户所需要的内容与服务,并结合用户的习惯与喜好进行智能推荐。用户只需在首屏轻轻一划,不用打开各类繁琐的手机应用,即可直接获取想要的服务与内容,帮助用户的工作生活更加智能和便捷。 随着智能手机的日益普及,手机中的智能应用正在走进人们生活中的每一个角落,作为运行在华为手机上的超级应用,华为智能助手以3.2亿的用户体量运行在华为云的终端云上,为用户提供稳定可靠的智能生活服务,其中应用市场日活高达6500万,云端相册每日新增相片已达4200万,庞大的体量使得应用系统稳定、可靠、敏捷的运行显得至关重要,而在背后全天候高效支撑的正是华为云PaaS服务中的微服务引擎CSE(CloudService Engine)。 11807 CSE是华为云PaaS家族产品中的企业架构解决方案,可为企业提供高性能的微服务框架和一站式的服务注册、服务治理、动态配置和分布式事务管理,帮助传统架构真正实现微服务应用的快速开发和高可用运维,而自去年商用发布以来便全面应用在华为智能助手的传统架构改造中。 从月到天 助力亿级应用交付周期大幅缩短 华为智能助手可以根据用户的使用习惯提供个性化的应用推荐组合,同时也为用户提供了应用市场、游戏中心、智能家居、视频、阅读等多种基本工具应用,满足用户生活中的各种智能化场景,随着业务量与日俱增,在海量用户的数字化场景下,早期的单体应用架构已不能满足业务的高并发、敏捷迭代的业务需求,迭代上新节奏缓慢,牵一发动全身,不仅仅影响用户体验,更严重影响了云端的运维效率,系统架构向分布式云化架构发展已成必然。 CSE具备开发模式门槛低、通用性强的改造优势,并支持契约优先,服务接口统一规范管理,微服务之间的调用非常方便,根据业务的现实痛点,智能助手将其后端拆分为多个微服务,并实施集群部署,而这一切全部基于CSE微服务框架开发并统一管理,现已支撑9000万用户日均1.8亿次请求,CSE稳定支持华为智能助手实现多个应用的分布式部署及管理,大幅缩短应用的迭代周期,并通过动态自治帮助其释放运维成本。 11804 以智能助手中的华为音乐为例,华为云CSE将其拆分为运营管理、内容推荐、用户交互三大服务场景,并进行了十五个以上的微服务拆分,使每个应用实现分布式的独立并行,新特性功能上线时间从以往的月为单位提升至天,大大缩短了业务的交付周期,通过敏捷迭代,不断满足在消费者场景中多变突发的需求。 化繁为简 实现复杂运维场景的自动化管理 虽然智能助手务已经跑在云端,在此前的单体架构的支撑下已难跟上前台业务的节奏,随着业务量的爆发性增长,服务越来越多,如何协调线上运行的各个服务,保障服务的SLA,对服务架构和运维人员是一个很大的挑战,当线上业务发生故障时,需要对故障业务做服务降级、流量控制、流量迁移等,快速恢复业务,这使运维的成本和难度成几何级上升。 11805 CSE通过在线的微服务治理,帮助智能助手实现微服务的弹性伸缩、故障自动迁移、降级熔断等,保障系统的运行质量。采用CSE微服务进行改造,使华为智能助手的运维效率大幅提升,智能助手应用SLA从99.9%提升到99.96%,有效的释放了沉重的运维压力。针对更轻量级的架构,智能助手的技术团队同时也拆分至多个3-5人的微服务团队,负责整个微服务的设计、开发、测试、部署运维和治理,通过全功能团队的建设,让业务真正敏捷起来。 有序重构 同等配置架构性能有效提升50% 早期的智能助手以部门自研GAF(封装Redis+Zookeeper作为通讯中间件)框架基础上构建,在并不复杂的业务场景下可以满足系统的稳定运行,随着业务量的攀升、系统复杂度提升、应用场景不断增加,GAF的架构开发门槛高、系统可扩展性差、应用耦合性高的问题日益严重,无法应对高并发流量场景,系统演进迫在眉睫。 11806 使用CSE框架进行全部重构之后,所有系统拆分成微服务,微服务之间调用采用Restful接口,使用SpringMVC的开发风格,开发效率提高一倍。使用EdgeService统一接口接入、鉴权、流控,在接口兼容场景前提下,同样的资源配置,系统吞吐量提高50%,系统开销降低30%。系统在可扩展性、高可靠性上优势明显,新特性开发全面采用DevOps开发模式,开发、运维成本明显降低。 华为消费者云微服务化总架构师王世军:随着华为终端消费市场的不断扩大,用户服务以及用户体验的持续提升显得尤为重要。作为距离桌面主屏最近的区域,华为智能助手在手机负一屏上不断的实现技术与产品创新,借助华为云CSE的微服务框架进行分布式云化改造,在提升系统性能,降低运维成本的同时,可以让智能助手更加专注在应用服务层的创新,持续为三亿用户提供更“懂”你的智能生活服务。 华为云PaaS服务产品部部长廖振钦表示:微服务与容器技术的结合正在发挥越来越重要的作用,华为“全面云化”战略下的统一PaaS平台,微服务与容器是其核心技术。华为微服务CSE已经在华为流程IT、各产品线云化、消费者云、外部客户等众多重大项目上成功稳定商用。包括最近在世界移动大会MWC2018上发布的华为5G核心网解决方案,也是基于华为的微服务架构。我们欢迎更多企业用户使用华为云的微服务,助力企业应用上云更简单、运行更高效,实现Cloud-Native敏捷开发。 CSE以华为自身实践为基础,历经亿级消费者业务场景的考验,专注帮助企业解决云化转型及上云前后的分布式架构改造难题,针对不同企业的业务场景,提供多语言、多架构的解决方案,致力于帮助企业搭建自身的分布式系统,更加敏捷的应对数字化转型带来的挑战。华为云微服务引擎 CSE ,截止到2018年6月30日 限时免费立即体验:https://console.huaweicloud.com/cse/?region=cn-north-1#/cse/home了解详情:https://www.huaweicloud.com/product/cse.html
  • [热门活动] 【新年贺卡】单身狗、房车狗、考试狗……应用服务论坛携手11大子版块祝大家新年快乐!
    本帖最后由 橘色祥云楼楼主 于 2018-2-13 10:44 编辑单身狗、房车狗、考试狗……新的一年里,希望生活待我们如春天般温暖!{:2_33:} 在这个举国举家同庆之际,应用服务论坛携手10大子版块祝大家新年快乐! 为大家准备了版块特色祝福语贺卡,请笑纳! 狗年不虐狗,新年快乐久!10950 1.微服务云应用平台:阖家齐聚看联欢,ServiceStage助力企业上云端! 10951 2.微服务引擎:2018轻装上阵,开发、运维,微服务生态管理,助您让应用轻起来! 10952 3.云容器引擎:轻松操作容易懂,应用搭建好上手!云容器引擎,助您一切操作顺顺利利! 10953 4.函数服务:快速构建,自动运维,FunctionStage助您灵活应对每一天! 10954 5.应用性能管理服务:实时监控,自我分析。APM助您放心体验,突破每一道难关! 10955 6.消息通知服务:简化系统耦合,定向推送消息,SMN助您耳聪目明、无往不利! 10956 7.应用编排服务:一键式部署,简化云管理。AOS助您生活有规则,有突破,有能量! 10957 8.API网关:API轻松管理,轻松构建。API网关助您人脉四通八达,所向披靡! 10958 9.云性能测试服务:专业测试报告,准时送达。CPTS为您出谋划´测´,安心应对多变场景! 10959 10.容器镜像服务:镜像管理,简单运维。SWR安抚好您的后宫,是每一年的职责! 10960 谢谢大家! 10961 注意:另外希望参加1月份爆料活动的朋友们及时登录后台查看私信是否有中奖, 年后我们回来瓜分礼包啦! 【1月中奖名单公布】看看有没有你?!恭喜所有中奖小伙伴! http://forum.huaweicloud.com/forum.php?mod=viewthread&tid=6354 10962
  • 【东软慧聚】东软慧聚H-ELS企业学习系统华为云SaaS集成版
    本帖最后由 东软慧聚 于 2018-1-22 16:00 编辑◆产品简介东软慧聚企业学习系统(简称:H-ELS)是强大的企业级学习管理平台,该产品已经在百余家政府和大型企事业客户项目中实施应用,能够更好的满足企事业客户的信息化培训实施及管理需要。结合华为云强大的计算优势、稳定的链路环境,东软慧聚推出H-ELS华为云SaaS集成版,为中小企业客户提供低维护成本、上线快的轻量级云端学习平台服务,帮助客户更便捷的实现信息化培训管理目标。 ◆云部署优势9343降低系统使用成本无需再承担高额的EL系统搭建所需的软硬件环境成本▪可按照使用周期分期购买平台服务,避免一次性大额投入对轻量级的企业用户,厂商选型风险大大降低,使用一短周期后不如意夸人随时更换上线周期短、快速推广使用用户直接访问云端的EL应用服务,省去基础环境搭建的人力消耗和漫长周期EL云端环境已经过多轮优化、成熟运行多年,用户可直接享用稳定、高效的系统服务从开通到全面推广使用,仅需1-2周时间贴心的运维服务,无需额外投入无需再考虑每年高额的IT韵味成本和团队人力投入 云服务厂商可提供免费、实时的EL系统使用咨询服务和培训数据报表,同时还为企业用户提供了多种日常学习、考试业务的运维服务包供选择 ◆东软慧聚服务优势SaaS集成版由东软慧聚运维团队直接为最终用户提供账号开通、用户操作培训及使用答疑等专业化服务,不需要供应商再单独配备支持力量,降低分销成本并保证服务质量。对于初始企业用户,慧聚可以提供账号开通、基础信息导入、业务规则导入、课件实体资源导入、操作权限划分等初始化服务,帮助用户快速的推广使用;在项目运行期间,慧聚还可以提供学习过程管理、考试过程管理等附加服务,还可以定期为企业推送培训大数据表;同时,在项目运行期间,慧聚还会提供配套的IT运维服务,以保证SaaS平台的该效率和准确性。 ◆产品主要模块9344H-ELS华为云SaaS集成版能够组织掌握、跟踪、管理学习情况,使学习者获得学习的主动权它综合了管理学习进程所需要的各种工具,它包括课程注册及审批、在线学习、检测考核、学习进度追踪、互动交流、报表统计等多个交互子系统。 ◆产品功能特性9345简单、高效的学习过程管理完整的考核测评功能详尽的培训报表设计强大、便携的移动学习APP端 ◆产品关键客户9347详情咨询:+86 400 898 9668服务邮箱:huiju@neusoft.com北京东软慧聚信息技术股份有限公司北京市海淀区西北旺东路10号院22号楼东软研发中心
  • 【麒麟科技】麒麟堡垒机,攻击中的“战斗机”吗?
    本帖最后由 灿烂千阳 于 2018-1-9 19:17 编辑北京中远麒麟科技有限公司入驻华为云市场上载了麒麟堡垒机 8586听着名字,就被这威力给震慑到了 堡垒机,是取炸碉堡的吗? 这一定是一款攻击中的“战斗机” 8585来,一起来看看这款“机”是做啥的1. 概述运维安全堡垒平台(以下简称运维堡垒机)是用于对第三方或者内部运维管理员的运维操作行为进行集中管控审计的系统。运维堡垒机可以帮助客户规范运维操作行为、控制并降低安全风险、满足等级保护级其他法规对IT内控合规性的要求。1.1. 功能介绍运维堡垒机集中管理运维账号、资产设备,集中控制运维操作行为,能够实现实时监控、阻断、告警,以及事后的审计与统计分析。支持常用的运维工具协议(如SSH、telnet、ftp、sftp、RDP、VNC等),并可以应用发布的方式支持图形化运维工具。运维堡垒机支持旁路模式和VPN模式两种方式,物理上旁路部署,灵活方面。运维堡垒机在操作方式上,不改变用户的操作习惯,仍然可以使用自己本机的运维工具。1.2. 名词解释协议指运维堡垒机运维工具所用的通信协议,比如Putty使用SSH协议,CRT支持SSH和Telnet等。工具指运维人员实现对设备的维护所使用的工具软件。设备账号指运维目标资产设备的用于维护的系统账户。自动登录指运维堡垒机为运维工具实现自动登录目标被管设备,而运维用户不需要输入目标设备的登录账号和密码,也称为单点登录(SSO)。命令阻断指根据命令权限策略检查用户输入的操作指令,如果策略不允许执行此指令,会拒绝转发此操作命令目标设备,同时向操作员反馈拒绝执行的提示信息。这是实现实时操作控制的一种重要手段。应用发布指通过在应用发布服务器部署应用程序,提供给用户远程虚拟化方式进行使用,就如同安装在本地一样的效果。 1.3. 环境要求运维堡垒机提供运维Web Portal,登录 Web Portal要求运维终端采用支持IE内核的浏览器,因为需要支持ActiveX控件,推荐使用IE浏览器,支持IE8、IE9、IE10。另外,运维终端还需要安装JRE环境,支持 Web Portal的Java Applet。2. 登录堡垒机 2.1. 准备 2.1.1. 控件设置WebPortal方式可以支持控件模式,不需要安装任何客户端,方式为:1. 继续上面设置,登录堡垒机,在堡垒机的其它菜单中,点击工具下载,下载:堡垒机控件-日期.zip,解压后安装(只需要默认点击下一步) 2.2. 登录堡垒机在浏览器地址栏输入https://ip,在已经导入证书的情况下,会顺利地打开登录页面,否则需要选择信任证书并继续浏览,才能看到登录界面。登录界面如下图:支持普通口令登录,也支持动态口令登录。动态口令登录需要登录用户手上有动态口令的USBKey才行,没有的人不能用动态口令登录。认证方式有英文名和中文名两种方式的原因是,在运维堡垒机都采用实名制账户管理,每个用户账号(英文名)都对应一个自然人的真实姓名(中文名)。一般直接使用默认的英文名登录认证方式即可。 输入用户名、密码后认证通过后即可看到堡垒机的运维主界面,如下图所示: 主界面为左右布局,左侧菜单,右侧为工作区,右侧展示菜单对应的各项功能和操作数据。菜单区有三大功能:“设备管理”、“运维审计”、“其他”。运维堡垒机的运维Web Portal的核心功能在“设备管理”和“运维审计”两块,设备管理是对设备进行运维的统一操作入口,运维审计是对运维操作的回顾和审计。从“设备管理”菜单的结构可以看出,运维堡垒机把所有设备分组管理,形成设备组,而且从右侧界面结构看到,设备又根据运维方式进一步分类,比如有SSH设备、RDP设备等,让用户能够很方便地找到操作对象。“设备管理”菜单中的另一块就是“应用发布”,“应用发布”就是在堡垒机上部署了一些运维工具,提供给运维人员使用,这些工具不需要下载安装,就可以直接使用来对设备进行运维,是一种虚拟化的操作方式。“运维审计”是提供给运维人员自己查看审计自己历史操作过程记录的一个途径,有利于积累操作经验。“其他”是一些辅助功能,比如修改个人信息、下载工具、网盘等。3. 设备运维运维堡垒机支持运维人员以三种方式登录运维:1) 打开WebPortal,在Webportal中点击相应的工具链接进行登录2) 直接在维护终端本地打开工具进行登录3) 进行VPN拨号,然后打开维护终端本地工具进行登录3.1. Web Portal设备运维设备运维除了选用应用发布服务器上的软件工具意外,都是使用本地安装的工具软件。首次登录注意看,设备列表中每个设备右端对应的操作栏,如下图所示。设备列表的第一列是ID,也非常重要,在下一节运维工具直接登录运维的时候要用到。以第一行设备Linux-1为例。它的操作为“ssh(putty | securecrt) sftp(WINSCP)”,表示该设备有两种运维登录方式,一种是ssh方式,第二种是sftp方式,并且列明了可以使用的工具,SSH方式可以使用putty或者securecrt,sftp方式使用WINSCP。括号里面的蓝色字体表示是链接,点击链接可与打开工具。第一次点击工具链接的时候,堡垒机系统并不知道你的工具是否安装以及所在位置,需要用户自己指定工具安装在哪个路径下面,因此,会弹出对话窗口让登录人员进行路径选择,第一次选择路径后,系统即会记录该路径,以后再登录都不需要重新输入,界面如下。找到运维工具后,启动工具,堡垒机系统一般将会自动登录到目标系统,代替运维人员实现登录目标设备的登录操作,这就是单点登录,简化运维操作,不需要记忆大量设备的账号密码。采用putty工具自动登录目标设备后的界面如下图所示。其他设备的运维与此类似。3.2. 运维工具直接登录除了在Web界面点击工具链接登录目标设备运维,支持使用本地运维工具直接进行登录运维,操作体验与没有使用堡垒机完全相同,完全不改变操作习惯。运维人员直接使用运维工具柜进行运维,与使用堡垒机之前不同,需要注意二个事项:1. 无论运维人员希望登录哪一台目标设备运维,工具的目标主机地址都是运维堡垒机,不能绕过堡垒机直接填写目标设备地址访问。2. 运维人员登录认证的帐号,也不能再使用目标设备最终登录账号,登录账号使用的是用户在运维堡垒机上的登录账号与目标设备在上的ID好组合而成的一个标识,其格式是:堡垒机账号—目标设备ID中间的连接符是两个减号。而登录密码就是用户在堡垒机上账号的密码。如何得到设备的ID呢?用浏览器登录堡垒机WebPortal可以查看,在设备列表的衣领就是设备ID,如下图所示172.16.26.222的空用户ID是20。因此当希望用工具直接登录目标设备Linux-1(192.168.1.45)时,应该在打开的工具(比如putty)界面上,目标主机的地方填写堡垒机地址(假定为192.168.1.61),如下图所示。 点击“Open”按钮,当Putty提示输入登录用户名和密码的时候,此时应该输入在堡垒机上的账号名(假设为tom)与ID的组合,即“tom--20”,密码为堡垒机用户tom的密码。这样Putty就会穿过堡垒机把你带到要维护的目标设备172.26.16.222。3.3. SecureCRT打开多个设备1、登录堡垒机WebPortal(假设为192.16.100.51),点击工具CRT链接可以登录一个目标设备,如下图所示。 在SecureCRT上打开“文件”-“快速连接”协议选择:“SSH2”主机名:“192.16.100.51”(主机名填写堡垒机的访问IP地址)端口: “23”用户名:即堡垒机用户名,这里是cx用户名格式:堡垒机用户名--服务器ID 如图:打开不同的AIX或Linux需查看不同的服务器ID 查看服务器ID的方法:在WebPortal设备列表中左边第一列。点击“连接”,输入堡垒机登录密码。 重命名服务器名称 3.4. 列表导出当设备非常多的时候,按上面每台设备添加并填入ID的方式,会给运维人员造成很大的负担,因此堡垒机提供列表导出方式,可以直接导出SecureCRT、Xshell的配置列表(ssh协议)和Mremote列表(RDP、VNC、X11协议),导入列表后,工具内就有用户可以登录所有的设备,并且已经配置好id值用户可以直接使用。首先登录到堡垒机前台,点击列表导出菜单,得到如下界面在界面中,只需要选择SECURECRT的版本(6或7),如果版本低,必须要升级到6.x或7.x版本,然后点击后面的提交按钮,会下载一个以主帐号为命名的zip文件(有的时候,因为IE安全问题,头一次点击提交无法下载,这时只要在到这个界面,选择好版本后在点击提交按钮就可以下载了)。将文件存到一个目录解压,会得到一个以用户名为名称的目录,里面就是所有的主机列表配置。打开Securecrt的option菜单里的global setting,可以得到securecrt的sessions文件存贮位置,如下图:只需要将下载解压的目录的放到这个目录的sessions目录下 打开CRT后,会出现一个以用户目录为名称的目录,里面会出现服务器组列表,服务器组列表就会有所有能登录的设备,这时,用户可以直接使用CRT,通过找到服务器点击的方式登录目标设备
  • [行业资讯] 华为云助力新再灵打造智能云梯,保障电梯安全运行
    电梯作为方便人们日常出行的主要运输工具,随着电梯数量的激增及电梯的老龄化和维保不到位,导致电梯安全事故频发,各地的电梯困人、伤人事件也常见端于媒体的报导。电梯安全问题已成为社会各界关注的焦点。国家质检总局连续发文,要求加强电梯的安全管理。目前杭州市电梯存量近11万台,且每年以超过1万台的规模快速增长,电梯安全管理中的一些新情况、新问题不断涌现,需要采取有力措施加以解决。l 电梯数量庞大,逐渐老化l 不文明乘梯,包括撞门、扒门、异物挡门、轿厢吸烟等行为,事故频发,60%以上故障和不当乘梯行为有关l 维保资金不足,维保人力不足,维保不到位不及时 如何让电梯安全有效运行?如何提高电梯的运维效率,及时消除电梯故障隐患,用有限的人力和资金,做好电梯的及时运维养护工作,防患于未然?浙江新再灵科技股份有限公司联手华为,架构出一套电梯安全的智能管理系统——云梯。云梯是对物联网和大数据技术的创新融合,运用智慧安防、物联网技术,将电梯运行实时检测和监管、乘梯行为监督、故障发现和处理、紧急事件响应等业务系统集成为统一的服务平台,实现了电梯动态数据的及时收集和风险隐患的远程监控,使其具有事前预警、事中安抚与处置、事后追溯功能,为政府部门的安全监管提供了有效保障,从而在根本上减少电梯事故的发生概率。 云梯通过以下关键技术对电梯实现有效的安全管理:独创的人工智能管理:云梯对电梯的运行在检测、管理、处置上,由人工智能系统自主判断、自主处理。人只是起到对智能系统的辅助作用,从而达到对电梯安全的高效管理和处置。云梯智能系统具有自我进化与升级功能。视频行为分析系统:云梯通过视频行为分析有效识别撞门、异物挡门、运行中扒门等不文明乘梯行为与长时间开门等异常环境,及时劝阻与报警,避免人为造成电梯损坏引发事故。实时体检与事前预警:云梯系统强调事前预警,以预防为主提高电梯安全性。通过将线下维保人员记录的维护数据上传 并与实时监测数据相结合判断事故隐患,做到事前预警,逐渐将定期定人的维保模式向实效定向智能的维保模式转变。从上图我们可以分析到,云梯系统将实时采集大量数据,通过各种通道传输到后台进行实时处理,并能实时将相关信息通知相关单位(例如维保、物业、质监部门等)。在这个过程中,大量数据将通过全国各地的网络传入到后台。我们以杭州市余杭区为例,假设有10余万部电梯接入,那么相当于有10余万用户在同时访问系统。如果全杭州市的电梯也接入这套系统,那么后台将承受非常大的压力,具体体现在如下几个方面:1、 并发高,假设有10个县市区接入,并发将达到百万级别;2、 数据处理性能要求高:云梯系统将实时采集视频、物理数据、环境信息,数据量非常庞大,需要后端大数据平台能实时处理,并将重要信息呈现给相关业务部门;3、 高可靠的维保服务:电梯是一年365天不间断运行,而且云梯关系大众民生,后端系统必须保障极高可靠性以及对故障的容错处理;4、 分布全国的电梯接入:全国范围内的电梯都要统一纳入管理;5、 数据独立性:涉及大众民生的大量数据,必须确保数据安全可靠,不被泄露,不被滥用。6、 人工智能的支持:云梯引入了人 工 智 能 视 频 识 别 技 术,需要对海量视频数据样本增加深度学习算法的支持;在整套系统中,新再灵使用到的华为云的如下资源对客户提供服务:1)云计算资源:ECS服务器/Docker容器/GPU加速云服务器/裸金属服务器2)存储资源:CDN/对象存储服务3)网络资源:VPN(虚拟专用网络)4)大数据基础服务: DIS(数据接入)/ DWS(数据仓库)/ MapReduce服务 / 数据挖掘服务 / 多维交互分析服务 MOLAP / 第三方人工智能服务 这是一个多方共赢的合作:对于群众出行而言,维护到位的电梯,实实在在的确保了出行的便利和安全;对政府而言,提高了公众的出行安全,实现了“办好民生实事,增进民生福祉”的目标,进一步讲,也是实现智慧城市的一个重要成果。对于新再灵,通过部署华为·新再灵云梯服务,让新再灵对数以万计的电梯的安全管理得以加强,从后台就可以对所有电梯的状态一目了然,减少了运维人员的现场采集数据的工作量,并且可以连续的,快速的获得电梯的运行状态,能第一时间发现问题,更合理的调配运维人员对可能出现问题的电梯进行提前的维护,把安全隐患消除于未然。对于新再灵,华为云给新再灵提供了高可靠、高性能的处理能力,解决高并发、高数据处理性能、高可靠的要求,全国范围内随时随地接入的稳定的网络质量确保电梯状态的实时稳定传送到云端,数据不丢失,业务更安全;弹性可扩展的资源,既实现了快速的业务上线和扩展,也大大降低了新再灵的运营成本。
  • [云监控] 新手入门02
    本帖最后由 花瓣部落 于 2017-12-29 13:21 编辑10S级主动监控,为ECS主机构建完善的运维监控体系 ECS主动监控需要用户安装由CES提供的开源Agent,可以对OS指标、自定义指标进行秒级监控告警,安全可靠 细粒度、自定义、系统级、多维度 01.高粒度(秒级)监控--应对业务陡增 02.虚机自定义指标监控--为运维快速定位问题提供便利 03.Guest OS级别监控简化--运维人员使用虚机成本更快捷的了解OS指标 04.多维度实时监控提供--更精确的监控数值,全面了解业务。
  • [运维二三事] 华为云“佛系“运维手册 助你轻松运维没毛病
    “油腻大叔”刚走,“佛系青年”又来。佛光普照众生,佛系追星、佛系男生、佛系玩家、佛系考研纷纷出世……如今,IT界开始流行“佛系运维”,顾名思义:简简单单、平平淡淡、能用一字回复绝不用俩。下面,咱们来脑补一下画面: 7521 作为运维工程师,你是不是时常感到无力感?因为你见,或者不见,bug就在那里,不离不弃。云时代来临,各企业应用纷纷上云,面对错综复杂的大型分布式应用关系。怎么才能保持一颗平静的心,做一个佛系运维工程师? 7522 提到华为云 APM ,其实来头不小。它是华为软件研发模式转型过程中沉淀出的应用性能管理服务(Application Performance Management),致力于改变传统运营和运维手工化、经验化、盲目化的现状,提供数字化全链路非侵入的应用管理服务,经过多年的江湖修炼,已形成独有的武功招数。其中最亮眼的还数这四大绝招: 反映真实的用户体验 实时业务会话监控,采集每笔交易的KPI数据,跟踪事务全程,快速分析业务的运行状态。如翻筋斗云一跃行十万八千里般的超高性能,支持每天亿级业务吞吐,为用户体验保驾护航。 展现应用关系与异常 采集应用KPI数据,并通过服务间接口自动发现并生成应用的依赖关系。通过拓扑图反映服务间的依赖关系、KPI、健康状态及负载均衡能力,关系网尽收眼底;帮您练就一双火眼金睛,快速完成应用运维、性能瓶颈问题分析,提升运维效率,降低成本。 追踪故障的来龙去脉 通过非侵入式埋点技术获取应用调用链,通过单击故障节点可自动下钻到故障的微服务实例、也可以关联到失败的调用链和调用栈,查看失败函数的入参和返回值。生态开放,数据查询接口和性能指标采集标准开放,支持自定义和二次开发,定义你的72变。 挖掘问题的根本原因 深度挖掘应用与中间件性能数据,支持主流中间件:支持JDK、MySQL、Tomcat、MangoDB等多种主流中间件数据采集,提供函数级问题诊断。慢SQL分析,帮助研发人员优化性能瓶颈。如重达一万三千五百斤的如意金箍棒一般,灵活定制,即取即用,一棒定位系统关键问题,堪比系统运维之定海神针,可随华为微服务云应用平台快速部署 。 华为云 APM 提供了自发现应用拓扑、慢SQL分析等能力,应用运行状况、故障点尽在掌握;调用栈分析、SQL诊断,轻松实现代码级运维。 7523 华为云APM沉淀自华为数十年的IT系统运维实践,历经亿级消费者业务场景考验,“四大绝招”即可助力用户体验真正的“佛系运维”,真正做到让老板放心,程序猿省心。 应用性能管理页面,猛击体验一下:https://www.huaweicloud.com/product/apm.html 更多关怀:
  • 运维接入认证安
    o 改变使用者的认证方式,可以使用 RADIUS 服务器,或者 Active Directory(AD) 的域控制器来对使用者进行授权,使用户名、密码等信息更统一、简单、安全、 有效。 o 设备密码的自动更改方式,可以设定每周期(天、周、月)内自动改变设备密码。 设备密码更改后,只有超级权限账号才能查看密码,对其余使用者的密码区则为 不可见状态。密码策略,类似于 Windows 的密码策略,主要是位数,复杂度的 定义。
  • 接入安全
    为了保证云服务数据中心的持续稳定运行,华为云建立了一支强大的运维队伍。通过在 华为云数据中心部署的 UMA 堡垒主机,实现运维管理平台的统一运维管理和审计。数 据中心外网运维人员和内网运维人员对网络、服务器等设备的本地及远程操作,全部集 中到堡垒主机系统上进行,通过二次跳转系统将维护人员连接到指定设备,实现用户对 设备资源操作管理的统一接入、统一认证、统一授权、统一审计。
  • 账号认证
    运维人员接入华为云管理网络对系统进行集中管理时,需使用员工身份账号,且要求使 用双因子认证,如 USB key、Smart Card 等。员工账号用于登录 VPN、跳板机,实现 用户登录的深度审计。 特权账号管理系统将日常或应急运维的功能账号或技术账号绑定到运维团队或个人。跳 板机上支持强日志审计,确保运维人员在目标主机上的操作行为都可以定位到个人
  • O&M 账号运营安全
    运维工作对华为云至关重要,涉及到安全的方方面面。针对运维安全,华为云有专门的 设计、规范和流程。运维安全包括统一帐号、权限和接入管理等。
  • [运维二三事] 华为云APM化身云端华佗 Show Off 四大绝学
    云时代来临,各企业应用纷纷上云。然而云如**复杂多变,非一般庸医所能应对,企业运维人员饱受Bug折磨,痛苦不堪。 华为云应用性能管理APM服务,人送外号“云医华佗”,立志帮助企业应用去除顽疾、轻松运维。经过多年苦修与临床实践,APM练就了“望闻问切”四大绝学。云医华佗——华为APM,11月18日已正式上线开馆,欢迎各位前来问诊! 一、望——应用拓扑主动运维云上应用架构和调用关系复杂,难以摸清;传统运维系统只能提供进程运行状态监控,应用是否健康、用户请求是否正常无从了解,运维人员只能被动运维,等着问题找上门来。 华为云APM的“望”字神功—应用拓扑图,自动发现应用状态和调用关系,直观展现应用、实例、链接状态,系统健康状态一望即知,从此告别被动运维,提前发现问题和性能瓶颈,主动优化,同是做运维,睡眠更安稳。 5848应用拓扑展示图 二、闻——KPI指标全面掌控传统运维系统监控对象往往是硬件资源,无法为应用运维和管理提供有效帮助。 华为云APM诊疗经验丰富,无需抽血B超,耳听鼻嗅即可了然应用动态,吞吐量、成功率、时延等各项KPI指标尽在掌握。 5849应用粒度KPI指标汇聚和展示 三、问——事务分析一目了然互联网时代应用竞争激烈,用户迁移成本低,用户体验的重要性毋庸置疑。然而用户体验如同镜花水月,难以捉摸,运营人员不知从何下手。 复杂的用户请求调用,华为APM问上几句便心中有数,各项事务SLA可视化展示并提供Apdex打分,用户体验数据数字化,产品运营胸有成竹。 5850事务级KPI统计、Apdex指数打分 四、切——非侵入式调用链全栈跟踪掌握应用健康状态还不够,应用异常崩溃根因和性能瓶颈点如何定界定位、快速修复?APM是否需要侵入应用代码才能找到根因? 5851 APM提供了把脉一般的非侵入式埋点技术,代码0改动即可使用。应用奇经八脉清清楚楚,轻松实现函数级调用链全栈跟踪,微小问题难逃法网,问题根因清晰可见。 5852函数级调用链,性能瓶颈无处可躲 APM志在去除应用顽疾帮助云上企业应用轻松运维医馆开业酬宾无需预约分文不取,免费坐诊!(2018年6月30日截止)http://www.huaweicloud.com/product/apm.html~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 现在问题来了您对APM服务中哪方面功能最感兴趣?{:3_45:} 思考说明你是聪明的,评论说明你是智慧的因为你带动了别人思考 {:4_87:} 更多关怀:
  • [技术干货] PaaS安全解决方案概述
    本帖最后由 川川 于 2017-11-27 09:54 编辑1概述 PaaS (Platform as a Service),作为云计算的第二层,主要面向开发、运维,提供软件开发,验证,部署,运行,以及运行时的管理、监控、故障恢复等服务。PaaS的设计主要围绕应用和服务的生命周期管理来作为服务提供。 目前,PaaS 2.0主要使用k8s为技术框架,应用采用Docker(容器)来实现部署运行。对于Docker的基于内核Namespace的逻辑隔离,安全更富有挑战。 PaaS的安全主要分以下几个维度为进行保障:功能安全、运维安全、OpenAPI安全、基础设置安全(IaaS)和容器、镜像安全。 2 功能安全 2.1 多租户隔离 租户基于Domain和Project的机制进行隔离,每个Domain的租户权限与资源互相隔离。其中,租户Domain的资源和权限集合为多个Project的总和。 租户内采用多用户和多用户组的管理方式,用户基于角色来进行授权,全部对接IAM来统一身份认证,实现统一的用户权限和资源管理。 2.2 多租户资源管理 通过IAM可以统一实现租户的资源信息同步和管理。用户具有可查看、增加自己的配额能力,构建自己的集群,部署各种服务。 2.3 身份认证和访问控制 PaaS的身份认证和访问控制,主要通过内置各服务租户和大量角色来进行用户访问控制,IAM进行认证和授权,以及基于Xrole的信任管理。 2.4 单点登录 在PaaS中,是多用户、多WEB应用,单个SSO认证中心的机制,实现所有登陆认证都在SSO认证中心统一认证,SSO认证中心与WEB应用建立一种信任关系。 SSO服务提供SSO Server和SSO Client软件,基于CAS来实现。 2.5 基于SAML的第三方IDP对接 多个应用的用户登录认证可以使用基于SAML的共享信任的机制,让IAM认证中心来对接第三方的IDP服务。达到多应用下,用户的共享信任。 2.6 PSM秘钥管理系统 PSM主要为PaaS的秘钥和证书管理系统,主要在初始化安装、创建Namespace、纳管节点、创建pod、证书和秘钥更新过程中,对秘钥和证书进行管理。 2.7 数据安全 使用主流的隐私模型和算法,集成主流的匿名化算法,覆盖数据的整个生命周期。 3运维安全 3.1 日志异常行为监测 3.1.1 运维面审计日志 通过rest接口记录运维管理员操作日志 3.1.2 管理面审计日志 通过将用户行为记录到本地文件与运行日志分开 3.1.3 日志分析 日志分析主要依赖于ALS(Application Log Service)和DPA(Data Process Analysis)。ALS可以提供统一的日志收集、查询、配置服务。DPA对收集的日志进行大数据分析,从中查找异常行为。 4 OpenAPI安全 4.1 API安全检测 1.认证检测,防止篡改和重放攻击 2.流量检测,防DDOS攻击 3.对受限资源的访问授权 4.报文异常参数检测 5 基础设置安全 5.1网络隔离 在PaaS组网与外网间采用防火墙隔离。PaaS内网采用双网卡的HA LB将运维、管理面和租户面进行隔离。租户面与运维、管理面采用不同网段和VIP,互相之间通过LB的两个VIP进行路由转发。 同时还需要对应的I层虚拟机进行网络隔离的安全设置,以达到虚机的逻辑VLAN隔离。 5.2 WAF 1.在PaaS中使用WAF进行WEB防护,WAF需要具备如下能力: 2.纵深安全防护,黑名单特征检测和协议重组检测 3.自学习建模和白名单,提高检测效率和准确率 4.高性能检测,对于静态文件进行高速转发,无需通过特征库检测 5.防篡改,自学习网站页面内容,对常用内容进行缓存和比对 6.自动侦测应用,从流量中自学习WEB协议信息,获取新增应用信息。 7.实时安全响应和告警 8.透明代理,部署WAF对用户网络透明,提升性能 9.高速缓存,对于静态文件进行大量缓存,提升服务器处理性能 10.CC防护 5.3 Anti-DDOS 在对接外网时,使用Anti-DDOS服务器,将网络流量复制到检测中心。检测中心发现DDOS流量,则通知ATIC服务器,联动路由器,将流量引流到清洗中心,进行流量清洗。剩余有效流量返回路由器进行转发。 6容器和镜像安全 6.1CVE安全扫描 在镜像入库和部署前,采用工具进行漏洞扫描。 6.2 CIS容器一致性检测 使用扫描工具,基于CIS(Center for Internet Security)的策略,对运行态的容器进行检查。 6.3 容器运行态防护 可使用容器监控工具,针对的具体的容器,镜像,服务主机,以及标贴(Labels)。对运行中文件、网络监控、进程以及系统调用进行监测。 6.4 镜像签名保护 Notary获取Docker镜像中的manifest文件,manifest包括各个层的散列值的详细信息。Notary对manifest文件进行签名。并且增加时间戳的签名。
  • [交流分享] 运维老司机是如何搞定老板,走上人生巅峰的!
    本帖最后由 哆啦A梦 于 2017-12-13 11:48 编辑朋友小李是一家互联网科技公司的运维工作人员,近来工作顺风顺水,升职加薪,适逢公司业务扩张,公司搭建的私有服务器系统需要处理的数据也越来越多,甚至系统运行都开始出现问题,小李和手下的团队开始了日常加班的生涯!5475一天,小李团队负责运维的系统又出现了问题,很快,老板就叫他到办公室去一趟。老板询问小李是何原因造成的系统经常崩溃,小李开始从技术和设备的角度为老板解释! “说人话…”老板有点不耐烦了。“额,目前我们的服务器太小,软件太次,硬件太老,需要更新换代。” “那你下去做一个解决方案给我”老板轻描淡写的讲述着。接到老板任务的小李开始上网考察各个不同的服务器硬件和软件供应商,在随后的一周内,小李提出了三种私有云服务器的组建搭配方案,却因价格昂贵,都被老板pass,小李顿感痛不欲生!5476 苦闷异常的小李,回到住处后向同为运维工程师的室友老王请教! “你啊,现在是什么时代,云2.0时代,你怎么还想着自己搭建服务器”老王的语气颇有些恨铁不成钢的味道。说着老王拿出手机了,“知道以前主做私有云业务的华为吗,最近他们也开始做公有云了,你看,他们有弹性云服务器、专属云、裸金属服务器等各种规格的服务器,绝对可以组合出一套完美支撑起你们公司业务的服务器,关键是价格很低,省却物理运维的环节,成本可以节省好几倍,目前他们还有各种优惠活动呢!” “而且华为的综合上云迁移交付服务,专业帮企业将私有云搬迁至公有云,一整套的方案流程,回头你好好研究下公有云吧!下周好找你们老板汇报新的方案。”小李的脸色随着老王的诉说,慢慢变得光彩熠熠了起来!5477第二周,小李自信满满的出现在了老板的办公室,向老板汇报了新的服务器优化方案,很快老板就同意了他的方案。公司在搭建公有云后再也没有出现过服务器被爆的情况,公司业务蒸蒸日上,很快就称为了同行企业的标杆!你问小李怎么样了?那还用问吗,解决了老板问题的他,当然是升职加薪、迎娶白富美喽!作为运维老司机的你,想升职加薪走上人生巅峰吗?12月15号,华为云在北京举行技术私享会《云*计算“硬专快稳”之道》,为你的程序人生加油充电! 6661 扫码加群,直连云端专家6660扫码赢豪礼
  • [云运维] 云化场景下多数据中心的运维有哪些挑战?
    本帖最后由 橘色祥云楼楼主 于 2017-11-23 15:31 编辑RT