• SSH 跳板机配置指南
    SSH 跳板机配置指南使用 ssh -J 命令快速跳转通过命令行直接跳转语法:ssh -J [跳板机用户名]@[跳板机IP/域名] [目标用户名]@[目标IP/域名] 典型示例ssh -J root@jump.server.com root@target.server.com使用 SSH Config 持久化配置编辑 ~/.ssh/config 文件添加以下配置:# 目标服务器别名(可自定义) Host target-server # 目标服务器真实地址 HostName target.server.com # 目标服务器用户名 User root # 跳板机配置 ProxyJump root@jump.server.com使用简化命令连接ssh target-server配置参数说明参数说明示例值Host自定义目标服务器别名target-serverHostName目标服务器真实IP/域名target.server.comUser目标服务器登录用户rootProxyJump跳板机连接信息root@jmp.svr.com提示:配置完成后可通过 ssh -v target-server 查看详细连接过程进行调试
  • 【话题交流】谈谈大家对本次HDC2025学到的知识知多少
    本月话题:谈谈大家对本次HDC2025学到的知识知多少本次 HDC2025 大会亮点满满,HarmonyOS 6 开发者 Beta 版发布,其在端侧智能、系统流畅性、全场景互联等方面技术迭代显著。比如社交与办公软件消息加载和文档处理效率提升,碰一碰功能覆盖超 50 款主流应用,100 多款应用支持跨设备接续。智能体概念推动操作系统角色转变,大众点评、深圳航空等应用接入智能体带来便捷体验。还有华为云开源的柔性智算平台、云原生 AI 智能调度等前沿技术。来盘点下,这些关键知识你掌握了多少?
  • 【话题交流】华为云CloudDevice 会使终端的游戏功能更加强大嘛?
    华为云CloudDevice在HDC 2025上精彩登场,6月21日,华为开发者大会(HDC 2025)期间,华为云CloudDevice首次在国内发布全系列云终端产品,包括支持XR健身和AI体感游戏的云机顶盒、不受终端设备限制畅玩的云游戏、具有AI知识助手功能的云空间等产品,以及备受关注的云手机。华为云CloudDevice 会使终端的游戏功能更加强大嘛?
  • 【合集】存储服务2025.06月技术干货合集
    删除数据库权限的限制与回收原理cid:link_10走进华为云CCI的CloudBursting解决方案cid:link_11如何优化华为云云容器Serverless应用性能cid:link_0APIG支持的监控指标有哪些cid:link_12IAM可以设置的登录验证策略有哪些?cid:link_1华为云内容审核获取请求认证的方式有哪些?cid:link_2一文带你了解华为云对象存储服务的存储类别cid:link_3华为云CCE评估资源预热功能的投资回报率和成本效益cid:link_4华为云CCE的服务网格和微服务架构的集成cid:link_13华为云CCE Autopilot确保数据安全性和隐私保护详解cid:link_14华为云CCE Autopilot的云生态服务cid:link_5Roach工具与OpenGauss备份适配性cid:link_15GaussDB PG 支持的标准日期时间类型​​详解cid:link_6一文带你了解自监督学习中的对比学习的负样本采样策略cid:link_16图神经网络中的数学原理cid:link_7神经架构搜索(NAS)如何通过自动化设计优化模型性能cid:link_8GAN模式崩溃及解决方案cid:link_17知识图谱与深度学习的结合cid:link_18联邦学习有效解决数据隐私与模型训练矛盾的方法cid:link_19多模态大模型的语义关联cid:link_20生成式AI模型实现语言理解与生成的核心cid:link_21CCE Autopilot支持的存储选项cid:link_22一招降低华为云CCE使用资源预热时运维成本和复杂性cid:link_9Redis实现限流方式比较cid:link_23华为云OBS中obsutil上传文件优化实践cid:link_24华为云MRS中pythonUDF调用实践cid:link_25
  • [热门活动] PaaS产品效能突破季——更多体验,更多奖品,等你来~
    【活动简介】本期活动以实践为主,将围绕CodeArts结合开发者空间和AI大模型的最新实践案例,以及Astro的最新实践案例,让更多开发者深入了解并体验CodeArts和Astro的强大功能与显著优势。活动报名>>入口<<【活动内容】一、资源准备——免费资源限时开通CodeArts Repo代码托管15元套餐DeepSeek Tokens 限时购创建CodeArts API示例项目免费开通CodeArts体验套餐Astro Zero 免费体验套餐免费领取200万Tokens,体验DeepSeek系列等模型免费领取开发者空间云主机二、课程学习——产品入门指导华为开发者空间快速入门DevOps实践与转型路径三、实践案例——动手体验应用快速构建>云主机+CodeArts实践开发初识云主机:CodeArts IDE入门基于云主机的CodeArts IDE运行Java电商项目基于云主机CodeArts IDE插件的代码质量检查基于CodeArts Repo云仓库管理云主机代码基于Repo和流水线门禁的分支合并与部署云端DevOps:实现持续交付生产线>>Astro+Deepseek实践开发华为云Astro轻应用智能语言助手校级就业指导轻应用接入DeepSeek智能分析>>>CodeArts+ModelArts+DeepSeek图生文体验在CodeArts API中探索AI识图作诗的魅力四、有奖互动完成实践体验:完成任一实践体验,并分享案例成果+体验心得/建议到>此活动帖<,将筛选优质分享内容,随机送出半入耳式耳机、案例学院卡、开发者徽章、体脂秤等奖品。完成问卷反馈:填写>>问卷<<,反馈产品建议和意见,即可参与抽奖(京东卡、移动电源、开发者徽章、案例学院卡等奖品) 
  • [公告] 华为AI百校计划2.0申报指南
    华为AI百校计划2.0购买昇腾AI云算力资源指导书:参考文档相关地址参考:华为AI百校计划2.0官网地址:cid:link_5查询账号id地址:https://console.huaweicloud.com/iam/?region=cn-north-4&locale=zh-cn#/mine/apiCredential华为云官网:https://www.huaweicloud.com/?utm_source=bing&utm_medium=brand&utm_campaign=&utm_content=&utm_term=&utm_adplace=AdPlace090661价格详情:cid:link_3大模型即服务平台 MaaS文档:cid:link_4ModelArts业务选型:cid:link_1     华为AI百校计划2.0官网地址:cid:link_5         华为AI百校计划2.0官网地址:cid:link_5     华为AI百校计划2.0官网地址:cid:link_5
  • 华为云MRS中pythonUDF调用实践
    华为云MRS(MapReduce Service)中的Hive支持使用Python实现自定义函数(UDF),但​​原生Python UDF需依赖特定环境配置​​,而通过TRANSFORM子句调用Python脚本则是更通用且灵活的实现方式。1. ​​Python UDF的原生支持​​​​有限支持​​:华为云MRS Hive的官方文档提到,当前仅支持​​参数数量≤5​​的Hive UDF,且​​不支持复杂数据类型​​(如数组、结构体)的Python UDF。这意味着直接通过CREATE FUNCTION创建Python UDF可能受限,尤其对需要聚合(UDAF)或表生成(UDTF)的场景。​​依赖环境​​:若需使用Python UDF,需确保集群已配置Python环境(如安装PyHive或Hive Server 2的Python驱动),但华为云未明确提供开箱即用的支持说明。2. ​​TRANSFORM实现Python处理(推荐方案)​​通过TRANSFORM子句调用外部Python脚本是​​最常用的替代方案​​,适用于所有类型的自定义逻辑(UDF/UDAF/UDTF)。其核心原理是:Hive将数据通过标准输入(stdin)传递给Python脚本,脚本处理后再通过标准输出(stdout)返回结果。​​实现步骤​​:​​编写Python脚本​​:读取sys.stdin,按\t分割字段。处理数据后,用print输出结果,字段间同样用\t分隔。​​示例场景​​:​​UDF​​:单行处理(如身份证解析、字符串大写转换)。​​UDAF​​:多行聚合(如统计总分、平均分)。​​UDTF​​:单行生成多行(如JSON数组展开)。# 示例:UDF(字段大写转换)import sysfor line in sys.stdin: fields = line.strip().split('\t') print('\t'.join(field.upper() for field in fields))​​上传脚本至HDFS/OBS​​:将脚本上传到分布式存储(如HDFS或OBS),并确保执行用户有读取权限。​​HiveQL调用​​:使用ADD FILE加载脚本,并通过TRANSFORM调用:ADD FILE hdfs:///path/to/script.py; -- 加载脚本SELECT TRANSFORM (col1, col2) USING 'python3 script.py' AS (output_col1 STRING, output_col2 INT) FROM table;​​优点​​:​​灵活性​​:支持任意Python库(如pandas、numpy)。​​跨版本兼容​​:不依赖Hive的UDF接口限制。​​适用性广​​:可模拟UDF、UDAF、UDTF所有功能。​​缺点​​:​​性能开销​​:数据需序列化传输,比原生Java UDF慢。​​调试复杂​​:错误需通过日志排查(如YARN Container日志)。3. ​​生产环境注意事项​​​​权限控制​​:在Kerberos认证集群中,需为业务用户授予HDFS文件读取权限及Hive执行权限。​​资源管理​​:避免脚本内存溢出,可调整YARN Container资源参数(如mapreduce.map.memory.mb)。​​高可用​​:若需持久化函数,建议封装为Java UDF(性能更优),仅临时需求使用TRANSFORM。4. ​​方案对比与选型建议​​​​方案​​​​适用场景​​​​优势​​​​限制​​​​原生Python UDF​​简单标量处理(参数≤5)语法简洁,类似内置函数不支持复杂类型,华为云支持有限​​TRANSFORM + Python​​复杂逻辑、聚合、表生成灵活支持所有Python库性能较低,调试复杂​​Java UDF​​高性能需求、生产环境核心逻辑执行效率高,兼容性好开发成本高,需Java知识💡 ​​推荐场景​​:​​临时分析​​:使用TRANSFORM快速实现Python逻辑。​​生产部署​​:对性能敏感场景改用Java UDF(参考华为云文档开发指南)。总结华为云MRS Hive​​可通过TRANSFORM子句高效支持Python自定义处理​​,尽管原生Python UDF受限,但TRANSFORM的灵活性足以覆盖大多数需求。建议结合性能要求选择方案,并优先参考华为云官方示例进行部署。若需进一步优化,可探索华为云Flink或Spark的Python API扩展能力。
  • 华为云OBS中obsutil上传文件优化实践
    在华为云OBS中,通过obsutil上传文件时​​无法直接通过命令行参数设置对象的过期时间(如7天后自动删除)​​,但可以通过​​对象元数据Expires字段​​实现单个文件的定时删除功能。以下是具体分析和操作建议:🔍 一、Expires字段的功能解析​​核心作用​​Expires是OBS系统定义的元数据字段,用于​​指定对象的过期删除时间​​(单位为天)。上传时设置该字段后,对象将在指定天数后被自动删除,无需依赖桶级的生命周期规则。​​示例​​:设置Expires=7,对象将在上传满7天后自动删除。​​与生命周期的区别​​:此字段仅作用于当前上传的对象,而生命周期规则覆盖整个桶或前缀匹配的批量对象。​​技术实现方式​​​​API/SDK支持​​:通过PUT或POST请求上传对象时,在请求头中添加x-obs-expires字段并赋值为整数(如x-obs-expires: 7)。​​obsutil的限制​​:当前版本的obsutil命令行工具​​不支持直接在上传命令中设置Expires参数​​。官方文档明确该功能仅可通过API或SDK实现。⚙️ 二、替代方案:如何实现上传时设置过期若需在上传时指定过期时间,可通过以下两种方式:​​使用OBS SDK(推荐)​​以Python SDK为例,上传时通过expires参数设置:from obs import ObsClientclient = ObsClient(access_key_id='AK', secret_access_key='SK', server='https://your-endpoint')# 设置7天后过期resp = client.put_file('bucketname', 'objectname', 'localfile', expires=7)支持语言:Java/Python/Go等主流SDK均提供expires参数。​​调用REST API​​在PUT请求头中显式添加x-obs-expires:PUT /objectname HTTP/1.1Host: bucketname.obs.cn-north-4.myhuaweicloud.comx-obs-expires: 7需自行处理签名和文件分块等细节。⚖️ 三、与生命周期规则的对比​​特性​​​​Expires字段(对象级)​​​​生命周期规则(桶级)​​​​配置方式​​上传时单个设置桶级别批量配置​​灵活性​​针对不同对象设置不同过期时间按前缀/标签统一规则​​功能范围​​仅支持删除,不支持存储类型转换支持删除、低频/归档存储转换​​适用场景​​临时文件、短期日志长期归档、存储成本优化​​运维复杂度​​低(无需维护规则)中(需管理规则优先级)⚠️ 四、关键注意事项​​优先级冲突​​若对象同时匹配桶生命周期规则和Expires字段,​​对象级Expires的删除操作优先执行​​。​​时间计算规则​​过期计时从对象上传完成后的​​下一个UTC零点开始​​(例如6月27日15:00上传,6月28日00:00开始计时)。实际删除可能延迟≤24小时(系统扫描周期影响)。​​多版本控制​​若桶启用了多版本,需为每个版本单独设置Expires,否则仅当前版本受影响。💎 五、最佳实践建议​​临时数据场景​​:使用SDK上传时设置expires参数,避免维护生命周期规则。​​长期管理需求​​:若需统一管理大量对象(如日志归档),仍建议配置生命周期规则,支持存储类型自动降级。​​工具选择​​:obsutil → 仅基础上传/下载;​​SDK/API​​ → 需高级功能(过期策略、加密等)。可通过华为云OBS SDK文档查看完整代码示例:OBS SDK参考。
  • Redis实现限流方式比较
    基于Redis实现限流是分布式系统中保护服务稳定的核心手段,主要包含四种实现方式,其适用场景和优劣对比如下:🔢 1. ​​固定窗口计数器(Fixed Window)​​​​原理​​:将时间划分为固定窗口(如1分钟),通过Redis的INCR命令统计请求数,达到阈值后限流,并通过EXPIRE设置窗口过期时间。​​示例代码​​(Spring Boot + RedisTemplate):public boolean isAllowed(String key, int limit, int windowSec) { Long count = redisTemplate.opsForValue().increment(key); if (count == 1) redisTemplate.expire(key, windowSec, TimeUnit.SECONDS); return count <= limit;}​​优点​​:实现简单,内存占用低(O(1)),性能高(压测可达12万QPS)。​​缺点​​:存在​​临界时间问题​​(窗口切换时可能瞬间涌入2倍阈值流量)。​​适用场景​​:低频接口防护(如小型网站)或对精度要求不高的场景。⏱️ 2. ​​滑动窗口(Sliding Window)​​​​原理​​:使用Redis的有序集合(ZSET)记录请求时间戳,每次请求移除过期时间戳,统计窗口内剩余请求数。​​示例代码​​:public boolean isAllowed(String key, int limit, int windowSec) { long now = Instant.now().getEpochSecond(); redisTemplate.opsForZSet().removeRangeByScore(key, 0, now - windowSec); // 清理旧请求 Long count = redisTemplate.opsForZSet().zCard(key); if (count < limit) redisTemplate.opsForZSet().add(key, UUID.randomUUID().toString(), now); return count < limit;}​​优点​​:​​精准控制流量​​,解决临界问题,适合非均匀流量的API限流。​​缺点​​:内存占用高(存储所有时间戳),性能较低(压测约8.5万QPS)。​​适用场景​​:高精度要求的API(如支付接口)。🪙 3. ​​令牌桶算法(Token Bucket)​​​​原理​​:定时向Redis List中添加令牌,请求时从List中弹出令牌(LPOP),无令牌则限流。支持突发流量(桶内令牌可一次性消耗)。​​实现步骤​​:定时任务向List填充令牌(如每秒10个)。请求调用LPOP获取令牌,失败则限流。​​优点​​:​​兼顾速率与突发流量​​(如秒杀系统),压测性能约9.8万QPS。​​缺点​​:需维护定时任务,实现复杂(需Lua脚本保证原子性)。🪣 4. ​​漏桶算法(Leaky Bucket)​​​​原理​​:请求进入Redis List(桶),以固定速率从List中取出请求处理(如每秒10次),桶满则拒绝请求。​​特点​​:​​强制恒定速率​​,无突发处理能力,压测性能最低(约7.2万QPS)。​​适用场景​​:需严格平滑流量的场景(如数据库写入保护)。🔍 ​​方案对比与选型建议​​​​算法​​精度突发流量支持性能复杂度适用场景固定窗口计数器低❌⭐⭐⭐⭐简单低频接口、简单防护滑动窗口高⚠️(部分)⭐⭐⭐中等API网关、高精度控制​​令牌桶​​中✅⭐⭐⭐复杂​​秒杀、突发流量场景(推荐)​​漏桶高❌⭐⭐复杂恒定速率处理(如日志上传)​​综合推荐​​:​​首选令牌桶​​:需应对突发流量(如促销活动),且允许短暂超限。​​次选滑动窗口​​:需精确控制(如API开放平台)。​​简单场景​​:固定窗口(如内部管理后台)。⚠️ ​​实践注意事项​​​​原子性​​:滑动窗口和令牌桶建议使用Lua脚本,避免并发问题。​​性能瓶颈​​:高频请求下优先选固定窗口或令牌桶。​​集群部署​​:通过Hash Tag确保Redis Key分布在同一节点。最终方案取决于业务需求:​​稳定性 > 突发处理 > 精度 > 性能​​。建议结合压测结果调整参数(如令牌生成速率、窗口大小)。
  • [其他问题] 【AR502产品】关于容器到AR502,再到云主机的端口开通策略
    当前IP数据如下:云主机ip 172.17.0.2 .AR502: 172.27.144.70 AR502里面的容器A: 172.17.0.6容器A中启动了nginx,nginx对外暴露的监听端口是7080,在AR502配置了端口映射,由容器的7080映射到AR502的7080nft add rule dnat1 pre ip daddr 172.27.144.70 tcp dport 7080 iif GE4 dnat 172.17.0.6:7080在云主机 可以ping 通 172.27.144.70 ,但是访问http://172.27.144.70:7080 报502.有大神知道原因么,或者怎么解决么,感谢。
  • [技术干货] 基于昇腾NPU部署llamafactory单机多卡微调Qwen3教程
    基于昇腾NPU部署llamafactory单机多卡微调Qwen3教程1. 进入华为云华为云首页点击右上角控制台 2.进入ModelArts点击搜索框->搜索“ModelArts”->选择AI开发平台ModelArts->进入平台后点击开发者空间 3.创建Notebook3.1在开发者空间中点击Notebook->在西南贵阳一下点击创建Notebook 3.2进入创建Notebook页面选择公共资源池中第2页的pytorch_2.1.0-cann_8.0.rc1-py_3.9-euler_2.10.7-aarch64-snt9b 3.3选择NPU与创建Notebook 4.打开服务器等待创建完成后,单击后面的“打开”按钮将服务器打开。 5.安装Python创建“python”版本的型号,点击上方的“+”,在展开的下拉菜单中选择“Notebook”将以下代码放在Notebook中执行conda create -n llamafactory python==3.10 -y 6.安装openMind Hub Client和openMind Library切换到终端窗口,点击上方的“+”,在展开的下拉菜单中选择“Termianl”在终端执行命令,激活或者启动昇腾资源服务。source /usr/local/Ascend/ascend-toolkit/set_env.sh 查看创建的环境 conda env list进入新建的python环境conda activate llamafactory 安装“openMind Hub Client”(可能出现以下的错误,不影响下面的操作)pip install openmind_hub  安装“openMind Library”,并安装“PyTorch”框架及其依赖(可能出现以下的错误,不影响下面的操作)pip install openmind[pt]  安装和下载“LLaMa Factory”工具(报错没关系)git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.gitcd LLaMA-Factorypip install -e ".[torch-npu,metrics]"pip install numpy==1.23.5 7.安装符合Qwen3要求的transformers请注意,这一点很重要,如果没安装,后面会报错没有qwen3模板pip install --upgrade transformers==4.51.08.模型下载Qwen3登录魔搭下载模型魔搭官网:https://www.modelscope.cn/search?search=qwen3安装安装ModelScopepip install modelscope复制官网链接下载Qwen3模型,模型会下载在/home/ma-user/.cache/modelscope/hub/models/Qwen/Qwen3-8B下,可以使用mv命令移动到指定文件夹下modelscope download --model Qwen/Qwen3-8B进入模型下载路径cd /home/ma-user/.cache/modelscope/hub/models/Qwen/Qwen3-8B查看当前路径获取路径地址pwd/home/ma-user/.cache/modelscope/hub/models/Qwen/Qwen3-8B使用mv命令移动到/home/ma-user/work/Model下,因为/home/ma-user/work下是进来显示的界面,是永久存储的(一开始选的100G云硬盘)mv /home/ma-user/.cache/modelscope/hub/models/Qwen/Qwen3-8B /home/ma-user/work/Model 9.构造数据集,注册数据集,使用命令微调Qwen3具体可以看llamafactory官网教程LLaMA-Factory官网:https://github.com/hiyouga/LLaMA-Factoryllamafactory官网数据处理详解:https://llamafactory.readthedocs.io/zh-cn/latest/getting_started/data_preparation.html在LLaMA-Factory/data 目录下的daraset_info.json中注册数据集,上传数据集到指定的位置 上传可以在要上传的文件夹下点击右上角上传,上传本地文件,如果文件过大,在弹出的提示中选择obs桶就行,默认就可以  10.使用命令微调Qwen3查看npu,便于观察npu-smi info 这是我的微调命令,根据自己的需求更改,其中NPU序列号是从0开始的,不用看别的,有几张卡都从0开始。ASCEND_RT_VISIBLE_DEVICES=0,1 llamafactory-cli train \ --stage sft \ --do_train True \ --model_name_or_path /home/ma-user/work/Model/Qwen3-8B \ --preprocessing_num_workers $(nproc) \ --finetuning_type lora \ --template qwen3 \ --flash_attn auto \ --dataset_dir data \ --dataset Multimodal_stock_train_cot \ --cutoff_len 3072 \ --learning_rate 5e-5 \ --num_train_epochs 3.0 \ --max_samples 100000 \ --per_device_train_batch_size 6 \ --gradient_accumulation_steps 4 \ --lr_scheduler_type cosine \ --max_grad_norm 1.0 \ --logging_steps 5 \ --save_steps 100 \ --warmup_steps 0 \ --packing False \ --enable_thinking True \ --report_to none \ --output_dir /home/ma-user/work/out/Qwen3-8B-text \ --bf16 True \ --plot_loss True \ --trust_remote_code True \ --ddp_timeout 180000000 \ --include_num_input_tokens_seen True \ --optim adamw_torch \ --lora_rank 8 \ --lora_alpha 16 \ --lora_dropout 0 \ --lora_target all成功微调~ 11.保存镜像由于环境是创建在cache下的,关闭后是不会被保存的,能够保存的只有云硬盘,所以要保留环境要创建自己的镜像,具体操作是在运行状态下点击更多->保存镜像 评估推理以及合并都是llamafactory官方一样,就不说明了~之后每次按照上述打开步骤打开平台就可以训练模型了,按照以上步骤就能部署好NPU的平台了,其他的错误可能就是依赖冲突问题,升级合适的版本即可
  • [热门活动] 华为开发者布道师技术直播第17期:鸿蒙端云一体化应用开发
    🚀【直播预告】华为开发者布道师技术直播第17期 | 鸿蒙端云一体化应用开发7月10日(周四)19:00-20:30本期嘉宾:南京师范大学泰州学院副教授,倪红军老师🔍 直播亮点 🔍随着鸿蒙生态的快速发展,原生应用的开发与适配成为技术前沿的热门话题。本次直播,我们将深入探讨“云数据库服务”在鸿蒙平台上的应用,倪红军老师将带领大家从零开始:🛠 创建云侧项目应用📦 新建对象类型与存储区📊 向对象类型中添加数据对象🌐 创建HarmonyOS平台端侧一体化工程项目🔗 关联云数据资源✨ 实现对云侧数据的增删改查加入我们,让我们共同见证和探索鸿蒙生态的无限可能!立即报名围观直播。报名地址:鸿蒙端云一体化应用开发 
  • [热门活动] 华为开发者布道师技术直播第16期:香橙派AIpro的远程推理框架与实验案例
    🌟【直播预告】香橙派AIpro的远程推理框架与实验案例 🚀面对复杂的开发环境配置与资源限制,你是否渴望一种简单、高效、弹性的解决方案?电子科技大学自动化工程学院的郝家胜副教授为大家带来香橙派AIpro:解锁远程推理新高度的华为开发者布道师第16期技术直播。💡本期亮点💡💡极简配置:一键安装,轻松上手。💡高效开发:复用抽象,提升开发效率。💡弹性部署:支持单板或集群部署,灵活适应需求。💡异构开发:多语言、多环境,自由选择你的开发方式。💡创新架构:AiR推理框架将模型推理与应用分离,构建分布式远程推理框架。💡多种输入输出:支持多种输入模态和输出方式。💡多线程支持:高度复用框架,提升性能。💡低门槛体验:10行代码即可体验图像分割迁移案例,真正做到开箱即用。无论你是AI新手还是资深开发者,这次直播都将为你带来全新的开发体验和实用技巧。火速报名,一起探索香橙派AIpro的无限可能!💡📢直播时间:7月3日(周四)19:00-20:30报名地址:香橙派AIpro的远程推理框架与实验案例
  • [热门活动] 华为开发者布道师技术沙龙·第15期直播【基于昇腾NPU的合成孔径雷达成像案例】总结简报
    【直播回放】直播回放地址【总结简报】华为开发者布道师技术沙龙·直播间精彩回顾【第1期】联接高校人才培养与前沿产业技术,成就学生未来 / 李一浩老师【第2期】逐梦之旅:学生开发者到华为开发者布道师的蜕变 / 杨阳同学【第3期】昇思MindSpore:AI 领域的创新力量与跨平台之路 / 陈新杰同学【第4期】基于OpenHarmony计算机学科人才培养经验分享 / 周睿老师【第5期】计算机核心课程贯通式实践教学体系介绍 / 赵欢老师、李博经理、杨科华老师【第6期】OpenHarmony应用开发之网络数据请求与数据解析 / 倪红军老师【第7期】华为开发者空间玩转DeepSeek / 马欣老师【第8期】基于能力图谱的openGauss项目闯关 / 马瑞新老师【第9期Day1】基于开源鸿蒙+海思星闪开发板:嵌入式系统开发实战 / 齐耀龙老师【第9期Day2】基于开源鸿蒙+海思星闪开发板:嵌入式系统开发实战 / 齐耀龙老师【第10期】基于华为云+DeepSeek大模型的脑肿瘤分割实验教学案例 / 林承德老师【第11期】WS63E星闪开发板快速入门指南:开启星闪技术之旅 / 杨阳同学【第12期】星闪应用开发技术课程(群)建设思路与设想 / 葛非老师【第13期】星闪主从一体模式与线性星闪网络  / 齐耀龙老师【第14期】基于昇腾的皮肤病理多模态大模型研发  / 崔笑宇老师【第15期】基于昇腾NPU的合成孔径雷达成像案例 / 李阳老师官网直播间观众问题回答摘要:序号问题答复1多普勒波束锐化与现代SAR成像算法有何本质区别?“多普勒波束锐化”是现代SAR成像算法的基本原理,没有本质区别,本质上就是多普勒域的相位调制近似线性调频,利用类似的脉冲压缩原理进行“压缩”,即实现“锐化”。2昇腾社区的开源SAR工具链支持哪些主流框架?主流的AI框架都是基于算子的通用计算(图)模型实现,可以实现任意的计算模型,包括SAR应用,但是不一定有性能优势。我们基于昇腾CANN提供的Ascend C编程语言,实现了自定义算子开发和集成,完成了昇腾硬件亲和的SAR成像应用,目的是减少冗余计算和数据搬移,尽量发挥昇腾硬件的强大算力。3多普勒波束锐化与现代SAR成像算法有何本质区别?同上4基于昇腾NPU的合成孔径雷达成像系统在恶劣天气条件下的稳定性如何?基于昇腾NPU的合成孔径雷达成像系统处理的是原始二维信号数据,如果雷达脉冲的射频波段对大气现象(如雨雪等)不敏感,则成像原始数据和成像结果也不会受恶劣天气影响。5请问老师,你们用tik开发fft和ascendc开发fft,这两个语言用起来有没有什么差别早期只有TIK,Ascend C是TIK的升级版,现在只需要学习和使用Ascend C即可。他们之间的主要差别体现在:1. 接口语言,TIK使用Python作为前端接口语言,Ascend C使用C++作为前端接口语言;2. TIK代码是Python脚本,需要经过Python解释器编译,然后利用CCEC编译器编译,也就是有多次编译过程,而Ascend C语言一次编译,编程模型一致性强;3. TIK基于Python,仿真和调试器性能没有基于C++的Ascend C仿真器性能好,开发效率低一些;4. Ascend C提供更多API、更多样例、更多范式、更高调试性能等,更易用。6round 和floor的误差分布,哪种更适合低精度NPU?4round和floor是两种类似但有区别的数学函数,不同系列310或910的NPU对floor和round的处理是与数学保持一致的,需要根据算法确定用哪个。7问题描述:李老师好,可以再详细讲讲使用AscendC怎样处理复数信号吗?现有的AscendC算子都是基于实数的复数是由实部和虚部构成,在实际应用中,一般是按照实部虚部交替排列存储的,可以将这样的复数张量看成一个最后多一维(维度为2)的实数张量。在实现复数运算的时候,加减法和实数张量完全一致,乘法可以将实部张量和虚部张量取出,按照定义计算然后组合。Ascend C提供了Gather和Scatter来辅助高性能完成复数类数据运算。在我们的应用中,中间算子之间的数据传输将实部和虚部完全分开,避免了中间不必要的Scatter和Gather。8方位向脉冲压缩的并行分块策略,怎么平衡计算负载与通信开销?方位向脉冲压缩,是进行FFT、RCMC、匹配滤波器应用和IFFT,其中不同阶段切分为单独算子实现,每个算子对数据进行处理时为了适配昇腾NPU的有限核内存储,需要进行分块,一般按照内部存储空间尽量用满来分块,同时按照Ascend C编程范式来依次处理每块数据。计算负载和通信开销可以在现有编程范式中开启Double Buffer实现流水并行,尽量将计算和通信相互掩盖,降低整体耗时。9自研FFT算子相比cuFFT/CUDA方案在SAR相位保留上有何优势?自研FFT算子相比cuFFT/CUDA方案在SAR相位保留上的优势:1. 通过自定义CT算法实现过程,有机会进一步保留FFT计算精度,比如稀疏矩阵乘相比稠密矩阵乘具有更小的量化误差,即更好地实现相位匹配;2.自研算子可以更好控制算法的量化误差传播,在性能和精度上取得平衡。 
  • 一招降低华为云CCE使用资源预热时运维成本和复杂性
    华为云CCE在使用资源预热功能时,可通过以下策略降低运维成本和复杂性:一、​​自动化资源预热策略​​​​动态资源池化技术​​基于CCE Autopilot的Serverless融合资源池,实现CPU/内存/GPU等资源的统一池化管理。通过​​动态预热技术​​自动分配资源,减少冷启动时间,避免手动干预资源分配。​​优势​​:资源供给速度提升至秒级,容器按需自动扩容,无需预置节点。​​智能弹性伸缩​​结合华为云​​CCI(容器实例)服务​​,根据业务负载预测自动调整资源预热规模。例如,通过分析历史流量数据,预加载容器镜像到边缘节点,缩短业务高峰期的启动延迟。二、​​优化资源分配与监控​​​​精细化资源配额管理​​使用​​资源编排服务​​定义预热资源模板,按需分配CPU/内存配额,避免过度预留。通过​​成本中心​​分析资源使用率,识别闲置资源并调整预热策略,减少浪费。​​实时监控与告警​​集成​​云监控服务​​,设置资源利用率阈值告警(如CPU/内存超过80%触发扩容)。利用​​FinOps成本洞察​​功能,监控预热资源的实际消耗,优化成本分摊策略。三、​​降低运维复杂性的关键措施​​​​全托管服务替代手动运维​​CCE Autopilot托管Kubernetes控制平面和工作节点,自动处理节点故障恢复、系统升级等操作,减少人工干预。通过​​智能购买组​​一键部署跨计费模式(如竞价实例+包年包月)的混合资源池,平衡成本与性能。​​标准化预热模板​​创建预定义的容器镜像和配置模板(如Nginx、MySQL),通过​​应用市场​​快速部署,避免重复配置。使用​​Helm Chart​​管理应用依赖,简化多组件应用的预热流程。四、​​成本优化实践​​​​混合计费模式​​对低频业务使用​​抢占式实例​​预热资源,成本降低至常规实例的10%-20%。对核心业务采用​​包年包月​​锁定长期资源价格,结合预留实例折扣。​​闲置资源自动回收​​配置​​自动释放策略​​,在业务低谷期(如夜间)释放非关键业务预热资源。利用​​成本优化顾问​​识别长期闲置的Pod或节点,自动缩容或删除。五、​​典型场景示例​​​​电商大促预热​​:提前通过​​弹性伸缩策略​​预热20%的容器实例,结合OBS缓存热点数据,避免流量突增时资源不足。​​AI模型推理​​:使用​​SFS Turbo高性能文件存储​​预热模型文件,减少容器启动时的IO等待时间,提升推理效率。总结通过​​自动化资源池化​​、​​智能弹性策略​​和​​精细化成本监控​​,华为云CCE的资源预热功能可显著降低运维复杂度,同时通过混合计费、闲置资源回收等手段优化成本。建议结合业务负载特征,灵活选用托管服务与自动化工具,实现高效资源管理与成本控制。
总条数:1617 到第
上滑加载中