• [案例共创] 【案例共创】基于华为开发者空间+DeepSeek:打造全链路高效数据分析工作流
    前言在当今这个数字经济时代,数据无疑成为企业最核心的资产之一。面对激烈的市场竞争,企业若想精准决策,迅速响应市场变化,就必须依赖高效的数据分析能力。数据分析不仅能够帮助企业洞察市场趋势、预测消费者行为,更可以优化运营效率,降低成本,提升企业的整体竞争力。举个简单的例子:以某服装电商为例:双十一前夕,数据分析师发现一个关键趋势——平台上’oversized卫衣’的搜索量在过去一周内激增了300%,但转化率却只有2.1%,远低于平均水平的5.8%。通过深入分析用户行为轨迹,团队发现问题所在:用户在商品详情页的平均停留时间只有15秒,且90%的用户会点击尺码表后直接关闭页面。进一步调研发现,消费者对’oversized’的具体版型理解存在偏差,担心买到的衣服过大或过小。基于这一洞察,企业立即调整策略:在商品页面增加真人试穿视频,标注模特身高体重及穿着尺码;优化尺码表,用’宽松度对比图’替代传统数据表格;针对搜索’oversized卫衣’的用户推送’30天无理由退换’的专属服务。结果在48小时内,该品类的转化率提升至6.2%,销量环比增长了180%。而没有及时响应这一数据信号的竞争对手,则错失了这波流量红利。这个成功案例的背后,反映出高效数据分析工作流的重要性。然而,在实际的数据分析实践中,许多企业和开发者仍面临着诸多挑战:从数据采集、清洗、建模到可视化展示,每个环节都可能成为效率瓶颈。如何构建一套流畅、智能的全链路数据分析工作流,正成为当下亟待解决的关键问题。本文将深入探讨华为开发者空间与DeepSeek的强强联合,如何助力打造全链路高效数据分析工作流,帮助开发者和企业在数据驱动的道路上走得更快、更稳。数据分析链路中存在哪些典型痛点?尽管数据分析的重要性已经得到普遍认可,但现实中企业在数据分析链路中仍面临诸多具体的挑战:首先,数据采集与处理难度大。企业的数据通常散落在各类系统和业务平台中,这些数据格式多样且杂乱无章,数据往往分散在ERP、CRM、电商平台、社交媒体、IoT设备等多个系统中,数据格式千差万别(结构化、半结构化、非结构化),数据标准不统一。获取这些数据需要对接各种API接口,配置复杂的ETL流程,整个过程耗时耗力。企业需要花费大量时间和精力去获取、清洗和整合数据,确保数据的准确性和一致性。这种繁琐而耗时的数据预处理环节严重拖慢了整体数据分析效率。其次,分析过程繁琐复杂,从数据预处理到建模分析,再到结果验证,往往需要使用多种不同的工具和平台(如Python、R、SQL、Tableau、PowerBI等),工具间切换频繁,学习成本高,协作效率低。析过程往往缺乏标准化流程和版本管理,同一个分析任务在不同时间、不同人员操作下可能产生不同结果,影响分析结果的可信度和可复现性。此外,数据分析人才短缺也是企业普遍面临的问题。纯技术背景的分析师往往缺乏对业务场景的深度理解,而业务专家又缺乏数据分析的技术能力,导致分析结果与业务需求之间存在较大鸿沟。专业的数据分析师招聘难度大、成本高,并且培养周期较长,企业难以快速组建起有效的数据分析团队,进一步加剧了数据分析能力的瓶颈。最后,分析结果的可视化程度较低。数据分析结果如果无法直观清晰地呈现给决策者,数据分析往往涉及IT、业务、管理等多个部门,缺乏统一的协作平台和标准化流程,沟通成本高,项目推进缓慢。以上痛点使得企业亟需更高效、更智能、更简单的数据分析解决方案。如何利用云计算、人工智能等新兴技术,打造一套全链路、低门槛、高效能的数据分析工作流,已成为当下数字化转型的关键课题。华为开发者空间与DeepSeek的技术基础华为开发者空间是面向全球开发者打造的专属空间,其技术基础具有多方面特性。它汇聚了鸿蒙、昇腾、鲲鹏、GaussDB、欧拉等各项根技术的开发资源及工具。在硬件资源层面,依托华为强大的技术实力,能为开发者提供性能强劲的云主机,保障开发过程中的计算需求,无论是复杂的模型训练,还是大规模的数据处理,都能高效运行。在开发工具方面,提供了一站式的开发环境。以 CodeArts IDE for Cangjie 编辑器为例,它不仅具备常用的语法高亮、错误诊断、自动补全等功能,可实时反馈并提升开发效率,还支持反向调试,方便开发者查看历史调试信息。并且,该编辑器被预置在云主机环境中,开发者开箱即用,极大降低了开发的前期准备成本。同时,开发者空间还集成了丰富的命令行工具,满足不同开发者多样化的开发习惯和复杂的开发需求。此外,华为开发者空间提供了从开发编码到应用调测的配套案例,结合其云上存储空间,形成了一个完整的开发闭环。开发者可以基于这些资源,在华为根技术生态下高效便捷地进行知识学习、技术体验以及应用创新。在利用华为开发者空间提供的云主机开发 DeepSeek 技术时,可从多维度实现两者的有机融合。华为开发者空间性能强劲的云主机,能为 DeepSeek 技术开发提供坚实的硬件支撑。预置的 CodeArts IDE for Cangjie 编辑器具备语法高亮、错误诊断、自动补全等功能,还支持反向调试,方便开发者对 DeepSeek 模型开发过程进行调试和优化。集成的丰富命令行工具,可满足 DeepSeek 开发中不同场景的需求。从开发闭环角度看,华为开发者空间从开发编码到应用调测的配套案例,结合云上存储空间,为 DeepSeek 技术开发提供了完整的流程支持。开发者可借助这些资源,在华为根技术生态下,更高效地进行 DeepSeek 模型的知识学习、技术体验以及应用创新。同时,DeepSeek 完全开源 R1 等模型、采用 MIT 协议的开源策略,与华为开发者空间的开放生态相契合,开发者可在云主机环境中自由定制和二次开发 DeepSeek 模型,进一步推动技术共享与协作。开放的 API 定价优势,也能让更多中小企业在华为开发者空间云主机上开发和应用 DeepSeek 技术,降低进入 AI 领域的门槛,促进 DeepSeek 在各行业的广泛应用。全链路高效数据分析工作流搭建与应用实践1.配置云主机首先进入到开发者空间,之后点击工作台,开始配置云主机:配置相应的云主机:以上系统模拟我们开发生产环境的主要机器,之后我们来开始一步步搭建,首先进入到云开发空间里面,打开终端界面,输入curl -fsSL https://dtse-mirrors.obs.cn-north-4.myhuaweicloud.com/case/0035/install.sh | sudo bash2.下载ollama先下载ollama下载完毕之后我们可以借助 Ollama 工具来部署 Deepseek 大模型,部署 deepseek-r1:1.5b 版本,如果硬件支撑可以部署更高效的模型,执行命令:ollama run deepseek-r1:1.5b以上我们就部署完了,可以尝试输入prompt来测试效果:通过命令:sudo netstat -tunlp可以查看olloama开放的本地端口:3.CodeArt IDE for Python那么接下来我们可以打开CodeArt IDE for Python,对端口进行通信,完成这一步之后我们可以开始尝试构建智能体:我们知道ollama serve默认监听地址为 http://localhost:11434,首先下载requests库:pip install requests我们可以通过Python代码尝试通信:import requests def chat_with_ollama(prompt, model="deepseek-r1:1.5b"): url = "http://localhost:11434/api/generate" headers = { "Content-Type": "application/json" } data = { "model": model, "prompt": prompt, "stream": False # 关闭流式返回,适合简单测试 } try: response = requests.post(url, json=data, headers=headers) response.raise_for_status() result = response.json() print("模型回复:", result["response"]) except requests.exceptions.RequestException as e: print("❌ 请求出错:", e) except Exception as e: print("❌ 其他错误:", e) if __name__ == "__main__": test_prompt = "你好" chat_with_ollama(test_prompt) 如何能获取到大模型输出,说明我们之前的过程都没有问题:4.工作流搭建.那么我们下一步就可以开始全链路高效数据分析工作流搭建了:4.数据获取/清洗/提取首先我们可以思考数据获取层,这方面可以是企业存储数据和历史数据,也可以爬取互联网上相关信息数据,这方面不需要AI介入,而数据清洗和提取就可以通过大模型完美替代,而且清洗提取特别高效。我们可以将这个 Agent 封装为一个 Python 类,支持如下功能:功能说明clean_text(text)文本清洗:去除空格、标点符号、HTML、无用词等extract_fields(text, instruction)利用大模型提取指定结构信息(如姓名、地址、公司名等)batch_process(data_list)支持批量数据清洗和字段抽取custom_prompt(data, task)通过自定义任务 prompt 构造更复杂的清洗与抽取任务具体代码可以如下编写:import requests import re class DataCleaningAgent: def __init__(self, model_name="deepseek-r1:1.5b", host="http://localhost:11434"): self.model = model_name self.api_url = f"{host}/api/generate" def _call_model(self, prompt, stream=False): payload = { "model": self.model, "prompt": prompt, "stream": stream } try: response = requests.post(self.api_url, json=payload) response.raise_for_status() result = response.json() return result.get("response", "").strip() except Exception as e: print("调用失败:", e) return "" def clean_text(self, text): """ 基础清洗:去除HTML标签、特殊字符、重复空格等 """ text = re.sub(r"<.*?>", "", text) # 去HTML text = re.sub(r"\s+", " ", text) # 合并空格 text = re.sub(r"[^\w\s\u4e00-\u9fff]", "", text) # 去除特殊符号 return text.strip() def extract_fields(self, text, instruction="请从中提取所有公司名称和联系人"): """ 调用LLM进行字段提取 """ prompt = f"以下是原始数据:\n{text}\n\n{instruction}" return self._call_model(prompt) def batch_process(self, data_list, instruction): results = [] for i, text in enumerate(data_list): print(f"处理第{i+1}条数据...") cleaned = self.clean_text(text) extracted = self.extract_fields(cleaned, instruction) results.append({ "original": text, "cleaned": cleaned, "extracted": extracted }) return results # 示例调用 if __name__ == "__main__": agent = DataCleaningAgent() sample_data = [ "联系人:张三,联系电话:123456789,公司:江西省招标有限公司", "地址:南昌市东湖区,北京华为技术有限公司,联系人王五" ] instruction = "请提取所有公司名称和联系人姓名,返回JSON格式" results = agent.batch_process(sample_data, instruction) for res in results: print("\n原始:", res["original"]) print("清洗后:", res["cleaned"]) print("提取信息:", res["extracted"]) 大家可自行验证:4.2 数据库读取SQL清洗完毕之后我们将数据转入库中即可,那么这是建立在我们需要收集外部数据的情况下设置的数据清洗和提取智能体,大部分企业是有存储自己业务数据的,一般直接放置在数据库中。但是获取这部分数据需要比较繁琐的步骤,一般来说数据分析师通过编写SQL获取,但也有不是数据分析师的客户或者是企业管理者想直接拿到数据分析,为了降低数据分析的门槛,我们可以直接设定一个获取数据的智能体,返回给我们基础数据。简而言之就是构建一个自然语言 → 数据库查询 → 自动执行SQL → 返回结果的智能体系统,为企业管理者、运营、产品等非技术用户提供低门槛的数据访问能力。需要注意的是这对我们的Prompt以及知识库要求较高,这里需要我们根据企业业务数据库去制作一份对应的数据字典,也就是说这份数据字典是包含所有业务数据字段的解释和各个表模块的介绍。这里给出一部分的Prompt示例:请根据下方表结构,从表 `sales_data` 中查询 2024 年每个月的销售总额和增长率: 表结构: CREATE TABLE sales_data ( id INT, sale_date DATE, amount DECIMAL, region VARCHAR(50) ) 问题: 2024年每个月的销售额是多少?同比去年增长了多少? 我们可以先解决需要代码编写的部分,比如执行层Python 实现数据库访问和结果返回:from sqlalchemy import create_engine import pandas as pd def execute_sql(sql: str, db_url: str): engine = create_engine(db_url) with engine.connect() as conn: df = pd.read_sql_query(sql, conn) return df 组件含义sqlalchemy.create_engine创建数据库连接对象,支持多种数据库(如 MySQL、PostgreSQL、SQLite)db_url数据库连接字符串,格式示例: mysql+pymysql://user:password@host:port/dbnamepd.read_sql_query(sql, conn)使用 pandas 执行 SQL 语句并将结果返回为 DataFrameconn数据库连接上下文,自动管理连接释放返回值 df查询结果组成的 DataFrame,可用于打印、导出、图表分析等调用实例如下:sql = "SELECT region, SUM(amount) as total FROM sales_data GROUP BY region" db_url = "mysql+pymysql://root:123456@localhost:3306/mydb" df = execute_sql(sql, db_url) print(df) 之后我们可以封装DeepSeek大模型,封装成一个DataQueryAgent,示例:class DataQueryAgent: def __init__(self, db_url: str, model_host="http://localhost:11434", model="deepseek-r1:1.5b"): ... def _generate_sql(self, question: str, schema_hint: str = ""): ... def query(self, question: str, schema_hint: str = ""): ... 设定面向用户的“自然语言问数据库”的封装类,封装了SQL生成 + 执行 两个流程。__init__ 方法比较简单定义:def __init__(self, db_url: str, model_host="http://localhost:11434", model="deepseek-r1:1.5b"): self.db_url = db_url self.model_host = model_host self.model = model _generate_sql() 方法就是完成功能(自然语言 → SQL)def _generate_sql(self, question: str, schema_hint: str = ""): prompt = f"根据以下数据库结构:\n{schema_hint}\n请生成对应SQL语句来回答问题:{question}" response = requests.post(f"{self.model_host}/api/generate", json={ "model": self.model, "prompt": prompt, "stream": False }) return response.json().get("response", "") 用本地部署的 DeepSeek 模型,将自然语言问题 + 数据库结构作为 Prompt,发送请求后解析返回结果为 SQL。query() 方法完成整个工作流(完整工作流:问题 → SQL → 查询结果)def query(self, question: str, schema_hint: str = ""): sql = self._generate_sql(question, schema_hint) print("生成的SQL:", sql) try: engine = create_engine(self.db_url) with engine.connect() as conn: df = pd.read_sql_query(sql, conn) return df except Exception as e: return f"SQL 执行失败: {e}" 示例调用:agent = DataQueryAgent( db_url="mysql+pymysql://root:password@localhost:3306/mydb" ) schema_hint = """ CREATE TABLE orders ( id INT, customer_name VARCHAR(50), amount DECIMAL(10,2), order_date DATE, status VARCHAR(20) ); """ question = "查询今年每个月的订单总金额" df = agent.query(question, schema_hint) print(df) 这样我们就得到一个完整的dataframe,之后我们就可以很轻松对其进行数据可视化了。4.3 DataFrame 可视化智能体(Visualization Agent)也可以将DataFrame 交给大模型智能体,让它根据数据内容决定可视化方式,并自动生成图表代码(如用 matplotlib / plotly / seaborn)。这种做法本质上就是构建一个 DataFrame 可视化智能体(Visualization Agent),它能够结合数据结构、字段含义与任务需求,为用户自动设计图表并呈现。具体实现逻辑很简单:DataFrame → LLM → 图表自动生成。构建可视化智能体类:import requests import pandas as pd import contextlib import io import traceback class VisualizationAgent: def __init__(self, model_host="http://localhost:11434", model="deepseek-r1:1.5b"): self.model_host = model_host self.model = model def _generate_plot_code(self, df: pd.DataFrame, task_description: str): # 将 df 转为 CSV 方便 LLM 解析 csv_data = df.to_csv(index=False) prompt = f""" 你是一个数据分析专家,以下是CSV格式的数据,以及用户的可视化需求。请根据这些数据生成 Python 绘图代码,使用 matplotlib(优先)或 plotly。 用户需求:{task_description} CSV数据如下:{csv_data} 请返回完整可运行的 Python 绘图代码: """ response = requests.post(f"{self.model_host}/api/generate", json={ "model": self.model, "prompt": prompt, "stream": False }) return response.json().get("response", "") def _safe_exec(self, code: str, local_vars=None): """ 安全执行模型生成的代码 """ local_vars = local_vars or {} global_vars = {"__builtins__": __builtins__, "pd": pd} try: # 重定向输出,避免污染控制台 with contextlib.redirect_stdout(io.StringIO()) as f: exec(code, global_vars, local_vars) except Exception as e: print("⚠️ 代码执行错误:") traceback.print_exc() def visualize(self, df: pd.DataFrame, task_description: str = "绘制销售额柱状图", show_code: bool = True): code = self._generate_plot_code(df, task_description) if show_code: print("模型生成绘图代码:\n") print(code) print("\n正在执行绘图代码...") self._safe_exec(code, local_vars={"df": df}) 使用示例if __name__ == "__main__": df = pd.DataFrame({ "region": ["华东", "华南", "华北", "西南"], "sales": [120000, 95000, 78000, 67000] }) agent = VisualizationAgent() agent.visualize(df, task_description="请生成一个地区销售额柱状图") 当运行这段代码后,它将调用模型生成图表代码,并自动执行、展示图表。5.总结在本章中,我们把“想法”一步步落地成了一条 端到端的智能数据分析流水线:环境就绪——先在云开发空间上快速拉起一台高配云主机,借助 curl install.sh 一键初始化开发环境,再用 Ollama 把 Deepseek-r1:1.5b 模型部署好并通过 netstat 确认端口;模型打通——用最简洁的 requests 脚本验证模型能正常对话,确保后面所有智能体都能调用;数据获取 & 清洗——编写 DataCleaningAgent,让大模型接管繁琐的文本去噪、实体抽取,批量输出结构化 JSON;自然语言查库——通过 DataQueryAgent 把 “一句中文 → SQL → DataFrame” 自动串起来,让非技术同事也能秒查运营数据;智能可视化——把查询得到的 DataFrame 交给 VisualizationAgent,由大模型自动产出 Matplotlib/Plotly 代码并即时执行,图表立现;全链路闭环——至此,数据从 获取 → 清洗 → 入库 → 查询 → 展示 全程自动化完成,真正实现了“低门槛、高效率、可复用”的企业级数据分析工作流。关键收益零 SQL / 零绘图门槛:业务人员只需说人话,背后全部自动完成。高度可插拔:每个 Agent 都是独立模块,清洗、查询、可视化可按需组合或替换更强模型。私有化可控:全部部署在企业自己的云主机与数据库内,安全合规。企业实战案例分享基于以上我们全链路的数据分析工作流的搭建,我们已经有足够的能力来实践一套供应链周报自动生成系统。一句话目标:让供应链经理把“写周报”这件事,彻底交给代码和大模型——数据自己来、图表自己画、结论自己写,人只需要点头确认。1. 背景与痛点典型痛点传统做法带来的问题数据源多、格式乱手动从 ERP / WMS / OMS 导出 Excel粗糙拼表、易漏字段,费时费神维度多、指标杂人肉写 SQL 拉数据运营/采购不懂 SQL,严重依赖数据团队图表重复劳动“复制数据 → 贴进模板 → 调样式”一键回车变成一上午文字结论经理凭经验手写主观、易漏看趋势结果:一个 10 页左右的供应链周报,往往要 3-4 人、费时半天才能端出来。2. 解决思路 :全链路工作流上场3. 核心模块落地3.1 数据清洗 & 入库接入源:ERP(采购、到货)、WMS(库存)、OMS(销售订单)工具:DataCleaningAgent任务:消歧同品名、规格(“A4纸80g” = “A4-80g”)解析自然语言备注,提取 供应商投诉 字段输出标准化 CSV,按天入 supply_dw 数据仓库3.2 自然语言取数使用者:采购经理、供应链分析师典型问句“近 12 周每周的采购金额与去年同期对比”“本周供应商到货准时率前 5 & 后 5”流程DataQueryAgent 读取 数据字典(自动生成或手写)Deepseek 模型根据问句 + Schema → 生成 SQL执行后返回 DataFrame示例快速验证:question = "列出最近4周库存周转天数趋势" schema_hint = "TABLE inv_summary(id, item, turnover_days, stat_week)" df_turnover = agent.query(question, schema_hint) 3.3 自动可视化 + 结论生成VisualizationAgent:DataFrame → 图表代码 → 即时渲染支持多图联排、双轴折线、漏斗、热力地图结论生成:再次调用 Deepseek:prompt = f"下面是近12周库存周转天数表格,请用200字生成总结性分析:\n{df.to_markdown()}" summary = llm(prompt) 3.4 报告编排 & 交付ReportBot(Python):收集所有图 PNG + 文字结论用 python-pptx 拼成周报 Deck,或 WeasyPrint 导出 PDF调用企业 IM / 邮件 API:“Hi @Team,本周周报已生成 👉 链接/附件”调度:Crontab / Airflow 每周一早 8 点自动跑4.关键代码骨架一览def weekly_report(): # 1. 拉取核心指标 metrics = { "采购金额": query_agent.query("近4周采购金额趋势", sales_schema), "到货准时率": query_agent.query("近4周到货准时率", inbound_schema), "库存周转": query_agent.query("近12周库存周转天数", inv_schema) } # 2. 生成图表 charts = {} for k, df in metrics.items(): charts[k] = viz_agent.visualize(df, f"绘制{k}折线图", show_code=False) # 3. AI 书写摘要 summary = llm("请基于以上三张表和图,总结供应链本周主要问题及建议") # 4. 组装 PPT ppt = build_ppt(charts, summary) ppt.save("weekly_supply_report.pptx") # 5. 送达 send_mail("weekly_supply_report.pptx", to=["boss@corp.com"]) 5. 效果速览指标传统方式全链路自动化周报产出时长≈ 4 小时 / 人≤ 10 分钟 / 机器参与人数运营 + 数据 + 设计0(无人值守)可追溯性低(手改 Excel)高(SQL + Git + 日志)结论一致性人工主观AI 根据数据重算6. 实施要点 & 踩坑提示数据字典必须够详细字段含义、单位、取值范围,一定要让大模型“看得懂”。SQL 安全在执行层加白名单,只允许 SELECT。图表代码安全执行VisualizationAgent 内部要过滤 os, subprocess 等危险关键字。权限管理建议给每个调用者分配专属 API Key + 查询范围。缓存/增量机制周报通常是“滚动周”,可以把前 N-1 周的数据缓存,速度更快。7. 价值回顾“让系统写报告,人来做决策。”效率:周报自动产出,数据团队有更多时间做深度分析。准确:口径统一、自动核对,避免手抄表格出错。透明:从原始数据到图表代码全链路留痕,可追溯可复盘。可扩展:同样的框架可复制到财务、营销、客服,形成企业级“智能报告工厂”。下一步,如果你想把这套系统推广到其他业务线,只需要:补充新表的 Schema;编写对应的 KPI Prompt;在调度器里新增定时任务。实践建议与关键技术要点总结大模型优化方法众多(如剪枝、量化、算子融合等),但没有 “通用最优解”。选择优化策略时,需结合业务需求、硬件条件、成本等多维度因素,避免盲目追求技术先进性而忽视实际效果。1应用场景导向应用场景导向的核心逻辑是不同场景对模型性能的需求不同,优化目标需与场景匹配。实时交互场景(如聊天机器人、自动驾驶):需低延迟,优先选择模型量化、算子融合或模型蒸馏。批量处理场景(如离线数据分析、大规模预测):需高吞吐量,可采用模型并行或动态批处理。边缘部署场景(如手机、物联网设备):受限于算力和能耗,需模型压缩+ 轻量级架构设计。若部署一个需要实时响应的智能家居语音助手,即使模型精度略低,也应优先选择量化和剪枝,以确保推理速度。2成本与性能平衡成本与性能平衡的核心逻辑是不同硬件对优化方法的支持程度不同,需充分发挥硬件优势。GPU/TPU 等加速硬件适合算子融合、模型并行等需要高并行计算的优化方法。边缘设备则需模型轻量化(剪枝、量化)+ 轻量级推理框架(如 TensorFlow Lite),避免复杂计算。CPU 服务器可选择多线程优化或内存优化(如 onnxruntime 的 CPU 优化)。比如在 GPU 集群上部署大模型时,使用 TensorRT 进行算子融合和图优化,能显著提升推理速度;而在手机端部署时,使用量化后的模型和 MNN 框架更合适。3. 实际应用中的综合决策在实际部署中,需结合多个原则进行权衡。比如自动驾驶公司需在车载设备(边缘硬件)上部署实时目标检测模型:场景导向:选择低延迟优化,如模型剪枝和量化。硬件匹配:针对车载芯片的架构,使用专用优化工具(如 Nvidia 的 TensorRT 针对 GPU 优化)。成本平衡:通过蒸馏轻量化模型,降低对高端硬件的依赖,控制成本。扩展性:设计可动态调整的流水线,未来若更换传感器或算法,可快速适配。这四个原则为大模型优化提供了从场景需求到技术落地的完整思考路径:以场景为起点,结合硬件和成本约束,选择灵活可扩展的方案。通过这种系统性的决策,企业既能在当下实现高效部署,又能为未来的业务增长预留技术空间。智能体编排未来应用趋势随着大模型从“一个聪明的回答机”逐步进化为“面向任务的执行体”,多智能体编排(Agent Orchestration) 正成为新一轮 AI 应用变革的核心引擎。相比传统单模型调用逻辑,智能体编排更像是构建“具身智能系统”或“数字员工团队”,将感知、思考、决策与执行完整串联起来,实现从“回答你”到“替你做”的飞跃。在我们展示的数据分析系统中,其实已经具备“雏形智能体”的要素:如 DataCleaningAgent、DataQueryAgent、VisualizationAgent 等等。这些模块虽然是按功能划分,但本质上已经具备“接收任务 → 理解意图 → 执行操作 → 返回结果”的 Agent 行为模式。而在更复杂的未来业务中,一个任务往往无法由单个智能体完成,这时需要:多个 Agent 分工合作、传递信息、联合完成复杂任务,甚至具备自治能力。比如在一个“企业经营分析”智能系统中:角色智能体职责说明任务协调 Agent(Coordinator)理解高层命令,如“生成月度经营报告”,并拆解成子任务数据智能体(Query Agent)根据需求调用数据库并返回 DataFrame图表智能体(Viz Agent)生成图表代码并渲染结果洞察智能体(Insight Agent)结合数据输出摘要分析与趋势判断报告生成 Agent汇总图表与文字,输出 Markdown/PPT/邮件等格式监控反馈 Agent记录执行日志、收集用户反馈并优化流程每一个 Agent 都是可复用的能力单元,而智能体间的协作流转由Agent Framework 或 编排平台调度控制。要真正落地多智能体协同系统,以下几个能力将成为技术团队不可回避的核心能力:意图解析能力需要将用户自然语言转化为结构化任务链(如 AWEL DSL、JSON Graph 等);任务拆解与分发能力使用树状或 DAG 结构,支持任务自动拆解与并发执行;智能体能力注册与调度机制类似“插件系统”,支持注册各类智能体,并调度调用;记忆与上下文管理实现智能体在多轮协作中共享上下文、传递中间变量;异常处理与回滚机制构建面向业务场景的“容错能力”,支持失败重试、断点续跑;安全与权限机制管理智能体访问数据的边界,防止越权调用或数据泄漏;未来的 AI,不再只是一个“回答者”,而是一个主动工作的“数字合作者”。从数据分析到知识总结,从任务执行到流程协同,我们已经看到多智能体系统开始扮演团队中的新角色。“让系统成为员工的一部分,而不仅仅是工具。”这不仅是数据智能化的进化方向,更是企业迈向新一代智能生产力时代的起点。下一阶段,智能体将不再只是调用函数的代理,而是逐步演化为具备推理、感知、社交能力的数字个体,真正融入业务、参与决策、持续学习与成长。我正在参加【案例共创】第4期 基于华为开发者空间+仓颉/DeepSeek/MCP完成应用构建开发实践 https://bbs.huaweicloud.com/forum/thread-02127182415062274055-1-1.html
  • 【已刷新】《人工智能入门级开发者认证》内容重大升级,敬请期待!
    尊敬的客户:您好!为了确保人工智能入门级开发者认证课程的时效性和技术领先性,帮助开发者更好地掌握最新的人工智能开发技能,同时紧跟华为云的最新技术动态,我们将对认证内容进行更新,预计2025年6月30日正式更新上线! 更新内容如下:1. 新增前沿大模型介绍,让初学AI的开发者对大模型有初步认识;2. 新增针对大模型的应用技术MCP,从其工作原理、操作流程讲起,重点突出使用MCP能带来的效率提升、成本降低等优势,使开发者明白其价值所在;3. 新增基于RAG技术的交通大模型应用作为实践案例,详细剖析其在实际交通场景中的应用方式、取得的成效以及解决的问题,让开发者直观感受RAG技术的强大。届时我们还将开展相关开发者认证上新活动,详情请关注华为云开发者学堂论坛-热门活动 相关通知。发布日期:2025年6月4日
  • 《人工智能工作级开发者认证》内容重大升级,敬请期待!
    尊敬的客户:您好!为了确保人工智能工作级开发者认证课程的时效性和技术领先性,帮助开发者更好地掌握最新的人工智能开发技能,同时紧跟华为云的最新技术动态,我们将对认证内容进行全面升级,预计2025年8月22日正式更新上线! 更新内容如下:1、课程逻辑重构:以大模型开发应用为主线,包含数据处理分析、大模型理论基础、基于大模型的AI应用开发、大模型优化等;同时精简机器学习/深度学习基础内容,移除EI服务介绍及API调用实操内容,聚焦大模型能力培养与认证;2、新增Transformer与大模型基础、大模型进阶与模型开发、大模型应用开发三大模块,涵盖核心技术:Transformer原理、多模态大模型(CLIP/Stable Diffusion)、强化学习与大模型训练(RLHF)、大模型评测方法等,夯实大模型核心技术基础;3、新增数据搜集、处理与分析,强调数据质量对模型的影响;4、新增AI伦理与未来趋势、具身智能等前沿议题;5、新增配套实验:Bert/GPT文本理解与生成实验,大模型微调与评测,Prompt工程构建聊天机器人,基于RAG的问答机器人开发,智能Agent开发等,强化大模型实操技能训练;6、扩展开发工具链:引入ollama、LlamaIndex、LangChain、Dify等新一代AI应用开发工具,替代了原认证中的ModelArts Pro套件,贴近开发者最新典型使用场景。 届时我们还将开展相关开发者认证上新活动,详情请关注华为云开发者学堂论坛-热门活动 相关通知。发布日期:2025年6月4日
  • [业务动态] 《云迁移工作级开发者认证》内容重大升级,敬请期待!
    尊敬的客户:您好!为了确保云迁移工作级开发者认证课程的时效性和技术领先性,帮助开发者更好地掌握最新的云迁移技能,同时紧跟华为云的最新技术动态,我们将对认证内容进行全面升级,预计2025年8月30日正式更新上线!一、新增内容1、新增Landing Zone设计和实施章节及配套实验,涵盖需求调研、方案实设计与实施等内容,使开发者掌握Landing Zone的设计和实施的关键要素;2、新增云服务器迁移实验:存储迁移、缓存迁移,增强开发者对于存储、缓存迁移的实操能力;3、新增IMS介绍与操作指导、键值存储KVS、kafka迁移工具介绍和工具迁移方案、 MGC介绍等内容,使开发者对计算、存储、消息队列等云服务及迁移工具有更为全面的掌握。二、更新内容1、云迁移方法论:方法论更新为云采用框架,包括迁移的战略制定与顶层规划、迁移调研分析和评估规划、迁移上云方案设计和试点规划、迁移上云实施和运维;2、云迁移实施案例:更新多个企业的迁移案例;3、云服务产品规格、实验界面:根据最新产品版本更新;4、移除原认证中“华为云核心服务”章节,使内容更聚焦于迁移技能;5、优化原有教材的逻辑结构:数据库服务器使用和迁移、容器服务使用和迁移、容器迁移实验等内容,去掉冗余内容,调整呈现结构,优化开发者学习体验。届时我们还将开展相关开发者认证上新活动,详情请关注华为云开发者学堂论坛-热门活动 相关通知。发布日期:2025年6月4日
  • [热门活动] 有人开发者活动恶意投机刷帖拿奖
    活动链接【中奖名单公示】///【体验有礼】华为开发者空间五一大放送!免费体验新技术,完成案例实践,赢华为无线耳机、手环、云宝手办等多重好礼!第4页_开发者空间_华为云论坛这个人华为云昵称为user_beifeng的有涉嫌投机,破坏活动公平性,严重破坏活动秩序,他利用活动规则活动二【实践互动】中奖小妙招:案例完成数最多的前三名,将100%获得奖励!,恶意连续发布多个案例,每个案例只选取一部分体验截图。首先他帖子发布时间从2025-05-15 22:15:12到2025-05-15 23:27:31,连续发布从11.基于云主机部署Python电商项目到38.开发者空间里玩转MySQL之事务与锁的28个案例,就是说不到一个半小时发布28个,这个时间要是每个案例都完整体验根本不可能完成,平均不到3分钟发布一篇案例,包括编辑帖子时间以及中间切换页面间隔,要么他是提前完成并记录,最后统一批量发布,那还合理;要么他是投机在2025年5月15号即活动的最后一天晚上的一个半小时连续发布多个帖子。截图里面打开个终端可能怕别人盗图吧,1.37.开发者空间里玩转MySQL之存储过程与触发器里面创建的一个事件手册上说是5分钟后执行,他截图显示Execute at :事件计划执行的时间,这里是2025-05-15 23:30:27,就是说他事件是2025-05=15 23.25左右创建,他11点25创建的事件,11点26分就发布帖子了,真够急的;2、他PyTho案例的体验里面33.Python高阶:看,那里有个BUG - 异常32.Python高阶:三个神器 - 迭代器、生成器与装饰器23点04发的帖子,右下角最近的运行会话[23:04] 23点03发的帖子,右下角最近的运行会话[23:02] 31. Python高阶:站在巨人的肩膀上 - Numpy、Pandas、Matplotlib、Requests 23点01发的帖子,右下角最近的运行会话[23:01]而且都是17.py这个文件夹;而且仓颉案例体验里面你都只改一个主文件,运行就交是吧,别的都没有变过,项目工程里面别的文件名是一模一样,玫瑰粉案例结构根部不一样,把21. 仓颉 – C跨语言编程实现控制台小游戏的工程结构一直用到30.仓颉之泛型和扩展的神奇天地是吧,(game_app文件很明显是项目的)根本不可能,有的缺少文件会报错好吧,你选个主文件随便一运行就当体验了是吧;报错了把终端隐藏了,虚啥呀;还有别的项目都是类似问题,赶着活动结束最后一天晚上1个半小时就搞定了28多个案例体验,忙不忙,换来换去,我都替你累,为了卷第一何必呢,都想你这样,几个小时不到那直接华为云案例中心直接全部做一遍了,你这样还拿奖了,那别人咋办啊。
  • [问题求助] 请问在哪里可以看到【华为开发者空间】体验打卡+技术实践 活动获奖名单?
    请问在哪里可以看到【华为开发者空间】体验打卡+技术实践 活动获奖名单?https://developer.huaweicloud.com/signup/f8a3298e6e854f52bb92abb242d66264?utm_source=wechat
  • [热门活动] 【云学堂云原生集证活动】微认证1元购·积分兑好礼|赢HDC.2025大会门票
    【获奖公示】一、积分数据公示见本论坛贴附件1,积分兑换获奖名单公示见本论坛贴附件2二、公示时间:2025年6月9日—2025年6月15日,若有疑问请在该时间段反馈,逾期视为放弃奖励!三、积分数据统计周期:仅统计5月20日—6月8日期间的考试数据(首次考取以上认证可参与积分)。四、奖品发放:所有奖励将于活动公示期后陆续安排发放。点此填写活动满意度调查问卷【活动福利】福利1:微认证1元购,集齐微认证证书一键兑换开发者认证证书福利2:邀请报名有礼:送最高1000元云资源代金券/1099元工作级开发者认证代金券福利3:考证积分兑好礼:最高送华为手表FIT3,积分排名top5可额外获得1张HDC.2025大会门票(双日票)!云资源代金券/开发者认证代金券/实物奖品免费兑,积分越高礼品越丰厚。福利4:积分抽奖,抽HDC.2025大会门票(双日票)与华为手环9点击链接立即报名:cid:link_9【活动时间】2025年5月20日—2025年6月8日【微认证1元购】序号认证名称(含购买入口)认证价格1云原生基础设施之容器入门582云原生基础设施之容器进阶583基于CCE Kubernetes编排实战684CCE网络与存储实战685云容器快速搭建网站586云原生入门级开发者认证通过序号1-5点此兑换开发者证书7智能信息过滤和图片鉴别388树回归算法分析房价趋势389智能表单及证件文字识别38点击前往活动页,可领取考试代金券及查看详细福利。部分奖品限量,先到先得,赶紧来参加吧!
  • [热门活动] 【活动已结束】华为云微认证专场活动
    【活动公示信息】1、120元云资源券公示名单见附件1,PC端下载后查看。领取奖励必须活动报名+完成对应的微认证数2、通过1门微认证后抽奖公示名单见附件2,PC端下载后查看,公示时间:10月11日—10月19日,如有疑问请在2025年10月19日(含)前反馈,逾视为放弃奖励特别说明:如果在活动期间领取了云学堂其它活动(云学堂「集证」有礼活动、云原生集证有礼、云计算集证有礼等活动)的奖励无法领取本活动福利,不发放120元云资源券。 【活动信息】1.任意考取1门微认证通过后,即可参与抽奖,800份豪礼相送;2.考取2门微认证送120元云资源代金券;活动链接:cid:link_0【注意事项】1、本活动中活动礼品如遇缺货等情况,将替换成类似款或其他等价值礼品。2、每个用户仅限参与一次抽奖,以首次通过认证时绑定的账号为准,重复考取其他微认证不增加中奖概率,但可以获取120元云资源代金券福利。3、云资源券会在5月20日统计发放第一批,后续每60天统计发放一次(非工作日除外,自动顺延一天),有效期为自发放之日起60天内有效,逾期未使用不予补发,请尽快使用,使用时建议按月续费!4、第一批活动获奖名单会在5月20日公示,后续每60天完成一次公示(非工作日除外,自动顺延一天),奖品发放时间根据实际情况动态调整,如有延期敬请见谅。5、若在通过认证期间,领取了其他云学堂活动的微认证福利,则无法领取本活动福利。
  • [课程学习] 华为云学堂精品课推荐! 《AI原生应用入门》
    如今智能科技无处不在,从智能音箱至自动驾驶汽车,再到聊天机器人,它们正以不同的方式提升着我们的生活体验。然而,究竟怎样的应用才能称得上是“AI原生应用”呢?。由华为云学堂技术团队精心打造的DeepSeek大模型部署系列课程,融合实战经验,体验在线实操,边学边练,为你扫清学习障碍。一次学习终身受用,省去万元试错成本,职业竞争力飙升!本课程主要讲述AI原生应用的基本概念、核心特点及典型应用场景,详细阐述华为云应用平台AppStage与华为云AI原生应用引擎的产品优势、功能及应用场景,最后通过一个规划旅游行程实践具体介绍Agent的编排使用。1、了解AI原生应用的基本概念2、熟悉华为云应用平台AppStage3、熟悉华为云AI原生应用引擎4、掌握Agent的编排使用点击课程链接学习,开启你的AI模型部署高光时刻!
  • [课程学习] 华为云学堂精品课推荐! 《CodeArts盘古助手入门和应用》
    随着人工智能技术的飞速发展,大模型已成为推动各行各业智能化转型的重要引擎。特别是2024年,大模型技术不仅在技术层面取得了突破,更在实际应用中展现出了巨大的潜力与价值。由华为云学堂技术团队精心打造的DeepSeek大模型部署系列课程,融合实战经验,体验在线实操,边学边练,为你扫清学习障碍。一次学习终身受用,省去万元试错成本,职业竞争力飙升!本课程主要介绍CodeArts盘古助手,通过CodeArts一系列强大的辅助编码功能,帮助开发者高效提升编码效率和质量。课程内容涵盖了CodeArts在自动生成代码及其测试用例方面的应用,通过多个代码生成案例,帮助大家更深刻地理解和掌握CodeArts工具的实际应用。课程目标:1、了解CodeArts盘古助手2、熟悉CodeArts辅助编码功能3、掌握CodeArts自动生成代码及测试用例4、熟悉CodeArts代码生成案例点击课程链接学习,开启你的AI模型部署高光时刻!
  • [课程学习] 华为云学堂精品课推荐! 《大模型技术的前沿应用详解》
    随着人工智能技术的飞速发展,大模型已成为推动各行各业智能化转型的重要引擎。特别是2024年,大模型技术不仅在技术层面取得了突破,更在实际应用中展现出了巨大的潜力与价值。告别天价算力,从入门到实战,手把手教你解锁大模型。由华为云学堂技术团队精心打造的DeepSeek大模型部署系列课程,融合实战经验,体验在线实操,边学边练,为你扫清学习障碍。一次学习终身受用,省去万元试错成本,职业竞争力飙升!本课程主要讲述进入大模型时代,各个领域在大模型实际落地的尝试和进展中呈现出多元化和加速化的趋势。课程目标:1、了解大模型技术在科学研究,教育,金融,医疗,具身智能等领域的前沿应用情况。2、熟悉大模型在特定领域下的细分应用场景。3、掌握大模型解决实际领域问题的思路和抓手。点击课程链接学习,开启你的AI模型部署高光时刻!
  • [课程学习] 华为云学堂精品课推荐! 《大模型应用开发工具包》
    大模型实践,手把手教你玩转AI。由华为云学堂技术团队精心打造的DeepSeek大模型部署系列课程,融合实战经验,体验在线实操,边学边练,为你扫清学习障碍。一次学习终身受用,省去万元试错成本,职业竞争力飙升!本课程主要讲述大模型应用开发工具包,包括RAG开发工具包llamaIndex、langchain RAG模块以及Agent开发工具包langchain Agent模块,并了解llamaIndex、Langchain的基本概念、学会使用如何使用这些工具包。。课程目标:1、掌握利用llamaIndex、 langchain RAG模块构建RAG的流程2、掌握利用langchain构建Agent的流程3、了解llamaIndex、 langchain的核心模块和功能 点击课程链接学习,开启你的AI模型部署高光时刻!
  • [业务动态] 华为云开发者学堂工作级开发者认证考试预约排考计划调整预通知
    尊敬的考生:为进一步优化考试资源分配,提升监考效率,现对工作级开发者认证考试预约安排进行如下调整:减少考试场次:由于当前排考场次过多,且上午时段考生人数较少,导致监考资源存在浪费现象。为合理利用资源,我们将适当减少考试场次安排。场次动态调整计划:后续我们将根据实际考试情况动态调整场次安排,并于每月公布一次考试计划,确保监考资源的高效配置,同时为考生提供更稳定的考试服务。详细场次安排可查看:cid:link_0感谢您的理解与支持!如有疑问,请联系客服咨询!
  • [热门活动] 云学堂集证有礼活动—【积分进度及各项福利获奖公示】——公示已结束
    【活动福利】1、 邀请报名有礼:送最高1000元云资源代金券/工作级开发者认证代金券。2、 考证积分有礼(含邀请好友考证):最高送华为手表FIT3,更有2000+份礼品/云资源代金券/开发者认证代金券等,积分越高礼品越丰厚。3、开发者空间案例实践抽奖:赢华为手环9/华为耳机/定制双肩包/华为云云宝盲盒等精美礼品。4、昇腾AI专区课程学习抽奖:赢华为手环9/华为耳机/定制双肩包/定制雨伞/华为云云宝盲盒等精美礼品。5、专属福利:工作级开发者认证通过后,岗位直推,更多职位机会等你来挑战!点击查看本次推荐。活动链接: cid:link_0一、活动公示信息1、积分进度公示及邀请好友考证数据,见本论坛贴附件22、邀请好友领云资源券公示,见本论坛贴附件43、昇腾A专区课程学习抽奖中奖公示,见本论坛贴附件54、积分兑换云资源券已填写问卷且符合条件的用户公示,见本论坛贴附件6说明:不在公示名单内,可能是未填写积分兑换云资源问卷或积分数不符合要求,积分兑换问卷将于5月18日(含)停止收集,请及时填写积分兑换问卷特别提醒:对以上任意获奖公示有疑问的学员务必在2025年5月23日(含)前反馈至小助手,逾期未反馈视为放弃奖励!二、【积分兑换实物奖品获奖公示】【公示时间】积分兑换实物奖品已于 2025年4月27日18:00 停止,获奖公示时间为2025年4月28日—2025年5月11日,请大家及时查看获奖公示,逾期反馈不予处理,请知悉!【奖品发放】活动奖品在所有奖励公示结束后统一发放! 积分兑换实物公示名单见本论坛贴附件3特别提醒:对以上任意获奖公示有疑问的学员务必在2025年5月11日(含)前反馈至小助手,逾期未反馈视为放弃奖励!(若对获奖名单存有异议可咨询小助手)三、为了后续给大家提供更好的活动体验,欢迎大家积极填写活动满意度调查问卷:cid:link_2
  • [课程学习] 华为云学堂精品课推荐! 《DeepSeek大模型服务API发布与调用》
          你是否还在为AI开发的高门槛发愁?看着心动却无从下手?由华为云学堂技术团队精心打造的DeepSeek大模型部署系列课程,融合实战经验,体验在线实操,边学边练,为你扫清学习障碍。一次学习终身受用,省去万元试错成本,职业竞争力飙升!本课程将深入探讨DeepSeek大模型的本地部署与API调用,帮助开发者从入门到实践,掌握这一强大工具的核心技能。课程目标:1、熟悉DeepSeek大模型的基本概念和应用场景;2、掌握如何使用不同的工具和框架实现大模型高效部署;3、掌握如何通过接口与模型交互,实现功能调用,并处理常见问题;4、了解各行各业应用案例与未来发展方向。点击课程链接学习,开启你的AI模型部署高光时刻!  
总条数:279 到第
上滑加载中