- 本文记录企业级法务知识库RAG系统的多AI协同开发实战:面对2万份格式混杂、含15%模糊扫描件的法律文档,14天交付需3秒响应精准查询的系统,构建Kiln AI、LlamaIndex、Helicone协同矩阵。Kiln AI完成数据清洗(有效信息密度提至85%)、合成训练样本及模型微调,使专业术语识别准确率达92%;LlamaIndex搭建三层检索架构,融合语义与关键词检索,匹配错误率降至5%。 本文记录企业级法务知识库RAG系统的多AI协同开发实战:面对2万份格式混杂、含15%模糊扫描件的法律文档,14天交付需3秒响应精准查询的系统,构建Kiln AI、LlamaIndex、Helicone协同矩阵。Kiln AI完成数据清洗(有效信息密度提至85%)、合成训练样本及模型微调,使专业术语识别准确率达92%;LlamaIndex搭建三层检索架构,融合语义与关键词检索,匹配错误率降至5%。
- 深度强化学习(Deep Reinforcement Learning, DRL)作为人工智能领域的一个重要分支,已广泛应用于智能控制系统中。从无人驾驶到机器人控制,DRL通过模拟和训练智能体,能够在复杂环境中做出决策并执行控制任务。本文将探讨DRL在智能控制系统中的应用、所面临的挑战以及如何克服这些挑战。 深度强化学习(Deep Reinforcement Learning, DRL)作为人工智能领域的一个重要分支,已广泛应用于智能控制系统中。从无人驾驶到机器人控制,DRL通过模拟和训练智能体,能够在复杂环境中做出决策并执行控制任务。本文将探讨DRL在智能控制系统中的应用、所面临的挑战以及如何克服这些挑战。
- Files containing only extrapolated orbital metadata, to be read via SDP Toolkit, Binary Format简介AM1EPHNE 是 Terra 近实时 (NRT) 2 小时航天器外推星历数据文件,采用原生格式。文件名格式如下:AM1EPHNE.Ayyyyddd.hhmm.vvv.yyyydddhhmmss,其... Files containing only extrapolated orbital metadata, to be read via SDP Toolkit, Binary Format简介AM1EPHNE 是 Terra 近实时 (NRT) 2 小时航天器外推星历数据文件,采用原生格式。文件名格式如下:AM1EPHNE.Ayyyyddd.hhmm.vvv.yyyydddhhmmss,其...
- 视频动作识别算法的核心是从视频的时空数据中提取运动特征与空间特征,并对人类或物体的动作类别进行分类。一、传统方法(基础参考,已较少用于主流场景)传统方法依赖手工设计特征,虽精度有限,但原理简单,适合资源极度受限或简单场景:HOG+SVM/BoW:原理:将视频帧拆分为块,提取HOG(方向梯度直方图) 描述空间纹理,结合光流(Optical Flow) 描述运动,再用BoW(词袋模型) 聚合特征... 视频动作识别算法的核心是从视频的时空数据中提取运动特征与空间特征,并对人类或物体的动作类别进行分类。一、传统方法(基础参考,已较少用于主流场景)传统方法依赖手工设计特征,虽精度有限,但原理简单,适合资源极度受限或简单场景:HOG+SVM/BoW:原理:将视频帧拆分为块,提取HOG(方向梯度直方图) 描述空间纹理,结合光流(Optical Flow) 描述运动,再用BoW(词袋模型) 聚合特征...
- 图像增强的核心目标是提升图像质量(如清晰度、对比度)、突出关键信息,或为后续任务(如目标检测、医学影像分析、遥感解译)优化数据。根据技术原理,可分为空域增强、频域增强、深度学习增强三大类。一、空域增强:直接操作像素域(最基础、应用最广)空域增强通过修改图像像素的灰度值或空间位置实现,无需转换到其他域,计算效率高,适合实时场景(如监控、手机拍照)。1. 灰度变换:调整像素灰度分布(提升对比度 ... 图像增强的核心目标是提升图像质量(如清晰度、对比度)、突出关键信息,或为后续任务(如目标检测、医学影像分析、遥感解译)优化数据。根据技术原理,可分为空域增强、频域增强、深度学习增强三大类。一、空域增强:直接操作像素域(最基础、应用最广)空域增强通过修改图像像素的灰度值或空间位置实现,无需转换到其他域,计算效率高,适合实时场景(如监控、手机拍照)。1. 灰度变换:调整像素灰度分布(提升对比度 ...
- 当AI遇上癌症:聊聊个性化治疗的新可能 当AI遇上癌症:聊聊个性化治疗的新可能
- 数据才是真救命的:聊聊如何用大数据提升灾难预警的精准度 数据才是真救命的:聊聊如何用大数据提升灾难预警的精准度
- 梯度下降(Gradient Descent)是机器学习和深度学习中最常用的优化算法之一,其目标是通过迭代更新模型参数以最小化损失函数。反向传播(Backpropagation)为梯度计算提供了高效的实现方式,而随机梯度下降(Stochastic Gradient Descent, SGD)则通过随机采样显著提升了大规模数据集上的训练效率。本文将深入探讨梯度下降、反向传播和SGD的核心原理、技... 梯度下降(Gradient Descent)是机器学习和深度学习中最常用的优化算法之一,其目标是通过迭代更新模型参数以最小化损失函数。反向传播(Backpropagation)为梯度计算提供了高效的实现方式,而随机梯度下降(Stochastic Gradient Descent, SGD)则通过随机采样显著提升了大规模数据集上的训练效率。本文将深入探讨梯度下降、反向传播和SGD的核心原理、技...
- 在深度学习领域,优化算法对于模型的训练和性能提升起着至关重要的作用。梯度下降、反向传播以及随机梯度下降(SGD)是其中最为基础和关键的算法。本文将详细介绍这三种算法的基本概念、原理、计算过程以及它们之间的关系,并通过示例和图表来帮助读者更好地理解。 一、引言深度学习模型通常包含大量的参数,需要在训练数据上进行多次迭代以调整这些参数,使得模型的预测结果与真实标签尽可能接近。梯度下降及其相关变种... 在深度学习领域,优化算法对于模型的训练和性能提升起着至关重要的作用。梯度下降、反向传播以及随机梯度下降(SGD)是其中最为基础和关键的算法。本文将详细介绍这三种算法的基本概念、原理、计算过程以及它们之间的关系,并通过示例和图表来帮助读者更好地理解。 一、引言深度学习模型通常包含大量的参数,需要在训练数据上进行多次迭代以调整这些参数,使得模型的预测结果与真实标签尽可能接近。梯度下降及其相关变种...
- 机器学习项目中至关重要的三重境界——特征提取(Feature Extraction)、特征选择(Feature Selection)和特征工程(Feature Engineering)。特征提取将原始数据转化为有意义的数值表示,特征选择从冗余特征中筛选关键信息,而特征工程则通过创造性变换提升模型性能。文章结合计算机视觉、自然语言处理等领域的经典案例,解析各环节的核心方法论与实战技巧,并提供可... 机器学习项目中至关重要的三重境界——特征提取(Feature Extraction)、特征选择(Feature Selection)和特征工程(Feature Engineering)。特征提取将原始数据转化为有意义的数值表示,特征选择从冗余特征中筛选关键信息,而特征工程则通过创造性变换提升模型性能。文章结合计算机视觉、自然语言处理等领域的经典案例,解析各环节的核心方法论与实战技巧,并提供可...
- 线性回归、逻辑回归和支持向量机(SVM)作为统计学习与机器学习的三大基石,一直广泛应用于回归预测、分类决策及异常检测等领域。本文从算法原理出发,深入解析三者的模型假设、损失函数与求解方法,随后给出统一的端到端实践流程(含流程图),并通过对比实验总结它们在不同场景下的优劣势,为工程落地提供参考。算法原理概述1.1 线性回归– 模型假设:y≈wᵀx+b– 损失函数:最小二乘 L(w,b)=1/2... 线性回归、逻辑回归和支持向量机(SVM)作为统计学习与机器学习的三大基石,一直广泛应用于回归预测、分类决策及异常检测等领域。本文从算法原理出发,深入解析三者的模型假设、损失函数与求解方法,随后给出统一的端到端实践流程(含流程图),并通过对比实验总结它们在不同场景下的优劣势,为工程落地提供参考。算法原理概述1.1 线性回归– 模型假设:y≈wᵀx+b– 损失函数:最小二乘 L(w,b)=1/2...
- 本文围绕强化学习(RL)核心脉络,从表格型 Q-learning 推进到深度强化学习(DRL)的价值型代表方法(以 DQN 系列为主),系统阐述理论要点、训练稳定性技巧与工程化落地细节。我们给出统一训练流水线与接口抽象,包含并行采样、经验回放、目标网络与评测闭环;提供一份可复现实验方案与对照表,便于在 CartPole、LunarLander 等经典任务上快速比较样本效率与稳定性。文章含流程... 本文围绕强化学习(RL)核心脉络,从表格型 Q-learning 推进到深度强化学习(DRL)的价值型代表方法(以 DQN 系列为主),系统阐述理论要点、训练稳定性技巧与工程化落地细节。我们给出统一训练流水线与接口抽象,包含并行采样、经验回放、目标网络与评测闭环;提供一份可复现实验方案与对照表,便于在 CartPole、LunarLander 等经典任务上快速比较样本效率与稳定性。文章含流程...
- 聚类算法是无监督学习领域中的重要分支,旨在将数据集中的数据对象划分为若干个相似的子集(簇)。本文详细介绍了两种常见的聚类算法——K-means和层次聚类,包括它们的基本原理、算法流程、优缺点以及应用场景,并通过表格和流程图等形式进行了直观展示,以便更好地理解和比较这两种算法。 一、引言聚类分析在众多领域如数据分析、图像识别、客户细分等有着广泛的应用。它能够帮助我们从大量数据中发现潜在的模式和... 聚类算法是无监督学习领域中的重要分支,旨在将数据集中的数据对象划分为若干个相似的子集(簇)。本文详细介绍了两种常见的聚类算法——K-means和层次聚类,包括它们的基本原理、算法流程、优缺点以及应用场景,并通过表格和流程图等形式进行了直观展示,以便更好地理解和比较这两种算法。 一、引言聚类分析在众多领域如数据分析、图像识别、客户细分等有着广泛的应用。它能够帮助我们从大量数据中发现潜在的模式和...
- 聚类是一种无监督学习方法,旨在将数据划分为若干组(簇),使得同一簇内的数据具有较高的相似性,而不同簇之间的数据差异较大。K-means和层次聚类是两种经典的聚类算法,分别基于划分和分层的思想。本文将深入探讨这两种算法的核心原理、技术特点及其应用场景,并展望聚类算法的未来发展方向。 正文: 1. 引言聚类是数据分析和机器学习中的重要任务,广泛应用于客户分群、图像分割、生物信息学等领域。作为无监... 聚类是一种无监督学习方法,旨在将数据划分为若干组(簇),使得同一簇内的数据具有较高的相似性,而不同簇之间的数据差异较大。K-means和层次聚类是两种经典的聚类算法,分别基于划分和分层的思想。本文将深入探讨这两种算法的核心原理、技术特点及其应用场景,并展望聚类算法的未来发展方向。 正文: 1. 引言聚类是数据分析和机器学习中的重要任务,广泛应用于客户分群、图像分割、生物信息学等领域。作为无监...
- 本文系统阐述机器学习领域中三大关键范式——迁移学习(Transfer Learning)、领域适应(Domain Adaptation)和多任务学习(Multi-Task Learning, MTL)的技术原理、方法论差异及其协同潜力。迁移学习聚焦于将预训练模型的知识迁移至新任务;领域适应致力于解决跨领域分布偏移带来的性能下降问题;多任务学习通过联合建模实现任务间的相互增强。三者共同构成了应... 本文系统阐述机器学习领域中三大关键范式——迁移学习(Transfer Learning)、领域适应(Domain Adaptation)和多任务学习(Multi-Task Learning, MTL)的技术原理、方法论差异及其协同潜力。迁移学习聚焦于将预训练模型的知识迁移至新任务;领域适应致力于解决跨领域分布偏移带来的性能下降问题;多任务学习通过联合建模实现任务间的相互增强。三者共同构成了应...
上滑加载中
推荐直播
-
华为云码道 × 仓颉编程:工程化AI编码探索2026/05/27 周三 19:00-21:00
刘俊杰-华为云仓颉语言专家/李炎-华为云码道技术专家/王智鹏-OpenCangjie开源社区发起人
本场直播围绕华为云仓颉语言与华为云码道的深度结合,展示华为云智能编程从零基础到高效落地的完整生态能力。以华为云码道为引擎,仓颉语言为载体,带给大家日常提效、趣味创新到极速量产的开发体验。
回顾中
热门标签