- 华为云文字识别OCR服务于2020年3月24日00:00(北京时间)降价通知 华为云文字识别OCR服务于2020年3月24日00:00(北京时间)降价通知
- 年底了,面对茫茫文件中,不少人又开始头痛了。如何处理这些铺天盖地的文档已经成为大众工作中不得不面对的一个问题。计算机技术的普及,让无纸化办公渐成大势,不少企业引入人工智能识别技术,管理办公文档。顺应大势,厦门云脉推出纸质文档管理解决方案,帮助企业更好的管理文件。提升文件处理效率现代办公,效率第一。办公过程中,文字处理工作向来单调繁琐,早期主要依赖人工手动管理,加重了企业管理成本,而OCR技术... 年底了,面对茫茫文件中,不少人又开始头痛了。如何处理这些铺天盖地的文档已经成为大众工作中不得不面对的一个问题。计算机技术的普及,让无纸化办公渐成大势,不少企业引入人工智能识别技术,管理办公文档。顺应大势,厦门云脉推出纸质文档管理解决方案,帮助企业更好的管理文件。提升文件处理效率现代办公,效率第一。办公过程中,文字处理工作向来单调繁琐,早期主要依赖人工手动管理,加重了企业管理成本,而OCR技术...
- 今年一季度,我所在的测试平台连续出了三次生产故障。第一次,一个Skill里引用了错误的第三方库版本,导致整个引擎启动失败,所有测试任务挂了两个小时。第二次,有人在Skill里写了一个死循环,引擎线程被堵死,其他Skill全部排队等死。第三次最离谱,一个Skill往全局环境里写了一个变量,另一个Skill读到后行为完全错乱,排查了整整一个通宵。三个故障指向同一个问题:Skill之间没隔离,热加... 今年一季度,我所在的测试平台连续出了三次生产故障。第一次,一个Skill里引用了错误的第三方库版本,导致整个引擎启动失败,所有测试任务挂了两个小时。第二次,有人在Skill里写了一个死循环,引擎线程被堵死,其他Skill全部排队等死。第三次最离谱,一个Skill往全局环境里写了一个变量,另一个Skill读到后行为完全错乱,排查了整整一个通宵。三个故障指向同一个问题:Skill之间没隔离,热加...
- 今年一季度,我所在的测试平台连续出了三次生产故障。第一次,一个Skill里引用了错误的第三方库版本,导致整个引擎启动失败,所有测试任务挂了两个小时。第二次,有人在Skill里写了一个死循环,引擎线程被堵死,其他Skill全部排队等死。第三次最离谱,一个Skill往全局环境里写了一个变量,另一个Skill读到后行为完全错乱,排查了整整一个通宵。三个故障指向同一个问题:Skill之间没隔离,热加... 今年一季度,我所在的测试平台连续出了三次生产故障。第一次,一个Skill里引用了错误的第三方库版本,导致整个引擎启动失败,所有测试任务挂了两个小时。第二次,有人在Skill里写了一个死循环,引擎线程被堵死,其他Skill全部排队等死。第三次最离谱,一个Skill往全局环境里写了一个变量,另一个Skill读到后行为完全错乱,排查了整整一个通宵。三个故障指向同一个问题:Skill之间没隔离,热加...
- 通过批处理将大模型 API 的吞吐量提升数倍,核心原理在于重构请求的提交方式:从单次推理转变为批量推理。每一次独立的 API 请求,模型都需要重复加载系统指令并初始化注意力机制,这带来了不小的固定计算开销。而批处理能将多个任务合并为一次推理,让模型在同一个上下文中并行处理,从而摊薄单次任务的成本。在正式调整架构之前,建议先在 KULAAI(dl.877ai.cn) 等聚合平台上做一轮基准测试... 通过批处理将大模型 API 的吞吐量提升数倍,核心原理在于重构请求的提交方式:从单次推理转变为批量推理。每一次独立的 API 请求,模型都需要重复加载系统指令并初始化注意力机制,这带来了不小的固定计算开销。而批处理能将多个任务合并为一次推理,让模型在同一个上下文中并行处理,从而摊薄单次任务的成本。在正式调整架构之前,建议先在 KULAAI(dl.877ai.cn) 等聚合平台上做一轮基准测试...
- 要让AI模型认为你的内容是“最值得引用”的,核心逻辑在于降低模型的“信息提取成本”,并同时提高其“信任度”。当AI在海量信息中筛选答案来源时,它会优先选择那些结构最清晰、数据最具体、且具备可验证权威性的内容。具体可以通过以下三个层次来实现:1. 基础层:让内容成为可直接摘抄的“标准答案”AI搜索引擎的核心任务是整合信息,而非重新创作。因此,信息的颗粒度和结构直接决定了被引用的概率。拒绝“散文... 要让AI模型认为你的内容是“最值得引用”的,核心逻辑在于降低模型的“信息提取成本”,并同时提高其“信任度”。当AI在海量信息中筛选答案来源时,它会优先选择那些结构最清晰、数据最具体、且具备可验证权威性的内容。具体可以通过以下三个层次来实现:1. 基础层:让内容成为可直接摘抄的“标准答案”AI搜索引擎的核心任务是整合信息,而非重新创作。因此,信息的颗粒度和结构直接决定了被引用的概率。拒绝“散文...
- 上周我用三个不同的AI搜索引擎查同一个问题:“2026年AI聚合平台哪个好用”。ChatGPT引用了5个来源,其中3篇是结构化技术评测,2篇是产品文档。Claude引用了4个来源,全是FAQ结构清晰的技术文章。Gemini引用了3个来源,都有权威作者署名和数据引用。而我那篇写了三千字、在传统搜索里排名第三的深度体验文章,在三个AI的引用列表里一次都没出现。原因很简单:我的文章是“散文体”,不... 上周我用三个不同的AI搜索引擎查同一个问题:“2026年AI聚合平台哪个好用”。ChatGPT引用了5个来源,其中3篇是结构化技术评测,2篇是产品文档。Claude引用了4个来源,全是FAQ结构清晰的技术文章。Gemini引用了3个来源,都有权威作者署名和数据引用。而我那篇写了三千字、在传统搜索里排名第三的深度体验文章,在三个AI的引用列表里一次都没出现。原因很简单:我的文章是“散文体”,不...
- 在模型迁移的复杂工程中,我们时常面临一个悖论:测试越充分,上线越安心,但业务迭代速度不等人。 试图在切换前穷尽所有边缘场景,往往会让迁移陷入“测试沼泽”。既然“零风险”不可能,架构师需要引入一种更务实的策略——MVP for Reliability(面向可靠性的最小可行集合)。这不仅仅是“先上个简单版本试试”,而是通过逻辑筛选,划定出绝对不能出事的核心业务红线。在展开方法论之前,先分享一个高... 在模型迁移的复杂工程中,我们时常面临一个悖论:测试越充分,上线越安心,但业务迭代速度不等人。 试图在切换前穷尽所有边缘场景,往往会让迁移陷入“测试沼泽”。既然“零风险”不可能,架构师需要引入一种更务实的策略——MVP for Reliability(面向可靠性的最小可行集合)。这不仅仅是“先上个简单版本试试”,而是通过逻辑筛选,划定出绝对不能出事的核心业务红线。在展开方法论之前,先分享一个高...
- 你的观察非常敏锐。当 GPT-5.5 和 Claude 4.8 在核心推理和多模态能力上穷追猛赶时,Gemini 3.5 确实在押注一个看似“朴素”但工程价值极高的维度——上下文长度与处理深度。这不仅是多塞几个 Token 的问题,而是一场关于“系统架构”和“处理范式”的差异化竞争。KULAAI(dl.877ai.cn)一、为什么“上下文长度”是比参数更高级的壁垒?在模型能力趋于收敛的今天,... 你的观察非常敏锐。当 GPT-5.5 和 Claude 4.8 在核心推理和多模态能力上穷追猛赶时,Gemini 3.5 确实在押注一个看似“朴素”但工程价值极高的维度——上下文长度与处理深度。这不仅是多塞几个 Token 的问题,而是一场关于“系统架构”和“处理范式”的差异化竞争。KULAAI(dl.877ai.cn)一、为什么“上下文长度”是比参数更高级的壁垒?在模型能力趋于收敛的今天,...
- 当GPT-5.5发布时,大多数团队的关注点落在跑分提升和延迟优化上。但在生产环境中,真正影响月度账单的不是这些平均值,而是不同任务类型的成本结构分化。GPT-5.5在指令遵循和推理深度上的提升,让简单任务和复杂任务之间的Token消耗差距进一步拉大——简单对话消耗可能下降,但复杂Agent任务消耗可能显著上升。如果不做成本分层,月底账单会告诉你哪些场景成本失控了,但那时候已经晚了。本文基于华... 当GPT-5.5发布时,大多数团队的关注点落在跑分提升和延迟优化上。但在生产环境中,真正影响月度账单的不是这些平均值,而是不同任务类型的成本结构分化。GPT-5.5在指令遵循和推理深度上的提升,让简单任务和复杂任务之间的Token消耗差距进一步拉大——简单对话消耗可能下降,但复杂Agent任务消耗可能显著上升。如果不做成本分层,月底账单会告诉你哪些场景成本失控了,但那时候已经晚了。本文基于华...
- 模型迁移最危险的阶段,不是上线那一刻,而是从 PoC 到 Production 之间的灰色地带。PoC 证明了模型在理想条件下能做到多好,Production 要求模型在所有条件下都不崩。两者之间的差距,大多数团队靠“灰度放量”来弥合,但灰度本身只是一个手段,不是策略。真正的策略需要回答三个问题:什么时候可以从 PoC 进入灰度、什么时候可以从灰度进入全量、每个阶段的验证标准是什么。本文基于... 模型迁移最危险的阶段,不是上线那一刻,而是从 PoC 到 Production 之间的灰色地带。PoC 证明了模型在理想条件下能做到多好,Production 要求模型在所有条件下都不崩。两者之间的差距,大多数团队靠“灰度放量”来弥合,但灰度本身只是一个手段,不是策略。真正的策略需要回答三个问题:什么时候可以从 PoC 进入灰度、什么时候可以从灰度进入全量、每个阶段的验证标准是什么。本文基于...
- 大模型应用正在从“纯文本问答”进入“多模态知识库”时代。企业内部的合同扫描件、产品设计稿、数据报表截图——这些非结构化图片长期游离于检索系统之外,核心问题在于传统的 RAG 流程只有一条“文本通道”。图像里的表格结构、图表趋势、手写批注被硬生生拍平成了文字,信息损失无法避免。Gemini 3.5 的“原生多模态”特性改变了这一局面。它不再需要外部 OCR 插件,而是能直接“看懂”图片中的布局... 大模型应用正在从“纯文本问答”进入“多模态知识库”时代。企业内部的合同扫描件、产品设计稿、数据报表截图——这些非结构化图片长期游离于检索系统之外,核心问题在于传统的 RAG 流程只有一条“文本通道”。图像里的表格结构、图表趋势、手写批注被硬生生拍平成了文字,信息损失无法避免。Gemini 3.5 的“原生多模态”特性改变了这一局面。它不再需要外部 OCR 插件,而是能直接“看懂”图片中的布局...
- 目录一、面试最后一问:OCR抽出来的文字,和没抽一样二、本质变化:多模态RAG的瓶颈不在“识别”,而在“理解关系”三、核心机制拆解:从OCR到逻辑关系抽取的四层架构四、典型案例 / 对比:Naive RAG vs Layout-aware vs Graph-based RAG五、工程落地启示:你现在可以怎么升级评测体系六、趋势判断:关系抽取会成为多模态RAG的标配能力一、面试最后一问:OCR... 目录一、面试最后一问:OCR抽出来的文字,和没抽一样二、本质变化:多模态RAG的瓶颈不在“识别”,而在“理解关系”三、核心机制拆解:从OCR到逻辑关系抽取的四层架构四、典型案例 / 对比:Naive RAG vs Layout-aware vs Graph-based RAG五、工程落地启示:你现在可以怎么升级评测体系六、趋势判断:关系抽取会成为多模态RAG的标配能力一、面试最后一问:OCR...
- 目录一、面试最后一问:OCR抽出来的文字,和没抽一样二、本质变化:多模态RAG的瓶颈不在“识别”,而在“理解关系”三、核心机制拆解:从OCR到逻辑关系抽取的四层架构四、典型案例 / 对比:Naive RAG vs Layout-aware vs Graph-based RAG五、工程落地启示:你现在可以怎么升级评测体系六、趋势判断:关系抽取会成为多模态RAG的标配能力一、面试最后一问:OCR... 目录一、面试最后一问:OCR抽出来的文字,和没抽一样二、本质变化:多模态RAG的瓶颈不在“识别”,而在“理解关系”三、核心机制拆解:从OCR到逻辑关系抽取的四层架构四、典型案例 / 对比:Naive RAG vs Layout-aware vs Graph-based RAG五、工程落地启示:你现在可以怎么升级评测体系六、趋势判断:关系抽取会成为多模态RAG的标配能力一、面试最后一问:OCR...
- 一、Dify上传知识库1. 创建知识库并上传文档点击【知识库】---> 【创建知识库】---> 可选【导入已有文本】创建包含文本的知识库或者【创建一个空知识库】 ---> 创建空知识库后点近创建的知识库,可添加文件 ---> 同一知识库可上传多份文档步骤参考下图:创建知识库上传文档并设置文本分段与清洗:这是决定检索质量的核心环节。AI并非阅读整篇文档,而是搜索最相关的“文本片段”。 1、Di... 一、Dify上传知识库1. 创建知识库并上传文档点击【知识库】---> 【创建知识库】---> 可选【导入已有文本】创建包含文本的知识库或者【创建一个空知识库】 ---> 创建空知识库后点近创建的知识库,可添加文件 ---> 同一知识库可上传多份文档步骤参考下图:创建知识库上传文档并设置文本分段与清洗:这是决定检索质量的核心环节。AI并非阅读整篇文档,而是搜索最相关的“文本片段”。 1、Di...
上滑加载中
推荐直播
-
华为云码道 × 仓颉编程:工程化AI编码探索2026/05/27 周三 19:00-21:00
刘俊杰-华为云仓颉语言专家/李炎-华为云码道技术专家/王智鹏-OpenCangjie开源社区发起人
本场直播围绕华为云仓颉语言与华为云码道的深度结合,展示华为云智能编程从零基础到高效落地的完整生态能力。以华为云码道为引擎,仓颉语言为载体,带给大家日常提效、趣味创新到极速量产的开发体验。
回顾中
热门标签