- 语音转写文字ASR技术的基本概念与数学原理简介。 语音转写文字ASR技术的基本概念与数学原理简介。
- 本文的内容是平安在 ICDAR 2021表格识别比赛中的解决方案。在此解决方案中把表格识别分成了四个部分:表格结构序列识别、文字检测、文字识别、单元格和文字框对齐。其中表格结构序列识别用到的模型是基于Master修改的,文字检测模型用到的是PSENet,文字识别用到的是Master模型。最终结果取得了此赛道的亚军。 本文的内容是平安在 ICDAR 2021表格识别比赛中的解决方案。在此解决方案中把表格识别分成了四个部分:表格结构序列识别、文字检测、文字识别、单元格和文字框对齐。其中表格结构序列识别用到的模型是基于Master修改的,文字检测模型用到的是PSENet,文字识别用到的是Master模型。最终结果取得了此赛道的亚军。
- Google 2021 本文研究了文本行识别问题。与大多数针对特定领域(如场景文本或手写文档)的方法不同,本文针对通用问题研究了一个通用体系结构,该体系结构可以从任何图像中提取文本,而不管图像源或输入模式如何。本文对两种解码器(CTC和Transformer)和三个编码器模块(双向LSTM、自我注意和GRCL)进行研究并进行广泛的实验,以比较它们在广泛使用的场景和手写数据集上的准确性和性能。 Google 2021 本文研究了文本行识别问题。与大多数针对特定领域(如场景文本或手写文档)的方法不同,本文针对通用问题研究了一个通用体系结构,该体系结构可以从任何图像中提取文本,而不管图像源或输入模式如何。本文对两种解码器(CTC和Transformer)和三个编码器模块(双向LSTM、自我注意和GRCL)进行研究并进行广泛的实验,以比较它们在广泛使用的场景和手写数据集上的准确性和性能。
- ECCV2020 通过视觉匹配的方法来做文本识别,解决文档识别中的文本文本识别多样性和泛化性问题。 ECCV2020 通过视觉匹配的方法来做文本识别,解决文档识别中的文本文本识别多样性和泛化性问题。
- 本文解读了《TransFG: A Transformer Architecture for Fine-grained Recognition》,该论文针对细粒度分类任务,提出了对应的TransFG 本文解读了《TransFG: A Transformer Architecture for Fine-grained Recognition》,该论文针对细粒度分类任务,提出了对应的TransFG
- 华为HiLens是端云协同多模态AI开发应用平台,提供给开发者的多语言类集成开发环境HiLens Studio,开发者可以在HiLens Studio 中编写和调试技能代码。HiLens Studio分为基础版和专业版,您可以根据业务所需选择订购。 华为HiLens是端云协同多模态AI开发应用平台,提供给开发者的多语言类集成开发环境HiLens Studio,开发者可以在HiLens Studio 中编写和调试技能代码。HiLens Studio分为基础版和专业版,您可以根据业务所需选择订购。
- 对于更新和删除操作频繁的表,会存在大量垃圾数据,导致磁盘空间的浪费和查询扫描时额外的IO开销,需要定期执行清理操作(vacuum)来控制行存表以及表上索引的膨胀。本文将对vacuum的原理以及影响vacuum效果的因素进行简单介绍。 对于更新和删除操作频繁的表,会存在大量垃圾数据,导致磁盘空间的浪费和查询扫描时额外的IO开销,需要定期执行清理操作(vacuum)来控制行存表以及表上索引的膨胀。本文将对vacuum的原理以及影响vacuum效果的因素进行简单介绍。
- 在通用目标检测算法,空洞卷积能有效地提升网络的感受野,进而提升算法的性能。本次解读的文章提出了一种空洞卷积变体及对应的空洞卷积搜索方法,充分探索空洞卷积的潜力,进一步提升网络模型的性能。 在通用目标检测算法,空洞卷积能有效地提升网络的感受野,进而提升算法的性能。本次解读的文章提出了一种空洞卷积变体及对应的空洞卷积搜索方法,充分探索空洞卷积的潜力,进一步提升网络模型的性能。
- 视频OCR(Video Optical Character Recognition)用于识别视频中出现的中英文字、繁简体文字、数字等内容,包括字幕、弹幕,以及部分自然场景文字、竖直文字和艺术字。通过自动分析视频中出现的文字内容,可以识别并提取违规或者关键信息。随着数字电视的不断推广和普及,对媒介管理的有效监控对于保障出品的质量和安全具有重要的作用。 视频OCR(Video Optical Character Recognition)用于识别视频中出现的中英文字、繁简体文字、数字等内容,包括字幕、弹幕,以及部分自然场景文字、竖直文字和艺术字。通过自动分析视频中出现的文字内容,可以识别并提取违规或者关键信息。随着数字电视的不断推广和普及,对媒介管理的有效监控对于保障出品的质量和安全具有重要的作用。
- 本文介绍了动态规划法的基本概念和基本特征,通过详细解析动态规划法的特征,给出判断问题是否使用动态规划法结题的思路。并根据具体问题,给出了分解问题的步骤。希望读者能了解掌握动态规划法这一基础算法。 本文介绍了动态规划法的基本概念和基本特征,通过详细解析动态规划法的特征,给出判断问题是否使用动态规划法结题的思路。并根据具体问题,给出了分解问题的步骤。希望读者能了解掌握动态规划法这一基础算法。
- 本文介绍了分治法的基本概念和基本特征,通过详细解析分治法的特征,给出判断问题是否使用分治法结题的思路。希望读者能了解掌握分治法这一基础算法。 本文介绍了分治法的基本概念和基本特征,通过详细解析分治法的特征,给出判断问题是否使用分治法结题的思路。希望读者能了解掌握分治法这一基础算法。
- 每一张信用卡都有唯一的 16 位卡号,卡号的自动识别有助于快速完成相关服务,具有重要的意义和广泛的应用前景。基于数字图像处理知识,我们实现了一种信用卡卡号自动检测方法,实现自动定位信用卡图像中卡号信息区域,进而完成单个数字的切分。 每一张信用卡都有唯一的 16 位卡号,卡号的自动识别有助于快速完成相关服务,具有重要的意义和广泛的应用前景。基于数字图像处理知识,我们实现了一种信用卡卡号自动检测方法,实现自动定位信用卡图像中卡号信息区域,进而完成单个数字的切分。
- 用过linux的都知道,echo和cat是我们常用的展示内容和写入内容的方式。 最近在使用这两个最简单的命令时,遇到了特殊字符写入失败问题。 这里重新学习一下echo和cat两个命令,记录一下。 用过linux的都知道,echo和cat是我们常用的展示内容和写入内容的方式。 最近在使用这两个最简单的命令时,遇到了特殊字符写入失败问题。 这里重新学习一下echo和cat两个命令,记录一下。
- 调研常用轻量化模型,取各家所长,促进对轻量化模型设计、部署及使用的理解。 调研常用轻量化模型,取各家所长,促进对轻量化模型设计、部署及使用的理解。
- RPA在各行业中得到广泛应用,热度大增。这匹“技术黑马”已然成为构建业务流程自动化的重要引擎之一,助力企业组织向“智能自动化转型。 RPA在各行业中得到广泛应用,热度大增。这匹“技术黑马”已然成为构建业务流程自动化的重要引擎之一,助力企业组织向“智能自动化转型。
上滑加载中
推荐直播
-
Skill 构建 × 智能创作:基于华为云码道的 AI 内容生产提效方案2026/03/25 周三 19:00-20:00
余伟,华为云软件研发工程师/万邵业(万少),华为云HCDE开发者专家
本次直播带来两大实战:华为云码道 Skill-Creator 手把手搭建专属知识库 Skill;如何用码道提效 OpenClaw 小说文本,打造从大纲到成稿的 AI 原创小说全链路。技术干货 + OPC创作思路,一次讲透!
回顾中 -
码道新技能,AI 新生产力——从自动视频生成到开源项目解析2026/04/08 周三 19:00-21:00
童得力-华为云开发者生态运营总监/何文强-无人机企业AI提效负责人
本次华为云码道 Skill 实战活动,聚焦两大 AI 开发场景:通过实战教学,带你打造 AI 编程自动生成视频 Skill,并实现对 GitHub 热门开源项目的智能知识抽取,手把手掌握 Skill 开发全流程,用 AI 提升研发效率与内容生产力。
回顾中 -
华为云码道:零代码股票智能决策平台全功能实战2026/04/18 周六 10:00-12:00
秦拳德-中软国际教育卓越研究院研究员、华为云金牌讲师、云原生技术专家
利用Tushare接口获取实时行情数据,采用Transformer算法进行时序预测与涨跌分析,并集成DeepSeek API提供智能解读。同时,项目深度结合华为云CodeArts(码道)的代码智能体能力,实现代码一键推送至云端代码仓库,建立起高效、可协作的团队开发新范式。开发者可快速上手,从零打造功能完整的个股筛选、智能分析与风险管控产品。
回顾中
热门标签