- Google 2021 本文研究了文本行识别问题。与大多数针对特定领域(如场景文本或手写文档)的方法不同,本文针对通用问题研究了一个通用体系结构,该体系结构可以从任何图像中提取文本,而不管图像源或输入模式如何。本文对两种解码器(CTC和Transformer)和三个编码器模块(双向LSTM、自我注意和GRCL)进行研究并进行广泛的实验,以比较它们在广泛使用的场景和手写数据集上的准确性和性能。 Google 2021 本文研究了文本行识别问题。与大多数针对特定领域(如场景文本或手写文档)的方法不同,本文针对通用问题研究了一个通用体系结构,该体系结构可以从任何图像中提取文本,而不管图像源或输入模式如何。本文对两种解码器(CTC和Transformer)和三个编码器模块(双向LSTM、自我注意和GRCL)进行研究并进行广泛的实验,以比较它们在广泛使用的场景和手写数据集上的准确性和性能。
- ECCV2020 通过视觉匹配的方法来做文本识别,解决文档识别中的文本文本识别多样性和泛化性问题。 ECCV2020 通过视觉匹配的方法来做文本识别,解决文档识别中的文本文本识别多样性和泛化性问题。
- 本文解读了《TransFG: A Transformer Architecture for Fine-grained Recognition》,该论文针对细粒度分类任务,提出了对应的TransFG 本文解读了《TransFG: A Transformer Architecture for Fine-grained Recognition》,该论文针对细粒度分类任务,提出了对应的TransFG
- 端到端文字识别算法Mask TextSpotter系列论文分为Mask TextSpotter v1(MTS V1),Mask TextSpotter v2(MTS V2)和Mask TextSpotter v3(MTS V3),分别发表于ECCV 2018,TPAMI 2021和ECCV 2020,其中V2是V1的期刊扩展版。限于篇幅,该系列将分为“上”、“下”两篇博客连载。 端到端文字识别算法Mask TextSpotter系列论文分为Mask TextSpotter v1(MTS V1),Mask TextSpotter v2(MTS V2)和Mask TextSpotter v3(MTS V3),分别发表于ECCV 2018,TPAMI 2021和ECCV 2020,其中V2是V1的期刊扩展版。限于篇幅,该系列将分为“上”、“下”两篇博客连载。
- 自然场景文字检测与识别系列博客将从背景、相关工作、文字检测算法介绍、文字识别算法介绍、端到端文字识别算法介绍、总结与展望等多个方面,介绍自然场景文字检测与识别算法。 自然场景文字检测与识别系列博客将从背景、相关工作、文字检测算法介绍、文字识别算法介绍、端到端文字识别算法介绍、总结与展望等多个方面,介绍自然场景文字检测与识别算法。
- 本文介绍几篇基于区域重组的弯曲文本检测算法 本文介绍几篇基于区域重组的弯曲文本检测算法
- ModelArts模型评估/诊断功能针对不同类型模型的评估任务,提供相应的评估指标。在展示评估结果的同时,会根据不同的数据特征对模型进行详细的评估,获得每个数据特征对评估指标的敏感度,并给出优化建议。模型评估/诊断功能帮助用户可以全面了解模型对不同数据特征的适应性,使得模型调优可以做到有的放矢。 ModelArts模型评估/诊断功能针对不同类型模型的评估任务,提供相应的评估指标。在展示评估结果的同时,会根据不同的数据特征对模型进行详细的评估,获得每个数据特征对评估指标的敏感度,并给出优化建议。模型评估/诊断功能帮助用户可以全面了解模型对不同数据特征的适应性,使得模型调优可以做到有的放矢。
- 华为HiLens是端云协同多模态AI开发应用平台,提供给开发者的多语言类集成开发环境HiLens Studio,开发者可以在HiLens Studio 中编写和调试技能代码。HiLens Studio分为基础版和专业版,您可以根据业务所需选择订购。 华为HiLens是端云协同多模态AI开发应用平台,提供给开发者的多语言类集成开发环境HiLens Studio,开发者可以在HiLens Studio 中编写和调试技能代码。HiLens Studio分为基础版和专业版,您可以根据业务所需选择订购。
- 对于更新和删除操作频繁的表,会存在大量垃圾数据,导致磁盘空间的浪费和查询扫描时额外的IO开销,需要定期执行清理操作(vacuum)来控制行存表以及表上索引的膨胀。本文将对vacuum的原理以及影响vacuum效果的因素进行简单介绍。 对于更新和删除操作频繁的表,会存在大量垃圾数据,导致磁盘空间的浪费和查询扫描时额外的IO开销,需要定期执行清理操作(vacuum)来控制行存表以及表上索引的膨胀。本文将对vacuum的原理以及影响vacuum效果的因素进行简单介绍。
- 在通用目标检测算法,空洞卷积能有效地提升网络的感受野,进而提升算法的性能。本次解读的文章提出了一种空洞卷积变体及对应的空洞卷积搜索方法,充分探索空洞卷积的潜力,进一步提升网络模型的性能。 在通用目标检测算法,空洞卷积能有效地提升网络的感受野,进而提升算法的性能。本次解读的文章提出了一种空洞卷积变体及对应的空洞卷积搜索方法,充分探索空洞卷积的潜力,进一步提升网络模型的性能。
- 视频OCR(Video Optical Character Recognition)用于识别视频中出现的中英文字、繁简体文字、数字等内容,包括字幕、弹幕,以及部分自然场景文字、竖直文字和艺术字。通过自动分析视频中出现的文字内容,可以识别并提取违规或者关键信息。随着数字电视的不断推广和普及,对媒介管理的有效监控对于保障出品的质量和安全具有重要的作用。 视频OCR(Video Optical Character Recognition)用于识别视频中出现的中英文字、繁简体文字、数字等内容,包括字幕、弹幕,以及部分自然场景文字、竖直文字和艺术字。通过自动分析视频中出现的文字内容,可以识别并提取违规或者关键信息。随着数字电视的不断推广和普及,对媒介管理的有效监控对于保障出品的质量和安全具有重要的作用。
- 本文介绍了动态规划法的基本概念和基本特征,通过详细解析动态规划法的特征,给出判断问题是否使用动态规划法结题的思路。并根据具体问题,给出了分解问题的步骤。希望读者能了解掌握动态规划法这一基础算法。 本文介绍了动态规划法的基本概念和基本特征,通过详细解析动态规划法的特征,给出判断问题是否使用动态规划法结题的思路。并根据具体问题,给出了分解问题的步骤。希望读者能了解掌握动态规划法这一基础算法。
- 本文介绍了分治法的基本概念和基本特征,通过详细解析分治法的特征,给出判断问题是否使用分治法结题的思路。希望读者能了解掌握分治法这一基础算法。 本文介绍了分治法的基本概念和基本特征,通过详细解析分治法的特征,给出判断问题是否使用分治法结题的思路。希望读者能了解掌握分治法这一基础算法。
- 每一张信用卡都有唯一的 16 位卡号,卡号的自动识别有助于快速完成相关服务,具有重要的意义和广泛的应用前景。基于数字图像处理知识,我们实现了一种信用卡卡号自动检测方法,实现自动定位信用卡图像中卡号信息区域,进而完成单个数字的切分。 每一张信用卡都有唯一的 16 位卡号,卡号的自动识别有助于快速完成相关服务,具有重要的意义和广泛的应用前景。基于数字图像处理知识,我们实现了一种信用卡卡号自动检测方法,实现自动定位信用卡图像中卡号信息区域,进而完成单个数字的切分。
- 用过linux的都知道,echo和cat是我们常用的展示内容和写入内容的方式。 最近在使用这两个最简单的命令时,遇到了特殊字符写入失败问题。 这里重新学习一下echo和cat两个命令,记录一下。 用过linux的都知道,echo和cat是我们常用的展示内容和写入内容的方式。 最近在使用这两个最简单的命令时,遇到了特殊字符写入失败问题。 这里重新学习一下echo和cat两个命令,记录一下。
上滑加载中
推荐直播
-
华为云IoT开源专家实践分享:开源让物联网平台更开放、易用
2024/05/22 周三 16:30-18:00
张俭 华为云IoT DTSE技术布道师
开源,意味着开放、共享、互助、共赢。作为万物上云及各行业数字化的物联网底座,华为云IoT积极拥抱开源,借助行业开源的最佳实践,构建可靠、易用的物联网平台,并通过开放南北向SDK,助力开发者快速构建物联网应用。本期直播,华为云IoT开源专家、物联网平台资深“程序猿”张俭,带你了解华为云IoT的开源生态,并手把手教你玩转开源社区!
去报名 -
华为云开发者日·广州站
2024/05/23 周四 14:30-17:30
华为云专家团
华为云开发者日HDC.Cloud Day是面向全球开发者的旗舰活动,汇聚来自千行百业、高校及科研院所的开发人员。致力于打造开发者专属的技术盛宴,全方位服务与赋能开发者围绕华为云生态“知、学、用、创、商”的成长路径。通过前沿的技术分享、场景化的动手体验、优秀的应用创新推介,为开发者提供沉浸式学习与交流平台。开放创新,与开发者共创、共享、共赢未来。
去报名
热门标签