- 本文提出了一种针对文字识别的半监督方法。区别于常见的半监督方法,本文的针对文字识别这类序列识别问题做出了特定的设计。具体来说,本文首先采用了teacher-student的网络结构,然后采用字符级别的一致性约束对teacher和student网络的预测进行对齐。此外,考虑到文字识别是step-by-step,每一个字符的预测都和之前时刻的预测结果相关。 本文提出了一种针对文字识别的半监督方法。区别于常见的半监督方法,本文的针对文字识别这类序列识别问题做出了特定的设计。具体来说,本文首先采用了teacher-student的网络结构,然后采用字符级别的一致性约束对teacher和student网络的预测进行对齐。此外,考虑到文字识别是step-by-step,每一个字符的预测都和之前时刻的预测结果相关。
- 本文提出了一种针对文字识别的多模态半监督方法,具体来说,作者首先使用teacher-student网络进行半监督学习,然后在视觉、语义以及视觉和语义的融合特征上,都进行了一致性约束。 本文提出了一种针对文字识别的多模态半监督方法,具体来说,作者首先使用teacher-student网络进行半监督学习,然后在视觉、语义以及视觉和语义的融合特征上,都进行了一致性约束。
- 基于文字识别服务OCR和弹性云服务器ECS开发并部署增值税发票验真web应用测试下 基于文字识别服务OCR和弹性云服务器ECS开发并部署增值税发票验真web应用测试下
- 这是水表读数识别项目,实现了如何端到端完成水表读数识别项目。涉及领域包括图像分类、语义分割、OCR文本检测、OCR文本识别。 这是水表读数识别项目,实现了如何端到端完成水表读数识别项目。涉及领域包括图像分类、语义分割、OCR文本检测、OCR文本识别。
- ⛳️ 自如 实战场景我们又碰到了一个字体反爬的站点,自如。该站点的字体反爬不是用字体文件实现的,而是基于图片+CSS,具体如下图所示。这里运用 CSS 背景偏移技术实现数字的展示。字体图片如下所示。图片宽度和高度的比例是 300*28,其中 300 像素被等比例放置了 10 个数字,即每 30 个像素一个数字,实测间隔是 21.4 个像素。后续可以参考该值做区分。下面还需要确定一下每次刷新... ⛳️ 自如 实战场景我们又碰到了一个字体反爬的站点,自如。该站点的字体反爬不是用字体文件实现的,而是基于图片+CSS,具体如下图所示。这里运用 CSS 背景偏移技术实现数字的展示。字体图片如下所示。图片宽度和高度的比例是 300*28,其中 300 像素被等比例放置了 10 个数字,即每 30 个像素一个数字,实测间隔是 21.4 个像素。后续可以参考该值做区分。下面还需要确定一下每次刷新...
- 本文主要介绍了华为云文字识别服务的相关概念和使用实操,想使用华为云OCR服务的小伙伴可以执行实操流程步骤来实现自己业务场景。 本文主要介绍了华为云文字识别服务的相关概念和使用实操,想使用华为云OCR服务的小伙伴可以执行实操流程步骤来实现自己业务场景。
- Python 验证码是什么如果你是一个数据挖掘爱好者,那么验证码是你避免不过去的一个天坑,和各种验证码斗争,必然是你成长的一条道路,本篇文章为你带来验证码的入门案例,来吧,一起 Coding 吧。 怎么用 数字+字母的验证码我随便在百度图片搜索了一个验证码,如下今天要做的是验证码识别中最简单的一种办法,采用pytesseract解决,它属于 Python 当中比较简单的OCR识别库 库的安... Python 验证码是什么如果你是一个数据挖掘爱好者,那么验证码是你避免不过去的一个天坑,和各种验证码斗争,必然是你成长的一条道路,本篇文章为你带来验证码的入门案例,来吧,一起 Coding 吧。 怎么用 数字+字母的验证码我随便在百度图片搜索了一个验证码,如下今天要做的是验证码识别中最简单的一种办法,采用pytesseract解决,它属于 Python 当中比较简单的OCR识别库 库的安...
- DevStar是基于模板快速开发云应用的开发平台,提供丰富的应用模板和一站式创建代码仓、生成框架代码、集成中间件以及建立DevOps流水线等能力,让开发无须从零开始,效率得以大幅提高。 DevStar是基于模板快速开发云应用的开发平台,提供丰富的应用模板和一站式创建代码仓、生成框架代码、集成中间件以及建立DevOps流水线等能力,让开发无须从零开始,效率得以大幅提高。
- 2021AIWIN 手写体 OCR 识别竞赛总结(任务一)参加了“世界人工智能创新大赛”——手写体 OCR 识别竞赛(任务一),取得了Top1的成绩。下面通过这篇文章来介绍我们队伍的方案。队伍随机组的,有人找我我就加了进来,这是我第一次做OCR相关的项目,所以随意起了个名字。 赛题一、赛题考官交通银行二、赛题背景银行日常业务中涉及到各类凭证的识别录入,例如身份证录入、支票录入、对账单录入等... 2021AIWIN 手写体 OCR 识别竞赛总结(任务一)参加了“世界人工智能创新大赛”——手写体 OCR 识别竞赛(任务一),取得了Top1的成绩。下面通过这篇文章来介绍我们队伍的方案。队伍随机组的,有人找我我就加了进来,这是我第一次做OCR相关的项目,所以随意起了个名字。 赛题一、赛题考官交通银行二、赛题背景银行日常业务中涉及到各类凭证的识别录入,例如身份证录入、支票录入、对账单录入等...
- 我们将学习深度学习中的OCR(Optical Character Recognition)光学字符识别技术。OCR作为计算机视觉中较早使用深度学习技术的领域,有很多优秀的模型出现,所以通过此案例我们来学习深度学习下的OCR技术。普遍的深度学习下的OCR技术将文字识别过程分为:文本区域检测以及字符识别。本案例中介绍的模型CRNN就是一种字符识别模型,它将文字图片中的文字识别出来。 我们将学习深度学习中的OCR(Optical Character Recognition)光学字符识别技术。OCR作为计算机视觉中较早使用深度学习技术的领域,有很多优秀的模型出现,所以通过此案例我们来学习深度学习下的OCR技术。普遍的深度学习下的OCR技术将文字识别过程分为:文本区域检测以及字符识别。本案例中介绍的模型CRNN就是一种字符识别模型,它将文字图片中的文字识别出来。
- 本文的内容是平安在 ICDAR 2021表格识别比赛中的解决方案。在此解决方案中把表格识别分成了四个部分:表格结构序列识别、文字检测、文字识别、单元格和文字框对齐。其中表格结构序列识别用到的模型是基于Master修改的,文字检测模型用到的是PSENet,文字识别用到的是Master模型。最终结果取得了此赛道的亚军。 本文的内容是平安在 ICDAR 2021表格识别比赛中的解决方案。在此解决方案中把表格识别分成了四个部分:表格结构序列识别、文字检测、文字识别、单元格和文字框对齐。其中表格结构序列识别用到的模型是基于Master修改的,文字检测模型用到的是PSENet,文字识别用到的是Master模型。最终结果取得了此赛道的亚军。
- Google 2021 本文研究了文本行识别问题。与大多数针对特定领域(如场景文本或手写文档)的方法不同,本文针对通用问题研究了一个通用体系结构,该体系结构可以从任何图像中提取文本,而不管图像源或输入模式如何。本文对两种解码器(CTC和Transformer)和三个编码器模块(双向LSTM、自我注意和GRCL)进行研究并进行广泛的实验,以比较它们在广泛使用的场景和手写数据集上的准确性和性能。 Google 2021 本文研究了文本行识别问题。与大多数针对特定领域(如场景文本或手写文档)的方法不同,本文针对通用问题研究了一个通用体系结构,该体系结构可以从任何图像中提取文本,而不管图像源或输入模式如何。本文对两种解码器(CTC和Transformer)和三个编码器模块(双向LSTM、自我注意和GRCL)进行研究并进行广泛的实验,以比较它们在广泛使用的场景和手写数据集上的准确性和性能。
- ECCV2020 通过视觉匹配的方法来做文本识别,解决文档识别中的文本文本识别多样性和泛化性问题。 ECCV2020 通过视觉匹配的方法来做文本识别,解决文档识别中的文本文本识别多样性和泛化性问题。
- 本文解读了《TransFG: A Transformer Architecture for Fine-grained Recognition》,该论文针对细粒度分类任务,提出了对应的TransFG 本文解读了《TransFG: A Transformer Architecture for Fine-grained Recognition》,该论文针对细粒度分类任务,提出了对应的TransFG
- 今天和大家一起学习文字识别中的语言模型。这是2018年发表在ACMMM的一篇论文,名为《Attention and Language Ensemble for Scene Text Recognition with Convolutional Sequence Modeling》。本文将会根据三个部分进行解读,分别是研究背景、算法模型的剖析、代码复现。 一、研究背景1.什么是场景文本识别场景... 今天和大家一起学习文字识别中的语言模型。这是2018年发表在ACMMM的一篇论文,名为《Attention and Language Ensemble for Scene Text Recognition with Convolutional Sequence Modeling》。本文将会根据三个部分进行解读,分别是研究背景、算法模型的剖析、代码复现。 一、研究背景1.什么是场景文本识别场景...
上滑加载中
推荐直播
-
Ascend C算子编程之旅:基础入门篇
2024/11/22 周五 16:00-17:30
莫老师 昇腾CANN专家
介绍Ascend C算子基本概念、异构计算架构CANN和Ascend C基本概述,以及Ascend C快速入门,夯实Ascend C算子编程基础
回顾中 -
深入解析:华为全栈AI解决方案与云智能开放能力
2024/11/22 周五 18:20-20:20
Alex 华为云学堂技术讲师
本期直播我们将重点为大家介绍华为全栈全场景AI解决方案以和华为云企业智能AI开放能力。旨在帮助开发者深入理解华为AI解决方案,并能够更加熟练地运用这些技术。通过洞悉华为解决方案,了解人工智能完整生态链条的构造。
回顾中 -
华为云DataArts+DWS助力企业数据治理一站式解决方案及应用实践
2024/11/27 周三 16:30-18:00
Walter.chi 华为云数据治理DTSE技术布道师
想知道数据治理项目中,数据主题域如何合理划分?数据标准及主数据标准如何制定?数仓分层模型如何合理规划?华为云DataArts+DWS助力企业数据治理项目一站式解决方案和应用实践告诉您答案!本期将从数据趋势、数据治理方案、数据治理规划及落地,案例分享四个方面来助力企业数据治理项目合理咨询规划及顺利实施。
去报名
热门标签