OCR_标签_开发者_华为云

博客(214)
视频(1)
论坛(0)
云声(0)
代码示例(0)

论文解读系列九：文字识别中基于Transformer识别方法之 SRN 简介
受Transformer模型的启发，目前一些学者将该结构应用到文本行识别中，以替代RNN，取得了良好的效果，如SRN。SRN使用了Transformer unit进行特征提取，并采用该文作者提出的并行解码器，整个模型拥有更好的可并行性。

谷雨润一麦
发表于2020-10-09 11:52:39
16159 0 0

16.1k 0 0

受Transformer模型的启发，目前一些学者将该结构应用到文本行识别中，以替代RNN，取得了良好的效果，如SRN。SRN使用了Transformer unit进行特征提取，并采用该文作者提出的并行解码器，整个模型拥有更好的可并行性。
人工智能 EI企业智能 Image OCR 机器视觉
论文解读系列八：文字识别中基于Transformer识别方法之 HGA-STR 简介
受Transformer模型的启发，目前一些学者将该结构应用到文本行识别中，以替代RNN，取得了良好的效果，如HGA-STR。总体上，HGA-STR更接近原有的Transformer的结构，使用了和Transformer类似的解码结构。

谷雨润一麦
发表于2020-10-09 10:28:33
10291 0 0

10.2k 0 0

受Transformer模型的启发，目前一些学者将该结构应用到文本行识别中，以替代RNN，取得了良好的效果，如HGA-STR。总体上，HGA-STR更接近原有的Transformer的结构，使用了和Transformer类似的解码结构。
EI企业智能 OCR 机器视觉 EI智能体人工智能
技术综述五：旋转目标检测系列算法讲解（一）
在自然场景图像的目标检测中，通常使用水平四边形框作为检测框对目标的位置进行框定。但是，在遥感目标检测以及文字检测等相关场景，目标通常情况都是倾斜的。因此，使用检测算法对旋转目标进行检测有利于对遥感目标检测以及文字检测中的目标进行精确定位，为后续识别、分析等高阶任务提供更加准确的初始结果。本文将介绍三种优秀的旋转目标检测算法。

我想静静
发表于2020-09-30 10:59:25
17003 0 0

17.0k 0 0

在自然场景图像的目标检测中，通常使用水平四边形框作为检测框对目标的位置进行框定。但是，在遥感目标检测以及文字检测等相关场景，目标通常情况都是倾斜的。因此，使用检测算法对旋转目标进行检测有利于对遥感目标检测以及文字检测中的目标进行精确定位，为后续识别、分析等高阶任务提供更加准确的初始结果。本文将介绍三种优秀的旋转目标检测算法。
Image EI企业智能 OCR EI智能体
技术综述四：目标检测之RepPoints系列算法讲解
本文对anchor-free的目标检测RepPoints系列算法进行梳理，具体包含RepPoints, RepPoints V2, Dense RepPoints.

我想静静
发表于2020-09-22 16:22:38
13610 0 2

13.6k 0 2

本文对anchor-free的目标检测RepPoints系列算法进行梳理，具体包含RepPoints, RepPoints V2, Dense RepPoints.
EI企业智能 OCR EI智能体
OCR技术专题系列二：TensorRT入门实践
我们在Tensorflow、Caffe、Pytorch等训练框架上训练神经网络之后，需要对模型迁移到部署框架上进行部署。TensorRT是Nvidia开发的一个神经网络前向推理加速的C++库，用户无需像剪枝那样在训练时对模型进行定制化处理，只需把模型提供给TensorRT即可实现加速。

一笑倾城
发表于2020-09-13 14:56:14
10025 0 0

10.0k 0 0

我们在Tensorflow、Caffe、Pytorch等训练框架上训练神经网络之后，需要对模型迁移到部署框架上进行部署。TensorRT是Nvidia开发的一个神经网络前向推理加速的C++库，用户无需像剪枝那样在训练时对模型进行定制化处理，只需把模型提供给TensorRT即可实现加速。
EI智能体 OCR
论文解读系列七：信息提取论文解读
信息抽取（Information Extraction, IE）领域有两个经典的解决方案，一个是基于规则的正则表达式匹配，另一个是基于学习的BiLSTM+CRF方法。在版式较为固定的情况下，这两种方法都可以取得良好的结果。但是对于版面复杂、视觉信息丰富的文档，这两种方法都忽略了视觉等关键信息，从而使得IE准确率下降。近两年，利用文档中的视觉、上下文等信息增强IE性能逐渐受到学者的重视。

一笑倾城
发表于2020-08-06 20:32:30
11644 0 4

11.6k 0 4

信息抽取（Information Extraction, IE）领域有两个经典的解决方案，一个是基于规则的正则表达式匹配，另一个是基于学习的BiLSTM+CRF方法。在版式较为固定的情况下，这两种方法都可以取得良好的结果。但是对于版面复杂、视觉信息丰富的文档，这两种方法都忽略了视觉等关键信息，从而使得IE准确率下降。近两年，利用文档中的视觉、上下文等信息增强IE性能逐渐受到学者的重视。
EI智能体 OCR
使用华为云鲲鹏部署Tesseract 工具，教你十分钟搞定上万字的文字识别，千万不要错过！
看视频，还可参与回帖互动领好礼活动！快来参与吧：https://bbs.huaweicloud.com/forum/thread-63290-1-1.html文字识别在生活中应用的场景很多，比如常见的汽车牌照识别，实名认证中对于身份证ID的自动识别，输入法的手写识别等等。实现文字识别的途径主要有三种，一个是我们自己手写代码，二是使用开源代码，三是调用云厂商的云服务。第一种，我们自己手写代码难...

hw74991521
发表于2020-07-23 16:33:10
7197 0 0

7.1k 0 0

看视频，还可参与回帖互动领好礼活动！快来参与吧：https://bbs.huaweicloud.com/forum/thread-63290-1-1.html文字识别在生活中应用的场景很多，比如常见的汽车牌照识别，实名认证中对于身份证ID的自动识别，输入法的手写识别等等。实现文字识别的途径主要有三种，一个是我们自己手写代码，二是使用开源代码，三是调用云厂商的云服务。第一种，我们自己手写代码难...
OCR 鲲鹏
技术综述二：标注数据不足下的深度学习方法概述
得益于深度学习的发展，许多计算机视觉任务在近几年取得了不错的效果。但是，现有的深度学习算法多是有监督学习算法，依赖大量人工标记的训练数据，而标注数据十分耗费人力成本。因此，解决深度学习对数据的依赖问题和减少数据标注成本成为了业界的研究热点。本文选取了相关领域的部分论文，将介绍以下几个方向：半监督/弱监督学习；数据合成；主动学习；自监督。

我想静静
发表于2020-07-23 15:46:11
14894 0 0

14.8k 0 0

得益于深度学习的发展，许多计算机视觉任务在近几年取得了不错的效果。但是，现有的深度学习算法多是有监督学习算法，依赖大量人工标记的训练数据，而标注数据十分耗费人力成本。因此，解决深度学习对数据的依赖问题和减少数据标注成本成为了业界的研究热点。本文选取了相关领域的部分论文，将介绍以下几个方向：半监督/弱监督学习；数据合成；主动学习；自监督。
EI企业智能 OCR EI智能体
技术综述三：基于边界的目标检测方法简介
对于目标的检测和实例分割任务，边界区域往往具有重要意义，决定了目标的包围框或分割图精准程度。一些领域的学者开始对这一特性进行挖掘，如OCR领域和通用目标实例分割领域，并都取得了良好的效果。本文选取了几篇近期的工作加以介绍。

我想静静
发表于2020-07-23 14:47:26
13470 0 0

13.4k 0 0

对于目标的检测和实例分割任务，边界区域往往具有重要意义，决定了目标的包围框或分割图精准程度。一些领域的学者开始对这一特性进行挖掘，如OCR领域和通用目标实例分割领域，并都取得了良好的效果。本文选取了几篇近期的工作加以介绍。
EI企业智能 OCR EI智能体
论文解读系列六：图片文字擦除方法EnsNet: Ensconce Text in the Wild
场景图片的敏感文本擦除对用户的隐私保护有很大的作用。文字擦除方法中通常需要检测出文字笔画的像素位置，然后将这些像素替换成合理的背景元素。本次解读的文章提出了一种基于cGAN的场景文字擦除方法EnsNet。

我想静静
发表于2020-07-08 20:22:52
14339 0 3

14.3k 0 3

场景图片的敏感文本擦除对用户的隐私保护有很大的作用。文字擦除方法中通常需要检测出文字笔画的像素位置，然后将这些像素替换成合理的背景元素。本次解读的文章提出了一种基于cGAN的场景文字擦除方法EnsNet。
EI企业智能 OCR EI智能体
论文解读系列五：结合NLP的文本识别方法SEED (Semantics Enhanced Encoder-Decode)
当前主流的文本识别方法主要可分为两种，一种基于CTC的序列识别方法、另一种是基于注意力机制的序列识别方法，而当前针对文本识别的一些研究也是基于以上方法做改进，如尝试通过引入矫正网络来实现对于曲形文本序列的识别，但是这种基于矫正的改进方法无法处理模糊、部分遮挡等问题，本文尝试通过结合NLP的方法将语义信息引入基于注意力机制的序列识别方法来解决以上问题。

谷雨润一麦
发表于2020-06-04 11:13:08
14481 0 0

14.4k 0 0

当前主流的文本识别方法主要可分为两种，一种基于CTC的序列识别方法、另一种是基于注意力机制的序列识别方法，而当前针对文本识别的一些研究也是基于以上方法做改进，如尝试通过引入矫正网络来实现对于曲形文本序列的识别，但是这种基于矫正的改进方法无法处理模糊、部分遮挡等问题，本文尝试通过结合NLP的方法将语义信息引入基于注意力机制的序列识别方法来解决以上问题。
人工智能 OCR
Tesserocr 的安装
爬虫过程中难免会遇到各种各样的验证码，而大多数验证码还是图形验证码，这时候我们可以直接用 OCR 来识别。 OCR OCR，即 Optical Character Recognition，光学字符识别。是指通过扫描字符，然后通过其形状将其翻译成电子...

崔庆才丨静觅
发表于2021-10-04 23:54:39
4424 0 0

4.4k 0 0

爬虫过程中难免会遇到各种各样的验证码，而大多数验证码还是图形验证码，这时候我们可以直接用 OCR 来识别。 OCR OCR，即 Optical Character Recognition，光学字符识别。是指通过扫描字符，然后通过其形状将其翻译成电子...
OCR Python
探讨场景文本识别中的语言模型
在目前基于深度学习的语言模型结构主要包括三个类别：基于RNN的语言模型，基于CNN的语言模型和基于Transformer的语言模型。接下来我会对它们进行依次介绍，并且逐一分析他们的优缺点。1．通过RNN的语言模型结构图1 基于RNN的语言模型结构随着深度学习的发展，在受到NLP(Natural Language Processing)等任务的启发，Lee等人在视觉特征建模之后，通过引入RN...

是非得失
发表于2020-12-04 19:44:42
5080 0 0

5.0k 0 0

在目前基于深度学习的语言模型结构主要包括三个类别：基于RNN的语言模型，基于CNN的语言模型和基于Transformer的语言模型。接下来我会对它们进行依次介绍，并且逐一分析他们的优缺点。1．通过RNN的语言模型结构图1 基于RNN的语言模型结构随着深度学习的发展，在受到NLP(Natural Language Processing)等任务的启发，Lee等人在视觉特征建模之后，通过引入RN...
神经网络 OCR
二值化、形态学操作
二值化和形态学操作是图像处理中的两个基本步骤，它们在预处理阶段对提高OCR识别率特别重要。二值化二值化是将图像转换为仅包含两种颜色的图像的过程，通常是黑色和白色。二值化的目的是简化图像，使其更易于分析。以下是二值化的一些关键点：目的：将图像中的像素分为前景（通常是黑色）和背景（通常是白色），以便于后续的处理和分析。方法：全局阈值法：选择一个固定的阈值，将所有像素值高于该阈值的设置为白色，低...

i-WIFI
发表于2025-01-21 20:32:12
1326 0 0

1.3k 0 0

二值化和形态学操作是图像处理中的两个基本步骤，它们在预处理阶段对提高OCR识别率特别重要。二值化二值化是将图像转换为仅包含两种颜色的图像的过程，通常是黑色和白色。二值化的目的是简化图像，使其更易于分析。以下是二值化的一些关键点：目的：将图像中的像素分为前景（通常是黑色）和背景（通常是白色），以便于后续的处理和分析。方法：全局阈值法：选择一个固定的阈值，将所有像素值高于该阈值的设置为白色，低...
OCR
去噪对OCR识别率有何影响？
去噪对OCR（光学字符识别）识别率有显著影响，以下是去噪对OCR识别率可能产生的影响：提高识别率：去噪可以消除图像中的干扰信息，使得字符更加清晰，从而提高OCR系统的识别率。清晰的字符轮廓有助于OCR算法更准确地提取特征，进行字符分类。减少误识别：噪声可能会导致OCR系统将某些噪点误识别为字符的一部分，或者将字符的一部分误识别为噪点，去噪可以减少这类误识别。对于字符间的粘连或分离，去噪可以有...

i-WIFI
发表于2025-01-21 20:31:45
1186 0 0

1.1k 0 0

去噪对OCR（光学字符识别）识别率有显著影响，以下是去噪对OCR识别率可能产生的影响：提高识别率：去噪可以消除图像中的干扰信息，使得字符更加清晰，从而提高OCR系统的识别率。清晰的字符轮廓有助于OCR算法更准确地提取特征，进行字符分类。减少误识别：噪声可能会导致OCR系统将某些噪点误识别为字符的一部分，或者将字符的一部分误识别为噪点，去噪可以减少这类误识别。对于字符间的粘连或分离，去噪可以有...
OCR

上滑加载中

推荐直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript