OCR_标签_开发者_华为云

博客(235)
视频(1)
论坛(0)
云声(0)
代码示例(0)

场景文本理解预训练PreSTU
在视觉与语言（V&L）模型中，阅读和推理图像中的文本的能力往往是缺乏的。我们如何才能学习出强大的场景文本理解（STU）的V&L模型呢？本文提出了PreSTU，一个专门为场景文本理解而设计的简单预训练模型。PreSTU将一个简单的OCR感知预训练目标与一个具有现成OCR信号的大规模图像-文本数据集相结合。

Hint
发表于2022-11-03 17:40:14
8152 0 1

8.1k 0 1

在视觉与语言（V&L）模型中，阅读和推理图像中的文本的能力往往是缺乏的。我们如何才能学习出强大的场景文本理解（STU）的V&L模型呢？本文提出了PreSTU，一个专门为场景文本理解而设计的简单预训练模型。PreSTU将一个简单的OCR感知预训练目标与一个具有现成OCR信号的大规模图像-文本数据集相结合。
OCR 机器学习深度学习
[CVPR 2022] 不使用人工标注提升文字识别器性能
本文提出了一种针对文字识别的半监督方法。区别于常见的半监督方法，本文的针对文字识别这类序列识别问题做出了特定的设计。具体来说，本文首先采用了teacher-student的网络结构，然后采用字符级别的一致性约束对teacher和student网络的预测进行对齐。此外，考虑到文字识别是step-by-step，每一个字符的预测都和之前时刻的预测结果相关。

Hint
发表于2022-11-03 17:36:58
10729 0 0

10.7k 0 0

本文提出了一种针对文字识别的半监督方法。区别于常见的半监督方法，本文的针对文字识别这类序列识别问题做出了特定的设计。具体来说，本文首先采用了teacher-student的网络结构，然后采用字符级别的一致性约束对teacher和student网络的预测进行对齐。此外，考虑到文字识别是step-by-step，每一个字符的预测都和之前时刻的预测结果相关。
人工智能 OCR 机器学习
一种针对文字识别的多模态半监督方法
本文提出了一种针对文字识别的多模态半监督方法，具体来说，作者首先使用teacher-student网络进行半监督学习，然后在视觉、语义以及视觉和语义的融合特征上，都进行了一致性约束。

Hint
发表于2022-11-03 17:32:36
10947 0 0

10.9k 0 0

本文提出了一种针对文字识别的多模态半监督方法，具体来说，作者首先使用teacher-student网络进行半监督学习，然后在视觉、语义以及视觉和语义的融合特征上，都进行了一致性约束。
OCR 机器学习
用OCR完成发票验真综合应用开发【玩转华为云】
基于文字识别服务OCR和弹性云服务器ECS开发并部署增值税发票验真web应用测试下

龙哥手记
发表于2022-09-16 18:35:36
5962 0 0

5.9k 0 0

基于文字识别服务OCR和弹性云服务器ECS开发并部署增值税发票验真web应用测试下
人工智能 OCR 云端实践图像处理神经网络
基于华为云ModelArts的水表读数识别开发实践【华为云至简致远】
这是水表读数识别项目，实现了如何端到端完成水表读数识别项目。涉及领域包括图像分类、语义分割、OCR文本检测、OCR文本识别。

Tianyi_Li
发表于2022-06-07 21:50:11
6541 0 0

6.5k 0 0

这是水表读数识别项目，实现了如何端到端完成水表读数识别项目。涉及领域包括图像分类、语义分割、OCR文本检测、OCR文本识别。
人工智能 AI开发平台ModelArts OCR pytorch 云端实践
听说学Python字体反爬的人，都打开过这篇博客，自如字体反爬，图片字体反爬 R26
⛳️ 自如实战场景我们又碰到了一个字体反爬的站点，自如。该站点的字体反爬不是用字体文件实现的，而是基于图片+CSS，具体如下图所示。这里运用 CSS 背景偏移技术实现数字的展示。字体图片如下所示。图片宽度和高度的比例是 300*28，其中 300 像素被等比例放置了 10 个数字，即每 30 个像素一个数字，实测间隔是 21.4 个像素。后续可以参考该值做区分。下面还需要确定一下每次刷新...

梦想橡皮擦
发表于2022-05-30 14:17:09
6028 0 1

6.0k 0 1

⛳️ 自如实战场景我们又碰到了一个字体反爬的站点，自如。该站点的字体反爬不是用字体文件实现的，而是基于图片+CSS，具体如下图所示。这里运用 CSS 背景偏移技术实现数字的展示。字体图片如下所示。图片宽度和高度的比例是 300*28，其中 300 像素被等比例放置了 10 个数字，即每 30 个像素一个数字，实测间隔是 21.4 个像素。后续可以参考该值做区分。下面还需要确定一下每次刷新...
OCR Python
【云驻共创】华为云文字识别服务的体验之旅
本文主要介绍了华为云文字识别服务的相关概念和使用实操，想使用华为云OCR服务的小伙伴可以执行实操流程步骤来实现自己业务场景。

愚公搬代码
发表于2022-05-23 22:00:45
14366 0 0

14.3k 0 0

本文主要介绍了华为云文字识别服务的相关概念和使用实操，想使用华为云OCR服务的小伙伴可以执行实操流程步骤来实现自己业务场景。
OCR 上云必读云端实践机器学习深度学习
【Python技能树共建】验证码实操2案例 r21
Python 验证码是什么如果你是一个数据挖掘爱好者，那么验证码是你避免不过去的一个天坑，和各种验证码斗争，必然是你成长的一条道路，本篇文章为你带来验证码的入门案例，来吧，一起 Coding 吧。怎么用数字+字母的验证码我随便在百度图片搜索了一个验证码，如下今天要做的是验证码识别中最简单的一种办法，采用pytesseract解决，它属于 Python 当中比较简单的OCR识别库库的安...

梦想橡皮擦
发表于2022-05-23 17:46:01
7767 0 0

7.7k 0 0

Python 验证码是什么如果你是一个数据挖掘爱好者，那么验证码是你避免不过去的一个天坑，和各种验证码斗争，必然是你成长的一条道路，本篇文章为你带来验证码的入门案例，来吧，一起 Coding 吧。怎么用数字+字母的验证码我随便在百度图片搜索了一个验证码，如下今天要做的是验证码识别中最简单的一种办法，采用pytesseract解决，它属于 Python 当中比较简单的OCR识别库库的安...
OCR Python
基于DevStar模板开发增值税发票文字识别应用 | 【玩转华为云】
DevStar是基于模板快速开发云应用的开发平台，提供丰富的应用模板和一站式创建代码仓、生成框架代码、集成中间件以及建立DevOps流水线等能力，让开发无须从零开始，效率得以大幅提高。

星恒
发表于2022-04-27 11:39:15
9988 0 0

9.9k 0 0

DevStar是基于模板快速开发云应用的开发平台，提供丰富的应用模板和一站式创建代码仓、生成框架代码、集成中间件以及建立DevOps流水线等能力，让开发无须从零开始，效率得以大幅提高。
OCR 云硬盘 EVS 云端实践
2021AIWIN 手写体 OCR 识别竞赛总结（任务一）
2021AIWIN 手写体 OCR 识别竞赛总结（任务一）参加了“世界人工智能创新大赛”——手写体 OCR 识别竞赛（任务一），取得了Top1的成绩。下面通过这篇文章来介绍我们队伍的方案。队伍随机组的，有人找我我就加了进来，这是我第一次做OCR相关的项目，所以随意起了个名字。赛题一、赛题考官交通银行二、赛题背景银行日常业务中涉及到各类凭证的识别录入，例如身份证录入、支票录入、对账单录入等...

AI浩
发表于2022-01-19 06:24:42
5897 0 0

5.8k 0 0

2021AIWIN 手写体 OCR 识别竞赛总结（任务一）参加了“世界人工智能创新大赛”——手写体 OCR 识别竞赛（任务一），取得了Top1的成绩。下面通过这篇文章来介绍我们队伍的方案。队伍随机组的，有人找我我就加了进来，这是我第一次做OCR相关的项目，所以随意起了个名字。赛题一、赛题考官交通银行二、赛题背景银行日常业务中涉及到各类凭证的识别录入，例如身份证录入、支票录入、对账单录入等...
OCR 机器学习
【云驻共创】华为云AI实战营：OCR
我们将学习深度学习中的OCR（Optical Character Recognition）光学字符识别技术。OCR作为计算机视觉中较早使用深度学习技术的领域，有很多优秀的模型出现，所以通过此案例我们来学习深度学习下的OCR技术。普遍的深度学习下的OCR技术将文字识别过程分为：文本区域检测以及字符识别。本案例中介绍的模型CRNN就是一种字符识别模型，它将文字图片中的文字识别出来。

Mr红凯
发表于2021-11-28 21:00:32
10643 0 0

10.6k 0 0

我们将学习深度学习中的OCR（Optical Character Recognition）光学字符识别技术。OCR作为计算机视觉中较早使用深度学习技术的领域，有很多优秀的模型出现，所以通过此案例我们来学习深度学习下的OCR技术。普遍的深度学习下的OCR技术将文字识别过程分为：文本区域检测以及字符识别。本案例中介绍的模型CRNN就是一种字符识别模型，它将文字图片中的文字识别出来。
人工智能 OCR 深度学习云学院
论文解读二十八：表格识别模型TableMaster
本文的内容是平安在 ICDAR 2021表格识别比赛中的解决方案。在此解决方案中把表格识别分成了四个部分：表格结构序列识别、文字检测、文字识别、单元格和文字框对齐。其中表格结构序列识别用到的模型是基于Master修改的，文字检测模型用到的是PSENet，文字识别用到的是Master模型。最终结果取得了此赛道的亚军。

cver
发表于2021-10-22 15:58:33
18703 0 2

18.7k 0 2

本文的内容是平安在 ICDAR 2021表格识别比赛中的解决方案。在此解决方案中把表格识别分成了四个部分：表格结构序列识别、文字检测、文字识别、单元格和文字框对齐。其中表格结构序列识别用到的模型是基于Master修改的，文字检测模型用到的是PSENet，文字识别用到的是Master模型。最终结果取得了此赛道的亚军。
EI企业智能 EI智能体 OCR 机器学习
论文解读二十七：文本行识别模型的再思考
Google 2021 本文研究了文本行识别问题。与大多数针对特定领域（如场景文本或手写文档）的方法不同，本文针对通用问题研究了一个通用体系结构，该体系结构可以从任何图像中提取文本，而不管图像源或输入模式如何。本文对两种解码器（CTC和Transformer）和三个编码器模块（双向LSTM、自我注意和GRCL）进行研究并进行广泛的实验，以比较它们在广泛使用的场景和手写数据集上的准确性和性能。

wooheng
发表于2021-10-07 13:16:45
14418 0 0

14.4k 0 0

Google 2021 本文研究了文本行识别问题。与大多数针对特定领域（如场景文本或手写文档）的方法不同，本文针对通用问题研究了一个通用体系结构，该体系结构可以从任何图像中提取文本，而不管图像源或输入模式如何。本文对两种解码器（CTC和Transformer）和三个编码器模块（双向LSTM、自我注意和GRCL）进行研究并进行广泛的实验，以比较它们在广泛使用的场景和手写数据集上的准确性和性能。
EI企业智能 EI智能体 Image OCR
论文解读二十六：基于视觉匹配的自适应文本识别
ECCV2020 通过视觉匹配的方法来做文本识别，解决文档识别中的文本文本识别多样性和泛化性问题。

wooheng
发表于2021-09-24 09:38:26
12392 0 0

12.3k 0 0

ECCV2020 通过视觉匹配的方法来做文本识别，解决文档识别中的文本文本识别多样性和泛化性问题。
EI企业智能 EI智能体 Image OCR
论文解读系列二十：用于细粒度分类的Transformer结构—TransFG
本文解读了《TransFG: A Transformer Architecture for Fine-grained Recognition》，该论文针对细粒度分类任务，提出了对应的TransFG

BigDragon
发表于2021-09-08 15:04:04
22352 0 1

22.3k 0 1

本文解读了《TransFG: A Transformer Architecture for Fine-grained Recognition》，该论文针对细粒度分类任务，提出了对应的TransFG
EI企业智能 EI智能体 Image OCR

上滑加载中

推荐直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript