OCR_标签_开发者_华为云

博客(235)
视频(1)
论坛(0)
云声(0)
代码示例(0)

论文解读系列十二：SDMG-R结构化提取—无限版式小票场景应用
在文档图像中提取关键信息在自动化办公应用中至关重要。传统基于模板匹配或者规则的方法，在通用性方面、未见过版式模板数据方面，效果都不好；为此，本文提出了一种端到端的空间多模态图推理模型（SDMG-R），能有效的从未见过的模板数据中提取关键信息，并且通用性更好。

一笑倾城
发表于2021-06-07 17:28:22
16154 0 1

16.1k 0 1

在文档图像中提取关键信息在自动化办公应用中至关重要。传统基于模板匹配或者规则的方法，在通用性方面、未见过版式模板数据方面，效果都不好；为此，本文提出了一种端到端的空间多模态图推理模型（SDMG-R），能有效的从未见过的模板数据中提取关键信息，并且通用性更好。
EI智能体 OCR 机器学习
论文解读系列十一：图神经网络应用于半结构化文档的命名实体识别和关系提取
随着用于传递和记录业务信息的管理文档的广泛使用，能够鲁棒且高效地从这些文档中自动提取和理解内容的方法成为一个迫切的需求。本次解读的文章提出利用图神经网络来解决半结构化文档中的实体识别（NER）和关系提取问题。

小菜鸟chg
发表于2021-06-01 19:19:47
14195 0 0

14.1k 0 0

随着用于传递和记录业务信息的管理文档的广泛使用，能够鲁棒且高效地从这些文档中自动提取和理解内容的方法成为一个迫切的需求。本次解读的文章提出利用图神经网络来解决半结构化文档中的实体识别（NER）和关系提取问题。
EI企业智能 OCR
技术综述十二：图网络的基本概念
从与卷积网络的比较中，理解图卷积网络

一笑倾城
发表于2021-06-01 14:56:12
11694 0 2

11.6k 0 2

从与卷积网络的比较中，理解图卷积网络
EI智能体 OCR
OCR性能优化系列（二）：从神经网络到橡皮泥
1. 深扒CNN：也谈机器学习的本质现在，从OCR性能优化系列（一）中的图1左下角的输入开始，串一遍图一的流程。首先是输入27张待识别的文字片段图片，每张图片的大小为32*132。这些图片会经过一个CNN网络进行编码，输出32个27*384的初步编码矩阵。如下图所示：值得注意的是，在这步操作中出现了维度次序的调整，即输入由27*（32*132）变成了 2...

HW007
发表于2021-05-25 19:44:11
10673 0 0

10.6k 0 0

1. 深扒CNN：也谈机器学习的本质现在，从OCR性能优化系列（一）中的图1左下角的输入开始，串一遍图一的流程。首先是输入27张待识别的文字片段图片，每张图片的大小为32*132。这些图片会经过一个CNN网络进行编码，输出32个27*384的初步编码矩阵。如下图所示：值得注意的是，在这步操作中出现了维度次序的调整，即输入由27*（32*132）变成了 2...
OCR 机器学习神经网络
OCR性能优化系列（一）：BiLSTM网络结构概览
但是他们的特征长度都是128！！！一个字是128，一个句子也是128？对于不同的文字图片中，句子的长度还可能不一样，怎么可能都用一个字的特征长度就表示了呢？

HW007
发表于2021-05-13 21:51:20
14515 0 0

14.5k 0 0

但是他们的特征长度都是128！！！一个字是128，一个句子也是128？对于不同的文字图片中，句子的长度还可能不一样，怎么可能都用一个字的特征长度就表示了呢？
OCR 应用性能调优机器学习网络
扫描笔融合OCR技术助力纸质信息快速实现结构化管理
随着时代的变迁，数码时代到来，传统摘录摘抄方式已经无法满足快节奏的生活，无纸化办公与传统办公模式的碰撞，诞生了一些新的办公周边产品，比如扫描笔。扫描笔，是通过扫描技术（一般采用红外线扫描），将印刷字体扫描到笔里通过里面的OCR技术进行识别，轻轻一刷即可将书籍、文件、报刊上的文字直接刷进电脑的Word/Excel，随意编辑引用。主要可用于扫描办公文件、书籍、身份证、名片等信息，很好的满足了现代...

云脉OCR技术
发表于2020-12-18 16:02:28
9644 0 0

9.6k 0 0

随着时代的变迁，数码时代到来，传统摘录摘抄方式已经无法满足快节奏的生活，无纸化办公与传统办公模式的碰撞，诞生了一些新的办公周边产品，比如扫描笔。扫描笔，是通过扫描技术（一般采用红外线扫描），将印刷字体扫描到笔里通过里面的OCR技术进行识别，轻轻一刷即可将书籍、文件、报刊上的文字直接刷进电脑的Word/Excel，随意编辑引用。主要可用于扫描办公文件、书籍、身份证、名片等信息，很好的满足了现代...
OCR
【学习笔记】AI全栈成长计划-AI应用篇-第二章人工智能的诗与远方：NLP案例开发
1、NLP介绍自然语言处理（Natural Language Processing，简称NLP）就是用计算机来处理、理解以及运用人类语言(如中文、英文等)，它属于人工智能的一个分支，是计算机科学与语言学的交叉学科，又常被称为计算语言学。2、jieba中文分词组件特点：1）支持三种分词模式 *精确模式，试图将句子最精确地切开，适合文本分析； *全模式，把句子中所有的可以成词的词语都...

真爱无敌
发表于2020-12-14 14:06:25
9303 0 0

9.3k 0 0

1、NLP介绍自然语言处理（Natural Language Processing，简称NLP）就是用计算机来处理、理解以及运用人类语言(如中文、英文等)，它属于人工智能的一个分支，是计算机科学与语言学的交叉学科，又常被称为计算语言学。2、jieba中文分词组件特点：1）支持三种分词模式 *精确模式，试图将句子最精确地切开，适合文本分析； *全模式，把句子中所有的可以成词的词语都...
智能问答机器人 OCR
【学习笔记】AI全栈成长计划-AI应用篇-第一章：企业应用最广泛的AI案例开发 OCR文字识别
1、OCR简介光学字符识别（Optical Character Recognition, OCR）是指对文本资料的图像文件进行分析识别处理，获取文字及版面信息的过程。亦即将图像中的文字进行识别，并以文本的形式返回。2、OCR应用场景1）针对图片类识别2）文档类识别场景3）拍照表单类场景4）自然场景（比如车牌识别、摄像监控、自动驾驶等）3、OCR流程图像预处理：去噪、灰度化、图像增强等文本检测...

真爱无敌
发表于2020-12-11 13:07:24
8299 0 0

8.2k 0 0

1、OCR简介光学字符识别（Optical Character Recognition, OCR）是指对文本资料的图像文件进行分析识别处理，获取文字及版面信息的过程。亦即将图像中的文字进行识别，并以文本的形式返回。2、OCR应用场景1）针对图片类识别2）文档类识别场景3）拍照表单类场景4）自然场景（比如车牌识别、摄像监控、自动驾驶等）3、OCR流程图像预处理：去噪、灰度化、图像增强等文本检测...
OCR
OCR身份证识别助力减少证件信息登记失误
身份证是每个人非常重要的证件，不论是出门乘车购票、办理银行业务，还是开通电信账号、考场出入......这些大大小小的生活场景以及办公业务，几乎都离不开身份证的使用。在OCR身份证识别技术还未投入使用之前，绝大多数业务办理都需要手动填写表单，且表单上不能出现涂抹、污渍、修改的痕迹。这就导致了我们不得不多准备一些表单以防填错更换。这种身份信息登记手法不仅耗时耗力，更是严重浪费纸张资源。如今，在O...

云脉OCR技术
发表于2020-12-08 13:46:47
12301 0 0

12.3k 0 0

身份证是每个人非常重要的证件，不论是出门乘车购票、办理银行业务，还是开通电信账号、考场出入......这些大大小小的生活场景以及办公业务，几乎都离不开身份证的使用。在OCR身份证识别技术还未投入使用之前，绝大多数业务办理都需要手动填写表单，且表单上不能出现涂抹、污渍、修改的痕迹。这就导致了我们不得不多准备一些表单以防填错更换。这种身份信息登记手法不仅耗时耗力，更是严重浪费纸张资源。如今，在O...
OCR
探讨场景文本识别中的语言模型：基于深度学习的解决思路
在目前基于深度学习的语言模型结构主要包括三个类别：基于RNN的语言模型，基于CNN的语言模型和基于Transformer的语言模型。接下来我会对它们进行依次介绍，并且逐一分析他们的优缺点。

谷雨润一麦
发表于2020-12-04 13:13:24
9023 0 0

9.0k 0 0

在目前基于深度学习的语言模型结构主要包括三个类别：基于RNN的语言模型，基于CNN的语言模型和基于Transformer的语言模型。接下来我会对它们进行依次介绍，并且逐一分析他们的优缺点。
卷积神经网络人工智能 OCR 语言理解自然语言处理基础
探讨场景文本识别中的语言模型：语言模型的定义
文本图像中包含两层信息：视觉纹理信息和语言信息。由于单纯根据视觉纹理信息进行文字识别缺少了对上下文的字符语义信息的挖掘，时常会导致错误的文本识别结果（之后会详细说明）。因此如何获得鲁棒的语言信息来提升识别性能成为了最近场景文本识别任务中比较受欢迎的思路。

谷雨润一麦
发表于2020-12-04 12:48:48
8591 0 0

8.5k 0 0

文本图像中包含两层信息：视觉纹理信息和语言信息。由于单纯根据视觉纹理信息进行文字识别缺少了对上下文的字符语义信息的挖掘，时常会导致错误的文本识别结果（之后会详细说明）。因此如何获得鲁棒的语言信息来提升识别性能成为了最近场景文本识别任务中比较受欢迎的思路。
OCR 机器视觉 EI智能体人工智能
我的华为云初体验
第一次用华为云的 EI OCR 服务，以消费者视角体验了 AI + 微服务，忍不住说一点感想。快捷易用我试用的是 EI 企业智能板块的 OCR 光学文字识别服务。从申请账号开始，到第一个车牌识别调用成功总共耗时20分钟，我一边做一边看产品文档，没有一味追求速度。整体流程很顺畅，流程合理直接。但让我意外的是，耗时最久，体验最差的环节是申请api token。token 是访问一个服务的信令，需...

oneliner
发表于2020-11-25 22:15:00
11273 0 1

11.2k 0 1

第一次用华为云的 EI OCR 服务，以消费者视角体验了 AI + 微服务，忍不住说一点感想。快捷易用我试用的是 EI 企业智能板块的 OCR 光学文字识别服务。从申请账号开始，到第一个车牌识别调用成功总共耗时20分钟，我一边做一边看产品文档，没有一味追求速度。整体流程很顺畅，流程合理直接。但让我意外的是，耗时最久，体验最差的环节是申请api token。token 是访问一个服务的信令，需...
EI企业智能 OCR EI创新孵化Lab
ASM重命名包含OCR_vote file的磁盘组
参考：1335975.111R2提供renamedg，可在磁盘组dismount时将其重命名；如果该磁盘组包含OCR/vote file，则dismount前需将其迁移至中间磁盘；创建一个临时磁盘组temp，将OCR/vote file迁移至此；将spfile也迁移到temp，重启CRS；卸载并重命名原磁盘组，并重新加载；将ocr/vote file/spfile迁回，重启CRS； ...

snowofsummer
发表于2020-11-16 10:09:06
5060 0 0

5.0k 0 0

参考：1335975.111R2提供renamedg，可在磁盘组dismount时将其重命名；如果该磁盘组包含OCR/vote file，则dismount前需将其迁移至中间磁盘；创建一个临时磁盘组temp，将OCR/vote file迁移至此；将spfile也迁移到temp，重启CRS；卸载并重命名原磁盘组，并重新加载；将ocr/vote file/spfile迁回，重启CRS； ...
OCR 数据库
浅谈OCR文字识别
OCR简介 OCR 是英文Optical Character Recognition的缩写，意思是光学字符识别，也可简单地称为文字识别，是文字自动输入的一种方法。它通过扫描和摄像等光学输入方式获取纸张上的文字图像信息，利用各种模式识别算法分析文字形态特征可以将票据、报刊、书籍、文稿及其它印刷品转化为图像信息，再利用文字识别技术将图像信息转化为可以使用的计算机输入技术。可应用...

运气男孩
发表于2020-11-16 00:02:23
7986 0 0

7.9k 0 0

OCR简介 OCR 是英文Optical Character Recognition的缩写，意思是光学字符识别，也可简单地称为文字识别，是文字自动输入的一种方法。它通过扫描和摄像等光学输入方式获取纸张上的文字图像信息，利用各种模式识别算法分析文字形态特征可以将票据、报刊、书籍、文稿及其它印刷品转化为图像信息，再利用文字识别技术将图像信息转化为可以使用的计算机输入技术。可应用...
OCR 人工智能
表单识别：自定义表单模板无需额外定制
在各行各业中，Excel和WPS是办公标配工具，办公的时候，我们经常遇到这样一个需求：将纸质表格/表格图片导入Excel。面对这种需求，多数人会选择在Excel中新建表单，对照着图片将内容一点一点敲进表格，操作时间长易出错，与越来越追求高效的现代办公节奏格格不入。近年来，随着OCR技术的成熟与普及，可用性不断提升，借助OCR工具从图片中提取文本信息渐成趋势。厦门云脉推出表单识别解决方案，帮助...

云脉OCR技术
发表于2020-10-27 15:48:22
7002 0 0

7.0k 0 0

在各行各业中，Excel和WPS是办公标配工具，办公的时候，我们经常遇到这样一个需求：将纸质表格/表格图片导入Excel。面对这种需求，多数人会选择在Excel中新建表单，对照着图片将内容一点一点敲进表格，操作时间长易出错，与越来越追求高效的现代办公节奏格格不入。近年来，随着OCR技术的成熟与普及，可用性不断提升，借助OCR工具从图片中提取文本信息渐成趋势。厦门云脉推出表单识别解决方案，帮助...
OCR 文字识别 OCR 票据类

上滑加载中

推荐直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript