OCR_标签_开发者_华为云

博客(235)
视频(1)
论坛(0)
云声(0)
代码示例(0)

【云驻共创】探讨文字识别中的语言模型
今天和大家一起学习文字识别中的语言模型。这是2018年发表在ACMMM的一篇论文，名为《Attention and Language Ensemble for Scene Text Recognition with Convolutional Sequence Modeling》。本文将会根据三个部分进行解读，分别是研究背景、算法模型的剖析、代码复现。一、研究背景1.什么是场景文本识别场景...

咸蛋超人
发表于2021-09-02 13:28:58
13389 0 0

13.3k 0 0

今天和大家一起学习文字识别中的语言模型。这是2018年发表在ACMMM的一篇论文，名为《Attention and Language Ensemble for Scene Text Recognition with Convolutional Sequence Modeling》。本文将会根据三个部分进行解读，分别是研究背景、算法模型的剖析、代码复现。一、研究背景1.什么是场景文本识别场景...
OCR 神经网络
论文解读系列十：空洞卷积框架搜索
在通用目标检测算法，空洞卷积能有效地提升网络的感受野，进而提升算法的性能。本次解读的文章提出了一种空洞卷积变体及对应的空洞卷积搜索方法，充分探索空洞卷积的潜力，进一步提升网络模型的性能。

我想静静
发表于2021-05-29 20:36:46
15198 0 0

15.1k 0 0

在通用目标检测算法，空洞卷积能有效地提升网络的感受野，进而提升算法的性能。本次解读的文章提出了一种空洞卷积变体及对应的空洞卷积搜索方法，充分探索空洞卷积的潜力，进一步提升网络模型的性能。
EI企业智能 EI智能体 OCR
技术综述十一：视频OCR基础知识、常见数据集和挑战
视频OCR（Video Optical Character Recognition）用于识别视频中出现的中英文字、繁简体文字、数字等内容，包括字幕、弹幕，以及部分自然场景文字、竖直文字和艺术字。通过自动分析视频中出现的文字内容，可以识别并提取违规或者关键信息。随着数字电视的不断推广和普及，对媒介管理的有效监控对于保障出品的质量和安全具有重要的作用。

谷雨润一麦
发表于2021-05-26 11:22:27
12523 0 0

12.5k 0 0

视频OCR（Video Optical Character Recognition）用于识别视频中出现的中英文字、繁简体文字、数字等内容，包括字幕、弹幕，以及部分自然场景文字、竖直文字和艺术字。通过自动分析视频中出现的文字内容，可以识别并提取违规或者关键信息。随着数字电视的不断推广和普及，对媒介管理的有效监控对于保障出品的质量和安全具有重要的作用。
人工智能 EI企业智能 EI智能体 OCR 音视频
【云享新鲜】社区周刊·Vol.6- MindSpore开源新特性；文字识别3种信息提取模型；聊聊Redis的前世今生…
本期精彩看点：文字识别关键信息提取的3种深度学习新模型都有哪些？ MindSpore开源周年狂欢，量子机器学习与深度分子模拟等巨量新特性来袭，发布新开源TinyMS工具包！大神给你解读Redis是个啥？聊聊分布式异步对象存储？

华为云社区精选
发表于2021-04-12 10:38:09
10866 0 0

10.8k 0 0

本期精彩看点：文字识别关键信息提取的3种深度学习新模型都有哪些？ MindSpore开源周年狂欢，量子机器学习与深度分子模拟等巨量新特性来袭，发布新开源TinyMS工具包！大神给你解读Redis是个啥？聊聊分布式异步对象存储？
MindSpore OCR Redis
技术综述十：文字识别之关键信息提取
从文档中提取结构化的关键信息，为文档自动化处理提供了基础，成为日益增加的业务需求。近年来，利用文档图片中的视觉、上下文等信息来进行文档的关键信息提取受到学术界和工业界的广泛关注。

小菜鸟chg
发表于2021-04-06 17:10:42
29400 2 2

29.4k 2 2

从文档中提取结构化的关键信息，为文档自动化处理提供了基础，成为日益增加的业务需求。近年来，利用文档图片中的视觉、上下文等信息来进行文档的关键信息提取受到学术界和工业界的广泛关注。
EI企业智能 OCR 通用AI
技术综述九：自然场景图像的文字擦除算法介绍
本文介绍几篇关于自然场景下文字擦除的论文工作。

我想静静
发表于2021-02-05 20:45:40
17240 0 0

17.2k 0 0

本文介绍几篇关于自然场景下文字擦除的论文工作。
Image EI企业智能 OCR EI智能体通用AI
技术综述六：一文带你了解两种Transformer文字识别方法
当前的文本行识别器为拥有更强的序列语义能力，模型多采用CNN + RNN的结构，如目前使用十分广泛的两个识别器CRNN和Aster，这些模型取得了非常好的效果。然而由于RNN只能采用串行计算，在目前大量采用并行计算设备的前提下，RNN面临着明显的速度瓶颈。而Transformer模型基于Attention实现，该操作可并行实现，因此该模型具有良好的并行性。

谷雨润一麦
发表于2020-11-22 14:46:15
11658 0 0

11.6k 0 0

当前的文本行识别器为拥有更强的序列语义能力，模型多采用CNN + RNN的结构，如目前使用十分广泛的两个识别器CRNN和Aster，这些模型取得了非常好的效果。然而由于RNN只能采用串行计算，在目前大量采用并行计算设备的前提下，RNN面临着明显的速度瓶颈。而Transformer模型基于Attention实现，该操作可并行实现，因此该模型具有良好的并行性。
机器视觉卷积神经网络人工智能 OCR EI企业智能
自学记录鸿蒙API 13：实现智能文本识别Core Vision Text Recognition
在完成语音助手项目后，我尝试了HarmonyOS Next API 13中的Core Vision Text Recognition API，体验其强大的文本识别功能。该API支持多语言高精度识别，能快速将图像中的文本提取为结构化信息，适用于文档扫描、票据管理和实时翻译等场景。通过权限配置、初始化服务、实现识别功能和构建用户界面，我完成了文本识别应用的开发，并探索了性能优化与功能扩展。鸿蒙生态的强

李游Leo
发表于2024-12-28 21:22:56
3357 0 0

3.3k 0 0

在完成语音助手项目后，我尝试了HarmonyOS Next API 13中的Core Vision Text Recognition API，体验其强大的文本识别功能。该API支持多语言高精度识别，能快速将图像中的文本提取为结构化信息，适用于文档扫描、票据管理和实时翻译等场景。通过权限配置、初始化服务、实现识别功能和构建用户界面，我完成了文本识别应用的开发，并探索了性能优化与功能扩展。鸿蒙生态的强
API HarmonyOS OCR
鸿蒙(HarmonyOS)原生AI能力之文本识别
鸿蒙原生AI能力之文本识别原生智能介绍在之前开发中，很多场景我们是通过调用云端的智能能力进行开发。例如文本识别、人脸识别等。原生即指将一些能力直接集成在本地鸿蒙系统中，通过不同层次的AI能力开放，满足开发者的不同场景下的诉求，降低应用开发门槛，帮助开发者快速实现应用智能化有哪些原生智能能力基础视觉服务基础语音服务端侧模型部署端侧推理意图框架… 基础视觉服务 - Core Vision ...

猫林老师
发表于2024-12-23 21:20:15
4202 0 0

4.2k 0 0

鸿蒙原生AI能力之文本识别原生智能介绍在之前开发中，很多场景我们是通过调用云端的智能能力进行开发。例如文本识别、人脸识别等。原生即指将一些能力直接集成在本地鸿蒙系统中，通过不同层次的AI能力开放，满足开发者的不同场景下的诉求，降低应用开发门槛，帮助开发者快速实现应用智能化有哪些原生智能能力基础视觉服务基础语音服务端侧模型部署端侧推理意图框架… 基础视觉服务 - Core Vision ...
HarmonyOS OCR 小程序移动APP 鸿蒙
华为出品！1行代码，识别户口本信息
小白也能用

程序员晚枫
发表于2024-07-11 00:11:35
4238 0 1

4.2k 0 1

小白也能用
OCR Python 文字识别 OCR 证件类
一个基于百度飞桨封装的.NET版本OCR工具类库 - PaddleOCRSharp
前言大家有使用过.NET开发过OCR工具吗？今天给大家推荐一个基于百度飞桨封装的.NET版本OCR工具类库：PaddleOCRSharp。OCR工具有什么用？OCR（Optical Character Recognition）工具可以将图像或扫描文件中的文本内容转换成可编辑的文本格式。这项技术可以帮助人们快速准确地将扫描文件、图片中的文字提取出来，从而进行编辑、存储和分析。百度飞桨Paddl...

追逐时光者
发表于2024-03-10 18:58:37
3140 0 0

3.1k 0 0

前言大家有使用过.NET开发过OCR工具吗？今天给大家推荐一个基于百度飞桨封装的.NET版本OCR工具类库：PaddleOCRSharp。OCR工具有什么用？OCR（Optical Character Recognition）工具可以将图像或扫描文件中的文本内容转换成可编辑的文本格式。这项技术可以帮助人们快速准确地将扫描文件、图片中的文字提取出来，从而进行编辑、存储和分析。百度飞桨Paddl...
.NET OCR 深度学习
Meta的OCR神器nougat强出了天际，赶紧试用一番！
@[toc] 摘要https://arxiv.org/pdf/2308.13418.pdfhttps://github.com/facebookresearch/nougatnougat：你们能识别的，我可以识别，你们不能识别的，我也可以识别，Meta出品，大厂背景！这就是nougat！！！切页试用了一番nougat，很强！很牛！但是也很耗显存，为了省显存，只能先做点处理，首先将PDF文档...

AI浩
发表于2024-02-15 07:40:31
4589 0 0

4.5k 0 0

@[toc] 摘要https://arxiv.org/pdf/2308.13418.pdfhttps://github.com/facebookresearch/nougatnougat：你们能识别的，我可以识别，你们不能识别的，我也可以识别，Meta出品，大厂背景！这就是nougat！！！切页试用了一番nougat，很强！很牛！但是也很耗显存，为了省显存，只能先做点处理，首先将PDF文档...
OCR
解决问题使用pytesseract出现错误：“[WinError 2] 系统找不到指定的文件
解决问题使用pytesseract出现错误：“[WinError 2] 系统找不到指定的文件”在使用pytesseract的过程中，有时候会遇到“[WinError 2] 系统找不到指定的文件”这个错误。这个错误通常是由于tesseract路径配置不正确导致的。下面是解决此问题的步骤：步骤一：安装Tesseract OCR首先，确保你已经安装了Tesseract OCR。可以从Tessera...

皮牙子抓饭
发表于2023-11-24 17:17:35
5762 1 1

5.7k 1 1

解决问题使用pytesseract出现错误：“[WinError 2] 系统找不到指定的文件”在使用pytesseract的过程中，有时候会遇到“[WinError 2] 系统找不到指定的文件”这个错误。这个错误通常是由于tesseract路径配置不正确导致的。下面是解决此问题的步骤：步骤一：安装Tesseract OCR首先，确保你已经安装了Tesseract OCR。可以从Tessera...
OCR Python
2023 第十二届中国智能产业高峰论坛 - 文档大模型的未来展望
前言在2023年的第十二届中国智能产业高峰论坛上，合合信息副总经理和高级工程师丁凯博士为我们带来了一场精彩的演讲，分享了关于文档大模型的最新研究成果以及对未来的展望。合合信息是一家领先的人工智能和大数据科技企业，以其创新的智能文字识别和商业大数据解决方案而闻名。本文将介绍丁凯博士在大会上的演讲内容，涵盖了文档图像分析、识别、以及大模型在这一领域的应用和挑战。让我们一起深入了解，探索文档大模型...

海拥
发表于2023-09-23 19:39:16
7282 0 0

7.2k 0 0

前言在2023年的第十二届中国智能产业高峰论坛上，合合信息副总经理和高级工程师丁凯博士为我们带来了一场精彩的演讲，分享了关于文档大模型的最新研究成果以及对未来的展望。合合信息是一家领先的人工智能和大数据科技企业，以其创新的智能文字识别和商业大数据解决方案而闻名。本文将介绍丁凯博士在大会上的演讲内容，涵盖了文档图像分析、识别、以及大模型在这一领域的应用和挑战。让我们一起深入了解，探索文档大模型...
OCR 图像处理
探索图像数据中的隐藏信息：语义实体识别和关系抽取的奇妙之旅
探索图像数据中的隐藏信息：语义实体识别和关系抽取的奇妙之旅

汀丶
发表于2023-09-03 16:23:41
3384 0 0

3.3k 0 0

探索图像数据中的隐藏信息：语义实体识别和关系抽取的奇妙之旅
OCR 机器学习自然语言处理自然语言处理基础

上滑加载中

推荐直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript