- Google 2021 本文研究了文本行识别问题。与大多数针对特定领域(如场景文本或手写文档)的方法不同,本文针对通用问题研究了一个通用体系结构,该体系结构可以从任何图像中提取文本,而不管图像源或输入模式如何。本文对两种解码器(CTC和Transformer)和三个编码器模块(双向LSTM、自我注意和GRCL)进行研究并进行广泛的实验,以比较它们在广泛使用的场景和手写数据集上的准确性和性能。 Google 2021 本文研究了文本行识别问题。与大多数针对特定领域(如场景文本或手写文档)的方法不同,本文针对通用问题研究了一个通用体系结构,该体系结构可以从任何图像中提取文本,而不管图像源或输入模式如何。本文对两种解码器(CTC和Transformer)和三个编码器模块(双向LSTM、自我注意和GRCL)进行研究并进行广泛的实验,以比较它们在广泛使用的场景和手写数据集上的准确性和性能。
- ECCV2020 通过视觉匹配的方法来做文本识别,解决文档识别中的文本文本识别多样性和泛化性问题。 ECCV2020 通过视觉匹配的方法来做文本识别,解决文档识别中的文本文本识别多样性和泛化性问题。
- 本文解读了《TransFG: A Transformer Architecture for Fine-grained Recognition》,该论文针对细粒度分类任务,提出了对应的TransFG 本文解读了《TransFG: A Transformer Architecture for Fine-grained Recognition》,该论文针对细粒度分类任务,提出了对应的TransFG
- 今天和大家一起学习文字识别中的语言模型。这是2018年发表在ACMMM的一篇论文,名为《Attention and Language Ensemble for Scene Text Recognition with Convolutional Sequence Modeling》。本文将会根据三个部分进行解读,分别是研究背景、算法模型的剖析、代码复现。 一、研究背景1.什么是场景文本识别场景... 今天和大家一起学习文字识别中的语言模型。这是2018年发表在ACMMM的一篇论文,名为《Attention and Language Ensemble for Scene Text Recognition with Convolutional Sequence Modeling》。本文将会根据三个部分进行解读,分别是研究背景、算法模型的剖析、代码复现。 一、研究背景1.什么是场景文本识别场景...
- 端到端文字识别算法Mask TextSpotter系列论文分为Mask TextSpotter v1(MTS V1),Mask TextSpotter v2(MTS V2)和Mask TextSpotter v3(MTS V3),分别发表于ECCV 2018,TPAMI 2021和ECCV 2020,其中V2是V1的期刊扩展版。限于篇幅,该系列将分为“上”、“下”两篇博客连载。 端到端文字识别算法Mask TextSpotter系列论文分为Mask TextSpotter v1(MTS V1),Mask TextSpotter v2(MTS V2)和Mask TextSpotter v3(MTS V3),分别发表于ECCV 2018,TPAMI 2021和ECCV 2020,其中V2是V1的期刊扩展版。限于篇幅,该系列将分为“上”、“下”两篇博客连载。
- 自然场景文字检测与识别系列博客将从背景、相关工作、文字检测算法介绍、文字识别算法介绍、端到端文字识别算法介绍、总结与展望等多个方面,介绍自然场景文字检测与识别算法。 自然场景文字检测与识别系列博客将从背景、相关工作、文字检测算法介绍、文字识别算法介绍、端到端文字识别算法介绍、总结与展望等多个方面,介绍自然场景文字检测与识别算法。
- 本文介绍几篇基于区域重组的弯曲文本检测算法 本文介绍几篇基于区域重组的弯曲文本检测算法
- 在通用目标检测算法,空洞卷积能有效地提升网络的感受野,进而提升算法的性能。本次解读的文章提出了一种空洞卷积变体及对应的空洞卷积搜索方法,充分探索空洞卷积的潜力,进一步提升网络模型的性能。 在通用目标检测算法,空洞卷积能有效地提升网络的感受野,进而提升算法的性能。本次解读的文章提出了一种空洞卷积变体及对应的空洞卷积搜索方法,充分探索空洞卷积的潜力,进一步提升网络模型的性能。
- 视频OCR(Video Optical Character Recognition)用于识别视频中出现的中英文字、繁简体文字、数字等内容,包括字幕、弹幕,以及部分自然场景文字、竖直文字和艺术字。通过自动分析视频中出现的文字内容,可以识别并提取违规或者关键信息。随着数字电视的不断推广和普及,对媒介管理的有效监控对于保障出品的质量和安全具有重要的作用。 视频OCR(Video Optical Character Recognition)用于识别视频中出现的中英文字、繁简体文字、数字等内容,包括字幕、弹幕,以及部分自然场景文字、竖直文字和艺术字。通过自动分析视频中出现的文字内容,可以识别并提取违规或者关键信息。随着数字电视的不断推广和普及,对媒介管理的有效监控对于保障出品的质量和安全具有重要的作用。
- ModelArts Pro提供了文字识别套件,基于丰富的文字识别算法和行业知识积累,帮助客户快速构建满足不同业务场景需求的文字识别服务。三分钟即可快速定制OCR服务,实现多种版式图像的文字信息结构化提取。 ModelArts Pro提供了文字识别套件,基于丰富的文字识别算法和行业知识积累,帮助客户快速构建满足不同业务场景需求的文字识别服务。三分钟即可快速定制OCR服务,实现多种版式图像的文字信息结构化提取。
- 本期精彩看点:文字识别关键信息提取的3种深度学习新模型都有哪些? MindSpore开源周年狂欢,量子机器学习与深度分子模拟等巨量新特性来袭,发布新开源TinyMS工具包!大神给你解读Redis是个啥?聊聊分布式异步对象存储? 本期精彩看点:文字识别关键信息提取的3种深度学习新模型都有哪些? MindSpore开源周年狂欢,量子机器学习与深度分子模拟等巨量新特性来袭,发布新开源TinyMS工具包!大神给你解读Redis是个啥?聊聊分布式异步对象存储?
- 从文档中提取结构化的关键信息,为文档自动化处理提供了基础,成为日益增加的业务需求。近年来,利用文档图片中的视觉、上下文等信息来进行文档的关键信息提取受到学术界和工业界的广泛关注。 从文档中提取结构化的关键信息,为文档自动化处理提供了基础,成为日益增加的业务需求。近年来,利用文档图片中的视觉、上下文等信息来进行文档的关键信息提取受到学术界和工业界的广泛关注。
- 本文介绍几篇关于自然场景下文字擦除的论文工作。 本文介绍几篇关于自然场景下文字擦除的论文工作。
- 当前的文本行识别器为拥有更强的序列语义能力,模型多采用CNN + RNN的结构,如目前使用十分广泛的两个识别器CRNN和Aster,这些模型取得了非常好的效果。然而由于RNN只能采用串行计算,在目前大量采用并行计算设备的前提下,RNN面临着明显的速度瓶颈。而Transformer模型基于Attention实现,该操作可并行实现,因此该模型具有良好的并行性。 当前的文本行识别器为拥有更强的序列语义能力,模型多采用CNN + RNN的结构,如目前使用十分广泛的两个识别器CRNN和Aster,这些模型取得了非常好的效果。然而由于RNN只能采用串行计算,在目前大量采用并行计算设备的前提下,RNN面临着明显的速度瓶颈。而Transformer模型基于Attention实现,该操作可并行实现,因此该模型具有良好的并行性。
- 本文解读了《FET-GAN: Font and Effect Transfer via K-shot Adaptive Instance Normalization》,该论文提出了一种端到端的模型FET-GAN用于实现文字字体风格迁移;还提出了一种小样本微调策略,在已有模型基础上实现新文字风格迁移;同时还构建了一个包含100种字体,800多字符的数据集用于验证模型效果。 本文解读了《FET-GAN: Font and Effect Transfer via K-shot Adaptive Instance Normalization》,该论文提出了一种端到端的模型FET-GAN用于实现文字字体风格迁移;还提出了一种小样本微调策略,在已有模型基础上实现新文字风格迁移;同时还构建了一个包含100种字体,800多字符的数据集用于验证模型效果。
上滑加载中
推荐直播
-
SaaS云原生应用典型架构
2022/07/07 周四 19:00-20:00
程泽 华为云SaaS专家
SaaS作为一种有效的软件交付形式,让企业IT团队可以将工作的重心从部署和业务系统定制转移到管理业务系统所提供的服务上来;但多租户开发、技术选型等问题会给SaaS应用开发带来挑战。本期直播将助力您破解这些难题,轻松构建云原生SaaS化应用。
去报名 -
崇本英才·智汇吴江· 无人车挑战赛赛题解读
2022/07/11 周一 19:00-21:00
岩风 华为云EI开发者生态工程师
本次直播主要介绍赛题讲解、baseline操作演示、常见问题答疑等。本次直播主要介绍赛题讲解、baseline操作演示、常见问题答疑等。
去报名 -
鸿蒙设备如何从0到1联网上云
2022/07/11 周一 19:30-20:30
Vz 华为云IoT高级工程师
本课程使开发者具备鸿蒙设备开发基础技能,掌握编译环境搭建、内核开发、驱动子系统开发、网络应用开发等知识点。
即将直播
热门标签