- 文本图像中包含两层信息:视觉纹理信息和语言信息。由于单纯根据视觉纹理信息进行文字识别缺少了对上下文的字符语义信息的挖掘,时常会导致错误的文本识别结果(之后会详细说明)。因此如何获得鲁棒的语言信息来提升识别性能成为了最近场景文本识别任务中比较受欢迎的思路。 文本图像中包含两层信息:视觉纹理信息和语言信息。由于单纯根据视觉纹理信息进行文字识别缺少了对上下文的字符语义信息的挖掘,时常会导致错误的文本识别结果(之后会详细说明)。因此如何获得鲁棒的语言信息来提升识别性能成为了最近场景文本识别任务中比较受欢迎的思路。
- 第一次用华为云的 EI OCR 服务,以消费者视角体验了 AI + 微服务,忍不住说一点感想。快捷易用我试用的是 EI 企业智能板块的 OCR 光学文字识别服务。从申请账号开始,到第一个车牌识别调用成功总共耗时20分钟,我一边做一边看产品文档,没有一味追求速度。整体流程很顺畅,流程合理直接。但让我意外的是,耗时最久,体验最差的环节是申请api token。token 是访问一个服务的信令,需... 第一次用华为云的 EI OCR 服务,以消费者视角体验了 AI + 微服务,忍不住说一点感想。快捷易用我试用的是 EI 企业智能板块的 OCR 光学文字识别服务。从申请账号开始,到第一个车牌识别调用成功总共耗时20分钟,我一边做一边看产品文档,没有一味追求速度。整体流程很顺畅,流程合理直接。但让我意外的是,耗时最久,体验最差的环节是申请api token。token 是访问一个服务的信令,需...
- 参考:1335975.111R2提供renamedg,可在磁盘组dismount时将其重命名;如果该磁盘组包含OCR/vote file,则dismount前需将其迁移至中间磁盘;创建一个临时磁盘组temp,将OCR/vote file迁移至此; 将spfile也迁移到temp,重启CRS; 卸载并重命名原磁盘组,并重新加载; 将ocr/vote file/spfile迁回,重启CRS; ... 参考:1335975.111R2提供renamedg,可在磁盘组dismount时将其重命名;如果该磁盘组包含OCR/vote file,则dismount前需将其迁移至中间磁盘;创建一个临时磁盘组temp,将OCR/vote file迁移至此; 将spfile也迁移到temp,重启CRS; 卸载并重命名原磁盘组,并重新加载; 将ocr/vote file/spfile迁回,重启CRS; ...
- OCR简介 OCR 是英文Optical Character Recognition的缩写,意思是光学字符识别,也可简单地称为文字识别,是文字自动输入的一种方法。它通过 扫描 和摄像等光学输入方式获取纸张上的文字图像信息,利用各种 模式 识别算法分析文字形态特征 可以将票据、报刊、书籍、文稿及其它印刷品转化为图像信息,再利用文字识别技术将图像信息转化为可以使用的计算机输入技术。可应用... OCR简介 OCR 是英文Optical Character Recognition的缩写,意思是光学字符识别,也可简单地称为文字识别,是文字自动输入的一种方法。它通过 扫描 和摄像等光学输入方式获取纸张上的文字图像信息,利用各种 模式 识别算法分析文字形态特征 可以将票据、报刊、书籍、文稿及其它印刷品转化为图像信息,再利用文字识别技术将图像信息转化为可以使用的计算机输入技术。可应用...
- 在各行各业中,Excel和WPS是办公标配工具,办公的时候,我们经常遇到这样一个需求:将纸质表格/表格图片导入Excel。面对这种需求,多数人会选择在Excel中新建表单,对照着图片将内容一点一点敲进表格,操作时间长易出错,与越来越追求高效的现代办公节奏格格不入。近年来,随着OCR技术的成熟与普及,可用性不断提升,借助OCR工具从图片中提取文本信息渐成趋势。厦门云脉推出表单识别解决方案,帮助... 在各行各业中,Excel和WPS是办公标配工具,办公的时候,我们经常遇到这样一个需求:将纸质表格/表格图片导入Excel。面对这种需求,多数人会选择在Excel中新建表单,对照着图片将内容一点一点敲进表格,操作时间长易出错,与越来越追求高效的现代办公节奏格格不入。近年来,随着OCR技术的成熟与普及,可用性不断提升,借助OCR工具从图片中提取文本信息渐成趋势。厦门云脉推出表单识别解决方案,帮助...
- 受Transformer模型的启发,目前一些学者将该结构应用到文本行识别中,以替代RNN,取得了良好的效果,如SRN。SRN使用了Transformer unit进行特征提取,并采用该文作者提出的并行解码器,整个模型拥有更好的可并行性。 受Transformer模型的启发,目前一些学者将该结构应用到文本行识别中,以替代RNN,取得了良好的效果,如SRN。SRN使用了Transformer unit进行特征提取,并采用该文作者提出的并行解码器,整个模型拥有更好的可并行性。
- 受Transformer模型的启发,目前一些学者将该结构应用到文本行识别中,以替代RNN,取得了良好的效果,如HGA-STR。总体上,HGA-STR更接近原有的Transformer的结构,使用了和Transformer类似的解码结构。 受Transformer模型的启发,目前一些学者将该结构应用到文本行识别中,以替代RNN,取得了良好的效果,如HGA-STR。总体上,HGA-STR更接近原有的Transformer的结构,使用了和Transformer类似的解码结构。
- 在自然场景图像的目标检测中,通常使用水平四边形框作为检测框对目标的位置进行框定。但是,在遥感目标检测以及文字检测等相关场景,目标通常情况都是倾斜的。因此,使用检测算法对旋转目标进行检测有利于对遥感目标检测以及文字检测中的目标进行精确定位,为后续识别、分析等高阶任务提供更加准确的初始结果。本文将介绍三种优秀的旋转目标检测算法。 在自然场景图像的目标检测中,通常使用水平四边形框作为检测框对目标的位置进行框定。但是,在遥感目标检测以及文字检测等相关场景,目标通常情况都是倾斜的。因此,使用检测算法对旋转目标进行检测有利于对遥感目标检测以及文字检测中的目标进行精确定位,为后续识别、分析等高阶任务提供更加准确的初始结果。本文将介绍三种优秀的旋转目标检测算法。
- 本文对anchor-free的目标检测RepPoints系列算法进行梳理,具体包含RepPoints, RepPoints V2, Dense RepPoints. 本文对anchor-free的目标检测RepPoints系列算法进行梳理,具体包含RepPoints, RepPoints V2, Dense RepPoints.
- 我们在Tensorflow、Caffe、Pytorch等训练框架上训练神经网络之后,需要对模型迁移到部署框架上进行部署。TensorRT是Nvidia开发的一个神经网络前向推理加速的C++库,用户无需像剪枝那样在训练时对模型进行定制化处理,只需把模型提供给TensorRT即可实现加速。 我们在Tensorflow、Caffe、Pytorch等训练框架上训练神经网络之后,需要对模型迁移到部署框架上进行部署。TensorRT是Nvidia开发的一个神经网络前向推理加速的C++库,用户无需像剪枝那样在训练时对模型进行定制化处理,只需把模型提供给TensorRT即可实现加速。
- 信息抽取(Information Extraction, IE)领域有两个经典的解决方案,一个是基于规则的正则表达式匹配,另一个是基于学习的BiLSTM+CRF方法。在版式较为固定的情况下,这两种方法都可以取得良好的结果。但是对于版面复杂、视觉信息丰富的文档,这两种方法都忽略了视觉等关键信息,从而使得IE准确率下降。近两年,利用文档中的视觉、上下文等信息增强IE性能逐渐受到学者的重视。 信息抽取(Information Extraction, IE)领域有两个经典的解决方案,一个是基于规则的正则表达式匹配,另一个是基于学习的BiLSTM+CRF方法。在版式较为固定的情况下,这两种方法都可以取得良好的结果。但是对于版面复杂、视觉信息丰富的文档,这两种方法都忽略了视觉等关键信息,从而使得IE准确率下降。近两年,利用文档中的视觉、上下文等信息增强IE性能逐渐受到学者的重视。
- 看视频,还可参与回帖互动领好礼活动!快来参与吧:https://bbs.huaweicloud.com/forum/thread-63290-1-1.html文字识别在生活中应用的场景很多,比如常见的汽车牌照识别,实名认证中对于身份证ID的自动识别,输入法的手写识别等等。实现文字识别的途径主要有三种,一个是我们自己手写代码,二是使用开源代码,三是调用云厂商的云服务。第一种,我们自己手写代码难... 看视频,还可参与回帖互动领好礼活动!快来参与吧:https://bbs.huaweicloud.com/forum/thread-63290-1-1.html文字识别在生活中应用的场景很多,比如常见的汽车牌照识别,实名认证中对于身份证ID的自动识别,输入法的手写识别等等。实现文字识别的途径主要有三种,一个是我们自己手写代码,二是使用开源代码,三是调用云厂商的云服务。第一种,我们自己手写代码难...
- 得益于深度学习的发展,许多计算机视觉任务在近几年取得了不错的效果。但是,现有的深度学习算法多是有监督学习算法,依赖大量人工标记的训练数据,而标注数据十分耗费人力成本。因此,解决深度学习对数据的依赖问题和减少数据标注成本成为了业界的研究热点。本文选取了相关领域的部分论文,将介绍以下几个方向:半监督/弱监督学习;数据合成;主动学习;自监督。 得益于深度学习的发展,许多计算机视觉任务在近几年取得了不错的效果。但是,现有的深度学习算法多是有监督学习算法,依赖大量人工标记的训练数据,而标注数据十分耗费人力成本。因此,解决深度学习对数据的依赖问题和减少数据标注成本成为了业界的研究热点。本文选取了相关领域的部分论文,将介绍以下几个方向:半监督/弱监督学习;数据合成;主动学习;自监督。
- 对于目标的检测和实例分割任务,边界区域往往具有重要意义,决定了目标的包围框或分割图精准程度。一些领域的学者开始对这一特性进行挖掘,如OCR领域和通用目标实例分割领域,并都取得了良好的效果。本文选取了几篇近期的工作加以介绍。 对于目标的检测和实例分割任务,边界区域往往具有重要意义,决定了目标的包围框或分割图精准程度。一些领域的学者开始对这一特性进行挖掘,如OCR领域和通用目标实例分割领域,并都取得了良好的效果。本文选取了几篇近期的工作加以介绍。
- 场景图片的敏感文本擦除对用户的隐私保护有很大的作用。文字擦除方法中通常需要检测出文字笔画的像素位置,然后将这些像素替换成合理的背景元素。本次解读的文章提出了一种基于cGAN的场景文字擦除方法EnsNet。 场景图片的敏感文本擦除对用户的隐私保护有很大的作用。文字擦除方法中通常需要检测出文字笔画的像素位置,然后将这些像素替换成合理的背景元素。本次解读的文章提出了一种基于cGAN的场景文字擦除方法EnsNet。
上滑加载中
推荐直播
-
通用人工智能(AGI)到来前夕如何实现企业降本增效和应用现代化
2024/04/19 周五 14:00-16:00
李京峰 T3出行VP/CTO
李京峰是T3出行CTO,本次他将分享通用人工智能(AGI)到来前夕,如何实现企业降本增效和应用现代化。
回顾中 -
华为云云原生FinOps解决方案,为您释放云原生最大价值
2024/04/24 周三 16:30-18:00
Roc 华为云云原生DTSE技术布道师
还在对CCE集群成本评估感到束手无策?还在担心不合理的K8s集群资源申请和过度浪费?华为云容器服务CCE全新上线云原生FinOps中心,为用户提供多维度集群成本可视化,结合智能规格推荐、混部、超卖等成本优化手段,助力客户降本增效,释放云原生最大价值。
去报名 -
产教融合专家大讲堂·第①期《高校人才培养创新模式经验分享》
2024/04/25 周四 16:00-18:00
于晓东 上海杉达学院信息科学与技术学院副院长;崔宝才 天津电子信息职业技术学院电子与通信技术系主任
本期直播将与您一起探讨高校人才培养创新模式经验。
去报名
热门标签