• [AI人工智能全栈成长...] 【问答官3阶段】在ModelArts 里,有可以直接用来训练OCR的数据集吗?
    在ModelArts 里,有可以直接用来训练OCR的数据集吗?
  • [AI人工智能全栈成长...] 【问答官3阶段】OCR识别和NLP有什么联系吗?
    同样是文字识别,OCR识别和NLP有什么区别和联系吗?
  • [AI人工智能全栈成长...] 【问答官3阶段】现在的modelArts 模型市场里,有最新的OCR检测算法吗?
    现在的modelArts 模型市场里,有最新的OCR检测算法吗?如果想移植github上的代码需要哪些步骤呢?
  • [AI人工智能全栈成长...] 【问答官3阶段】OCR使用流程及其优势
    OCR光学字符识别,我们使用OCR能减少大量人工劳动能力,那么使用OCR有哪些流程?我们为什么要是使用OCR,它的优势在哪里?
  • [AI人工智能全栈成长...] 【问答官3阶段】OCR通用文字识别练习python代码运行错误
    第1章 1.2节华为云OCR调用指南根据视频以及文档演示操作,等最后运行时出现错误:visual studio code:pycharm:按照文档一步步操作下来,重复了几次,还是有问题,求大佬解答
  • [AI人工智能全栈成长...] 【问答官3阶段】OCR调用是否支持离线部署?
    按照教程,这个是通过在线申请调用服务,获取AK和SK,并通过HTTP联网调用,是否可以离线部署在内网环境?若要定制化OCR识别票据,是怎样的流程?
  • [线上活动] 11.11文字识别特惠狂欢,低至80元/年!
    【11.11上云嘉年华,文字识别特惠狂欢】19款产品全线抄底价2折钜惠!网络图片识别低至80元/年!在线体验,一键接入华为自研、屡获大奖、极简至快!火热抢购中→点此直达
  • [问题求助] ocr的mobilenet模型,转换失败,解析caffemodel有问题
    【功能模块】【操作步骤&问题现象】1、转换模型2、【截图信息】【日志信息】(可选,上传日志内容或者附件)2020-10-13 16:12:49  com.huawei.mindstudio.ascend.ide.lib.common.model.ParseModelException: ATC start working now, please wait for a moment.[ERROR] GE(3444,atc):2020-10-13-16:12:49.828.459 [framework/domi/common/util.cc:97]3444 ReadProtoFromBinaryFile: ErrorNo: -1(failed) Parse file[/home/gongjia/mobilnetv2/mobilenet/mv2_bb.caffemodel] failed.[ERROR] GE(3444,atc):2020-10-13-16:12:49.832.003 [framework/domi/parser/caffe/caffe_parser.cc:1515]3444 Parse: ErrorNo: -1(failed) ReadProto from BinaryFile:/home/gongjia/mobilnetv2/mobilenet/mv2_bb.caffemodel fail[ERROR] GE(3444,atc):2020-10-13-16:12:49.832.133 [framework/domi/parser/caffe/caffe_parser.cc:1490]3444 Parse: ErrorNo: 50397185() Parser weight for graph domi_default_20201013161249 failed.[ERROR] GE(3444,atc):2020-10-13-16:12:49.832.709 [framework/domi/offline/../session/omg.cc:710]3444 ParseGraph: ErrorNo: -1(failed) ATC weights parse ret fail. Error Code:0x3010001(Failed to parse the weights!)[ERROR] GE(3444,atc):2020-10-13-16:12:49.833.191 [framework/domi/offline/main.cc:768]3444 GenerateInfershapeJson: ErrorNo: -1(failed) ATC Parse graph domi::FAILED[ERROR] GE(3444,atc):2020-10-13-16:12:49.833.871 [framework/domi/offline/main.cc:1193]3444 main: ErrorNo: -1(failed) ATC ConvertJson execute failed!!ATC run failed, Please check the detail log, Try 'atc --help' for more information
  • 【API进阶之路】没有AI工程师也能做OCR文字识别
    在公司技术委员会副主席这个位置上干了有几个月了,期间,我一方面给研发团队整理各种文档资料,做技术沉淀;一方面给市场/运营帮了几次忙,用技术解决业务问题。上周又解决了一个业务难题,估计是考虑到升职加薪也不能太频繁,老板就奖励了我7天带薪假期,让我自己安排。(上集故事请查看:《破圈,用一个API代替10人内容团队》)程序员的工作时间不是996就是007,这突然有了假,干点啥去呢?疫情期间也不能出去浪,有日子没回老家了,回去看看吧。躺在老家院子里的摇椅上,我妈养的中华田园犬在身边绕来绕去,晃晃**地吃了睡睡了吃,日子虽然无聊,倒也难得清闲。叮~同样是做研发的高中同学发不脱同志给我打电话,约我晚上去学校旁边吃烧烤。说走就走,到了地方我看见这小子,紧了紧头上的帽子,赶紧坐下。几杯酒下肚,聊起大家的近况,发不脱表示出了对我的羡慕,“真羡慕你在北京工作,开发的都是些有意思的产品,不像我,待在老家,每天就是围绕销售的需求,让干啥就干啥,实在是没劲,一点成就感都没有。就比如最近销售提了个需求,让我给做一个自动识别名片的功能,你说这玩意能有啥用?”自动识别名片?现在谁还用名片,不都是微信联系了么,最多也是弄个小程序,一扫码就有自己的个人信息了,多方便。我说完,发不脱也说:“对啊,现在谁还用名片,所以这个需求销售那边一个月里提了三四次,都被我们给拒绝了,做了也没价值。”正说到这儿,我看着隔壁桌来了2个小伙子,俩人不太熟的样子,一见面又是握手又是寒暄,最后交换了名片才坐下。这名片难道还真有市场?看完这一幕,我突然有了点想法,跟发不脱说,还是帮销售实现这个需求吧,又不费事,几行代码就解决了,万一人家有用呢。没想到发不脱差点跟我急了:“几行代码?你闹呢?文字识别欸,我们又没有AI工程师,没那个技术能力!”这还不好解决么,说着我掏出手机,打开浏览器进入了华为云API Explorer,搜索“名片识别”,找到对应API,按照接口说明把调用方式发给了发不脱,可不就几行代码的事么。 过去了大概10来天,我已经回公司上班了,发不脱给我发信息:“哥们,谢谢你啊,这个名片识别的功能上线之后才发现,销售们每天能收回来一百多张名片,以前要手动录入CRM,现在扫完就能直接录入了,老板因为这个还给我涨工资了呢,大家还打听我什么时候学的AI,哈哈。” 通过这件事我也意识到,有些功能还真不能光凭自己的直觉和认识,来自一线的声音才是最真实的用户需求。如果你也需要名片识别这个功能,“名片识别API”调用方式如下,拿走不谢。步骤一:开通服务1.       进入文字识别OCR主页,单击“立即使用”,进入文字识别Console控制台。2.       选择服务所在的区域。系统默认显示“华北-北京四”,根据各服务的部署区域选择对应区域,开通与调用的服务必须在同一个区域。3.       在左侧服务列表中单击需要使用的服务,单击“开通服务”。 服务开通成功后,界面显示已开通的服务。步骤二:调试服务通过API Explorer可进行快速调试。在API Explorer点击文字识别。我们先看看调用这个API都需要点啥:看上去获取到名片图片的64位编码或者url就能调用了。举个栗子接下来我们就拿“诸葛亮”的名片调试一下。1、  获取名片图片的64位编码:把“诸葛亮”放进Chrome浏览器里,按F12,在弹出窗口点Sources,选中“诸葛亮”的名片文件,这样就能看到名片的64位编码了。2、  双击选中图片的base64编码信息,“Ctrl+C”复制,然后粘贴到 API Explorer里,点击“调试”,响应结果里就把“诸葛亮”的名片信息都识别出来了~(注意不可使用鼠标右键方式进行复制) 了解更多华为云API信息:“免费下载创新加速利器《华为云API精选手册》【拓展阅读】【API进阶之路】因为不会创建云服务器,我被实习生摆了一道【API进阶之路】前浪的绝地反击与自我证明【API进阶之路】甩锅大会上,我是如何绝地求生的【API进阶之路】一个技术预案,让老板当场喊出了“奥利给”【API进阶之路】万万没想到,一个技术方案帮实习生追到了运营妹子!【API进阶之路】一个技术盲点,差点让整个项目翻车【API进阶之路】老板给我涨薪30%!如何通过SDK接口搞定千万级流量直播【API进阶之路】半天搞定百万条手机号归属地查询,竟影响了公司战略方向!【API进阶之路】无法想象!大龄码农的硬盘里有这么多宝藏【API进阶之路】高考要考口语?一场10w+刷屏活动是如何用多模态评测API做出来的【API进阶之路】帮公司省下20万调研费!如何巧用情感分析API实现用户偏好调研【API进阶之路】逆袭!用关键词抽取API搞定用户需求洞察【API进阶之路】破圈,用一个API代替10人内容团队【API进阶之路】用API打造一条自动化内容生产流水线——活动推荐——华为云已经成为全球主要云服务供应商,在华为云上开放了2400+ API,包括计算、存储、网络、应用服务、软件开发服务、视频、数据库、EI智能等74+产品,如何利用这些丰富强大的API快速开发自己的应用和服务,成为大家关注的热点。华为云API学习赛,为入门初学者量身定制的学习平台,以赛带学,学以致用。无需代码,只需下载体验模板,按操作文档操作即可完成作品。参赛、邀请都有丰富奖品,还有机会拿P40 5G手机超级激励!!识别下图二维码即可报名参加。API入门学习赛·AI人脸识别报名地址奖项设置API入门学习赛·探险寻宝之旅报名地址奖项设置 
  • [技术干货] 【API进阶之路】没有AI工程师也能做OCR文字识别
    在公司技术委员会副主席这个位置上干了有几个月了,期间,我一方面给研发团队整理各种文档资料,做技术沉淀;一方面给市场/运营帮了几次忙,用技术解决业务问题。上周又解决了一个业务难题,估计是考虑到升职加薪也不能太频繁,老板就奖励了我7天带薪假期,让我自己安排。(上集故事请查看:《破圈,用一个API代替10人内容团队》)程序员的工作时间不是996就是007,这突然有了假,干点啥去呢?疫情期间也不能出去浪,有日子没回老家了,回去看看吧。躺在老家院子里的摇椅上,我妈养的中华田园犬在身边绕来绕去,晃晃**地吃了睡睡了吃,日子虽然无聊,倒也难得清闲。叮~同样是做研发的高中同学发不脱同志给我打电话,约我晚上去学校旁边吃烧烤。说走就走,到了地方我看见这小子,紧了紧头上的帽子,赶紧坐下。几杯酒下肚,聊起大家的近况,发不脱表示出了对我的羡慕,“真羡慕你在北京工作,开发的都是些有意思的产品,不像我,待在老家,每天就是围绕销售的需求,让干啥就干啥,实在是没劲,一点成就感都没有。就比如最近销售提了个需求,让我给做一个自动识别名片的功能,你说这玩意能有啥用?”自动识别名片?现在谁还用名片,不都是微信联系了么,最多也是弄个小程序,一扫码就有自己的个人信息了,多方便。我说完,发不脱也说:“对啊,现在谁还用名片,所以这个需求销售那边一个月里提了三四次,都被我们给拒绝了,做了也没价值。”正说到这儿,我看着隔壁桌来了2个小伙子,俩人不太熟的样子,一见面又是握手又是寒暄,最后交换了名片才坐下。这名片难道还真有市场?看完这一幕,我突然有了点想法,跟发不脱说,还是帮销售实现这个需求吧,又不费事,几行代码就解决了,万一人家有用呢。没想到发不脱差点跟我急了:“几行代码?你闹呢?文字识别欸,我们又没有AI工程师,没那个技术能力!”这还不好解决么,说着我掏出手机,打开浏览器进入了华为云API Explorer,搜索“名片识别”,找到对应API,按照接口说明把调用方式发给了发不脱,可不就几行代码的事么。 过去了大概10来天,我已经回公司上班了,发不脱给我发信息:“哥们,谢谢你啊,这个名片识别的功能上线之后才发现,销售们每天能收回来一百多张名片,以前要手动录入CRM,现在扫完就能直接录入了!老板因为这个还给我涨工资了呢,大家还打听我什么时候学的AI,哈哈。” 通过这件事我也意识到,有些功能还真不能光凭自己的直觉和想当然,来自一线的声音才是最真实的用户需求。如果你也需要名片识别这个功能,“名片识别API”调用方式如下,拿走不谢。步骤一:开通服务1.       进入文字识别OCR主页,单击“立即使用”,进入文字识别Console控制台。2.       选择服务所在的区域。系统默认显示“华北-北京四”,根据各服务的部署区域选择对应区域,开通与调用的服务必须在同一个区域。3.       在左侧服务列表中单击需要使用的服务,单击“开通服务”。 服务开通成功后,界面显示已开通的服务。步骤二:调试服务通过API Explorer可进行快速调试。在API Explorer点击文字识别。我们先看看调用这个API都需要点啥:看上去获取到名片图片的64位编码或者url就能调用了。 举个栗子接下来我们就拿“诸葛亮”的名片调试一下。1、  获取名片图片的64位编码:把“诸葛亮”放进Chrome浏览器里,按F12,在弹出窗口点Sources,选中“诸葛亮”的名片文件,这样就能看到名片的64位编码了。2、  双击选中图片的base64编码信息,“Ctrl+C”复制,然后粘贴到 API Explorer里,点击“调试”,响应结果里就把“诸葛亮”的名片信息都识别出来了~(注意不可使用鼠标右键方式进行复制) —— 分割线 ——了解更多华为云API信息:“免费下载创新加速利器《华为云API精选手册》【拓展阅读】【API进阶之路】因为不会创建云服务器,我被实习生摆了一道【API进阶之路】前浪的绝地反击与自我证明【API进阶之路】甩锅大会上,我是如何绝地求生的【API进阶之路】一个技术预案,让老板当场喊出了“奥利给”【API进阶之路】万万没想到,一个技术方案帮实习生追到了运营妹子!【API进阶之路】一个技术盲点,差点让整个项目翻车【API进阶之路】老板给我涨薪30%!如何通过SDK接口搞定千万级流量直播【API进阶之路】半天搞定百万条手机号归属地查询,竟影响了公司战略方向!【API进阶之路】无法想象!大龄码农的硬盘里有这么多宝藏【API进阶之路】高考要考口语?一场10w+刷屏活动是如何用多模态评测API做出来的【API进阶之路】帮公司省下20万调研费!如何巧用情感分析API实现用户偏好调研【API进阶之路】逆袭!用关键词抽取API搞定用户需求洞察【API进阶之路】破圈,用一个API代替10人内容团队【API进阶之路】用API打造一条自动化内容生产流水线——活动推荐——华为云已经成为全球主要云服务供应商,在华为云上开放了2400+ API,包括计算、存储、网络、应用服务、软件开发服务、视频、数据库、EI智能等74+产品,如何利用这些丰富强大的API快速开发自己的应用和服务,成为大家关注的热点。华为云API学习赛,为入门初学者量身定制的学习平台,以赛带学,学以致用。无需代码,只需下载体验模板,按操作文档操作即可完成作品。参赛、邀请都有丰富奖品,还有机会拿P40 5G手机超级激励!!识别下图二维码即可报名参加。API入门学习赛·AI人脸识别报名地址奖项设置API入门学习赛·探险寻宝之旅报名地址奖项设置
  • [技术干货] OCR助力小微商户入网进件智能高效
    公司介绍:       深圳云码通科技有限公司成立于2015年。是一家专业的信息科技人工智能服务商,业务主要包括:个人信息实名验证、企业工商信息查验、金融风控预警、OCR识别、活体检测、人像比对等服务。并成功服务了包括深银联易办事、北京好易联、恒丰银行、易宝支付、快钱支付等数百家企业。       作为一家坚持以客户为中心,紧密围绕客户核心需求,致力于为客户和合作伙伴创造核心价值的企业,与众多知名企业建立了良好的合作关系,全面覆盖银联银行、互联网公司、第三方支付公司,消费金融、电商等领域。并在不同业务领域产生了积极影响,打造智能业务体系,构建人工智能业务生态圈。业务场景:       小微商户入网进件,运用身份证识别、营业执照识别、人脸识别等技术实现商户经营信息、法人身份信息、各类证件资料的快速录入、识别和审核。       小微商户入网活体实名认证,运用活体检测技术确保为真人操作,实现在无人监管场景下,仍能准确高效地完成入网,让用户按照指令做出动作,完成活体检测,确保用户身份真实性。解决问题:       解决支付、金融等行业小微商户入网进件过程中人工审核工作量大、准确率低、安全保密性低、时间人力成本高、图片识别率低等问题,实现小微商户入网的智能进件流程,提高工作效率节省成本,使整个进件更加合规和高效。面临挑战:       根据央行及相关部门、机构规定要求,金融、支付机构在进行商户进件时需完成商户营业执照、法人身份证、开户许可证、商户信息表、商户业务合作合同、金融机构出具的风险告知书等相关信息录入、识别、审核、入档。目前大多人工审核为主,但随着业务的增长人工审核信息的工作量越来越大,耗时耗力且准确性和安全性难以保障,效率低且成本高。此外客户提供的证件照片等存在文件大小差异较大、原件彩照和复印黑白扫描件、图像模糊、俯仰过大、过度曝光、照片拍摄角度各异等问题,会导致识别率下降。同时要能做到拒绝二次翻拍、抠图、打印件、视频抽帧等,满足远程开户实名认证的安全性需求。使用服务:       身份证识别/营业执照识别/人脸识别/图像处理/活体检测如何解决:       采用OCR识别、图像处理、图像智能压缩、智能脸部识别、图像自动旋转剪切、身份信息与照片比对等组合技术,实现无人系统自动化识别并核验。      1.引入华为云的身份证识别、营业执照识别、人脸识别等技术对图片中的有效信息进行自动识别和关键字段结构化提取,快速完成信息录入和实名认证。      2.引入华为云的图像处理技术,比如清晰度检测、低光照增强、图像去雾等技术对进件过程中商户提供的图片进行处理,提高图像识别的准确率。      3.引入华为云的活体检测技术,让用户按照指令做出动作,完成活体检测,确保用户身份真实性。使用收益:      提高工作效率:通过系统识别避免人为录入错误,有效提高录入资料的准确性、减少资料录入和审核时间,提高进件效率。      提升用户体验:通过系统识别,快速进行资料录入和实名核验,大大减少进件所需的时间,客户无需和以前一样等待人工审核,整个进件过程简单流畅,准确安全且高效,客户满意度提升,有更好的客户体验。      节省人力物力:通过使用智能文字识别,减轻一线业务员和后台审核人员的工作强度、降低出错概率、提升工作效率,极大地降低人力物力成本。
  • [技术干货] 论文解读系列五:结合NLP的文本识别方法SEED (Semantics Enhanced Encoder-Decode)
    当前主流的文本识别方法主要可分为两种,一种基于CTC的序列识别方法、另一种是基于注意力机制的序列识别方法,而当前针对文本识别的一些研究也是基于以上方法做改进,如尝试通过引入矫正网络来实现对于曲形文本序列的识别,但是这种基于矫正的改进方法无法处理模糊、部分遮挡等问题,本文尝试通过结合NLP的方法将语义信息引入基于注意力机制的序列识别方法来解决以上问题。详情请点击博文链接:https://bbs.huaweicloud.com/blogs/173490
  • [技术干货] 【打卡帖】文字识别8月调用打卡,结果公布!!!
    8月调用打卡结果公布啦!!!请连续7天完成论坛打卡用户,在3个工作日内,私信楼主,回复收获信息(姓名/电话/地址)注:逾期未回复收获信息,则视为放弃领奖,感谢配合与支持华为云账号奖品昵称连续7天完成论坛打卡2020/8/172020/8/182020/8/192020/8/202020/8/212020/8/222020/8/232020/8/242020/8/252020/8/262020/8/272020/8/282020/8/292020/8/302020/8/31zhanghui_chinaU型枕张辉√√√√√√√√lhw79459023-U型枕多米诺的古牌√√√√√√√√hw97193110U型枕hw97193110√√√√√√√√hw92843841U型枕胡桃木√√√√√√√√hw91101899U型枕hw91101899√√√√√√√√hw85902251U型枕卷毛C酱√√√√√√√√hw84882161U型枕yue√√√√√√√√hw83759112U型枕xiaowei-www√√√√√√√√hw81644006U型枕混天魔√√√√√√√√hw64453159U型枕S@T√√√√√√√√hw62411807U型枕SSLL√√√√√√√√hw61635344U型枕hw61635344√√√√√√√√hw51952327U型枕加油O幸福√√√√√√√√hw51658880U型枕Idea√√√√√√√√hw48915504U型枕ZXF√√√√√√√√hw45125164U型枕小小啦啦√√√√√√√√hw44726740U型枕mahua√√√√√√√√hw4197chmtU型枕满心√√√√√√√√hw39031024U型枕SHY√√√√√√√√hw38947158U型枕爱宁√√√√√√√√hw16680644U型枕hw16680644√√√√√√√√hw03605507U型枕官方AI小助手√√√√√√√√hw02157796U型枕嗯嗯1√√√√√√√√hw00257852U型枕fforeverm√√√√√√√√√√√fengjianwenU型枕DevFeng√√√√√√√√hw081310U型枕Darliamall√√√√√√√√hw36479093U型枕王果儿√√√√√√√√hw96060622U型枕乐多那姐姐√√√√√√√√fengfeier6U型枕@Wu√√√√√√√√√ linteng0718U型枕linteng0718√√√√√√√√PunnyXuU型枕PunnyXu√√√√√√√√hw62503727U型枕yzymin√√√√√√√√√√√hw62766686U型枕晶晶眼中的华为全链接√√√√√√√√ltdev_    yinzhenxinglt_yzx√√√√√√√maoning2019帅气的我√√√√√√√qianggeqiangqianggeqiang√√√√√√√renzhe_wdrenzhe√√√√√√√niboaixboaix√√√√√√√yinzhenxingyzx√√√√√√√vaza123456789y娃哈哈23√hw32618007赫塔穆勒√√√√√√hw20132549海棠木√HaoGesHaoGe√√√√√√√他来了他来了他带着礼物走来了8月调用打卡活动已正式开启活动时间:8.17-8.31活动对象:文字识别/内容审核/图像搜索/语音交互/图像识别/Hilens/图引擎/自然语言处理/对话机器人服务活动规则:1、8月份连续调用API接口产品7天;2、在调用服务对应版块回帖7天;【打卡方法说明】请严格按照给出的打卡样例进行打卡,才可打卡成功
  • [问题求助] C#多线程调用OCR通用文字识别,操作超时
    【功能模块】C#多线程调用OCR通用文字识别,通过Token请求【操作步骤&问题现象】1、C#多线程调用API,连续执行到第四五十次的时候会抛异常,异常信息:操作超时。2、设置System.Net.ServicePointManager.DefaultConnectionLimit的值大于4之后,在GetResponse()的位置抛异常。异常信息远程服务器返回错误:(429)Too Many Requests。【截图信息】【日志信息】(可选,上传日志内容或者附件)
  • [技术干货] 利用OCR卡证类识别助力身份录入省时高效
    业务场景:将智慧工地工人身份信息,自动识别录入信息系统解决问题:当下智慧工地需要对所有工人进行身份信息的录入,若采用传统方式,手工登记,将耗费大量人力物力。使用卡证类识别录入,自动识别身份证上的全部信息,支持身份证正反面识别,一次扫描即可识别身份证号码、姓名、地址等全部信息,图像中的文字转换成可编辑的文本格式,不需手工录入,将极大的减少录入人员工作的重复度以及工作量。对身份证件这类对数据准确度要求极高的数据大大的降低了出错率,减轻了工作人员的压力。挑战:少数民族文字,无法识别。并发能力有所欠缺,人数增多后,会出现卡顿等情况。一次只能识别一张身份证。因不支持离线模式,有时会出现网络不稳定导致调用服务接口返回时间较长使用服务:  OCR卡证类识别如何解决:分批次,避免集中录入。并发问题寻求了开发人员的帮助与支援。对身份证识别接口二次开发,进行循环及批量处理,使其能够一次识别多张身份证,也可以通过智能分类识别接口实现一次识别多张身份证,但需要将待识别身份证放在一张图片上。响应时间较长是因为尺寸过大会导致图片在网络传输过程中耗时较长,可以在不改变图片质量的情况下对图片进行等比例缩放。使用场景:工人将证件信息传入智慧工地录入身份信息系统,将证件识别为文字信息后,将文字录入系统。使用规模:200次左右\每日使用效益:大大缩减了录入人员的工作量,且减少出错率,提升准确度,节约了时间与人力成本。作者:hw32618007
总条数:278 到第
上滑加载中