-
【功能模块】C#多线程调用OCR通用文字识别,通过Token请求【操作步骤&问题现象】1、C#多线程调用API,连续执行到第四五十次的时候会抛异常,异常信息:操作超时。2、设置System.Net.ServicePointManager.DefaultConnectionLimit的值大于4之后,在GetResponse()的位置抛异常。异常信息远程服务器返回错误:(429)Too Many Requests。【截图信息】【日志信息】(可选,上传日志内容或者附件)
-
业务场景:将智慧工地工人身份信息,自动识别录入信息系统解决问题:当下智慧工地需要对所有工人进行身份信息的录入,若采用传统方式,手工登记,将耗费大量人力物力。使用卡证类识别录入,自动识别身份证上的全部信息,支持身份证正反面识别,一次扫描即可识别身份证号码、姓名、地址等全部信息,图像中的文字转换成可编辑的文本格式,不需手工录入,将极大的减少录入人员工作的重复度以及工作量。对身份证件这类对数据准确度要求极高的数据大大的降低了出错率,减轻了工作人员的压力。挑战:少数民族文字,无法识别。并发能力有所欠缺,人数增多后,会出现卡顿等情况。一次只能识别一张身份证。因不支持离线模式,有时会出现网络不稳定导致调用服务接口返回时间较长使用服务: OCR卡证类识别如何解决:分批次,避免集中录入。并发问题寻求了开发人员的帮助与支援。对身份证识别接口二次开发,进行循环及批量处理,使其能够一次识别多张身份证,也可以通过智能分类识别接口实现一次识别多张身份证,但需要将待识别身份证放在一张图片上。响应时间较长是因为尺寸过大会导致图片在网络传输过程中耗时较长,可以在不改变图片质量的情况下对图片进行等比例缩放。使用场景:工人将证件信息传入智慧工地录入身份信息系统,将证件识别为文字信息后,将文字录入系统。使用规模:200次左右\每日使用效益:大大缩减了录入人员的工作量,且减少出错率,提升准确度,节约了时间与人力成本。作者:hw32618007
-
OCR服务以开放API(Application Programming Interface,应用程序编程接口)的方式提供文字识别能力,将图片或扫描件中的文字识别成可编辑的文本。 调用API接口需要具备一定的编程开发能力,文字识别后返回的结果为JSON格式,用户需要通过编程来处理识别结果。 您可以根据以下方式的介绍选择合适的使用方式: **通过华为云EI智能体验馆 > 文字识别。** 如果您是业务开发者,没有代码编写基础,您可以使用该方式体验部分OCR服务。 该方式只能用于体验,不能用于开发,一次只能识别一张图片。例如:身份证识别,一次只能上传一张身份证。 **通过可视化工具(如curl、Postman)发送请求调用OCR服务API。** 详细介绍请参见如何使用Postman调用华为云OCR服务。 如果您是开发初学者,有代码编写基础,对HTTP请求与编程基础有一定的了解,您可以通过postman方式调用接口使用服务。 该方式需要下载工具(如curl、Postman)并安装,熟悉工具使用方法。 **通过编写代码调用OCR服务API。** 详细介绍请参见如何使用SDK调用华为云OCR服务。 如果您是开发工程师,熟悉代码编写,华为云为您提供Java/Python/iOS/Android/Node.js等版本的SDK,方便您快速集成。 该方式需要编写并调试代码,安装配置开发环境。
-
OCR的概念是在1929年由德国科学家Tausheck最先提出来,并申请了专利。后来美国科学家Handel也提出了利用技术对文字进行识别的想法。中国最早的OCR商业应用是由科学家王庆人教授在南开大学开发出来的,并在美国市场投入商业使用。日本在20世纪60年代开始研究OCR识别理论,开发了邮政编码识别系统。
-
用工具擦掉图像污点,包括原来版面中的不需要识别的插图、分隔线等,使文字图像中除了文字没有一点多余的东西;这可以大提高识别率并减少识别后的修改工作。 如果要扫描印刷质量稍微差一些的文章,比如说报纸,扫描的结果将不会黑白分明,会出现大量的黑点,而且在字体的笔画上也会出现粘连现象,这两项可是汉字识别的大忌,将严重影响汉字识别的正确率。为获得较好的识别结果,必须仔细进行色调调节,反复扫描多次才能获得比较理想的结果。另外由于报纸很薄且大部分纸质不高,导致扫描仪上盖板不能完全压住报纸(有缝隙),所以一般情况下报纸的扫描识别效果没有杂志的效果好。解决办法是在报纸上压一至两本16K的杂志,效果还是不错的。
-
在放置扫描原稿时,把扫描的文字材料一定要摆放在扫描起始线正中,以最大限度地减小由于光学透镜导致的失真。同时应保护扫描仪玻璃的干净和不受损害。文字有一定角度的倾斜,或者是原稿文字部分为不正规排版,必须在扫描后使用旋转工具,进行纠正;否则OCR识别软件会将水平笔划当做斜笔划处理,识别正确率会下降很多。建议用户尽量将扫描原稿放正,用工具旋转纠正会降低图像质量,使字符识别更加困难。 先"预览"整体版面,选定要扫描的区域,再用"放大预览"工具,选择一小块进行放大显示到全屏幕,观察其文字的对比度,文字的深浅浓度,据情况调整"阀值"的大小,最终要求文字清晰,不浓(文字成团),不淡(文字断笔伐),一般在"阀值"80左右为宜,最后再扫描。
-
遇到图文混排的扫描原稿,首先明确使用的识别软件是否支持自动分析图文这一功能。如果支持的话,在进行这类扫描识别时,OCR软件会自动计算出文本的内容、位置和先后顺序。文字部分可以按照标示顺序正常识别。 手动选取扫描区域会有更好识别效果。设置好参数后,先预览一下,然后开始选取扫描区域。不要将要用的文章一股脑儿选在一个区域内,因为现在的文章排版为了追求更好的视觉效果,使用图文混排的较多,扫成一幅图像会影响OCR识别。因此,要根据实际情况将版面分成N个区域,怎么划分区域呢?每一区域内的文字字体、字号最好一致,没有图形、图像,每一行的宽度一致,遇到长短不一,再细分,一般一次最多可扫描10个选区。根据不同情况,合理地设置识别区域的顺序。不要嫌这个过程太烦,那可是提高识别率的有效手段。注意各识别区域不能有交叉,做到一切觉得完好以后再进行识别。这样一般的识别率会在95%以上,对于识别不正确的文字进行校对后,就可以进入相应的文字处理软件进行所需的处理了。
-
公司业务信息:(公司名称名称、所属行业、主要业务)堪博互联网科技,英文名:Canbloom, 自从推出SQL备份专家软件以来,受到大量专用用户青眯。我们拥有自主研发能力和成熟的技术积淀,通过互联网产品发展趋势深度挖掘, 自2020始,以SQL备份专家为代表数据资产应用基础上,推出 专注于游戏互动式 订单转化营销系统,基于在线SAAS,同时可为用户提供客制化的订单转化营销。 可以自由定制需要的系统类型,包括小程序、商城、淘宝客,在线支付、公众号、论坛、知识库、营销码系统、生产打印系统。 激活用户的资产数据,实现智慧办公,智慧营销。让粉丝不再是静态数据,红包游戏、粉丝互动、抽奖返现、微信吸粉,提升二次销售。解决问题与挑战:1.某个或某几个业务场景是怎样的?遇到了怎样的问题、痛点,有哪些挑战(技术的挑战、解决方案的挑战等); ps:至少罗列1个及以上的业务场景及挑战(通过例子详细描述业务场景和问题痛点);2.这些问题和痛点为什么可以通过XXX服务来解决?(比如工作量大,或者准确性差这些痛点);业务场景:在这个信息技术日渐发达的时代,随着移动互联网的发展和电子支付在中国大陆的普及,大量手机端的app应用产生了涉及个人财务的海量信息,依靠个人是很难有足够的时间和精力去收集管理自己散布在各个平台上大量财务信息以充分分析了解自身完整的财务状况并进一步进行合理地优化改善。 解决问题:实现各类app的资产和账单页面的识别,汇总个人财务信息,并进一步利用大数据分析技术提供财务管理服务。 挑战:需要剔除所识别提取的信息中,无效或无法利用的信息。 使用服务:文字识别 如何解决:引入华为云的通用文字识别技术,可从用户上传的图片内提取出全部与财务相关的信息进行记账。使用场景:账单信息汇总使用规模:1000次/日使用收益:1.已为业务带来了哪些提升,用户体验或反馈有哪些优化等;2.预计或将为业务带了怎样的创新性提升等。展望下未来;300字及以上传统记账产品以手工记账为主,用户在操作时仅仅输入最简单基本的信息。目前,各个平台的app应用中已经存在包含丰富信息的电子账单,但这些信息是被割裂分布的,通过OCR技术可以高效准确地把各个应用内资产及账单中与财务相关的信息进行识别提取,达到汇总记账的效果,让用户可以完整了解自身的财务和现金流等状况。换言之,理论上利用OCR技术可以导入任何平台的任何信息,在形成一定用户规模的情况下可形成个人财务大数据,继而利用数据分析挖掘技术为用户提供智能化的财务管理服务。此外,个人财务信息大数据还可用于为其他行业如零售消费、投资理财等提供数据支持,如构建消费画像、财务画像等等。因此,该项目拥有广泛的市场应用前景具备很高的价值潜力。
-
如果要进行的文本是带有格式的,如粗体、斜体、首行缩进等,部分OCR软件识别不出来,会丢失格式或出现乱码。如果必须扫描带有格式的文本,事先要确保使用的识别软件是否支持文字格式的扫描。也可以关闭样式识别系统,使软件集中注意力查找正确的字符,不再顾及字体和字体格式。 在扫描识别报纸或其他半透明文稿时,背面的文字透过纸张混淆文字字形,对识别会造成很大的障碍。遇到该类扫描,只要在扫描原稿的背面附。盖一张黑纸,扫描时,增加扫描对比度,即可减少背面模糊字体的影响,提高识别正确率。 一般文本扫描原稿都为黑、白两色原稿,但是在扫描设置时却常将扫描模式设为灰度模式。特别是在原稿质量较差时,使用灰度模式扫描,并在扫描软件处理完后再继续识别,这样会得到较好的识别正确率。值得注意的是OCR识别软件可以自己确定阀值,几个百分点的阀值差异,可能就会影响识别的正常进行。当然,得到的图像文件的大小会比黑白文件大很多。在进行大批量文稿扫描时,必须对原稿进行测试,找到最佳的阀值百分比。
-
扫描时适当地调整好亮度和对比度值,使扫描文件黑白分明。这对识别率的影响最为关键,扫描亮度和对比度值的设定以观察扫描后的图像中汉字的笔画较细但又不断开为原则。进行识别前,先看看扫描得到的图像中文字质量如何,如果图像存在黑点或黑斑时或文字线条很粗很黑,分不清笔画时,说明亮度值太小了,应该增加亮度值在试试;如果文字线条凹凸不平,有断线甚至图像中汉字轮廓严重残缺时,说明亮度值太大了,应减小亮度后再试试。 选好扫描软件。选一款好的适合自己的OCR软件是作好文字识别工作的基础,一般不要使用扫描仪自带的OEM软件,OEM的OCR软件的功能少、效果差,有的甚至没有中文识别。
-
分辨率的设置是文字识别的重要前提。一般来讲,扫描仪提供较多的图像信息,识别软件比较容易得出识别结果。但也不是扫描分辨率设得越高识别正确率就越高。选择300dpi或400dpi分辨率,适合大部分文档扫描。注意文字原稿的扫描识别,设置扫描分辨率时千万不要超过扫描仪的光学分辨率,不然会得不偿失。下面是部分典型设置,仅供参考。 (1)1、2、3号字的文章段,推荐使用200dpi。 (2)4、小4、5号字的文章段,推荐使用300dpl (3)小5、6号字的文章段,推荐使用400dpl (4)7、8号字的文章段,推荐使用600dpi。
-
决定因素 1.图片的质量,一般建议150dpi以上 2.颜色,一般对彩色识别很差,黑白的图片较高,因此建议ocr的为黑白tif格式 3.最重要的就是字体,如果是手写识别率很低。 国内OCR识别简体差错率为万分之三,如果要求更高的精度需要投入更大的人工干预。繁体识别由于繁体字库的不统一性(民国时期的字库和现在繁体字库不统一),导致识别困难,在人工干预下,精度能达到90%以上(图文清晰情况下)。
-
识别过程 书本级:中文,英文;简体,繁体; 版式级:竖排,横排;有无分栏; 行切分 字切分 识别:真正的OCR识别过程,图像信息还原成文本信息 后处理:人工干预,主要集中在前四个阶段。
-
资料录入 文献资料的数字化录入,一般分为: 1.纯图像方式。 2.目录文本、正文图像方式。 3.全文本方式。 4.全文索引方式。文本方式和图像方式的混合体。
-
公司业务信息: 北京远盟健康科技有限公司为远盟康健科技有限公司子公司,成立于2015年5月6日,主要致力于紧急救援领域事业,是中国领先的智慧医疗急救平台服务提供商,同时也是绿色通道救援联盟和华人全球救援联盟(ICAA)的执行机构。北京远盟健康科技有限公司依托资源优势,在各部门的共同努力下,开发了智慧医疗急救平台,集微急救服务平台、SIRE智慧旅行救援服务平台、远盟PSAP系统(远盟全国救援黄页系统)、远盟E-Call系统(远盟车联网紧急救援服务系统)和云平台急救调度系统多功能为一体的智慧医疗急救平台。 公司目前已与全国200多个大中城市的260多家急救中心、上千家网络医院、全球211个国家和地区的救援服务网络、7*24小时专业的医护服务团队以及覆盖全国权威医院与近250位医疗专家的建立合作。北京远盟希望通过自己的力量能为中国紧急救援的健康发展提供支持和帮助,为国人的生命健康安全保障护航。 公司致力于120急救信息化建设,通过云计算、大数据、5G等技术,为120提供急救调度云平台、急救电子病历、院前院内一体化、智能车载、急救调度助手等急救全流程的信息化产品。解决的问题: 在急救车上,时间短,任务急,如何在有限的时间内获取患者病情,了解既往病史、用药史,以便给患者提供针对性救治,并能够帮助车上的医生快速的获取患者基本信息,填写电子病历,加强电子病历的规范性,解决患者唯一身份识别问题。业务场景: 在急救车上,医护人员通过在电子病历APP上面扫描患者身份证,识别出患者姓名、身份证号信息,通过患者身份证号,去查询电子健康档案,获取患者的既往病史、用药史等信息,让医生能够获取患者及时、有效的病情信息,同时获取的信息能够填充到电子病历中,提高病历的录入效率和准确性,解决了信息重复录入和信息不准确问题。使用服务: OCR身份证文字识别服务如何解决: 电子病历APP中集成拍照功能,把拍摄的身份证图片转换为base64图片编码,调用华为云OCR身份证文字识别服务,获取姓名、身份证号,通过身份证号调用云端电子健康档案接口,获取电子健康档案信息填充到电子病历中。使用场景: 电子病历APP:识别身份证号码,获取电子健康档案信息填充到电子病历 脑卒中、胸痛管理企业号应用:识别姓名和身份证号,填充到卒中、胸痛患者的基本信息中方案截图: 使用规模: 日调用量50/次左右使用收益: 提高了现场车组人员填写病历的效率和准确率,及时获取病人档案信息,解决患者身份唯一识别问题,后续可通过身份证号跟更多的系统和业务进行huto业务扩展: 银行卡识别:用于医护平台用户信息注册 车牌号识别:通过各地120微急救公众号,为公众提供拍照辨识真假救护车服务作者: brucepeng(北京远盟研发总监)