• [其他] 华为云OCR服务使用途径
    OCR服务以开放API(Application Programming Interface,应用程序编程接口)的方式提供文字识别能力,将图片或扫描件中的文字识别成可编辑的文本。 调用API接口需要具备一定的编程开发能力,文字识别后返回的结果为JSON格式,用户需要通过编程来处理识别结果。 您可以根据以下方式的介绍选择合适的使用方式: **通过华为云EI智能体验馆 > 文字识别。** 如果您是业务开发者,没有代码编写基础,您可以使用该方式体验部分OCR服务。 该方式只能用于体验,不能用于开发,一次只能识别一张图片。例如:身份证识别,一次只能上传一张身份证。 **通过可视化工具(如curl、Postman)发送请求调用OCR服务API。** 详细介绍请参见如何使用Postman调用华为云OCR服务。 如果您是开发初学者,有代码编写基础,对HTTP请求与编程基础有一定的了解,您可以通过postman方式调用接口使用服务。 该方式需要下载工具(如curl、Postman)并安装,熟悉工具使用方法。 **通过编写代码调用OCR服务API。** 详细介绍请参见如何使用SDK调用华为云OCR服务。 如果您是开发工程师,熟悉代码编写,华为云为您提供Java/Python/iOS/Android/Node.js等版本的SDK,方便您快速集成。 该方式需要编写并调试代码,安装配置开发环境。
  • [其他] 【文字识别基础知识】 OCR发展历史
    OCR的概念是在1929年由德国科学家Tausheck最先提出来,并申请了专利。后来美国科学家Handel也提出了利用技术对文字进行识别的想法。中国最早的OCR商业应用是由科学家王庆人教授在南开大学开发出来的,并在美国市场投入商业使用。日本在20世纪60年代开始研究OCR识别理论,开发了邮政编码识别系统。
  • [其他] 【文字识别基础知识】 提升识别率的技巧(6)
    用工具擦掉图像污点,包括原来版面中的不需要识别的插图、分隔线等,使文字图像中除了文字没有一点多余的东西;这可以大提高识别率并减少识别后的修改工作。 如果要扫描印刷质量稍微差一些的文章,比如说报纸,扫描的结果将不会黑白分明,会出现大量的黑点,而且在字体的笔画上也会出现粘连现象,这两项可是汉字识别的大忌,将严重影响汉字识别的正确率。为获得较好的识别结果,必须仔细进行色调调节,反复扫描多次才能获得比较理想的结果。另外由于报纸很薄且大部分纸质不高,导致扫描仪上盖板不能完全压住报纸(有缝隙),所以一般情况下报纸的扫描识别效果没有杂志的效果好。解决办法是在报纸上压一至两本16K的杂志,效果还是不错的。
  • [其他] 【文字识别基础知识】 提升识别率的技巧(5)
    在放置扫描原稿时,把扫描的文字材料一定要摆放在扫描起始线正中,以最大限度地减小由于光学透镜导致的失真。同时应保护扫描仪玻璃的干净和不受损害。文字有一定角度的倾斜,或者是原稿文字部分为不正规排版,必须在扫描后使用旋转工具,进行纠正;否则OCR识别软件会将水平笔划当做斜笔划处理,识别正确率会下降很多。建议用户尽量将扫描原稿放正,用工具旋转纠正会降低图像质量,使字符识别更加困难。 先"预览"整体版面,选定要扫描的区域,再用"放大预览"工具,选择一小块进行放大显示到全屏幕,观察其文字的对比度,文字的深浅浓度,据情况调整"阀值"的大小,最终要求文字清晰,不浓(文字成团),不淡(文字断笔伐),一般在"阀值"80左右为宜,最后再扫描。
  • [其他] 【文字识别基础知识】提升识别率的技巧(4)
    遇到图文混排的扫描原稿,首先明确使用的识别软件是否支持自动分析图文这一功能。如果支持的话,在进行这类扫描识别时,OCR软件会自动计算出文本的内容、位置和先后顺序。文字部分可以按照标示顺序正常识别。 手动选取扫描区域会有更好识别效果。设置好参数后,先预览一下,然后开始选取扫描区域。不要将要用的文章一股脑儿选在一个区域内,因为现在的文章排版为了追求更好的视觉效果,使用图文混排的较多,扫成一幅图像会影响OCR识别。因此,要根据实际情况将版面分成N个区域,怎么划分区域呢?每一区域内的文字字体、字号最好一致,没有图形、图像,每一行的宽度一致,遇到长短不一,再细分,一般一次最多可扫描10个选区。根据不同情况,合理地设置识别区域的顺序。不要嫌这个过程太烦,那可是提高识别率的有效手段。注意各识别区域不能有交叉,做到一切觉得完好以后再进行识别。这样一般的识别率会在95%以上,对于识别不正确的文字进行校对后,就可以进入相应的文字处理软件进行所需的处理了。
  • [技术干货] OCR实现个人财务管理信息大数据服务
    公司业务信息:(公司名称名称、所属行业、主要业务)堪博互联网科技,英文名:Canbloom,   自从推出SQL备份专家软件以来,受到大量专用用户青眯。我们拥有自主研发能力和成熟的技术积淀,通过互联网产品发展趋势深度挖掘,   自2020始,以SQL备份专家为代表数据资产应用基础上,推出 专注于游戏互动式 订单转化营销系统,基于在线SAAS,同时可为用户提供客制化的订单转化营销。   可以自由定制需要的系统类型,包括小程序、商城、淘宝客,在线支付、公众号、论坛、知识库、营销码系统、生产打印系统。   激活用户的资产数据,实现智慧办公,智慧营销。让粉丝不再是静态数据,红包游戏、粉丝互动、抽奖返现、微信吸粉,提升二次销售。解决问题与挑战:1.某个或某几个业务场景是怎样的?遇到了怎样的问题、痛点,有哪些挑战(技术的挑战、解决方案的挑战等);   ps:至少罗列1个及以上的业务场景及挑战(通过例子详细描述业务场景和问题痛点);2.这些问题和痛点为什么可以通过XXX服务来解决?(比如工作量大,或者准确性差这些痛点);业务场景:在这个信息技术日渐发达的时代,随着移动互联网的发展和电子支付在中国大陆的普及,大量手机端的app应用产生了涉及个人财务的海量信息,依靠个人是很难有足够的时间和精力去收集管理自己散布在各个平台上大量财务信息以充分分析了解自身完整的财务状况并进一步进行合理地优化改善。   解决问题:实现各类app的资产和账单页面的识别,汇总个人财务信息,并进一步利用大数据分析技术提供财务管理服务。   挑战:需要剔除所识别提取的信息中,无效或无法利用的信息。   使用服务:文字识别   如何解决:引入华为云的通用文字识别技术,可从用户上传的图片内提取出全部与财务相关的信息进行记账。使用场景:账单信息汇总使用规模:1000次/日使用收益:1.已为业务带来了哪些提升,用户体验或反馈有哪些优化等;2.预计或将为业务带了怎样的创新性提升等。展望下未来;300字及以上传统记账产品以手工记账为主,用户在操作时仅仅输入最简单基本的信息。目前,各个平台的app应用中已经存在包含丰富信息的电子账单,但这些信息是被割裂分布的,通过OCR技术可以高效准确地把各个应用内资产及账单中与财务相关的信息进行识别提取,达到汇总记账的效果,让用户可以完整了解自身的财务和现金流等状况。换言之,理论上利用OCR技术可以导入任何平台的任何信息,在形成一定用户规模的情况下可形成个人财务大数据,继而利用数据分析挖掘技术为用户提供智能化的财务管理服务。此外,个人财务信息大数据还可用于为其他行业如零售消费、投资理财等提供数据支持,如构建消费画像、财务画像等等。因此,该项目拥有广泛的市场应用前景具备很高的价值潜力。
  • [其他] 【文字识别基础知识】 提升识别率的技巧(3)
    如果要进行的文本是带有格式的,如粗体、斜体、首行缩进等,部分OCR软件识别不出来,会丢失格式或出现乱码。如果必须扫描带有格式的文本,事先要确保使用的识别软件是否支持文字格式的扫描。也可以关闭样式识别系统,使软件集中注意力查找正确的字符,不再顾及字体和字体格式。 在扫描识别报纸或其他半透明文稿时,背面的文字透过纸张混淆文字字形,对识别会造成很大的障碍。遇到该类扫描,只要在扫描原稿的背面附。盖一张黑纸,扫描时,增加扫描对比度,即可减少背面模糊字体的影响,提高识别正确率。 一般文本扫描原稿都为黑、白两色原稿,但是在扫描设置时却常将扫描模式设为灰度模式。特别是在原稿质量较差时,使用灰度模式扫描,并在扫描软件处理完后再继续识别,这样会得到较好的识别正确率。值得注意的是OCR识别软件可以自己确定阀值,几个百分点的阀值差异,可能就会影响识别的正常进行。当然,得到的图像文件的大小会比黑白文件大很多。在进行大批量文稿扫描时,必须对原稿进行测试,找到最佳的阀值百分比。
  • [其他] 【文字识别基础知识】 提升识别率的技巧(2)
    扫描时适当地调整好亮度和对比度值,使扫描文件黑白分明。这对识别率的影响最为关键,扫描亮度和对比度值的设定以观察扫描后的图像中汉字的笔画较细但又不断开为原则。进行识别前,先看看扫描得到的图像中文字质量如何,如果图像存在黑点或黑斑时或文字线条很粗很黑,分不清笔画时,说明亮度值太小了,应该增加亮度值在试试;如果文字线条凹凸不平,有断线甚至图像中汉字轮廓严重残缺时,说明亮度值太大了,应减小亮度后再试试。 选好扫描软件。选一款好的适合自己的OCR软件是作好文字识别工作的基础,一般不要使用扫描仪自带的OEM软件,OEM的OCR软件的功能少、效果差,有的甚至没有中文识别。
  • [其他] 【文字识别基础知识】 提升识别率的技巧(1)
    分辨率的设置是文字识别的重要前提。一般来讲,扫描仪提供较多的图像信息,识别软件比较容易得出识别结果。但也不是扫描分辨率设得越高识别正确率就越高。选择300dpi或400dpi分辨率,适合大部分文档扫描。注意文字原稿的扫描识别,设置扫描分辨率时千万不要超过扫描仪的光学分辨率,不然会得不偿失。下面是部分典型设置,仅供参考。 (1)1、2、3号字的文章段,推荐使用200dpi。 (2)4、小4、5号字的文章段,推荐使用300dpl (3)小5、6号字的文章段,推荐使用400dpl (4)7、8号字的文章段,推荐使用600dpi。
  • [其他] 【文字识别基础知识】中文识别 - 成功率决定因素
    决定因素 1.图片的质量,一般建议150dpi以上 2.颜色,一般对彩色识别很差,黑白的图片较高,因此建议ocr的为黑白tif格式 3.最重要的就是字体,如果是手写识别率很低。 国内OCR识别简体差错率为万分之三,如果要求更高的精度需要投入更大的人工干预。繁体识别由于繁体字库的不统一性(民国时期的字库和现在繁体字库不统一),导致识别困难,在人工干预下,精度能达到90%以上(图文清晰情况下)。
  • [其他] 【文字识别基础知识】中文识别 - 识别过程
    识别过程 书本级:中文,英文;简体,繁体; 版式级:竖排,横排;有无分栏; 行切分 字切分 识别:真正的OCR识别过程,图像信息还原成文本信息 后处理:人工干预,主要集中在前四个阶段。
  • [其他] 【文字识别基础知识】中文识别 - 资料录入
    资料录入 文献资料的数字化录入,一般分为: 1.纯图像方式。 2.目录文本、正文图像方式。 3.全文本方式。 4.全文索引方式。文本方式和图像方式的混合体。
  • [技术干货] 文字识别案例 - 利用OCR文字识别提高院前急救电子病历录入效率
    公司业务信息:    北京远盟健康科技有限公司为远盟康健科技有限公司子公司,成立于2015年5月6日,主要致力于紧急救援领域事业,是中国领先的智慧医疗急救平台服务提供商,同时也是绿色通道救援联盟和华人全球救援联盟(ICAA)的执行机构。北京远盟健康科技有限公司依托资源优势,在各部门的共同努力下,开发了智慧医疗急救平台,集微急救服务平台、SIRE智慧旅行救援服务平台、远盟PSAP系统(远盟全国救援黄页系统)、远盟E-Call系统(远盟车联网紧急救援服务系统)和云平台急救调度系统多功能为一体的智慧医疗急救平台。    公司目前已与全国200多个大中城市的260多家急救中心、上千家网络医院、全球211个国家和地区的救援服务网络、7*24小时专业的医护服务团队以及覆盖全国权威医院与近250位医疗专家的建立合作。北京远盟希望通过自己的力量能为中国紧急救援的健康发展提供支持和帮助,为国人的生命健康安全保障护航。    公司致力于120急救信息化建设,通过云计算、大数据、5G等技术,为120提供急救调度云平台、急救电子病历、院前院内一体化、智能车载、急救调度助手等急救全流程的信息化产品。解决的问题:      在急救车上,时间短,任务急,如何在有限的时间内获取患者病情,了解既往病史、用药史,以便给患者提供针对性救治,并能够帮助车上的医生快速的获取患者基本信息,填写电子病历,加强电子病历的规范性,解决患者唯一身份识别问题。业务场景:      在急救车上,医护人员通过在电子病历APP上面扫描患者身份证,识别出患者姓名、身份证号信息,通过患者身份证号,去查询电子健康档案,获取患者的既往病史、用药史等信息,让医生能够获取患者及时、有效的病情信息,同时获取的信息能够填充到电子病历中,提高病历的录入效率和准确性,解决了信息重复录入和信息不准确问题。使用服务:  OCR身份证文字识别服务如何解决:      电子病历APP中集成拍照功能,把拍摄的身份证图片转换为base64图片编码,调用华为云OCR身份证文字识别服务,获取姓名、身份证号,通过身份证号调用云端电子健康档案接口,获取电子健康档案信息填充到电子病历中。使用场景:    电子病历APP:识别身份证号码,获取电子健康档案信息填充到电子病历   脑卒中、胸痛管理企业号应用:识别姓名和身份证号,填充到卒中、胸痛患者的基本信息中方案截图:  使用规模:    日调用量50/次左右使用收益:    提高了现场车组人员填写病历的效率和准确率,及时获取病人档案信息,解决患者身份唯一识别问题,后续可通过身份证号跟更多的系统和业务进行huto业务扩展:   银行卡识别:用于医护平台用户信息注册   车牌号识别:通过各地120微急救公众号,为公众提供拍照辨识真假救护车服务作者: brucepeng(北京远盟研发总监)
  • [技术干货] 文字识别实现OCR图文转换,助力高质量手机扫描仪开发
    前言:武汉网幂科技有限公司成立于2012 年,是一家致力于“做卓越的扫描仪”的新兴移动互联网公司。 其主推的全能扫描宝有超过 1000 万人在使用,每天有超过 10 万次普通文字识别请求与1万次高精度文字识别请求。 正文:业务场景:全能扫描宝是一款贴近生活,多使用场景的生活助手,它能够提取书籍、照片、名片、表格中的文字,也是一款能够直接实现扫描翻译的全能扫描仪,是学生党和上班族的智能辅助工具。上班族:可以用它随时随地的扫描合同、文件,并生成PDF或word文档一键分享;学生党:随手扫描老师上课PPT、学霸笔记分享,再也不用担心学过就忘啦;旅行者:随时扫描各种证件、银行卡信息保存,再也不用手输啦,从此解放你的双手。……只需手机拍照需扫描的图片或选取相册照片,全能扫描宝就能快速实现文字识别提取、表格识别、照片扫描、卡证扫描、拍照翻译等功能,免除了手动输入排版的麻烦,图片高清处理,可直接生成PDF或JPG文件保存或打印。解决问题:实现对海量数据进行OCR光学识别处理,实现高效,准确,快速的文字识别提取。挑战:如何在极短的时间内完成大量图片转文字需求,且保证高精度识别效果.使用服务:华为云 / 文字识别解决办法:华为云助力网幂科技打造高效智能全能扫描宝,通过基于深度学习的AI计算机视觉技术,智能识别图片中的文字并转换为电子文档.其自主学习判断的认知能力可应对多种复杂场景,精度高达95%以上.此外,表格识别集海量的数据样本,精准的识别技术及高效的学习认知助力全能扫描宝实现高效表格识别.全能扫描宝使用华为云开发平台文字识别模块,通过其自带的优化模型算法,解决了算法优化难的问题,同时在华为云AI技术的基础上,添加自身特色功能,打造高质量扫描仪.华为云AI提供的训练模型,极大的降低了我司开发成本,提高了图片标注,模型训练效率,降低了人力成本.业务架构:使用场景:1.图片转文字: 用户选取相册中的图片,进行文字识别.2.拍照转文字: 用户拍照进行文字识别.提取照片中的文字.3.批量文字识别: 用户上传多张图片,异步进行文字识别.效果:1.准确度高 .2.速度快.建议:  1.目前文字识别精度较高但依旧有较大的提升空间2.暂不支持智能裁剪文档,需要预处理.3.价格小贵.期待能够随着生态的发展和完善,降低产品价格,或推出价格更低的基础版。作者:    武汉网幂科技有限公司
  • [其他] 【文字识别基础知识】OCR人工矫正
    OCR最后的关卡,在此之前,使用者可能只是拿支鼠标,跟着软件设计的节奏操作或仅是观看,而在此有可能须特别花使用者的精神及时间,去更正甚至找寻可能是OCR出错的地方。一个好的OCR软件,除了有一个稳定的影像处理及识别核心,以降低错误率外,人工校正的操作流程及其功能,亦影响OCR的处理效率,因此,文字影像与识别文字的对照,及其屏幕信息摆放的位置、还有每一识别文字的候选字功能、拒认字的功能、及字词后处理后特意标示出可能有问题的字词,都是为使用者设计尽量少使用键盘的一种功能,当然,不是说系统没显示出的文字就一定正确,就像完全由键盘输入的工作人员也会有出错的时候,这时要重新校正一次或能允许些许的错,就完全看使用单位的需求了。
总条数:278 到第
上滑加载中