OCR_标签_开发者

博客(192)
视频(1)
论坛(278)
云声(0)
代码示例(0)

[其他] OCR常用资料汇总

产品介绍文字识别（Optical Character Recognition，简称OCR）以开放API的方式提供给用户，用户使用Python、Java等编程语言调用OCR服务API将图片识别成文字，帮助用户自动文字识别（Optical Character Recognition，简称OCR）以开放API的方式提供给用户，用户使用Python、Java等编程语言调用OCR服务API将图片识别成文字，帮助用户自动采集关键数据，打造智能化业务系统，提升业务效率。采集关键数据，打造智能化业务系统，提升业务效率。视频资料点击链接即可播放，支持下载链接：学习资料：第1章初识OCR技术第2章华为云OCR服务介绍第3章华为云OCR使用指南第4章 FAQ及随堂测试链接OCR资讯动态：链接

我就是豆豆 发表于2021-09-14 10:45:55 2021-09-14 10:45:55 最后回复我就是豆豆 2021-09-14 10:45:55
354 0

OCR
[其他] OCR 常见问题分享

梳理常见的OCR问题，请参考1、如何选择OCR服务套餐包的区域？不同的地域之间资源包不互通，每个地域需分别购买，请根据您的实际需求慎重选择。各服务所部署区域请参见终端节点。请先确定使用的服务与区域之后再购买相应区域的套餐包。2、OCR服务识别结果可以转化为Word或者TXT吗？OCR提取之后返回的结果是JSON格式，需要用户通过编程，将结果保存为Word或者TXT格式。3、OCR服务提供哪些版本的SDK？目前OCR提供的SDK有Java、Python、iOS、Android、Node.js版本。如果想用其他编程语言调用OCR API服务，可以使用Token鉴权方式，参考接口说明文档实现接口调用。4、OCR服务可以识别文本格式文件吗？OCR服务是指对图像中的文字进行检测与识别，不能识别word、pdf、excel等文件。5、关于数据安全，隐私保护的有什么措施？OCR服务坚持“华为云始终把可信作为产品质量的第一要素”的理念，我们基于安全、合规、隐私、韧性、透明，为您提供有技术、有未来、值得信赖的云服务。具体请参见白皮书资源。

我就是豆豆 发表于2021-09-14 10:45:23 2021-09-14 10:45:23 最后回复学习怪 2021-09-15 11:48:00
444 3

OCR
[其他] 我发现文字识别OCR一个有趣的情况

使用的是华为电脑管家里面的“Huawei Image Viewer", 看图的，但有个OCR的功能都对于印刷文字来说，中文识别率很高，可以说完美。英文识别一塌糊涂。有的就识别不出来。我想这除了是软件的问题之外，也有语言本身的问题吧。开始觉得IT里面，英文比较适合，比如写代码呀、打字啊，那都是要会英文24个字母的呀，用中文很麻烦呀但后来觉得不是那么简单~嘿嘿~

黄生 发表于2021-09-10 08:46:13 2021-09-10 08:46:13 最后回复我就是豆豆 2021-09-10 11:11:16
1181 2

OCR
[技术干货] 华为RPA常见问题类型汇总（持续更新~）

1 常见安装配置问题及解决方案查看2 常见studio错误提示及解决方案查看3 常见网页及应用程序自动化问题及解决方法查看4 常见Excel自动化操作问题及解决方法查看5 常见控件使用问题及解决方案查看6 常见Email自动化操作问题及解决方案查看7 常见studio错误提示及解决方案（二）查看8 常见系统、文件和数据库操作问题及解决方案查看9 web操作中的常用js语句查看华为RPA 经验分享合集 ————————————————————— [studio 2.16] Studio中很多时候都会用到Json与Dict类型的转化查看 [studio 2.16]获取当前时间（例如：前几年...几月...几日、几小时、几分钟、几秒...的时间）查看常用studio内置变量查看 web操作中的常用js语句查看如何在studio中用查找工具查找关键字，提高编写效率?查看关于 SetActive控件与 SelectWindow 控件的区别查看关于Studio中Try-Catch中的Try属性当中的错误重试次数如何体现的？查看如何在管理中心GDE或助手Assisant上执行项目？查看如何获取邮件中的表格并将其写入excel？查看关于getText控件获取内容失败的解决或者获取时间过长的解决方法查看 WeAutomate Studio 2.16 控件插件自动安装失败解决方案查看 [studio 2.16] 关于发布脚本/工程到管理中心失败的解决方法查看 [studio 2.14及以后版本] 运行失败提示Excel.Application.ShowWindowsInTaskbar查看 [studio 2.16] openurl失败提示"以一种访问权限不允许的方式做了一种访问套接字的尝试"查看 [studio 2.16执行机助手]安装时显示乱码，安装失败的解决方法查看共享一个图片转成base64的方法查看使用开源硬件Arduino模拟USB键盘解决密码输入框中密码输入难题查看文件交互插件（文件上传，另存为弹框）查看 [Windows系统]Windows系统自动登录到桌面的方法查看 [2.1x设计器操作数据库]SQL异常提示：a number is required, not str查看 [Studio2.14以前版本] 如何取消studio在机器人脚本发布时的io风险校验查看 [2.17studio]win32桌面应用操作type等提示has no attribute 'handle'查看 [2.1x设计器]共享一个图片URL保存为图片的方法查看关于定位过程中写两个不同元素的xpath的应用查看 [2.1x设计器]请检查57889端口是否被占用类问题解决方法。查看 [2.16设计器]Server运行提示“DLL load failded while importing cv2:找不到指定模块查看 [设计器2.16及以后]脚本发布时关于第三方依赖包的导包问题查看 [Studio]script cannot references self/SubScript cannnot referenc查看图片在线识别getpicinfo_online的另一个使用方式查看 [2.16执行器]python脚本提示“invalid character in identifier”查看 [2.16设计器]smtp.sendemail发送邮件注意事项/未命名的附件000.dat查看 [studio 2.16] 运行报错RobotKeyError exception details：'USERNAME'查看 [设计器]找不到发布按钮，怎么办？Studio E 与Studio切换/Studio切换Studio E模式/设计器模式切换查看连接失败（Open Connector Failed）查看 [2.17设计器]调用子程序callScript的用法演示查看汉字unicode转换工具，供大家转换时测试使用。查看全局变量与全局参数有什么区别？WeAutomate支持哪些变量类型查看 csv和excel(xlsx,xlsm,xls,xlsb)互相转化查看要保存的文件不能与已打开的文档重命。有一个打开的文档使用了当前指定的名称。查看【Studio 2.16版本】pandas has no attribute "plotting"查看 no validate rule 'server_address' what you need查看根据excel某一列分类来分发不同表格数据到对应的邮箱——机器人查看打开Excel提示“this Com can not automate the makepy process查看 [设计器2.17]设计器获取不到ESN，插件加载失败，提示设计器内部异常错误。查看 Studio2.17——关于“人工智能-Manas引擎-图像识别”系列控件的使用与返回结果的解析查看关于长路径和长字符串的键入替代查看 The northbound interface supports only public assets查看 EI-OCR中的“前置控件-华为云版”如何配置与使用 ||报错信息“flag_token缺失，可能是因为前置组件未添加查看 SAP操作/SAP插件查看防止电脑锁屏工具/虚拟移动鼠标/鼠标移动工具查看设计器调用getVatInfoOcr增值税发票识别，报错attributeError("'str' has no attribu查看应用场景分享——获取邮件正文中的表格到Excel_支持多对多或一对一查看应用场景分享——跑不死的脚本如何开发查看文件操作——【WinRAR命令行】加密压缩文件、解压加密文件、分卷压缩、解压分卷...查看应用场景分享——RPA华为云EI-OCR服务控件的使用查看【应用场景分享】网页表格保存为Excel查看自定义扩展插件——数据库sqlite3相关控件查看应用场景分享——XPath中根据某个节点定位另一个节点查看自定义扩展控件——OCR识别图片生成Excel文件、图片转Excel查看自定义扩展控件——OCR识别图片或PDF文件，生成Word文件查看 WeAutomate Assistant 助手2.17版本以及后续版本点击启动无反应，检查日志报错提示SQLError查看以管理员权限运行RPA，方法适用于所有windows应用程序查看 LAMP方式和LNMP方式创建数据库的区别查看减轻超大Excel表格“数据处理中断”的时间损失查看 [EBS][Java1.8]windows找不到文件\Studio\jre\jre_86\bin\java.exe查看 Studio设计器界面操作卡顿或机器人长时间运行C盘内存占用过多查看print模块怎么使用查看如何将已有的Python脚本应用到weAutemate的流程中？查看利用华为weautomate，怎么获取网页里图片的链接查看华为RPA 管理中心经验分享合集 ————————————————————— [管理中心]设计器调用管理中心2.0的服务报错:Check the openness level of the service查看 RPA管理中心2.0环境创建机机用户操作流程查看 [管理中心1.5.3]执行器助手2.14 执行器处于空闲状态，然而云管理中心中查看执行器状态一直处于运行状态原因分析及解决办法查看 [管理中心]北向接口开发文档1.5.x/2.0x/北向接口开发手册查看 [管理中心2.1]管理中心操作指导查看 [管理中心2.0]管理中心登录异常，提示无法进入编辑模式查看 [管理中心2.0]修改管理中心的登出时间/修改管理中心锁屏时间/延长管理中心注销时间查看【2.1管理中心安装】停止安装FusionStage查看【2.1】RPA管理中心，OP部署环境下进行备份操作查看【1.5.3】小程序迁移操作指导查看【管理中心】一体机场景，服务器下电操作指南查看【2.1管理中心安装】前台卸载数据面失败查看【2.1版】RPA管理中心安装小提示查看【2.1管理中心】增加备份服务器失败查看【2.1管理中心安装】虚拟机磁盘挂载大小与场景包中建议值不一致怎么办？如何修改场景包？如何在Gkit前台页面修改配置？查看【2.1管理中心安装】只安装一个管理中心，不安装其他服务（如：NLP服务），场景包需要做哪些修改？查看管理中心虚机资源说明查看管理中心、执行器、设计器安装环境要求查看【1.5.3管理中心】OP（本地）部署环境下创建租户指导查看【管理中心】本地部署环境下，1.5.3版管理中心升级为2.1版管理中心操作指南查看【2.1管理中心】OP（私有化部署）环境下，如何创建用户及用户管理角色介绍查看【2.1管理中心】OP（私有化部署）环境下，创建删除了的同名用户指导查看【2.1管理中心】OP（私有化部署）环境下，系统安装完毕后，建议修改用户密码策略，如延迟密码过期时间，增加密码重试次数查看【2.1管理中心】OP（私有化部署）环境下，数据面admin用户密码忘记，如何重置密码查看

礼貌酱 发表于2021-09-08 17:31:57 2021-09-08 17:31:57 最后回复 holo.yh 2022-09-08 23:55:53
17696 5

OCR 机器人 Python
【SDK案例系列 02】基于 MindX SDK + Pytorch CRNN的OCR识别

源码下载：cid:link_2快速运行攻略（MindX SDK环境已经部署完毕情况下）：1、获取模型文件（1）crnn.onnx文件cid:link_3存放到 image_crnn/data/models/crnn 目录下2、模型文件转换（1）image_crnn/data/models/crnn目录下执行模型转换，根据芯片类型，执行atc_310.sh 或 atc_310P3.shbash atc_310.shbash atc_310P3.sh3、修改run_cpp.sh & run_python.sh中MX_SDK_HOME为MindX SDK安装目录export MX_SDK_HOME=/usr/local/sdk_home/mxVision4、执行run_cpp.sh 或者 run_python.shbash run_cpp.shbash run_python.sh一、安装昇腾驱动先安装昇腾驱动，昇腾驱动请参考各个产品安装手册，安装完成后npu-smi info 显示安装成功[root@localhost ~]# [root@localhost ~]# npu-smi info +-------------------------------------------------------------------------------------------------+ | npu-smi 22.0.2 Version: 22.0.2 | +------------------+--------------+---------------------------------------------------------------+ | NPU Name | Health | Power(W) Temp(C) Hugepages-Usage(page) | | Chip Device | Bus-Id | AICore(%) Memory-Usage(MB) | +==================+==============+===============================================================+ | 1 310 | OK | 12.8 45 0 / 0 | | 0 0 | 0000:05:00.0 | 0 2621 / 8192 | +==================+==============+===============================================================+二、安装MindX SDK > mxVision（1）MindX SDK需要通过官网获取。（2）mxVision说明手册：cid:link_0（3）安装MindX SDK./Ascend-mindxsdk-mxvision_3.0.RC2_linux-aarch64.run --install --install-path=/usr/local/sdk_home--install-path为指定安装的路径（4）安装成功后会提示如下信息Installing collected packages:mindx Successfully installed mindx-3.0.RC2（5）安装成功后在对应目录下查看，能看到mxVision[root@localhost sdk_home]# [root@localhost sdk_home]# pwd /usr/local/sdk_home [root@localhost sdk_home]# ls mxVision mxVision-3.0.RC2 [root@localhost sdk_home]# [root@localhost sdk_home]#（6）MindX SDK使用中需要用到OSD功能，安装后需要执行以下命令，生成om文件bash /usr/local/sdk_home/mxVision/operators/opencvosd/generate_osd_om.sh执行成功后，显示如下效果[root@localhost ~]# bash /usr/local/sdk_home/mxVision/operators/opencvosd/generate_osd_om.sh ASCEND_HOME is set to /usr/local/Ascend by user Set ASCEND_VERSION to the default value:ascend-toolkit/latest ATC start working now,please wait for a moment. ATC run success, welcome to the next use. The model has been successfully converted to om,please get it under /usr/local/sdk_home/mxVision/operators/opencvosd. [root@localhost ~]# （9）安装完MindX SDK后，需要配置环境变量.bashrc文件添加以下环境变量# 安装mxVision时配置 . /usr/local/sdk_home/mxVision/set_env.sh用户也可以通过修改~/.bashrc文件方式设置永久环境变量，操作如下：a) 以运行用户在任意目录下执行vi ~/.bashrc命令，打开.bashrc文件，在文件最后一行后面添加上述内容。b) 执行:wq!命令保存文件并退出。c) 执行source ~/.bashrc命令使其立即生效。三、ATC模型转换1、把训练好的crnn.pth模型转onnx后，放在image_crnn/data/models/crnn目录下获取路径：cid:link_3[root@localhost crnn]# [root@localhost crnn]# ls aipp_crnn_rgb_gray_norm.config atc_310.sh atc_310P3.sh crnn.cfg crnn-label.names crnn.onnx [root@localhost crnn]# 2、执行模型转换命令（1）AIPP需要配置aipp.config文件，在ATC转换的过程中插入AIPP算子，即可与DVPP处理后的数据无缝对接，AIPP参数配置请参见《CANN 开发辅助工具指南 (推理)》中“ATC工具使用指南”。cid:link_1aipp_crnn_rgb_gray_norm.configaipp_op { aipp_mode: static input_format: RGB888_U8 src_image_size_w: 100 src_image_size_h: 32 csc_switch: true rbuv_swap_switch: true matrix_r0c0 : 76 matrix_r0c1 : 150 matrix_r0c2 : 30 matrix_r1c0 : 0 matrix_r1c1 : 0 matrix_r1c2 : 0 matrix_r2c0 : 0 matrix_r2c1 : 0 matrix_r2c2 : 0 output_bias_0 : 0 output_bias_1 : 0 output_bias_2 : 0 min_chn_0: 127.5 min_chn_1: 127.5 min_chn_2: 127.5 var_reci_chn_0: 0.0078431 var_reci_chn_1: 0.0078431 var_reci_chn_2: 0.0078431 }（2）用户可以使用ATC的帮助命令atc --help查看参数配置。（3）模型转换Ascend310芯片模型转换命令如下：atc \ --mode=0 \ --framework=5 \ --model=crnn.onnx \ --output=crnn \ --input_format=NCHW \ --input_shape="actual_input_1:1,1,32,100" \ --enable_small_channel=1 \ --log=info \ --soc_version=Ascend310 \ --insert_op_conf=aipp_crnn_rgb_gray_norm.configAscend310P3芯片模型转换命令如下：atc \ --mode=0 \ --framework=5 \ --model=crnn.onnx \ --output=crnn \ --input_format=NCHW \ --input_shape="actual_input_1:1,1,32,100" \ --enable_small_channel=1 \ --log=info \ --soc_version=Ascend310P3 \ --insert_op_conf=aipp_crnn_rgb_gray_norm.config参数说明：--model：待转换的ONNX模型的路径文件。--framework：5代表ONNX模型。--output：转换后输出的om模型名称。--input_format：输入数据的格式。--input_shape：输入数据的shape。actual_input_1的取值根据实际使用场景确定。--enable_small_channel=1：对于视觉模型四维数据卷积算子的特殊优化，可以提升性能，其他模型可能导致性能下降，不建议开启。--insert_op_conf=aipp_TorchVision.config：根据实际aipp配置文件路径进行调整。AIPP插入节点，通过config文件配置算子信息，功能包括图片色域转换、裁剪、归一化，主要用于处理原图输入数据，常与DVPP配合使用。（4）模型转换后，会在目录下生成crnn.om[root@localhost crnn]# [root@localhost crnn]# ls aipp_crnn_rgb_gray_norm.config atc_310.sh atc_310P3.sh crnn.cfg crnn-label.names crnn.om crnn.onnx [root@localhost crnn]# 四、使用image_crnn1、修改run_cpp.sh & run_python.sh中MX_SDK_HOME为MindX SDK安装目录export MX_SDK_HOME=/usr/local/sdk_home/mxVision2、执行run_cpp.sh 或者 run_python.shbash run_cpp.shbash run_python.sh3、OCR识别出的文字信息与test.jpg一致CRNN IS GOOD五、image_crnn详解1、技术流程图视频解码：调用OPENCV解码能力，转换为 YUV 格式图像数据。图像缩放：调用OPENCV，将图像缩放到一定尺寸大小。模型推理：CRNN模型针对文字进行OCR识别。模型后处理：针对推理结果进行后处理文字转换。数据序列化：将stream结果组装成json字符串输出。2、pipeline详解{ "classification": { "stream_config": { ##设置业务流在哪个芯片上处理 "deviceId": "0" }, "mxpi_imagedecoder0": { ##图像解码（OpenCV方式） "props": { "handleMethod": "opencv" }, "factory": "mxpi_imagedecoder", "next": "mxpi_imageresize0" }, "mxpi_imageresize0": { ##图像缩放（OpenCV方式） "props": { "handleMethod": "opencv", "resizeHeight": "32", "resizeWidth": "100", "resizeType": "Resizer_Stretch" }, "factory": "mxpi_imageresize", "next": "mxpi_tensorinfer0" }, "mxpi_tensorinfer0": { ##模型推理 "props": { "dataSource": "mxpi_imageresize0", "modelPath": "data/models/crnn/crnn.om", ##模型路径 "waitingTime": "2000", "outputDeviceId": "-1" }, "factory": "mxpi_tensorinfer", "next": "mxpi_classpostprocessor0" }, "mxpi_classpostprocessor0": { ##模型后处理 "props": { "dataSource": "mxpi_tensorinfer0", "postProcessConfigPath": "data/models/crnn/crnn.cfg", "labelPath": "data/models/crnn/crnn-label.names", "postProcessLibPath": "libcrnnpostprocess.so" }, "factory": "mxpi_textgenerationpostprocessor", "next": "mxpi_dataserialize0" }, "mxpi_dataserialize0": { ##数据序列化 "props": { "outputDataKeys": "mxpi_classpostprocessor0" }, "factory": "mxpi_dataserialize", "next": "appsink0" }, "appsrc0": { "props": { "blocksize": "409600" }, "factory": "appsrc", "next": "mxpi_imagedecoder0" }, "appsink0": { ##输出推理结果 "props": { "blocksize": "4096000" }, "factory": "appsink" } } }3、C++源码详解int main(int argc, char* argv[]) { // 读取pipeline配置文件 std::string pipelineConfigPath = "data/pipeline/Sample.pipeline"; std::string pipelineConfig = ReadPipelineConfig(pipelineConfigPath); if (pipelineConfig == "") { LogError << "Read pipeline failed."; return APP_ERR_COMM_INIT_FAIL; } // 初始化 Stream manager 资源 MxStream::MxStreamManager mxStreamManager; APP_ERROR ret = mxStreamManager.InitManager(); if (ret != APP_ERR_OK) { LogError << GetError(ret) << "Failed to init Stream manager."; return ret; } // 根据指定的pipeline配置创建Stream ret = mxStreamManager.CreateMultipleStreams(pipelineConfig); if (ret != APP_ERR_OK) { LogError << GetError(ret) << "Failed to create Stream."; return ret; } // 读取测试图片 MxStream::MxstDataInput dataBuffer; ret = ReadFile("data/test.jpg", dataBuffer); if (ret != APP_ERR_OK) { LogError << GetError(ret) << "Failed to read image file."; return ret; } std::string streamName = "classification"; int inPluginId = 0; // 发送测试图片到Stream进行推理 ret = mxStreamManager.SendData(streamName, inPluginId, dataBuffer); if (ret != APP_ERR_OK) { LogError << GetError(ret) << "Failed to send data to stream."; delete dataBuffer.dataPtr; dataBuffer.dataPtr = nullptr; return ret; } // 获取推理结果 MxStream::MxstDataOutput* output = mxStreamManager.GetResult(streamName, inPluginId); if (output == nullptr) { LogError << "Failed to get pipeline output."; delete dataBuffer.dataPtr; dataBuffer.dataPtr = nullptr; return ret; } // 打印推理结果 std::string result = std::string((char *)output->dataPtr, output->dataSize); LogInfo << "Results:" << result; // 销毁Stream mxStreamManager.DestroyAllStreams(); delete dataBuffer.dataPtr; dataBuffer.dataPtr = nullptr; delete output; return 0; }4、Python源码详解if __name__ == '__main__': # 初始化 Stream manager 资源 streamManagerApi = StreamManagerApi() ret = streamManagerApi.InitManager() if ret != 0: print("Failed to init Stream manager, ret=%s" % str(ret)) exit() # 根据指定的pipeline配置创建Stream with open("data/pipeline/Sample.pipeline", 'rb') as f: pipelineStr = f.read() ret = streamManagerApi.CreateMultipleStreams(pipelineStr) if ret != 0: print("Failed to create Stream, ret=%s" % str(ret)) exit() # 读取测试图片 dataInput = MxDataInput() with open("data/test.jpg", 'rb') as f: dataInput.data = f.read() # 发送测试图片到Stream进行推理 streamName = b'classification' inPluginId = 0 uniqueId = streamManagerApi.SendDataWithUniqueId(streamName, inPluginId, dataInput) if uniqueId < 0: print("Failed to send data to stream.") exit() # 获取推理结果 inferResult = streamManagerApi.GetResultWithUniqueId(streamName, uniqueId, 3000) if inferResult.errorCode != 0: print("GetResultWithUniqueId error. errorCode=%d, errorMsg=%s" % ( inferResult.errorCode, inferResult.data.decode())) exit() # 打印推理结果 print(inferResult.data.decode()) # 销毁Stream streamManagerApi.DestroyAllStreams()

frankling 发表于2021-09-06 19:48:56 2021-09-06 19:48:56 最后回复 frankling 0
5264 0

pytorch OCR API/SDK
[其他] 分享计算机视觉项目---用于场景文本检测的开源计算机视觉项目

在任何给定的场景中检测给定的场景是另外的一个非常有趣的问题。场景文字就是出现在户外拍摄的图像中出现的字符。例如，道路上的车牌号，道路上的公告牌等等。场景图像中的文字在形状，字体，颜色和位置上都是变化的。由于光照和聚焦的不均匀性，使得场景文本识别的复杂度进一步增加。下边这些流行的数据集将会丰富你分析场景文字检测的技能：SVHN街景门牌号码（SVHN）数据集是其中最受欢迎的开源数据集之一。它已用于Google创建的神经网络中，以读取门牌号并将其与地理位置匹配。这是一个很好的基准数据集，可用于练习，学习和训练可准确识别街道编号的模型。此数据集包含从Google街景视图中获取的超过60万张带标签的真实房门图像。SceneText数据集场景文本数据集包含在不同环境中捕获的3000张图像，包括在不同光照条件下的室外和室内场景。图像是通过使用高分辨率数码相机或低分辨率移动电话相机捕获的。此外，所有图像均已调整为640×480。此外，场景文本检测是一个两步过程，包括图像中的文本检测和文本识别。对于文本检测，我发现了最先进的深度学习方法EAST。它可以找到水平和旋转边界框。您可以将其与任何文本识别方法结合使用。

初学者7000 发表于2021-08-28 20:24:27 2021-08-28 20:24:27 最后回复运气男孩 2021-08-31 23:49:39
934 2

OCR
[问题求助] 【文字识别OCR】【使用Android SDK】参照OCR Android SDK开发工具包无法调用识别服务

【功能模块】【文字识别OCR】【使用Android SDK】参照OCR Android SDK开发工具包无法调用识别服务【操作步骤&问题现象】1、参照OCR Android SDK开发工具包中的HWOcrClientAKSK类，调用requestOcrAkskService方法的85行（okhttp3.Request signedRequest = Client.signOkhttp(request);）报错，报错信息无法捕捉；2、AK、SK检查过都争取，region为：cn-south-1，uri为：/v2/0bb8d5f7ee0025752f9cc016a427a44a/ocr/web-image【截图信息】【日志信息】（可选，上传日志内容或者附件）

态度决定高度 发表于2021-08-17 12:00:18 2021-08-17 12:00:18 最后回复 iMaster NAIE官方 2021-08-17 14:14:08
3265 3

OCR Android API/SDK
[问题求助] 有没有OCR体验页面

如题，有没有界面可以直接上传图片可以出识别结果

sabrinalx 发表于2021-08-05 16:09:49 2021-08-05 16:09:49 最后回复 llu 2021-08-05 17:12:18
3896 1

OCR
[问题求助] 【ocr产品】【身份证识别功能】遮挡状态下识别率不高

【功能模块】【操作步骤&问题现象】1、如果身份证被遮挡了头像，那么生日的识别都会受到影响，这个是必现的问题2、【截图信息】【日志信息】（可选，上传日志内容或者附件）

小蛇丸 发表于2021-07-12 09:18:18 2021-07-12 09:18:18 最后回复 llu 2021-07-13 11:55:53
5024 3

OCR
[其他] 分享ModelArts Pro 文字识别套件，三分钟快速定制OCR服务

ModelArts Pro 是为企业级AI应用打造的专业开发套件。基于华为云的先进算法和快速训练能力，提供预置工作流和模型，提升企业AI应用的开发效率，降低开发难度。ModelArts Pro提供了文字识别套件，基于丰富的文字识别算法和行业知识积累，帮助客户快速构建满足不同业务场景需求的文字识别服务。三分钟即可快速定制OCR服务，实现多种版式图像的文字信息结构化提取。接下来就是见证奇迹的时刻~预置工作流文字识别套件当前提供了单模板工作流和多模板工作流，自主构建文字识别模板，识别模板图片中的文字，提供高精度的文字识别模型，保证结构化信息提取精度。通用单模板工作流通过构建文字识别模板，识别单个板式图片中的文字，提供高精度的文字识别模型，保证结构化信息提取精度。多模板分类工作流支持用户自定义多个文字识别模板，通过模型训练，自动识别图片所需使用的模板，从而支持从大量不同板式图像中提取结构化信息。通常适用于物流行业。更多详情请见产品介绍>文字识别套件。特色优势领先的AI开发平台底层依托ModelArts提供的领先的算法技术，保证AI应用开发的高效和推理结果的准确，同时减少人力投入。简单的流程式开发无需人工智能专业知识，用户可借助预置的行业工作流，全流程可视化完成完成AI应用开发以及持续迭代。高效的行业算法领先人工智能技术结合行业专家经验，构建出优质高效的行业预置算法，行业AI应用开发者仅需少量标注数据，就能获得高精度的AI应用。支持复杂场景旋转、褶皱等不利的图片质量下，能做到高精度的有效识别。5步上手文字识别套件第一步：开通套件目前ModelArts Pro 文字识别套件处于公测阶段，首次使用文字识别套件需要开通公测权限。登录ModelArts Pro控制台，选择行业套件卡片并单击“申请公测”，在申请公测页面根据界面提示填写所需信息。申请公测操作完成后，单击“前往我的公测”，进入“我的公测”页面。当“审批状态”显示为“审批通过”时，表示您已经获得了该行业套件的公测权限。第二步：委托授权在您使用ModelArts Pro过程中，ModelArts Pro需要进行委托授权，用于访问ModelArts服务的云资源。如果没有授权，相关功能将不能正常使用。如果未获得ModelArts委托授权和访问秘钥（AK/SK）授权，当进入ModelArts Pro控制台的行业套件时，会弹出“访问授权”对话框。在弹出的“访问授权”对话框填写授权信息，然后单击“同意授权”，完成访问授权的配置。“用户名”为当前需要授权的用户名，保持默认值。“委托”选择“modelarts_agency”。勾选“我已经详细阅读并同意《ModelArts服务声明》”。详情请见配置访问权限。第三步：创建应用根据您的行业和应用场景，选择匹配的工作流，创建您的应用。1、在ModelArts Pro控制台界面，单击“文字识别”套件卡片的“进入套件”。进入文字识别套件控制台。2、在左侧导航栏选择“应用开发>工作台”。默认进入“我的应用”页签。3、在“我的应用”页签下，单击“新建应用”。进入“新建应用”页面。您也可以单击“我的工作流”，切换至“我的工作流”页签，选择工作流并单击卡片中的“新建应用”。4、根据业务需求填写“应用名称”、“应用负责人”和“应用描述”，选择“所属行业”及工作流。5、确认信息后，单击“确定”。成功新建应用。详情请见新建应用。第四步：开发并上线应用根据流程指引完成工作流，并将应用发布上线。通用单模板工作流：详情请见通用单模板工作流。多模板分类工作流：详情请见多模板分类工作流。第五步：迭代优化维护应用，不断优化迭代。物流+ModelArts Pro 文字识别套件物流企业源自全球各地的单据板式数以万计，物流参与各方需要耗费人力执行大量的纸质单证信息的手工录入等操作。传统方式开发文字识别需要7天，使用ModelArts Pro 文字识别套件的预置工作流完成新版式票证结构提取接口开发仅需3分钟。还等什么，赶快来大展身手吧！转自【云小课】EI第15课 ModelArts Pro 文字识别套件，三分钟快速定制OCR服务-云社区-华为云 (huaweicloud.com)

初学者7000 发表于2021-06-30 23:04:50 2021-06-30 23:04:50 最后回复黄生 2021-07-01 10:06:31
538 1

AI开发平台ModelArts OCR
[问题求助] 想了解一下OCR服务的计费标准是什么，返回什么值是计费的？

想了解一下OCR服务的计费标准是什么，返回什么值是计费的？

sabrinalx 发表于2021-06-29 16:04:06 2021-06-29 16:04:06 最后回复 llu 2021-06-29 16:08:48
4489 1

OCR
[热门活动] 华为云AI论文精读会2021第八期：探讨文字识别中的语言模型

2021年6月24日举办了华为云AI论文精读会2021第八期：探讨文字识别中的语言模型嘉宾是中国科学技术大学信息与通信技术博士---王裕鑫博士本次论文精读的领域是CV领域，感兴趣的小伙伴一定不要错过呦！华为云AI论文精读会致力于让更多人低门槛使用经典算法，助力AI开发者基于ModelArts，实现高效率论文复现和挑战！观看地址：https://res-static.hc-cdn.cn/cloudbu-site/china/zh-cn/competition/1624673202271037396.mp4华为云AI论文精读会2021·论文算法实战赛报名地址：https://competition.huaweicloud.com/information/1000041393/introduction

Euuufe 发表于2021-06-26 18:26:19 2021-06-26 18:26:19 最后回复 Euuufe 2021-06-26 18:26:19
3737 0

OCR 人工智能
[其他] 文字识别应用领域

文字识别可应用于许多领域，如阅读、翻译、文献资料的检索、信件和包裹的分拣、稿件的编辑和校对、大量统计报表和卡片的汇总与分析、银行支票的处理、商品发票的统计汇总、商品编码的识别、商品仓库的管理，以及水、电、煤气、房租、人身保险等费用的征收业务中的大量信用卡片的自动处理和办公室打字员工作的局部自动化等。以及文档检索，各类证件识别，方便用户快速录入信息，提高各行各业的工作效率。

小耳东 发表于2021-06-06 11:20:05 2021-06-06 11:20:05 最后回复小耳东 2021-06-06 11:20:05
4629 0

OCR
[其他] 文字识别分为哪些部分？

文字识别：一般包括文字信息的采集、信息的分析与处理、信息的分类判别等几个部分。信息采集将纸面上的文字灰度变换成电信号，输入到计算机中去。信息采集由文字识别机中的送纸机构和光电变换装置来实现，有飞点扫描、摄像机、光敏元件和激光扫描等光电变换装置。信息分析和处理对变换后的电信号消除各种由于印刷质量、纸质（均匀性、污点等）或书写工具等因素所造成的噪音和干扰，进行大小、偏转、浓淡、粗细等各种正规化处理。信息的分类判别对去掉噪声并正规化后的文字信息进行分类判别，以输出识别结果。

小耳东 发表于2021-06-06 11:18:46 2021-06-06 11:18:46 最后回复小耳东 2021-06-06 11:18:46
4526 0

OCR
[其他] 何为文字识别？

利用计算机自动识别字符的技术，是模式识别应用的一个重要领域。人们在生产和生活中，要处理大量的文字、报表和文本。为了减轻人们的劳动，提高处理效率，50年代开始探讨一般文字识别方法，并研制出光学字符识别器。60年代出现了采用磁性墨水和特殊字体的实用机器。60年代后期，出现了多种字体和手写体文字识别机，其识别精度和机器性能都基本上能满足要求。如用于信函分拣的手写体数字识别机和印刷体英文数字识别机。70年代主要研究文字识别的基本理论和研制高性能的文字识别机，并着重于汉字识别的研究。

小耳东 发表于2021-06-06 11:16:56 2021-06-06 11:16:56 最后回复小耳东 2021-06-06 11:16:56
4110 0

OCR

上滑加载中

推荐直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript