• [技术干货] DocSDK 在“通用文档全文检索系统”中的作用
      九云图DocSDK智能文档格式转换系统(九云图DocSDK Server,www.docsdk.com ),是一个服务器软件,提供了开发接口(API),能够解决各类文档格式转换问题。用户通过部署该产品,可以在软件产品中,快速实现涉及文档格式转换的相关功能,提高研发效率。下面是一个“通用文档全文检索系统”产品技术方案架构示意图:  该方案部署了九云图DocSDK Server,用来支持非结构化文档。主要作用如下:1. 格式解析。对所支持的Office/WPS/ODF/CAD/PDF等各类文档进行格式解析,将文档的非结构化信息解析成结构化的 JSON 格式,用于建立索引;2. 版面重建。一些绝对定位的文档中,缺少准确的段落描述,比如有的文档的豆腐块版式,文本PDF,文字是以零散方式描述的位置信息。这种方式预览阅读时没有问题,视觉效果上具有段落区分。但程序在进行全文检索时,就会出现错漏情况。九云图DocSDK通过智能算法,根据文字位置、字体、内容的相关信息,准确划分段落,实现版面重建;3. 表格识别。表格里的信息天然具备结构化特征,很多情况检索时需要利用这类特征。但有些文档表面看起来是表格,实际并没有行列关系的描述,这时就需要通过表格识别算法,将行列关系还原出来;4. 在线展现。检索结果需要在线展现,九云图DocSDK对各类文档提供了三种在线展现形式,图片、传统HTML和HTML5。图片方式通用性好,但缩放时存在不清晰现象。传统HTML可以支持交互,能实现内容标注、编辑等需求。但由于描述能力限制,展现复杂格式存在不完全兼容的情况。HTML5兼容性好,通过嵌入字库子集,在移动端缺少字库的情况下,也能准确展现出各种字体效果。九云图DocSDK系统运行需求是4核32G,最大支持500M文档,每秒钟能处理5~10页内容。采用多线程技术,可同时处理20个文档,超过20个时自动排队。对于高并发场景,可部署集群,集群方案采用MongoDB做中间件,支持负载均衡。
  • [应用推荐] DocSDK 在“通用文档全文检索系统”中的作用
      九云图DocSDK智能文档格式转换系统(九云图DocSDK Server,www.docsdk.com ),是一个服务器软件,提供了开发接口(API),能够解决各类文档格式转换问题。用户通过部署该产品,可以在软件产品中,快速实现涉及文档格式转换的相关功能,提高研发效率。下面是一个“通用文档全文检索系统”产品技术方案架构示意图:  该方案部署了九云图DocSDK Server,用来支持非结构化文档。主要作用如下:1. 格式解析。对所支持的Office/WPS/ODF/CAD/PDF等各类文档进行格式解析,将文档的非结构化信息解析成结构化的JSON格式,用于建立索引;2. 版面重建。一些绝对定位的文档中,缺少准确的段落描述,比如有的PDF,文字是以零散方式描述的位置信息。这种方式预览阅读时没有问题,视觉效果上具有段落区分。但程序在进行全文检索时,就会出现错漏情况。九云图DocSDK通过智能算法,根据文字位置、字体、内容的相关信息,准确划分段落,实现版面重建;3. 表格识别。表格里的信息天然具备结构化特征,很多情况检索时需要利用这类特征。但有些文档表面看起来是表格,实际并没有行列关系的描述,这时就需要通过表格识别算法,将行列关系还原出来;4. 在线展现。检索结果需要在线展现,九云图DocSDK对各类文档提供了三种在线展现形式,图片、传统HTML和HTML5。图片方式通用性好,但缩放时存在不清晰现象。传统HTML可以支持交互,能实现内容标注、编辑等需求。但由于描述能力限制,展现复杂格式存在不完全兼容的情况。HTML5兼容性好,通过嵌入字库子集,在移动端缺少字库的情况下,也能准确展现出各种字体效果。九云图DocSDK系统运行需求是4核32G,最大支持500M文档,每秒钟能处理5~10页内容。采用多线程技术,可同时处理20个文档,超过20个时自动排队。对于高并发场景,可部署集群,集群方案采用MongoDB做中间件,支持负载均衡。
  • [大赛资讯] 2022华为软件精英挑战赛SDK使用说明
    3月17日发布初赛相关材料如下:※  2022华为软件精英挑战赛SDK使用说明
  • [区域初赛赛题问题] SDK_C++里的CMakeLists是用来做什么的呀?
    【功能模块】【操作步骤&问题现象】1、2、【截图信息】【日志信息】(可选,上传日志内容或者附件)
  • [区域初赛赛题问题] 请问data和output本地测试时两个目录相对于SDK应该放到那里了
  • [区域初赛赛题问题] SDK_Python中的build_and_run.sh问题
    请问build_and_run.sh中最后一个命令调用的是python而不是python3,是用的python2进行解释运行的吗?在本机Linux下运行测试使用python3上没问题。提交到平台上就有“选手程序运行错误”的提示。
  • [区域初赛赛题问题]  SDK 说明文档在哪里下载?
    RT
  • [问题求助] 【ABC平台】【GIS功能】ABC平台如何更新伟岸纵横的SDK程序包
    【功能模块】ABC平台GIS地图【操作步骤&问题现象】伟岸纵横因为解决BUG修改了SDK包,现在需要将ABC平台上原有的包进行更新,不知道怎么操作,需要指导。【截图信息】【日志信息】(可选,上传日志内容或者附件)
  • [互动交流] 使用Java SDK上传图片后,在浏览器通过URL下载该对象时如何展示图片而不是下载
    使用Java SDK上传一个对象,如 ```java ObsClient obsClient = xxx; String bucket = "xxx", key = "yyy"; InputStream inputStream = new FileInputStream("xxx.jpg"); PutObjectResult result = obsClient.putObject(bucketName, key, inputStream); ``` 其中result中可以获得该对象的url,通过浏览器访问url,并不会直接显示,而是下载 看到有一个帖子,想像该地址一样,可以在浏览器直接展示图片 [https://hot-image-1.obs.cn-east-3.myhuaweicloud.com/huawei/full/0fa336004bff33b6443b79f3feebf751734992f6.jpg](https://hot-image-1.obs.cn-east-3.myhuaweicloud.com/huawei/full/0fa336004bff33b6443b79f3feebf751734992f6.jpg) 对比后发现我这里的响应多了一个`Content-Disposition: attachement`,这个就是下载,我想把这个响应头属性去掉,但是不知道如何弄 ![image.png](https://bbs-img.huaweicloud.com/data/forums/attachment/forum/20223/11/1646970936185738004.png) 也尝试在上传对象的时候或上传后重新设置元属性,比如以下方式 ```java ObjectMetadata metadata = new ObjectMetadata(); metadata.setContentType("image/jpeg"); // 设置ContentType为jpeg metadata.setContentDisposition("inline"); // 设置ContentDispositon不为attachement,防止下载 PutObjectResult result = obsClient.putObject(bucketName, key, inputStream); ``` 后台看确实设置成功了 ![image.png](https://bbs-img.huaweicloud.com/data/forums/attachment/forum/20223/11/1646970767240211307.png) 但是通过链接访问还是下载,请问如何让该图片直接在浏览器中直接展示呢 ---- ---- 下午补充:貌似现在不支持在线预览了?[华为云对象存储服务OBS禁止通过OBS的默认域名(桶访问域名或静态网站访问域名)在线预览桶内对象](https://support.huaweicloud.com/obs_faq/obs_03_0087.html#obs_03_0087__section178821448171714)。但是为什么上边那个可以预览呢,是因为他是规定颁布之前上传的吗
  • [技术干货] AppCube与2D/3D伟岸纵横标准版/高级版对接
    AppEngine与伟岸纵横地图对接需要配置相关的系统参数。对接方法登录AppEngine开发环境。依次选择“管理 > 应用管理> BO配置”,单击“GIS”,进入GIS BO配置界面。单击“GIS系统参数”菜单,配置与伟岸纵横标准版/高级版地图相关的系统参数,修改参数中的“值”属性。表1 配置参考系统参数值GIS_WazhMap_URL2D/3D伟岸纵横标准版/高级版地图服务地址。安装完GIS系统后,需要在AppEngine平台的nginx中配置GIS系统的路由信息。配置规则是AppEngine平台域名+GIS系统上下文根。如果已配置路由信息,则地图服务地址为:AppEngine地址+/iserver_wazh。如:https://.......com/iserver_wazh。GISBO_WazhAdminUserNameGIS厂商(2D/3D伟岸纵横标准版/高级版)管理员账户,安装服务器时的管理员账号。GISBO_WazhAdminPassWordGIS厂商(2D/3D伟岸纵横标准版/高级版)管理员密码,安装服务器时管理员账号的密码。GISBO_SecurityMode说明:本参数仅影响:中地标准版2D/3D地图,超图2D、伟岸标准版2D。功能为了防止SDK升级而地图服务器未升级导致的访问故障,做兼容性处理。该情况下,本参数需要配置为1。GIS服务安全模式。取值:0:GIS SDK访问地图服务的时候放到,Token放在请求Header中。1:GIS SDK访问地图服务的时候放到,Token放在请求URL中。默认为0。创建GIS系统用户、根据需要上传园区地图以及修改地图属性。
  • [互动交流] obs c sdk内网下载文件缓慢
    使用了obs c sdk的接口进行文件的下载,下载缓慢,200MB的图片集用了1000s;请问obs c sdk提供了并行的文件下载接口吗?造成下载速度慢的原因可能是什么呢?
  • [互动交流] [OBS SDK Version=3.21.12];[Endpoint=http://obs.cn-east-3.myhuawe
    [OBS SDK Version=3.21.12];[Endpoint=http://obs.cn-east-3.myhuaweicloud.com:80/];[Access Mode=Virtul Hosting]  提示 WARN;是什么原因造成的呢?
  • [容器专区] 【AR502H产品】使用eciot-ova脚本制作容器运行build_sdk_base.sh报错
    【AR502H产品】使用eciot-ova脚本制作LXC容器运行build_sdk_base.sh报错【操作步骤&问题现象】1、使用公司内网制作,已配置docker内网镜像2、报错内容Step 1/10 : FROM debian:busterGet "https://registry-1.docker.io/v2/": net/http: request canceled while waiting for connection (Client.Timeout exceeded while awaiting headers)【截图信息】【日志信息】(可选,上传日志内容或者附件)
  • [视频直播] 视频直播有加水印的sdk吗?
    直播中,客户端看到视频已经是加上水印,有啥好的解决方案
  • [互动交流] obs java sdk 可以设置之前上传文件的有效期吗?
    obs java sdk 之前上传有效期为1天,现在想修改已上传的文件为永久有效? 可以吗?