pangukitsappdev.doc_split package¶
Submodules¶
pangukitsappdev.doc_split.pangu_split module¶
- class pangukitsappdev.doc_split.pangu_split.DocPanguSplit(split_config: SplitConfig)¶
-
- get_task_result(task_id, headers)¶
- submit_task(headers, mode=0) str ¶
提交文档解析任务 :param headers: 鉴权信息 :param mode: 段落拆分模式,默认为0 0 - 返回文档的原始段落,不做其他处理 1 - 根据标注的书签或目录分段,一般适合有层级标签的word文档 2 - 根据内容里的章节条分段,适合制度类文档 3 - 根据长度分段,默认按照500字拆分,会尽量保留完整句子 :return:
- pangukitsappdev.doc_split.pangu_split.extract_actions(result)¶