pangukitsappdev.doc_split package

Submodules

pangukitsappdev.doc_split.pangu_split module

class pangukitsappdev.doc_split.pangu_split.DocPanguSplit(split_config: SplitConfig)

基类:AbstractLoaderApi

get_task_result(task_id, headers)
load() List[Document]

实现类方法 :return: 解析分割后的document列表

submit_task(headers, mode=0) str

提交文档解析任务 :param headers: 鉴权信息 :param mode: 段落拆分模式,默认为0 0 - 返回文档的原始段落,不做其他处理 1 - 根据标注的书签或目录分段,一般适合有层级标签的word文档 2 - 根据内容里的章节条分段,适合制度类文档 3 - 根据长度分段,默认按照500字拆分,会尽量保留完整句子 :return:

pangukitsappdev.doc_split.pangu_split.extract_actions(result)

Module contents