• [其他] 自由文本电子病历信息抽取综述
    电子病历信息抽取技术能够从自由文本电子病历中获取到有用的关键信息,从而为医院的信息管理和后续的信息分析处理工作提供帮助。简要介绍了现阶段自由文本电子病历信息抽取的主要流程,分析了近十几年来关于自由文本电子病历中命名实体、实体修饰与实体间关系三类关键信息的单独抽取以及联合抽取方法的研究成果,对这些成果所采用的主要方法、使用的数据集、最终的实验效果等进行了对比总结。除此之外,还对最新的几种流行方法的特点以及优缺点进行了分析,对目前电子病历信息抽取领域常用数据集进行了总结,分析了目前国内相关领域的现状和发展趋势。http://www.joca.cn/CN/abstract/abstract24511.shtml信息抽取是电子病历后结构化的核心步骤。后结构化是 指将以自由文本方式录入的电子病历进行结构化分析,提取 出电子病历中的非结构化信息,并将其转换为结构化信息的 过程。后结构化的分析过程往往会利用医学本体(Ontology) 的 相 关 知 识 ,使 用 自 然 语 言 处 理(Natural Language Processing,NLP)领域的先进技术,并且需要严格遵循专业医 学术语以及病历格式的相关规范。后结构化过程中的信息抽取可以帮助抽取出自由文本电 子病历中的关键信息,如疾病、检查、症状、治疗、疾病诊断分 类等。在将这些信息按照专业的医学逻辑进行组织分类之 后,最终得到的结构化信息具有非常重要的作用。一方面,结 构化的病历信息可以方便病人和医生更加直观地获取自己关 心的内容;另一方面,结构化的电子病历还有利于计算机的识 别存储,并为后续的数据挖掘、知识库和知识图谱构建及病历语义检索等信息分析处理工作奠定基础[1] 。 自由文本病历后结构化不仅仅包括信息抽取这一个阶 段,而是一个比较复杂的过程,经过相关领域多年的研究改 进,常规的电子病历后结构化流程如图1所示其中,预处理包括了对病历文本进行的各种初步处理,以 便于后续信息提取工作的开展,根据信息抽取方法和所用数 据集的不同,预处理过程可能有很大区别。模板填充是在信 息抽取完成之后的最终步骤,一般采用树状结构的结构化病 历模板,该步骤中最常使用的数据存储语言是可扩展标记语 言(eXtensible Markup Language,XML)。将信息抽取环节抽取到的结构化信息填充到病历模板中的对应位置,从而形成 最终的结构化电子病历。而介于文本划分和模板填充之间的 信息抽取环节是整个后结构化过程的核心步骤,也是近年来 相关成果的主要研究方向。 概念(医疗问题、检查、治疗等实体)的识别、医疗问题的 修饰和概念间关系的抽取是电子病历信息抽取研究的三个核 心任务。这三个核心任务均围绕医疗问题这个中心展开,分 别对应了电子病历后结构化过程中的三个关键步骤:命名实 体识别、实体修饰识别和实体关系抽取。 本文将针对自由文本电子病历信息抽取的这三个主要任 务,分析近十几年来国内外自由文本病历信息抽取领域的相 关文献成果,将其中的核心思路、方法进行总结与横向对比, 分析出其中的创新点和不足之处,进而提出接下来可能的研 究 方 向 和 发 展 趋 势 。涉 及 到 的 文 献 主 要 来 自 于 BIBM (international conference on BioInformatics and BioMedicine)和 EMNLP(conference on Empirical Methods in Natural Language Processing)等国际知名学术会议,以及 JAMIA(Journal of the American Medical Informatics Association)和 JBI(Journal of Biomedical Informatics)等著名医学信息学期刊。
  • [技术干货] 文字识别案例 - 利用OCR文字识别提高院前急救电子病历录入效率
    公司业务信息:    北京远盟健康科技有限公司为远盟康健科技有限公司子公司,成立于2015年5月6日,主要致力于紧急救援领域事业,是中国领先的智慧医疗急救平台服务提供商,同时也是绿色通道救援联盟和华人全球救援联盟(ICAA)的执行机构。北京远盟健康科技有限公司依托资源优势,在各部门的共同努力下,开发了智慧医疗急救平台,集微急救服务平台、SIRE智慧旅行救援服务平台、远盟PSAP系统(远盟全国救援黄页系统)、远盟E-Call系统(远盟车联网紧急救援服务系统)和云平台急救调度系统多功能为一体的智慧医疗急救平台。    公司目前已与全国200多个大中城市的260多家急救中心、上千家网络医院、全球211个国家和地区的救援服务网络、7*24小时专业的医护服务团队以及覆盖全国权威医院与近250位医疗专家的建立合作。北京远盟希望通过自己的力量能为中国紧急救援的健康发展提供支持和帮助,为国人的生命健康安全保障护航。    公司致力于120急救信息化建设,通过云计算、大数据、5G等技术,为120提供急救调度云平台、急救电子病历、院前院内一体化、智能车载、急救调度助手等急救全流程的信息化产品。解决的问题:      在急救车上,时间短,任务急,如何在有限的时间内获取患者病情,了解既往病史、用药史,以便给患者提供针对性救治,并能够帮助车上的医生快速的获取患者基本信息,填写电子病历,加强电子病历的规范性,解决患者唯一身份识别问题。业务场景:      在急救车上,医护人员通过在电子病历APP上面扫描患者身份证,识别出患者姓名、身份证号信息,通过患者身份证号,去查询电子健康档案,获取患者的既往病史、用药史等信息,让医生能够获取患者及时、有效的病情信息,同时获取的信息能够填充到电子病历中,提高病历的录入效率和准确性,解决了信息重复录入和信息不准确问题。使用服务:  OCR身份证文字识别服务如何解决:      电子病历APP中集成拍照功能,把拍摄的身份证图片转换为base64图片编码,调用华为云OCR身份证文字识别服务,获取姓名、身份证号,通过身份证号调用云端电子健康档案接口,获取电子健康档案信息填充到电子病历中。使用场景:    电子病历APP:识别身份证号码,获取电子健康档案信息填充到电子病历   脑卒中、胸痛管理企业号应用:识别姓名和身份证号,填充到卒中、胸痛患者的基本信息中方案截图:  使用规模:    日调用量50/次左右使用收益:    提高了现场车组人员填写病历的效率和准确率,及时获取病人档案信息,解决患者身份唯一识别问题,后续可通过身份证号跟更多的系统和业务进行huto业务扩展:   银行卡识别:用于医护平台用户信息注册   车牌号识别:通过各地120微急救公众号,为公众提供拍照辨识真假救护车服务作者: brucepeng(北京远盟研发总监)