随着信息技术的飞速发展,医疗人工智能技术已经在许多疾病的诊断和治疗中发挥了重要作用,可助力提高临床诊疗的精准性与效率,快速全面提升诊断水平。然而在开展真实世界研究的过程中,面临诸多困难和挑战。血液系统疾病的临床研究离不开多维度、高质量的数据支撑,如何有效打通“数据孤岛”,完成合规数据整合是首先面临的问题。
在此背景下,中国医学科学院血液病医院构建了全院级别的血液病医疗大数据平台,以满足临床医生科研需求,为临床医生提供个性化的科研数据服务。
科研大数据平台应用探索实践
作为我国目前最大的集医疗、科研、教学、产业于一体的国家级科研型血液病专业医疗机构,中国医学科学院血液病医院(中国医学科学院血液学研究所)拥有国家血液系统疾病临床医学研究中心等六大国家级平台,开启国家重点实验室和国家临床医学研究中心“双轮驱动”新发展模式,为建设成为国内顶尖和世界一流的血液病防治、血液学研究、人才培养和成果转化的科技创新核心基地而不懈努力。
由于我国血液系统疾病诊疗体系数据多割裂在几十个甚至上百个临床系统中,导致临床数据难以被有效分析和应用。为深化血液系统疾病的基础与临床研究,提高临床研究能力,促进研究成果的临床应用及转化推广,中国医学科学院血液病医院整合医院主要系统的医疗数据,与医渡云携手搭建了血液病医疗大数据平台,建设了包括白血病、淋巴瘤、骨髓瘤、出凝血疾病、骨髓增生异常综合征、再生障碍性贫血、儿童血液病、造血干细胞移植等病种的具有中国人群特色的血液系统疾病专科库。通过高效的数据检索、筛选和导出,解决了医疗数据查询困难、标准不一、利用率低,无法复用等科研问题,满足了医生科研成长和医院临床发展的基础需求。
血液病专科库接入了HIS、LIS、EMR、PACS、病理、超声、心电图、手麻、基因、骨穿等系统,并基于病历书写结构将散落在各系统内的数据进行重组及结构化形成重点事件、患者人口学信息、就诊记录、病历信息、诊断、检查、检验、病理、治疗、医嘱、随访、细菌培养与药敏试验、MICM、造血干细胞移植、生物样本库、费用信息及临床试验等18大数据模块,并有针对性地完成专科库的迭代和更新,优化专科库的字段设计,更加符合临床实际的应用场景。
平台技术优势
在血液病临床大数据平台的基础上,中国医学科学院血液病医院还建设了专科库,并接入多个科室级别的信息系统和院外数据源,包括生物样本库、二代测序等多种数据形式,可满足各种研究需求。
平台具有以下技术优势:
(1)采用私有云数据采集和处理技术,数据始终留在院内,保障数据的安全性和隐私性。
(2)运用机器学习、自然语言处理(NLP)的技术,实现数据集成、数据标准化统一生产,并实现非结构化长文本病历转化为结构化数据。
(3)支持专病数据反向溯源,每条数据均可追溯系统原始数据,确保数据的生产透明度和标准透明度。
(4)支持数据实时采集,提供多种数据更新方案,方便临床医生及时获取结构化的患者全生命周期整合数据。
(5)数据质量监控,实时监控临床医生的诊疗行为和病历填写习惯,发现数据问题并提供解决方案。
基于医院数据的复杂性及可扩展性要求,平台采用Hadoop技术框架,Hadoop现在已成为事实上的人工智能平台非结构化数据处理的标准配置,它将为半结构化及非结构化的临床数据提供分布式数据存储资源,并为NLP(自然语言处理) 、模型算法提供分布式计算资源。
平台基于LINUX操作系统,运用虚拟化技术构建大规模Hadoop集群,自主研发运维管理平台,自动监控平台的各组件问题,为医疗数据处理提供深度调优,提高效率。平台可扩展性非常强,存储、计算、应用资源松耦合,非常方面进行扩展,灵活满足业务需求,二次开发成本低。
成果丰硕,再攀高峰
为建立数据标准,进一步促进血液系统疾病的规范化诊疗和高效科研产出,目前中国医学科学院血液病医院已出版《白血病标准数据集》、《淋巴瘤标准数据集》、《骨髓瘤标准数据集》、《骨髓增生异常综合征标准数据集》、《再生障碍性贫血标准数据集》、《血栓与止血标准数据集》等6本标准数据集。通过建立规范统一的血液系统疾病标准数据集,解决数据标准化的问题,实现医疗的数字化、智慧化,实现高效率的医疗资源共享、跨区域医疗、跨系统医疗,有利于各医院在血液系统疾病数据结构和标准化方面实现统一与互通,助力高效疾病诊疗和医学科研开展。
此外,医院还建立了白血病、淋巴瘤、多发性骨髓瘤等多个疾病的大型队列,产出了系列科研成果,发表在NEJM、Blood、Leukemia、Blood Advances、Nature computational science等专业领域高水平期刊。
同时,医院不断深化国家中心任务落实,建成了辐射全国的145家专科网络联盟,其中28家首批协同分中心共同组建多中心数据平台,并已着手搭建国内一流、国际领先的涵盖血液病患者临床资料、随访数据、生物样本等信息的双向队列研究数据库。
总结
中国医学科学院血液病医院不断致力于深化血液系统疾病的基础与临床研究,提高临床研究能力,促进研究成果的临床应用及转化推广,建立高质量的大数据基础数据治理平台及专科库,为推动智能医疗、科研、教学、管理等方面打下了坚实的基础,也为未来国家血液系统疾病临床医学研究中心的数据采集和临床研究提供精确的数据整合平台,从而快速推动真实世界的临床研究。