关于华信永益
医疗信息化推动大健康行业发展新阶段
了解更多
医疗大数据方案
医疗行业大数据发展背景
随着信息技术的快速发展,国内越来越多的医疗机构正加速实施基于信息化平台的整体建设,以提高医院的服务水平与核心竞争力。 同时,为了满足人们随着生活水平不断提高而日益增长的医疗卫生需求,医疗机构也在大力推进、深化医疗服务信息化。
解决方案
在过去的30年间,我国的医疗行业经历了医改、新医改,医疗信息化也经历了从数字化、四梁八柱、35212等不同的发展阶段, 信息技术的发展使数字化医疗日趋成熟。云计算、大数据等新兴技术的推动又给医疗信息化及新医改带来了新的契机,从大数 据的角度进行分析,探讨医疗信息化的发展方向。
如何把医疗大数据转换为经济价值,“关键是怎么能够提取出与诊疗有关的数据。”医疗行 业的大数据集量大且繁杂,其中蕴含的信息价值也多样且丰富,如果能够对其进行有效的存储、处理、查询和分析,那么就可 对于小到辅助某个临床医生做出更为科学和准确的诊断和用药决策,或帮助某个医院根据患者潜在需求开发全新个性化服务及 自动服务,大到帮助相关研究机构突破医疗方法和药物革新,或支持地区甚至全国医疗行业主管部门优化医疗资源及服务配置, 提供前所未有的强力支持。
然而,如何将海量、复杂的数据的存储、处理和保护成本降至最低,同时还能对此进行实时 或准实时的处理、查询需求响应以及智能、深入的分析,推出针对医疗行业大数据设计和优化的智能管理、分析、查询及存储 平台,来替代传统关系型数据库平台,顺利帮助用户跨迈大数据应用这道门槛。
医疗行业数据分析
根据医疗数据的所属部门,通常将其分为医疗管理机构及医疗服务机构,不同机构的应用系统各不相同,其数据类型及数据量也大相径庭。分析如下:
数据来源:数据通常来源于诸如公共卫生系统(妇幼、防疫、血站等)、院内系统、及对 两种系统融合的区域卫生平台。
数据规模:由于公卫系统相对独立,其数据量相对较小,通常情况下,单一公卫系统中一年的 数据规模约为10T;院内系统的应用类型繁多,诸如CISC、PACS等均会产生大量的数据,普通三甲医院的数据规模约为几十T;区 域平台是基于EMR(个人健康档案)及EHR(个人电子病历)建立的,其数据量比上述两种系统的总和还要庞大,通常的市级区域 卫生平台的一年的数据规模约为上百T。
数据类型:根据日趋完善的国家标准,各系统产生的数据格式也日趋标准,但由于医疗的业务系 统诸多,数据类型也呈现多样化趋势。不仅仅具有病人主索引系统中的结构化数据,PACS系统中还存在Dicom、JPG的文件,手术系 统中还会有视频文件,用于病历中的XML文件也是医疗应用中重要的数据类型之一。
医疗大数据方案设计
对医疗数据的采集、存储、分析、展示是医疗大数据方案的核心立足点。下图是医疗大数据的设计模型:
该模型由大数据支撑平台及大数据应用平台构成。大数据支撑平台是医疗大数据应用的基础环境,利用大数据管理的手段对不 同的基础硬件、基础软件、开发平台从架构上进行规划,从而满足医疗行业大数据应用平台的需求。大数据应用平台则通过建 立一套信息化、标准化、智能化的决策支持应用系统,可方便医疗管理机构及医疗服务机构进行卫生管理和决策指导。医疗大 数据系统主要为医疗卫生规划指导、监督管理、资源协调、疾病防控等方面提供服务。
大数据支撑平台
大数据支撑平台包括基础设施层、数据存储层、数据处理层、应用层以及管理层。
基础设施层由专为大数据定制的服务器及网络构成的集群组成,是构建大数据应用的硬件平台。
数据源所涉及的对象包括医疗机构、社康、门诊,以及区公卫机构,医疗机构的HIS、LIS、 PACS、CIS;社康HIS、CIS、CHSS以及公卫疾控系统、传染病上传系统等数据构成总体架构最基本数据源,数据源通过医疗机构、 社康、公卫等的前置机进行采集,再通过前置机内置路由网关传输到数据平台,数据源层完成了各个分散系统的数据采集及传输。
数据存储层则基于并行数据库系统以及Hadoop发行版及标准数据库实现。用来存储从每个医疗数据源收集来的海量结构化和非结构化数据,
数据处理层对数据进行处理,其处理内容包含:数据清洗、数据校验、数据转换。处理对象包含标准数据及非标准数据,处理的 数据结构包括非结构化数据、半结构化数据及结构化数据(如非结构化数据的简单分析--过滤和统计、基于计算模型进行结构化 数据和非结构化数据的统一关联和统计处理、复杂的分析和挖掘以及复杂问题的近似模糊求解等操作)。被处理的数据最终转化 成符合医疗卫生信息化标准的卫生综合数据,标准数经过ETL后存入医疗中心数据仓库,为大数据应用做数据准备。
数据应用层为大数据应用平台提供类型丰富的访问接口,包括Search API、Pig、Hive QL以及专 为用户设计的SJDBC(类JDBC)和UDF(用户自定义函数)接口,方便用户的使用。
大数据支撑平台针对医疗行业大数据应用特点,采用多项创新的结构化与非结构化数据一体化处理、 并行处理、SQL/MapReduce统一执行引擎、分布式容错及自动故障处理、复杂数据类型关联分析、多IP通路负载均衡、处理任务断点执行、 动态扩展等技术,从服务器、网络、操作系统到软件层逐层优化,保证系统具有高性能、高可靠、易扩展、易使用等特点,同时为大数 据支撑平台设计了图形化的统一管理系统,简化用户的管理和维护工作。
大数据支撑平台
医疗大数据应用平台将医疗卫生数据中心仓库的数据经过ETL后,集中到数据集市,数据集市中的数据经过OLAP和数据挖掘分析引 擎处理后,应用于大数据的报表展现、卫生数据统计、决策分析、数据挖掘、疾病预警、预测等。通过应用系统,提供给使用者直观展示。
其应用方向可包括医疗收入、患者负担、工作负荷、工作效率、疾病监控等多个主题。各主题分析都 基于大数据技术构建,通过采集不同医疗机构业务系统数据,对各项医疗业务进行汇总统计、构成分析、对比分析、因素分析、 增量函数分析等,并通过各种图表形象、直观的表达出来,能够有效的反映医疗管理机构或服务机构的整体运营、管理等情况。 同时有利于管理层正确分析并做出有效决策,强化医卫管理,优化资源配置、控制不合理因素。
方案收益
该方案旨在建设一套信息共享化、决策智能化、管理科学化的医疗大数据应用系统。通过该系统,可以对治疗安全质量、医疗收入、 患者负担、工作负荷、工作效率、疾病监控、在线监管等多个角度进行探索。其有效地将医疗质量安全目标分解到具体监控指标, 通过管控指标的设置与分发,事中进行环节质控与监测,事后进行对标总结与PDCA持续优化改进,使医疗管理从被动型、粗放型的管理, 转向前瞻性、主动性和精细化的管理。利用医疗大数据平台可以:
辅助科学决策:充分利用区域平台采集的大量医疗和卫生数据,采用先进的BI信息分析、挖掘、视图展示等技术,进行数据多维分 析和挖掘,趋势、预测分析和规划,为各级政府部门的科学决策提供及时、准确、全面的信息支撑,同时提高对深化医疗卫生体制 改革中各项任务实施情况的动态监测和宏观的调控能力;
实时、动态监管:改变以往人工统计报表和人工填报评估系统来监管和考核的方式,帮助政府卫生主管部门更科学地、更有效地 实施规划、执行、监管等管理职能,对医疗机构进行实时和动态的监管;
医疗信息服务:为医疗科研和其他机构提供医疗卫生方面的数据分析、挖掘和信息共享服务。优秀的报表:报表数据统计查询及时、 快速,具备丰富的可视化表现形式(表,Dashborad , 仪表盘,驾驶舱,地图GIS),多维分析,可以跨系统异构;
高效可靠的性能:处理大批量数据不延迟,数据库查询快,对业务系统无影响,不会影响其他系统的使用或者瘫痪;支持多维数据 结构,具有大量数据进行分布式处理功能,同时系统能自动升级,异构跨平台。