医疗信息分类:医疗大数据安全管控分类指南

一、 健康医疗大数据来源

  • 1.     医院医疗大数据

  • 医院医疗大数据产生于医院常规临床诊治、科研和管理过程,包括各种门急诊记、住院记录、影像记录、实验室记录、用药记录、手术记录、随访记录和医保数据等,包括但不限于HIS,LIS,PACS等系统提供的数据。

    医疗数据的复杂性在于:一方面包含了大量的医学专业用语,仅疾病名称就有万多种,另外还有数以万计的诊断、手术和药物名称,以及大量影像、医嘱等非结构化数据。另一方面,由于医疗数据是不同临床诊疗服务过程中的产物,所以数据之间关系复杂,并且也很容易会受到各种因素的影响,致使某些数据带有偏倚性。一般来说,医院之间在很多方面是会有差别的,如病人的个体特征和疾病程度、医院的诊断和治疗水平、医疗数据的记录和编码水平等。另外,除了包含病人隐私信息,医疗数据也包含了大量关于医院运转、诊疗方法、药物疗效等信息。这些信息一般都很敏感,某些可能会涉及商业利益。

  • 2.     区域卫生服务平台大数据

  • 区域协同背景下的大数据是重要的健康医疗大数据之一,也是未来健康医疗大数据的发展方向。一方面,区域协同通过健康医疗服务平台汇聚整合了区域内很多家医院和相关医疗机构的健康医疗数据,致使数据量大幅度增加。另一方面,由于平台数据收集事先都经过充分的科学论证和规划,所以会比单独医院数据更为规范。

  • 3.     基于大量人群的医学研究或疾病监测大数据

  • 院校、科研院所、疾控中心等单位提供的数据。一些健康医疗大数据来自于专门设计的基于大量人群的医院研究和疾病监测。专项设计的大数据还包括各种全国性抽样调查和疾病监测数据,

  • 4.     生物信息大数据

  • 生物信息大数据是一类比较特殊的健康医疗大数据。这类数据具有很强的生物专业性。主要是关于生物标本和基因测序的信息。虽然在信息内容表达方式上,生物信息大数据与常见的大数据不大相同,但他直接来源于人体生物标本,并且关系到临床的个性化诊疗和精准医疗。

  • 5.     自我量化大数据

  • 基于移动物联网的个人身体体征和活动的自我量化数据是一种新型的医疗健康大数据。自我量化数所包含的福、心跳、糖、呼吸、睡眠、体育锻炼等信息,除了有利于帮助及时了解自身健康状况,经过一定时期累积在医学上会变得很有用,既有助于识别疾病病因或防控疾病,也有助于个性化临床诊疗,从而塑造一种全新的医疗或健康管理模式。

  • 6.     网络大数据

  • 网络大数据产生于社交互联网关于疾病、健康或寻医的话题、互联网上的搜寻内容和购药行为、健康网站访问行为等等。网络大数据杂乱无章,同一主题的数据既可来自于同一网站众多不同的网络用户,也可来自不同的网站,而且有时又会包含大量音视频、图片、文本等异构性数据。与自我量化等数据相比较,网络大数据是被动性存在,随机性很大,数据中蕴含的信息缺乏稳定性。由于信息噪声很高,缺乏医学专业规律,所以绝大部分数据都不会有医学价值。即使少部分可被用于分析,但也必须要进行深入了解。

  • 7.     用户自生成大数据

  • 用户自生成大数据主要指由大数据平台提供存储或计算服务的用户,自己生成和独享使用的数据。

    二、 数据类型

    按照数据内容类型分为以下四大类型:

  • 1.     诊疗数据

  • 来自患者在医院诊所就医过程中产生的数据,主要的采集端口是医疗机构,如医院。其包括电子病历、传统检测项目结果(生化、免疫、PCR等)、新兴检测项目结果(基因测序等)、医生用药选择、诊疗路径记录等。增长快速,特别是新兴检测数据,如基因检测数据。

    诊疗数据数据量较大,但数据完整性、结构化、和标准化有待提高。其细分可分为病历类,传统检测类和新型检测类。病历类有病史、诊断结果、用药等信息。传统检测可包括影响、生化、免疫、PCR等。新兴检测有基因测序等。该部分的数据主要来源于医院、诊所,检测机构、科研机构等。

  • 2.     研发数据

  • 主要来自器械医药研发企业、研发外包公司、科研机构等研发过程中产生的数据,主要的数据来源如:(1)医药研发过程如医院临床试验;(2)科研机构最新科研进展。

    研发数据特点为:完成性、结构化、标准化都比较理想,数据可细分为医药研发数据,包括临床前、1-3期临床、4期临床、上市后大量人群中进行疗效跟踪获得的临床数据,以及科研数据。该数据的主要来源为医药器械研发公司。

  • 3.     患者数据

  • 患者自身的、在院外的行为和感官产生的数据,主要采集终端是可穿戴设备和各类网上轻医疗平台,包括(1)通过可穿戴设备收集的体征类的健康管理数据;(2)网络行为数据,例如挂号问诊、网络购药、健康管理、医患病友交流等。

    患者数据主要为可穿戴设备和智能手机中得到的数据,大部分为体征类的健康管理数据。

  • 4.     支付&医保数据

  • 一切与付费方相关的审核/报销记录,主要包括患者支付记录、报销记录、医药流通记录等。

    支付数据主要为患者的支付记录,报销赔付记录,医疗机构、流通厂商医药支付记录,主要来源有医疗机构,药店,互联网医疗公司医院,社保部门等。

    三、数据分类表

    根据以上背景,基于医学电子数据分级分类标准,将医学数据分类存储,分级设置权限,在不丢失数据信息基础的同时,保证了数据安全。另外,根据数据的分级制定数据加密存储规则,根据数据敏感度,进行数据分级加密。

    数据分级应依据以下原则。各级界限明确原则:数据分级是按照数据敏感程度进行划分;就高不就低原则:如果同一批数据中各属性或字段的分级不同,需要按照定级最高的属性或字段的级别一并实施安全管控。

    表 3‑1数据分类表

    类别

    子类及范围

    (A类)个体身份相关数据

    (A1)个体身份和标识信息:(A1-1)个体身份标识、(A1-2)网络身份标识、(A1-3)个体基本资料、(A1-4)实体身份证明、(A1-5) 个体私密资料

    (B类)个体诊疗数据

    (B1)病历类:(B1-1)用户疾病史、(B1-2)诊断结果、(B1-3)用药信息、(B1-4)医生建议

    (B2)传统检测类:(B2-1)影像检测记录、(B2-2)生化检查记录、(B2-3)免疫、(B2-4)PCR检查

    (B3)新型检测类:(B3-1)基因测序结果、(B3-2)医生用药选择、(B3-3)诊疗路径记录

    (C类)支付数据

    (C1)支付信息:(C1-1)用户支付记录、(C1-2)医疗机构、流通厂商医药支付记录

    (C2)医保信息:(C2-1)报销记录、(C2-2)报销赔付记录、(C2-3)医药流通记录

    (D类)个体自采数据

    (D1)智能电子设备自采数据:(D1-1):可穿戴设备自采数据、(D1-2): 智能家居设备数据

    (D2)互联网诊疗数据:(D2-1):  app医生诊疗数据

    (E类)研发数据

    (E1)医药研发数据:(E1-1):文本类医药研发数据、(E1-2): 图像类医药研发数据

    (E2)科研数据:(E2-1): 科研进展数据

    (F类)医院数据

    (F1)医院属性数据:(F1-1):医院基本属性数据、(F1-2): 医院诊室数据

    (F2)医院组织机构数据:(F2-1):医院人员数据、(F2-2):医院设备数据

    (F3)药品、设备与材料数据

    (F4)卫生管理数据

    3.3.1 个体身份相关数据(A类

    表 3‑2个体数据

    子类别

    范围

    对应数据

    A1:个体身份和标识信息

    (A1-1)个体身份标识

    个体姓名、证件类型及号码,包括身份证、军官证、护照、驾驶证、工作证、社保卡、医保卡、居住证、就诊卡等

    (A1-2)系统身份标识

    个体在大数据系统中的主索引、辅助索引组合

    (A1-3)个体基本资料

    个体联系电话、职业、工作单位、年龄、性别、籍贯、社保号等

    (A1-4)实体身份证明

    身份证、护照、驾照等证件影印件等;个人基因、指纹、声纹、虹膜、掌纹、耳廓、面部识别特征等

    (A1-5)个体私密资料

    揭示个人种族、家属信息、居住地址、宗教信仰、基因、个人健康、私人生活等有关的用户私密信息

    《征信业管理条例》等法律、行政法规规定禁止公开的用户其他信息

    3.3.2 个体健康医疗数据(B类)

    个体健康医疗数据主要来自患者在医院诊所就医过程中产生的数据,主要的采集端口是医疗机构,如医院。其包括电子病历、传统检测项目结果(生化、免疫、PCR等)、新兴检测项目结果(基因测序等)、医生用药选择、诊疗路径记录等。增长快速,特别是新兴检测数据,如基因检测数据。

    诊疗数据数据量较大,但数据完整性、结构化、和标准化有待提高。其细分可分为病历类,传统检测类和新型检测类。病历类有病史、诊断结果、用药等信息。传统检测可包括影响、生化、免疫、PCR等。新兴检测有基因测序等。该部分的数据主要来源于医院、诊所,检测机构、科研机构等。

    表 3‑3 个体健康医疗数据

    子类

    范围

    对应数据

    B1.病历类

    B1-1:用户疾病史

    自然人个人或家族以往所患疾病的历史。在医学上,可从病史可以推测及研究出某些疾病之间的因果关系或交叉影响。

    B1-2:诊断结果

    指对人体生理或精神疾病及其病理原因所作的判断。这种判断一般是由医生等专业人员根据症状、病史(包括家庭病史)、病历及医疗检查结果等资料作出。

    B1-3:用药信息

    药品名称,药品剂量,用药疗程,用药注意,药品成分,适用症状,不良反应等

    B1-4:医生建议

    注意事项等

    B2:传统检测类

    B2-1:影像检测记录

    影像诊断学、放射学、内视镜、医疗用热影像技术、医学摄影和显微镜,脑波图和脑磁造影

    B2-2:生化检查记录

    血液检查、血清学检查、各种体液的显微镜检查、生化检查、免疫学检查、微生物学检查(含致病性的病毒、衣原体、立克次体、细菌、寄生虫等)、细胞学检查、各种组织及器官的病理学检查,生理功能的检查(如脑波检查、各种神经功能检查、肌电图、心电图、听力检查等等)

    B2-3:免疫功能检查

    生物机体识别和排除抗原物质的一种保护性反应。其中包括特异性免疫(后天免疫系统)与非特异性免疫(先天免疫系统)

    B2-4:PCR检查

    分子生物学技术,用于扩增特定的DNA片段,这种方法可在生物体外进行,不必依赖大肠杆菌或酵母菌等生物体

    B3:新型检测类

    B3-1:基因测序结果

    特定DNA片段的碱基序列,也就是腺嘌呤(A)、胸腺嘧啶(T)、胞嘧啶(C)与鸟嘌呤的(G)排列方式

    B3-2:医生用药选择

    局部给药(topical)、消化道给药(enteral)、非消化道给药(parenteral)、腹腔注射、硬膜外腔注射(例如麻醉)、脊髓注射(进入脑脊液)、眼球玻璃体注射等

    B3-3:诊疗路径记录

    诊疗流程数据

    3.3.3 支付&医保数据(C类)

    一切与付费方相关的审核/报销记录,主要包括患者支付记录、报销记录、医药流通记录等。

    支付数据主要为患者的支付记录,报销赔付记录,医疗机构、流通厂商医药支付记录,主要来源有医疗机构,药店,互联网医疗公司医院,社保部门等。

    表 3‑4支付&医保数据(C类)

    子类

    范围

    对应数据

    C1.支付信息

    C1-1:用户支付记录

    一切与付费方相关的审核记录

    C1-2:医疗机构、流通厂商医药支付记录

    主要来源有医疗机构,药店,互联网医疗公司医院,社保部门

    C2:医保信息

    B2-1:报销记录

    一切与付费方相关的报销记录

    B2-2:报销赔付记录

    来自于报销的全部记录

    B2-3:医药流通记录

    主要来源有医疗机构,药店,互联网医疗公司医院

    3.3.4 用户自采数据(D类)

    用户自采数据是患者自身的、在院外的行为和感官产生的数据,主要采集终端是可穿戴设备和各类网上轻医疗平台,包括(1)通过可穿戴设备收集的体征类的健康管理数据;(2)网络行为数据,例如挂号问诊、网络购药、健康管理、医患病友交流等。患者数据主要为可穿戴设备和智能手机中得到的数据,大部分为体征类的健康管理数据。

    表 3‑5用户自采数据

    子类

    范围

    对应数据

    D1:智能电子设备自采数据

    D1-1:可穿戴设备自采数据

    来自智能可穿戴设备的自采数据,如智能血压仪,智能血糖仪,智能手表,心率测量,睡眠监测等。

    D1-2: 智能家居设备数据

    来自智能家居设备的数据,如智能体脂秤,智能空气监测仪等。

    D2:互联网诊疗数据

    D2-1: app医生诊疗数据

    来自app医生诊疗数据,例如寻医问药app,丁香园app中,医生对用户主诉病状的问答数据。

    3.3.5 研发数据(E类)

    研发数据主要来自器械医药研发企业、研发外包公司、科研机构等研发过程中产生的数据,主要的数据来源如:(1)医药研发过程如医院临床试验;(2)科研机构最新科研进展。

    研发数据特点为:完成性、结构化、标准化都比较理想,数据可细分为医药研发数据,包括临床前、1-3期临床、4期临床、上市后大量人群中进行疗效跟踪获得的临床数据,以及科研数据。该数据的主要来源为医药器械研发公司。

    表 3‑6研发数据表

    子类

    范围

    对应数据

    E1:医药研发数据

    E1-1:文本类医药研发数据

    从临床前,1-3期临床,4期临床,上市后大量人群临床实验,进行疗效跟踪的文本类数据

    E1-2: 图像类医药研发数据

    从临床前,1-3期临床,4期临床,上市后大量人群临床实验,进行疗效跟踪的图像类数据

    E2:科研数据

    E2-1: 科研进展数据

    来自科研机构的最新科研进展数据。

    3.3.6 医院数据(F类)

    医院数据包括医院的基本属性等医院相关数据。

    表 3‑7医院数据表


    子类

    范围

    对应数据

    F1:医院属性数据

    F1-1:医院基本属性数据

    医院基本属性包括:医院名称,医院等级信息。

    F1-2: 医院诊室数据

    医院诊室数据包括:医院的诊室名称和诊室信息。

    F2:医院规模数据

    F2-1:医院人员数据

    医院人员数据包括:医院各职能部门和各诊室的人员配置数据。

    F2-2:医院设备数据

    医院设备数据包括:医院的各个诊室设备名称及数量。

    F3:药品、设备与材料数据

    F3-1: 药品

    药品:药品本身的介绍、生产信息、物流信息数据等

    F3-2: 设备

    设备:设备本身的介绍、生产信息、物流信息数据等

    F3-3:材料数据

    材料数据:材料本身的介绍、生产信息、物流信息数据

    F4:卫生管理数据

    F4-1

    卫生管理数据

    免责申明:我们尊重原创,也注重分享。部分素材来源网络,版权原作者所有,如有侵犯您的权益,我们将第一时间删除。

    相关推荐

    相关文章