发布时间:2025-11-25
其中,临床数据脱敏是数据合规的关键前提,也是备案材料审核的重点环节。
数据类别 | 原始字段 | 脱敏规则 | 脱敏后示例 | 适用场景 |
患者标识信息 | 姓名 | 拼音首字母 + 随机 3 位数字(去标识化);或直接替换为 “患者 XXX”(匿名化) | LXY632 / 患者 089 | 模型训练、案例展示 |
身份证号 | 保留前 6 位(行政区划码)+ 后 4 位,中间 10 位用 “*” 屏蔽 | 110105********3672 | 医保关联、数据溯源(去标识化) | |
手机号 | 保留前 3 位 + 后 4 位,中间 4 位用 “*” 屏蔽 | 138****5678 | 联系信息脱敏 | |
病历号 / 就诊卡号 | 原始编号 + 随机前缀(如 “MED-”),或替换为纯随机字符串 | MED-892736 / XQZ928371 | 数据存储、模型推理 | |
诊疗核心数据 | 诊断结果 | 疾病名称泛化处理(避免具体亚型泄露),编码保留国标码 | 原发性高血压(I10)→ 高血压(I10) | 训练数据、统计分析 |
医嘱内容 | 去除患者标识信息,药品名称保留通用名,剂量 / 用法保留规范表述 | “患者 089 口服氨氯地平片 5mg qd” | 模型推理、临床辅助决策 | |
手术记录 | 隐去术者姓名、手术室编号,保留手术名称、术式国标编码 | “腹腔镜胆囊切除术(ICD-9-CM 51.23)” | 手术相关模型训练 | |
检验 / 检查数据 | 检验报告单编号 | 原始编号 + 机构缩写,中间插入随机字符 | HOS-LAB-7291XZ3 | 检验数据关联分析 |
影像数据(DICOM) | 去除 DICOM 标签中的患者姓名、身份证号、住院号,保留设备信息、影像参数 | 设备:GE Revolution / 患者 ID:匿名 037 | 影像分析模型训练 | |
敏感关联信息 | 家庭住址 | 保留到地级市,去除区县及详细地址 | 北京市 朝阳区 → 北京市 | 非地理关联类模型训练 |
联系方式 | 仅保留 “是否有紧急联系人” 标识,隐去具体号码 | 有紧急联系人:是 | 基础信息统计 |