发布时间:2026-06-08
信息来源:中关村科学城微信公众号
字体:
大
中
小
打印
发布时间:2026-06-08
信息来源:中关村科学城微信公众号
2025年底,某靶向药物面临一个关键节点:医保目录续约谈判。按照惯例,进入医保的药品在续约时往往面临降价压力。但这一次,企业提交了一份特殊的“证据”:一份基于北京定点医药机构,并严格脱敏后的真实数据分析报告。报告显示,该药物在药物经济学等方面的综合表现俱佳。最终,该款药品成功留在医保目录,并获得了科学合理的定价。
这份报告从何而来?
答案藏在位于
东升科技园东畔创新中心办公楼内的
北京市医药健康可信数据空间
数据“富矿”,如何点石成金?
相关数据显示,北京集聚了全国46%的国家临床医学研究中心,牵头国家级科研项目占比达52%,每年有超过2000万人次患者从全国各地来此就医。年复一年的诊疗中,海量的病历、处方、结算单沉淀下来,构成一座沉睡的“数据富矿”。
但富矿不等于金子。北京市医药健康可信数据空间建设运营负责人赵丽丽用一个形象的比喻,点明了可信数据空间的核心功能:“原始数据就像一车白菜,优质数据则是松茸,从白菜到松茸,价值如何跃升?中间还差着一整套‘冶炼’工艺。”
对药企而言,这个痛点尤为尖锐。一款新药研发平均需要10年、10亿美元,成功率却不足10%,业内称为“三十定律”,且成本还在逐年攀升。研发前,企业不知道“做什么药才有市场”;临床试验时,找不到合适的患者入组;上市后,又缺乏真实世界证据支撑医保定价。数据“拿不到、不好用”,研发只能“摸着石头过河”。

2025年3月,北京市医药健康可信数据空间(以下简称“可信数据空间”)在中关村论坛上正式揭牌,成为国内首批面向医药健康领域的数据流通利用基础设施。经过一年建设,这个以“政府监管、国企建设、科技企业联合运营”为特色的数据流通利用基础设施逐步摸索出了一些“解题思路”。
“原始数据不出域”是铁律
医药数据十分特殊,一条病历、一份处方、一张结算单,背后都是真实的人和隐私。数据一旦泄露或滥用,不仅是法律问题,更可能危及患者安全。也正因如此,医疗数据的流通利用,安全是必须守住的底线。
走进可信数据空间,安全设计随处可见。“对于高安全级别的数据,我们采取‘域内安全设备+专线’的方式接入。”赵丽丽介绍,目前,北京市医保专线已连通,其他数据通道正在逐步打通。但数据接进来只是第一步。怎么用?核心理念只有一句话:“数据可用而隐私不可见”。据了解,空间引入了隐私计算、代码审计、区块链存证等一整套技术手段,相当于为数据在平台上打造了一间“安全屋”。
与之配套的,还有物理用数空间。在这间经过物理隔离的“安全屋”里,摆放着几台定制电脑,接入了国产操作系统和专网专线。需求方的用数过程既严谨又高效:研究员坐在这里,看到的并不是原始病历,而是经过脱敏及匿名化处理的高质量数据集。他们只需勾选所需的变量,拖拽进分析界面,运行自己的统计代码。系统返回的是计算结果,看不到任何一名患者的个人信息,所有分析都在这台电脑上完成,结果可以带走,而原始数据留在这里。空间还设计了保障数据结果安全的监管机制,建立伦理审查委员会,所有结果须通过伦理审查委员会和法律合规两道关卡,方可交付。
14层滤网把“白菜”炼成“松茸”
安全只是基础
真正让数据产生价值的
是对“矿石”的精炼提纯
可信数据空间联合运营方、零氪科技创始人张天泽告诉记者,原始数据中存在天然盲区,电子病历记录了诊疗过程,却缺少院后随访;医保结算单反映费用支付,却很难还原完整诊疗路径;死亡登记记录生命终点,却连不上之前的治疗信息。“我们将这些分散在不同机构的数据,在安全合规的前提下打通、对齐、拼接,就能构建出从发病到结局的完整证据链。”他解释,以糖尿病和肺癌两个监管级数据集为例,运营团队先从北京市医保数据库中锁定目标人群,再匹配重点医疗机构的诊疗数据,拼接从确诊到治疗结局的完整链条,最后与中疾控的死因数据交叉验证。
拼接之后,是数据的层层提纯。零氪科技自研的ACE数据治理平台,通过“14层滤网”对原始数据层层处理:首先是多源数据对齐,将不同口径的数据通过编码化处理实现匹配;其次是校验修正,剔除脏数据和缺项漏项;最后是复集仿真,对必要但缺失的数据通过上下文逻辑推演补全。张天泽以“一致性校验”和“逻辑校验”为例,向记者解释了数据提纯的过程:系统会将不同数据源中的记录进行比对,标记并回退相互矛盾的信息;还会自动识别不符合临床逻辑的错误数据并加以剔除,确保最终数据经得起验证。经过缺失值补全、异常值识别、时序逻辑验证等层层筛查,最终输出的是FACT数据集——可直接支撑药品注册申报、审批、医保定价和临床研究的数据。
一个药盒的故事
在可信数据空间的展示区,一排排的药盒格外引人注目。在这里,类似的探索正在多个领域展开。一款心衰领域药物首次采用大规模医保、医院与死因跨域融合数据,完整还原了药物在中国患者中的实际效果,精准捕捉到心血管死亡风险的显著降低。某罕见病药物的儿科真实世界研究试点,更是直接推动了儿童适应症的获批。“以前我们找数据要跑七八个部门,还不一定能找到,现在在一个平台上就能完成合规的数据分析。”一位药企负责人告诉记者。
赵丽丽还以慢性肾病为例,向记者描绘了数据如何改变这一困局:假如一家药企计划研发一款慢性肾病新药,在研发立项前接入可信数据空间,调取脱敏后的肾病病例数据,分析不同亚型的患者规模、现有用药方案的疗效短板、未满足的临床需求集中在哪个阶段。这些洞察帮助它提前锁定更有市场价值的靶点,避免在红海赛道烧钱。临床试验阶段,基于真实世界数据的患者筛选又能大幅加速入组;上市后,真实世界证据还能为药品定价和医保准入提供科学支撑。每一步时间的压缩、费用的降低,最终都会反映在患者手中那颗更便宜、更有效的药片上。
“数据的价值最终要落在产业上。”赵丽丽说道。从ALK靶点药物到心衰药物的研发管线,一个个药盒背后,是一条从数据汇聚到价值释放的闭环正在成形。
产业聚集效应初显
可信数据空间的产业集聚效应正在显现。2026年3月,罗氏制药将全球研发中心落户海淀,就在可信数据空间所在楼宇的三楼。国内创新药企同样受益:某本土BTK抑制剂成为率先赴美获批的同靶点药物,某全球首款DLL3/CD3双抗以近十亿美元完成授权转让——背后都有可信数据空间真实世界数据的支撑。为什么在海淀?在采访中,赵丽丽向记者揭示了答案:“除了全国领先的医疗资源底子,更关键的是人工智能产业的深厚积累。在海淀,集聚了大量AI企业,从靶点发现、分子设计到临床预测,技术能力几乎覆盖了新药研发的每一个环节。”下一步,可信数据空间将以自身为底座,搭建一站式AI For Drug Discovery服务平台,把分散的合同研发企业能力整合到一个可信平台上,让各类生物科技企业像接入电网一样,放心使用这些AI技术服务,而不用担心数据泄露。“数据+AI”的双轮驱动,正在重新定义医药研发的路径。
据透露,北京市医药健康可信数据空间计划将批量开展20个监管课题、治理16个监管级数据集、上架50个专病数据集。目前,空间一期软硬件部署已完成,6月机房建成投用。下一步,这里要成为全国示范性的医药数据要素流通枢纽。
记者观察
从“富矿”到“真金”
在展厅里,我注意到一个细节:一张严格脱敏后的普通医保结算单,上面密密麻麻的项目编码对普通人而言如同天书。工作人员告诉我,正是这张单子上几十个字段的交叉比对,才能还原出一位患者长达数年的治疗轨迹。那一刻我突然理解了什么是“数据富矿”:金子不是明晃晃摆在那里的,而是需要一层层筛出来。采访中,赵丽丽说了一句让我印象很深的话:“最让我兴奋的,不是技术本身,而是药企真的把研发中心搬到了我们楼上。这说明他们不仅是来参观的,更是希望来落地的。”从一张结算单到一个高质量数据集,从一个药盒的谈判筹码到一个产业的范式变革,可信数据空间所做的,正是将这座沉睡的富矿唤醒。它不直接生产药品,却让药品的研发更精准;它不直接治病救人,却让未来的患者用上更便宜、更有效的药。这种“看不见”的价值,或许正是数据要素改革最值得期待的地方。从“数据富矿”到“价值真金”,这条在海淀先行先试的转化之路,为医药健康产业如何用好数据要素,打开了新的想象空间。
相关人物