联仁大咖说|中国年轻女性乳腺肿瘤良/恶性诊断影响因素回顾性研究
中国年轻女性乳腺肿瘤良/恶性诊断
影响因素回顾性研究
2021年末,为推进政府数据开放,推动医疗与健康大数据创新应用,促进学术科技创新发展,国家健康医疗大数据东部中心基于数据开放运营方案征集的需求,邀请各业务单位参加“2021常州健康医疗数据开放创新应用大赛”。联仁健康医疗大数据科技股份有限公司报名参加大赛,并确定主要研究课题为:年轻女性乳腺肿瘤良/恶性诊断影响因素回顾性研究,以及衍生研究课题:患者是否需要为BI-RADS评分4级而过度紧张。
通常而言,乳腺癌患者以年长女性为主,但是近年来,有研究数据显示,确诊为乳腺癌的年轻女性比例在不断上涨。因此团队决定将研究主体定位在年轻女性,并致力于分析东部中心中的真实世界医疗数据中年轻女性肿瘤良/恶性情况及其影响因素。
数据来自国家癌症中心
本次研究数据主要来源为常州市医保数据及常州卫健医疗数据。常州市医保数据库为常州参保人员医保结算数据,覆盖2015年至2020年常州市600多万人医保数据,数据库中的表包括就诊人员、诊疗项目、服务设施、处方用药、医疗用费等数据,共涵盖700多种数据项以及24亿条记录。常州卫健医疗数据库为常州医疗机构就诊数据,覆盖2018年至2020年常州市500多万人3000万次就诊记录,数据库中的表包括挂号、就诊、检查、检验、处方、入院、出院、医嘱、病案、结算等数据,共涵盖1500多种数据项、13亿条记录。经过一系列纳排条件筛选,并通过自然语言处理方法从医疗文本中提取出BI-RADS评分相关变量,最终确定研究数据集。
研究使用统计方法为描述性统计分析、差异性分析、Kruskal-Wallis秩和检验和多元逻辑回归,经过统计推断,发现一些影响因素较为显著,主要为BI-RADS评分最高级、检验检查结果、最大病灶宽度等。其中,“BI-RADS最高级”变量经过数据预处理,转换为BI-RADS评分小于4级、等于4级、高于4级的有序三分类变量。研究结果显示,针对“BI-RADS最高级”变量,进行组间两两比较,主要结论为除“4级以下”与“4级”之间暂无证据表明有显著性差异外,其他两组均有显著性差异。
研究的主要结论总结为:BI-RADS评分4级与乳腺肿瘤恶性诊断之间的关联程度较低。在缺乏进一步检查和确诊的情况下,不建议此类患者过度治疗,以增加患者获益和减少医疗花费。
当然,本次研究也存在一定的局限性,由于时间限制及数据完整度等因素,部分较为重要的指标尚未纳入研究,从而导致研究假设和目前结论需要进一步验证。进一步的课题例如:构建预测模型进行精准诊断;预测BI-RADS评分为后症乳腺癌的概率等,皆可作为后续的研究内容。
免责声明:本文仅用于解释数据分析的基本技术。这并不意味着为分析结果提供任何医疗建议。
供稿:医药事业部
开拓健康医疗大数据应用新高地
联仁大咖说|以山东高脂血症市场为例浅谈统一医保支付价格(URP)政策对普药的影响
众志成城,同心抗疫|党旗在“疫”线飘扬|联仁健康党委号召党员先行,抗疫有我④
联仁大咖说|真实世界数据(RWD)驱动的医药研发思维转变
众志成城,同心抗疫|联仁健康党委号召党员先行,抗疫有我③