查看原文
其他

【视频回放】中国生物统计2022年学术年会

KouShare 蔻享学术 2023-01-30



会议名称:

中国生物统计2022年学术年会

主办单位

中国卫生信息与健康医疗大数据学会统计理论与方法专业委员会中国卫生信息与健康医疗大数据学会卫生统计教育委员会中国现场统计学会生物医学统计分会中华预防医学会生物统计分会国际生物统计学会中国分会

承办单位:

北京大学公共卫生学院生物统计系北京大学北京国际数学研究中心中国数学会医学数学专业委员会

赞助单位:

JMP中国赛仕软件(北京)有限公司


回放通道

蔻享学术

识别二维码,即可观看回放。
 


从1984年9月南宁的第一届开始,中国生物统计年会已经举办了近37届,在我们专业领域内有着很高的知名度和影响力!近年来,随着人们在生物医学、公共卫生,制药学等领域研究的深入,越来越多的科学问题需要以量化研究依据作为支撑,生物统计越来越受到研究者的重视。大家在这次会议中参与的热情也从侧面反映了我们学科发展的趋势。会议于2022年8月27日至28日在线上举行,本次会议分为4个session,共邀请了15位嘉宾作报告,探讨生物统计领域的新进展。会议不仅设有专家学者报告,还组织了优秀研究生论文评选。累计超过1000人次注册会议,超过20000人次观看会议直播。


专题一:因果推断及医学大数据应用专场顾东风(中国科学院院士、南方科技大学代理副校长,讲席教授)

康医疗大数据推动心血管疾病防控

医疗大健康数据是国家的基础性战略资源,已经广泛应用于医疗的各个领域,顾院士就健康医疗大数据推动心血管疾病防控方面进行了讨论。顾院士首先介绍了目前心血管医疗健康大数据的来源及其在心血管疾病的疾病负担、基因组学研究、遗传风险预测、早期预测、防控、诊疗等方面的应用。创新性的使用了中国人的数据,创造了China-PAR模型,是医防结合的范例。随后提出人工智能利用算法助力心血管疾病精准医疗,主要包括:心血管疾病早期诊疗,发病风险预测、分子分型,干预、治疗措施筛选,长期预后评估等方面。最后对健康大数据应用的未来进行了展望,我国健康中国战略和行动需要健康医疗大数据的开发和利用,应用前景广阔,但也需要国家的政策引导、扶持,各个部门、学科共同参与努力,共同推进心血管代谢疾病防控。


周晓华(北京大学讲席教授,北京大学公共卫生学院生物统计系主任)
Causal Inference in the Presence of Unmeasured Confounders

存在未测量混杂因素一直是因果推断中的难点。周教授首先介绍了混杂因素的定义,平均因果效应的定义及其在RCT、Stratified RCT、Ignorability情况下的计算。其后介绍了在混杂因素不可被测量的情况下,估计个体因果效应和整体人群的因果效应的常用方法及新方法原理、适用条件及新方法实际应用,主要包括以下方法:(1)Instrumental Variables(IV法,工具变量法),(2)Auxiliary Variables(辅助变量法),(3)Proximal Causal Inference Using Negative Controls(使用阴性对照的近端因果推断),(4)Data Fusion with Surrogates(替代变量的数据融合方法),(5)Principal Stratification to Identify Local Effects。最后周教授强调每种方法都对未测量的混杂和可观测数据施加限制(假设),例如等价性、完备性或单调性。大多数假设时不可检验的,因此在应用假设时需确认假设是成立的。


薛付忠(山东大学特聘教授)
     边际因果知识驱动的因果网络建模方法


目前我国存在慢病早筛、早诊早治占比低,治疗效果欠佳,医疗花费巨大,无效治疗,药物不良反应繁多的情况,急需建立“一脑多端”智慧医学图脑系统促进人群健康。其中由于多源异构高噪稀疏大数据,传统回归模型无法多动联动难以实时调整预测因子等困难,提出可通过建立基于因果网络不确定性推理在线实时因果推理的预测预警与决策支持模型途径来解决。但由于现有因果网络构建方法存在的工作量大,未考虑未知混杂,难以确定稳健、准确的网络结构等局限性,薛教授提出了边际因果知识驱动的因果网络建模的方法。其后详细介绍了基于孟德尔随机化的边际孟德尔随机化网络介导的因果网络算法和基于最小分割体边际因果知识介导的因果网络算法原理、算法步骤及其优缺点,并对两种方法进行了实例分析,更直观的体现出边际因果知识驱动的因果网络建模方法的能够利用巨大样本量、有效控制未观测混杂、增加了准确性等优势。
专题二:组学数据统计分析方法学专场
周翔(美国密西根大学)Multi-ancestry eQTL mapping and TWAS analysis in GENOA
周翔教授首先介绍了表达数量性状位点(eQTL)分析对于确定基因与疾病关联、揭示疾病发病分子机制的重大作用。但由于目前大多数GWAS研究的主要研究对象都是欧裔人群,eQTL在种族间的异质性使研究结论不能直接外推到其他种族人群。因此,周翔教授使用METRO等研究方法,开展了以非裔人群为主的多组学研究,研究发现以非裔人群为主的基因表达模型在TWAS分析和BMI、T2DM等疾病和危险因素预测等方面确实取得了更好的效果,证实了种群特殊的eQTL研究和多种族组学研究的必要性和重要意义。此外,周教授还使用因果模型进行了SNP与DNA甲基化、基因表达、表型的分析,并通过中介分析阐述了这一系列影响通路的具体机制。
杨剑(西湖大学)Deciphering the genetic basis of human complex traits

杨剑教授以身高、BMI、精神分裂症等为例介绍了人类复杂遗传性状在传统GWAS研究等组学分析中遗传解释性的不足,而全SNP模型可以明显提高多种表型的遗传解释度,证明单纯的GWAS研究的确存在信息遗漏。此外,杨教授团队通过多年的研究也成功揭示了基因变异的负向选择原理,即带来更大影响的变异倾向于被自然选择排除,而小的变异更容易稳定遗传。在生物统计方法方面,面对基因型分析、DNA甲基化分析、RNA剪切分析等多组学数据分析的挑战,杨教授团队基于混合线性模型、广义线性模型开发的新计算方法fastGWA,也在多种应用场景中实现了运行时间更快,占用内存更少的优越性能。

 
赵杨(南京医科大学)基于组学数据的预测建模

 

赵杨教授通过三个研究案例介绍了基于组学数据预测建模的相关研究成果和见解。其中复杂关联模式与肺癌易感性研究模型通过纳入基因交互作用的分析构建了iPRS增强肺癌筛查模型,表现出了比传统PRS模型更优的表现;脑胶质瘤预后预测模型——APOLLO平台是同类中预测精读最高的模型,并作为首个交互作用赋能模型,提供了在线预测平台,方便了医务工作者直接进行预后分析;低血镁对非小细胞肺癌治疗疗效影响的研究中,赵杨教授展示了预测模型搭建过程中常见的偏倚和统计学陷阱,并以此为例,为大家介绍了预测建模过程中应注意的统计学问题。


专题三:疫情预测模型研究专场余宏杰(复旦大学教授)
Modeling transmission of SARS-CoV-2 Omicron in China


新冠新型病株奥米克戎BA.2在南非首次出现后,余宏杰教授和团队构建了模拟奥米克戎BA.2在中国大范围传播的数学模型,以模拟其大规模传播对人民健康和医疗系统的负担,以及结合疫苗接种、抗病毒药物和NPIs的防疫策略是否可以缓解其造成的影响。该数学模型综合考虑了感染者就诊后的病情发展、医疗系统设施、疫苗接种情况以及地理之间的异质性,采用香港自治区和巴西的数据进行估计,比较了单一方案防控以及多方案防控对模拟的疫情传播的影响,让与会人员对新冠疫情有了更加清楚的认识,为中国防疫政策提供了建议。

 
唐三一(陕西师范大学教授)
传染病动力学预测预警模型与数据分析


唐三一教授介绍了自己与团队使用数学模型在艾滋病、甲型流感、SARS和新冠疫情中所做的一系列工作以及相关的数据,他指出,数学建模可以降低传染病防控措施中的不确定性,在防控中降低资源挤兑,明确需求,也能为突发的传染病提供决策建议以及定量预测防控政策的成本效益与有效性。唐三一教授在最后展示了团队在数学模型建立的普适性基础上搭建的模型族和大数据驱动的预警系统平台,为公共卫生工作者在数据分析方面提供便利。


尹 凌(中国科学院深圳先进技术研究院研究员)
数据智能支持下的城市疫情时空分析与建模
近年来,为了应对复杂的国家经济、社会、科技发展、国家安全等科学问题,多学科交叉逐渐走向常态,尹凌研究员介绍了她所在团队的工作——结合流行病学、大数据、人工智能、地理学、管理科学等多个领域,将空间移动定位、时空行为感知与分析等应用到对疫情时空扩散过程的预测,为疫情防控提供精准的信息以做出相应的辅助决策。尹凌研究员介绍了城市中人群动态观测分析、构建疫情扩散模型的新方法,对于精细化人群动态轨迹、人际接触网络的构建等也做了多方面的考虑,在最后的展望中,她提到复杂人群时空行为的耦合建模工作还有着巨大潜力,同时她也希望能有更多的普适的建模数据和工具能够出现并应用到实际。 

青年论坛陈 雯(中山大学教授)
中断时间序列模型的应用及其优化
陈雯教授介绍了中断时间序列模型ITS和CITS模型,指出可以利用中断时间序列模型设计建立各地医疗服务的季节模型来预测门诊量,以及评估各省份医疗服务数据等等方面。对于模型的使用,陈雯教授比较了CITS模型和ITS模型,要依据对照组的选择、合成控制法、倾向性评分加权等选择合适的模型。同时可以将模型与ARIMA models嵌套,结合滞后效应以及协变量非线性的影响进一步优化模型,提高准确性和精确性。
 
李向杰(昌平实验室研究员)
单细胞RNA测序的批次效应问题

李向杰研究员分享的是关于单细胞RNA测序的批次效应问题,首先简要介绍了单细胞RNA-seq测序的流程以及scRNA-Seq数据,以及存在的一些问题。接着通过具体的图示介绍了scPSM在处理测序批次问题时的效果,即scPSM为scRNA-seq数据开发出了一种倾向性评分的匹配方法,能够同时做到去除批次处理效应,对数据进行剔除和去噪处理以及实现多批次集成。此外,scPSM可以在整个基因表达空间内工作,同时保证工作效率;而且scPSM总是能够实现高聚类精度,实现不同批次的理想混合,消除批次效应并估算DE分析中的损失,在跨批次去噪的同时保持真实的生物结构。


张   涛(山东大学教授)
慢性病纵向队列研究-生命历程理论与方法
张涛教授以生命历程视角下的心血管病防控为背景提出生命历程纵向队列设计的研究分析思路,即以轨迹参数分析方法发现关键窗口、通过交叉滞后分析探明因果路径和以累积中介效应来评估中介效应。其中,生命历程纵向队列数据是稀疏且不规则的,张涛教授指出可以采用GBTM或LCMM混合效应模型来拟合轨迹,然后使用slope、AUC等方法进行轨迹参数分析,结合生命历程因果模型进行交叉滞后路径分析,为心血管病全生命周期防治提供依据。
贾金柱(北京大学研究员)
Evaluating causes of effects by posterior effects of causes

关于因果的关系的研究是最近比较热门的研究方向,贾金柱研究员在此次年会中重点讲解了通过原因的后验效应评估影响结果的原因,首先举高血压的例子说明了effects of causes和causes of effects,然后继续说明了后验因果效应postTCE ,指出后验因果效应的可识别性以及可识别性的两个假设—Monotonicity和No confounding。同时既说明了Single causes的情况,也讲明了Multiple causes时的情况,能够为因果研究提供了一定的借鉴和参考。


魏永越(南京医科大学教授)
消化系统疾病因果网络推断与共享基因识别


各独立GWAS发现的基因,约有40%与多种表型的疾病存在关联,魏永越教授以消化系统疾病遗传研究现状为背景探索良恶性疾病之间的因果关系和消化道疾病间的共享变异位点或基因。首先进行遗传易感性分析,然后利用贝叶斯网络(BN)模型表示疾病之间的条件依赖关系,接着利用IVW、GSMR、median-MR等统计方法进一步验证疾病之间的因果关系。在探究共享基因时,魏教授提出可以利用多表型GWAS分析来进行筛选,效率会更高。魏教授的研究结果为消化道肿瘤高危人群的识别和防控提供了思路,具有很高的潜在价值。


 赵   星(四川大学教授)
大型多中心队列研究的统计设计挑战与新匹配方法研究


赵星教授首先分享了统计设计的基本思想,指出好的观察性研究要从设计开始,从处理、混杂变量、结局定义,估计目标人群的量以及分配机制入手。接着引入大型多中心队列研究,点明多中心队列设计的优势和待解决的需求。现有的多中心研究的匹配方法都存在有各种各样的问题和不足,赵教授提出了介于中心内部匹配和全局匹配的算法,即层次距离优先匹配(HPM),具体是先进行倾向性评分再进行匹配;还有考虑人群解释性的多中心完全匹配,通过Convex Hull方法和Maximal Box算法抓取样本人群,然后再进行后续匹配。这两种新匹配方式的结果较旧的方式有所改善。


2022中国生物统计年会圆满成功,也收获了颇多赞誉,期待大家在攀登生统阶梯的路途上越挫越勇,期待热爱生统科学的你的加入!关注中国生物统计,让我们相约2023!





推荐阅读

【视频回放】第十二届空间综合人文学与社会科学论坛 >>

【视频回放】2022世界青年科学家峰会—高端装备系统动力学与智能诊断维护学术研讨会 >>

【视频回放】第十二届全国流体力学学术会议 >>

【视频回放】中国物理学会2022年度秋季学术会议 >>

【视频回放】2022年地震学算法与程序培训班 >>

编辑:王亚琨

蔻享学术 平台


蔻享学术平台,国内领先的一站式科学资源共享平台,依托国内外一流科研院所、高等院校和企业的科研力量,聚焦前沿科学,以优化科研创新环境、传播和服务科学、促进学科交叉融合为宗旨,打造优质学术资源的共享数据平台。

识别二维码,

下载 蔻享APP  查看最新资源数据。


点击阅读原文,查看更多精彩!

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存