【文献计量学】国际孤独症谱系障碍研究的知识图谱分析
点击标题下「蓝色微信名」可快速关注
文章来源:中华精神科杂志2020,53(4):339-346
作者:吕艳华 段志光
目的
从情报学视角科学梳理孤独症谱系障碍(autism spectrum disorder,ASD)研究脉络,为ASD研究决策提供基础的研究框架。
方法
以科研文献中的MeSH主题词为主要研究对象,构建以文本及其关系为基础的ASD语义网络,并采用词频统计、共词聚类分析和知识图谱绘制等方法,对2018年12月31日之前的ASD研究内容及其结构知识图谱进行分析。
结果
从35 854篇ASD相关文献中提取到1 752个高频主题词,以此构建共词网络并聚类得到6个研究主题。
结论
以ASD科学研究为核心形成了6个分支研究及严密的体系,同时其与多学科之间联系密切。
孤独症谱系障碍(autism spectrum disorder,ASD)又称孤独症或孤独性障碍,最早于1911年由瑞士精神病学医生Eagen Bleuer提出[1],之后被逐步认知与重视。ASD发病率从最初的1/10 000到2012年的1/68[2],2016年的1/45[3],呈现世界范围内无地区差异性的流行趋势[4],ASD越来越引起研究人员的重视和关注。在我国依据已有调查数据保守估计,发生率在1%左右,即我国13亿人口中,可能有超过1 000万的ASD人群,其中儿童200万,并以每年将近20万的速度增长[4]。关于ASD的病因和治疗至今仍然包含大量的未知领域,亟需寻找一些对医生和研究人员非常重要且已然存在于事实中的潜在知识。至今,在ASD研究方面学界已经取得了丰硕的成果和瞩目的成绩。我们以ASD研究文献为基础,采用社会网络分析和情报计量学方法,对ASD研究内容及其结构进行知识图谱分析,旨在梳理ASD研究脉络,为ASD研究决策提供基础的研究框架。如今临床决策中单一的经验描述研究纲领已经不再适应现代医学发展的环境,我们从宏观视角揭示国际ASD研究主题及其结构,将有助于医学科学决策的多维度研究,对于充分发挥情报的科学决策作用,更深刻理解和把握科学研究的整体性,从而确保医学研究的最佳发展态势具有重要意义。
数据和方法
一、基本数据
20世纪70年代之前ASD没有成为单独的障碍诊断类别,只是在描述症状时提到Autism或autistic。70年代后期及80年代初,DSM-Ⅲ中孤独症首次作为一项单独的诊断类别出现,与广泛性发展障碍和非典型广泛性发展障碍共同组成广泛性发展障碍,并在其修订版中明确了孤独症的三大核心症状。1994年发布的DSM-Ⅳ中,对广泛性发展障碍的亚型进行了进一步分离和明确。2013年发布的DSM-5中,ASD取代了广泛性发展障碍,成为这一障碍类别的总称,而Rett综合征作为一种神经系统疾病而非精神类疾病被移除[5]。我们以生物医学信息检索系统PubMed为检索数据源,构造了“((pervasive developmental disorder)or autism spectrum disorder)not rett syndrome”的检索式进行主题检索,年限为2018年12月31日之前。共检索出35 854篇ASD相关文献,作为本研究的基础研究数据。
二、方法
采用Python语言开展并完成提取主题词、主题词统计与筛选以及构建主题词共现网络并根据聚类算法进行聚类等工作,共词网络聚类的结果采用可视化工具Vosviewer绘制知识图谱。
1.词频分析法:
词频分析法是指利用能够代表文献核心内容的主题词在科技文献中出现的次数来发现发展动向和研究主题的方法。如果某一主题词在其所在领域的文献中反复出现,则反映了其表征的研究主题受到研究人员较多关注。
2.共词聚类分析法:
在构建主题词共现网络的基础上对网络节点进行聚类的一种内容分析方法。首先,根据主题词与主题词共同出现的频次及其所形成的网络结构来衡量它们之间的疏密程度,并以此作为聚类的理论基础。共现频次越高的主题词对被认为其主题关联越密切,则主题越相似。其次,根据节点之间的相似性计算开展主题聚类。聚类原理采用关联强度展示图谱中节点之间的关联。
Sij=
其中,Cij为节点i和j共同出现的总次数,Wi和Wj是指节点i和j各自的频次,Sij表示节点i和节点j的相似度。
3.可视化方法:
可视化方法是利用统计方法、数学方法与计算机联合,将抽象数值转化为视觉图形过程的方法,以达到增强对抽象信息的认识。其可通过可视化图形呈现信息间的关系和隐藏的内在的本质。本文中采用Vosviewer绘制图谱并可视化呈现。图谱中最小化所有节点对应的欧几里得平方距离的加权和。2个节点之间的距离表示它们之间的相似度Sij。在颜色表达上,图谱中每个节点的颜色是由该节点的密度决定,用
其中,n为节点的数量,向量xi=(xi1, xi2)代表一个二维知识图谱上节点i的位置,||*||表示欧几里得标准。目标函数的极小值服从约束条件:
结果
一、ASD研究的基本信息分析
1.逐年发文量分析:
共收集2018年之前的ASD相关研究文献36 854篇,最早的ASD研究文献发表于1946年。自有ASD研究文献以来,ASD科学研究论文发文量的实际增长情况大体符合美国著名情报学家普赖斯所提出的科学文献指数增长规律[6],反映了该领域文献的持续生产过程,也表明这一时期科学文献的增长速度与现存科学文献的数量整体上成正比。同时,也应证了普赖斯的观点“指数曲线的存在,显然具有普遍性和长期性”。统计结果显示,1946-2018年ASD文献发表数量呈逐年增加趋势。2000年之后ASD研究发文量出现快速上升,研究人员对ASD的关注度出现较大幅度地增加,并于2011年出现了快速增长,在2018年达到峰值3 251篇。尽管整体上ASD研究论文的数量呈指数增长态势,但是逐年发展并不平衡,提示研究人员对ASD研究的关注度整体处于盘旋上升且不均衡的特点;见图1。
图1 发表于2018年之前的孤独症谱系障碍相关文献的逐年统计结果
2.研究国家分析:
从目前研究文献的绝对数量看,ASD研究最多的前十个国家分别是美国、英国、中国、加拿大、日本、意大利、澳大利亚、法国、荷兰和德国。美国研究数量是英国的近5倍,是中国的近9倍;中国研究总量略高于加拿大、日本、意大利和澳大利亚等国。若除去人口基数的影响,则ASD研究最受关注的前10个国家是冰岛、瑞典、荷兰、澳大利亚、英国、丹麦、加拿大、美国、以色列和挪威,我国居第32位。
二、基于共词聚类的ASD研究主题及其结构分析
从35 854篇科研文献中收集到唯一主题词(不重复的主题词)8 758个。根据主题词累积频次的集中分散定律,取前20的主题词作为本文研究对象(共1 752个, 频次F≥16),词频统计与分析见表1;共现网络及主题聚类见图2。
表1 1946—2018年孤独症谱系障碍研究主题词的词频分布一览表(部分)
图2 国际1946—2018年孤独症谱系障碍研究的知识图谱
整个研究主题以“Humans”(人类)为中心构成一个基于主题词共现网络形成的知识图谱,而可视化网络图谱中较大的节点则是出现频次较多的主题词,如“Child”(儿童),“Child, Preschool”(学龄前儿童),“Animals”(动物),“Brain”(脑),“Intellectual disability”(智力残疾),“Social behavior”(社会行为),“Male”(男性),“Case-control studies”(病例对照分析)等,这些高频词在一定程度上反映73年间ASD研究受到科研人员较多关注的主题或领域。词频统计结果显示,在超高词频中人群研究占较大比例,如:“Male”(男性),“Child”(儿童),“Female”(女性),“Child, Preschool”(学龄前儿童),“Adolescent”(青少年),“Adult”(成人),“Infant”(婴儿),“Young adult”(青年),“Middle aged”(中年),“Infant_newborn”(新生儿),可见人群研究是ASD研究的一个重要领域,见图2。ASD患者多为儿童,男孩多于女孩,因此“Child”(儿童),“Child, Preschool”(学龄前儿童),“Infant”(婴儿),“Infant_newborn”(新生儿)以及性别研究[7]一直是人群研究的重点,且伴随着整个ASD研究历程,其词频增长平缓且稳定。除了儿童之外,还有大龄ASD患者,且随着第一代被诊断(有文献记载)ASD患者[8]长大、变老,对其病症发展状况及谱系障碍人群共患病情况的研究受到了更多关注,因此关于青年人、中年人和老年人的关注出现较大幅度的增长,尤其是对青年ASD患者,从2007年开始其正式作为一种人群受到关注并被持续进行研究。对中年ASD患者的关注在近十年中也出现井喷式增长。从“生命全程”的视角,从早期筛查和诊断、早期抢救性干预、幼儿教育、学龄期随班就读、职业培训、就业、养老等各个环节为ASD患者提供全方位的研究和支持。
基于ASD研究的共现网络,聚类结果按照其词频及词与词之间的网络结构关系远近,现有的1 752个主题词被聚类成6个研究领域(图2),代表6个研究主题。根据所包含主题词的数量由大到小,依次是:ASD致病机制的基础研究;ASD筛检与健康风险评估;认知与脑发育机制研究;ASD疾病诊断及其发展测评;ASD临床治疗及其效果评估研究;ASD危险因素研究。
1.ASD致病机制的基础研究:
该领域的高频主题词有“Animals”(动物),“Disease models, animal”(动物疾病模型),“Neurons”(神经元),“Prenatal exposure delayed effects”(产前暴露延迟效应)和“Fragile X syndrome”(脆性X综合征)等。从主题词突现的时间上,“Genetic association studies”(遗传关联研究),“Comparative genomic hybridization”(比较基因组杂交),“DNA copy number variations”(DNA复制数量变异)等均是近十年才出现,之前未见相关的文献报道。
2. ASD筛检与健康风险评估:
“Child”(动物),“Adult”(成人),“Child development disorders, prevasive”(先兆儿童发育障碍),“Autism spectrum disorder”(孤独症谱系障碍),“Infant”(婴儿),“Middle aged”(中年),“Surveys and questionnaires”(调查问卷)为该领域的高频主题词。其研究人群相对较为广泛,包括了儿童、成人、婴儿、中年人、老人和80岁以上老人,其中对儿童的关注度最高。从研究的国家来看,英国、中国、瑞典和日本研究的居多。值得注意的是,中国ASD筛检与健康风险评估研究大致开始于20世纪末,并在近十年受关注程度快速增长。
3.认知与脑发育机制研究:
该领域的高频主题词有“Adolescent”(青少年),“Young adult”(年轻人),“Case-control studies”(病例对照分析),“Neuropsychological tests”(神经心理学测试),“Brain mapping”(脑成像),“Neural pathways”(神经通路),“Image processing, computer-assisted”(计算机辅助影像处理)。此外,“Magnetic resonance imaging”(磁共振成像),“Electroencephalography”(脑电图),“Neuroimaging”(神经成像),“Neurofeedback”(神经反馈),“Neuroanatomy”(神经解剖学)也是该知识图谱的核心词。
4.ASD疾病诊断及其发展测评:
以高频词“Intellectual disability”(智力残疾),“Social behavior”(社会行为),“Interpersonal relations”(人际关系),“Follow-up studies”(随访研究),“Brain damage, chronic”(慢性脑损伤),“Neurocognitive disorders”(神经认知障碍)为核心形成了该研究主题。
5.ASD临床治疗及其效果评估研究:
该领域的高频主题词有“Treatment outcome”(治疗结果),“Severity of illness index”(疾病严重程度指数),“Psychiatric status rating scales”(精神状态评定量表),“Comorbidity”(共病),“Retrospective studies”(回顾性研究),“Double-blind method”(双盲法)。
6. ASD危险因素研究:
“Female”(女性),“Risk factors”(危险因素),“Infant_newborn”(新生儿),“Cohort studies”(队列研究)为该研究主题的高频词汇,且词频分布统计结果显示,自20世纪40年代至今词频持续增长。此外,“Pregnancy complications”(妊娠并发症)也是这一时期ASD危险因素研究主题中呈现持续增长的主题词。
讨论
从ASD研究的共现聚类网络结果看,1 752个主题词被聚类成6个研究主题。这6个主题既相互独立又相伴相生,形成一个错综复杂的网络结构。
73年来,关于致病机制的基础研究一直是ASD研究领域的热门主题。与该病发生相关的遗传机制多元复杂[8],包括染色体异常,基因组上的大片段失衡或小片段拷贝数变异,以及单基因突变等。通过微阵列(microarray)和外显子组测序(exome-sequencing)技术,已经明确了超过100个ASD易感基因[9]。深入研究基因功能及探索ASD的致病分子细胞机制可以为ASD疾病研究提供重要的理论基础。无论从知识图谱还是词频统计结果看,各种类型的动物实验和动物模型都是研究ASD的重要方法。自2001年开始,有研究者以转基因小鼠进行动物实验。但从词频分布上,近交系小鼠一直是21世纪以来ASD动物实验的理想选择,类型包括:inbred C57BL、inbred Stains、inbred BALB C、inbred ICR,其中以inbred C57BL最受欢迎,多用于生理学、遗传学方面的实验。相反,对于染色体相关动物实验的关注度在近十年中出现一定程度的下降,原因是已有研究认为染色体异常只是ASD病因的一种,染色体正常也可能出现ASD。对于基因小鼠实验及模型、神经元及动物模型的ASD研究是近十年这个领域关注的重点。同时,过去人们曾一度认为ASD是教育失当导致的心理障碍,无神经形态学改变,因此从免疫学角度研究神经免疫与ASD发病之间的关系也成为该领域中人们试图多方面探讨ASD病因及其治疗的方式之一[10, 11]。
在ASD筛检与健康风险评估研究方面,由于ASD病因与诊断均较为复杂,虽然近年来ASD患病率持续升高,但目前并没有特别有效的治疗方法,早发现、早干预仍然是目前最有效的措施[12],因此筛检和健康风险评估是ASD研究领域中一个重要的主题。调查问卷、早期诊断、早期干预、健康风险评估、大规模筛查等均是该领域的高频主题词,而儿童是最受关注的人群。采用横断面设计对ASD疾病分布情况进行调查,而调查问卷是资料收集的常用方法,尤其在2010年之后受关注程度较高。同时,在21世纪之前对Asperger综合的关注较少,尤其是1980年DSM-Ⅲ颁布之前,仅有2篇文献提及,而1999年其频次达15次,之后保持持续快速增长态势;自2014年开始其关注度骤减并持续递减,与2013年DSM-5中由ASD取代广泛性发展障碍成为这一障碍类别的总称,并取消其原来的亚类别如孤独症、Asperger综合征、儿童期瓦解性障碍以及待分类广泛性发展障碍有关。
关于孤独症的认知与脑发育机制研究,病理研究结果显示ASD患者的海马、边缘系统、杏仁核、神经元密度增高,帕金森氏细胞数量减少,脑干尤其是下橄榄核,小脑部位有神经细胞迁移异常,浦肯野细胞数量低[13, 14]。电生理研究也表明,ASD患儿有脑功能障碍[15],这可能是造成患者在认知、社会及语言能力等方面发育异常的原因之一,因此关于脑结构及生理研究是该领域一个重要的研究主题。ASD被认为具有遗传基础,尽管没有单一基因与该病症直接相关。在检查技术方面,磁共振技术也是近十年才用于ASD形态学的检查,并迅速代替了流行于20世纪90年代末到本世纪初的回波平面成像技术,成为主流的ASD辅助检查手段。MRI和PET扫描可以显示大脑结构的异常,同时也可以显示小脑、脑干和中脑脑桥的发育轨迹。ASD患者发育过程中其幼儿期头围往往明显大于同龄健康儿,而青春期头围却又明显小于同龄健康人[16]。头围异常反映脑发育的异常,而脑异常则涉及全脑多个脑区,以额叶皮质、边缘系统、小脑和脑干等的形态变化尤其明显[17]。而各脑区的病理变化可通过神经形态学、影像学及动物实验等技术显示。探讨这一问题,对于认识免疫异常与ASD发病之间的关系及ASD防治极其重要。
在ASD疾病诊断及其发展测评研究方面,ASD被认为是一组以社交沟通障碍、兴趣或活动范围狭窄及重复刻板行为为主要特征的神经发育性障碍,多发于儿童早期 [18]。其鉴别诊断是一个多学科、多层次的系统工程,也是该领域经久不衰的话题,自1959年以来保持着平稳发展的态势,其在DSM-5发布前后呈现关注的小幅增长趋势。随访主要用于评估临床诊断效果,是ASD临床诊疗工作的重要组成部分[11]。早发现、早干预对ASD患者的预后发展有着重要的作用。同时,以心理状态分级测量、心理测评等特征词汇为主形成ASD发展测评的重要方法。
ASD临床治疗及其效果评估研究方面,以剖析疾病临床表现及治疗为主要内容的回顾性研究一直是ASD治疗领域探索临床治疗方案及其效果评价的主要方法。在ASD临床试验领域,双盲随机对照试验是临床治疗方法或药物效果检测的重要方法。在ASD临床治疗过程中,患者病情以及共病状况都是开展临床治疗的重要基础,因此病情严重程度指数和精神状态评定量表受关注程度较高。治疗手段通常采取以非药物干预治疗为主,药物治疗为辅的综合治疗方案,但是从文献研究情况来看,研究人员对于药物治疗的关注度明显高于非药物干预治疗。
越来越多的证据表明,导致ASD的遗传原因具有异质性,因此很难明确导致ASD的主要基因和因素,ASD患病因素的研究始终是一个重要的研究主题。研究表明,遗传因素和胎儿宫内环境因素在ASD发病中起重要作用,还包括其他因素如免疫因素、营养因素等。同时,产后及儿童期的某些环境因素的暴露也会增加ASD的发病风险,因此,这方面的研究也一直是该领域研究的重要主题,对于疾病预防、早期诊断和及时干预起到重要作用。如有学者发现ASD患者体内的金属代谢异常,金属硫参与神经元发育,若患者存在金属硫障碍,可影响其铜、锌及其他金属代谢。这方面研究是自2002年后开始,但关注度一直较为平缓。研究设计以队列研究、纵向研究、病例对照为主,具体的分析方法则以回归分析、多变量分析为主。
我们分析认为,ASD研究结构有较强的宏观性,蕴含着ASD研究的基本规律,即该领域有深厚的理论基础、逻辑方法,并形成了独特、严密的体系,同时与其他学科之间形成了紧密联系,是医学科学研究的缩影。以ASD科学研究为核心的6个分支研究之间相生相伴、相辅相成,共同形成了ASD研究体系。其中“ASD致病机制的基础研究”是国际ASD相关研究的主体部分,从知识图谱中主题词分布情况可以看到,“ASD的危险因素研究”和“ASD筛检与健康风险评估”都是这个主体研究领域的一部分,后来发展成为一个独立的研究主题。“ASD疾病诊断及其发展测评”是专门研究疾病诊断及发育评估的一个研究领域,与“认知与脑发育机制研究”关系较为密切,同时也与“ASD临床治疗及其效果评估研究”呈现出较明显的交叉发展态势。然而ASD研究体系是一个立体结构,本文中仅分析了基础结构,还需要进一步对每一个分支研究领域进行深入剖析,以形成一个立体结构,为ASD研究提供更翔实、深入的决策依据。
参考文献(略)
↓↓↓详情可点击文末下方阅读原文