一般来说,大城市中的居民会有更多、更多样化的社会经济关系。从理论上讲,过多的社交关系接触会导致人们潜在的“精神过载”,但同时也会产生更多的激励与选择。社会经济网络的拓扑扩张离不开城市中规模经济和强大经济生产力的支持。社会经济互动平均数k(average number of socioeconomic interactions)的变化是城市空间性质和社会经济变量的定量预测中的关键因素,它类似于网络中的度值(degree)。在之前的研究中,学者们得到在规模为N的城市中存在k(N)=k0Nδeξ的关系。指数表城市人口每增加一个百分点后社会互动的增长百分比,类似于经济学中的“弹性”。k(N)整体可视作一个幂律表达式:k(N)~Nδ。社会经济互动对城市规模增大的比例规律符合日常认知,例如大城市中病毒传播更快、大城市拥有更高的人均经济生产率等。这种关系对抑郁症的研究也很重要,因为已有研究证实,对于个体而言,社交圈子越小抑郁风险越高。为了把k(N)中的普适关系转换为抑郁风险与城市规模的关系,研究者们将不仅限于特定城市规模中社会经济互动平均数k和K(N)的具体表达式,更要侧重于城市中个体的异质性和其对抑郁症的影响。通过建立统计数学模型,研究者们将社会经济网络结构与个人抑郁风险有效结合。图2为社会网络模型中抑郁的亚线性标度规律。图2A表示个体在城市基础设施网络上的活动。图2B中,若把个人与外界的互动视作是网络的度,那么随着城市规模增加,累积接触互动导致的社会网络度平均值也随之提升,即更大城市中的人均社会互动更多。图2C表示个体抑郁风险与社会连通程度成反比,并叠加于城市社会网络之上。
为证明数学模型的有效性,研究者们利用美国四组、两大类独立的真实数据集来验证抑郁症和城市规模的关系。第一大类数据为真实调查数据,具体为国家药物研究与健康调查(National Survey on Drug Use and Health , HSDUH)和行为风险因素检测系统(Behavioral Risk Factor Surveillance System , BRFSS)中对抑郁症患病数量的估计值。前者询问受访者在过去一年内是否经历严重的抑郁发作,后者询问受访者是否被告知患有抑郁症。在这两项社会调查中,调查者和受访者之间通过电话或者面谈的方式,因此可以排除调查方法对结论有影响的可能性。第二类数据为被动测试数据集——推特数据集。该类数据集包括来自2010和2019年的两组数据,增加被动观察数据可以增强数据的丰富性,也可以避免由于抑郁症污名化带来的偏差。这些数据包含了不同城市的个人信息、抑郁症症状信息和部分地理位置信息。此前已经有不少利用推特数据的类似研究,例如发现人的幸福感随人均发推数量下降、用户数量与城市规模呈超线性关系、幸福感地域化区域等现象,但是尚未被用来研究心理健康与城市规模之间的联系。该项研究采用机器学习相关技术从推特数据中识别抑郁症状态,并模拟临床医生常用的患者健康问卷9(Patient Health Questionnair-9 , PHQ-9)测评用户抑郁程度。通过对总抑郁病例数和人口规模对数之间的普通最小二乘线性回归,可以得到各数据集的比例指数β近似值。若忽略数据类型与年份,如图3所示可得到整体的拟合指数β=0.868(95% CI=[0.843,0.892]),抑郁症病例与城市规模呈亚线性关系,该结果和之前理论预测的 β=0.859 一致。图4为分别为各类数据集独立拟合图和拟合结果。