海归学者发起的公益学术平台
分享信息,整合资源
交流学术,偶尔风月
实验研究发现羟基磷灰石纳米粒子(HANP)能将骨肉瘤、黑色素瘤等当作“眼中钉肉中刺”,而对正常组织细胞却“视而不见”,有较好的抗肿瘤应用前景,只是为什么他会有这等脾气人们还不太清楚。有人想借数据驱动的方法一窥究竟,但苦于没有HANP的材料数据集,乃靡技可施,望粒子兴叹,更拿着机器学习的宝剑干瞪眼,直跺脚。
忽报南京大学化学化工学院女帅马晶教授指挥一哨人马,联合计算机科学与技术系高阳教授的精干人员,轻取了四川大学朱向东教授等核心成员的办公室,从他们的电脑、橱柜、抽屉、珠宝箱里搜刮了HANP高通量计算数据、实验制备数据、结构表征数据、肿瘤抑制数据等,构建了“抗肿瘤/组织再生性材料数据库” (http://www. webace-i3c.com/ATTRMaterialDatabase/home/home),囊括了TEM、SEM、XRD、结晶度、zeta电势、活性氧(ROS)、肿瘤抑制率等实验结果。事后,他们用Aprior与Bayesian网络等数据挖掘算法对诸类数据作了关联分析,发现材料形貌的描述符(如长径比)与肿瘤抑制率、活性氧(ROS)等生物学活性间存在说不清道不明的关联。于是三伙人马合作采用三种不同理论(DFT、DFTB、分子力场)计算了4万多种不同大小、不同长相的HANP表面能等性质,又基于常用的可解释的机器学习方法(LightGBM, XGBoost, Support Vector Machine, GDRT等)明确了其中几组间的关系:仅用三个描述符(长径比、钙离子配位数、纳米粒子顶部晶面到中心的距离)即可精确预测含数十万原子的HANP表面能。接着,他们又改进了高精度、可迁移图神经网络DeepMoleNet深度学习方法,不需派人作材料特征选秀(人工特征工程),就可将小纳米粒子(<200个原子)DFT数据集训练的表面能预测模型转用(迁移)于较大的纳米粒子(≤1000个原子)。马-高-朱团队引入标度函数建立了不同大小HANP数据集之间的关系,利用图像分割技术由TEM或SEM照片重建HANP的3维结构,以此实现预测结构与实验电镜照片之间的关联,并进一步使预测的XRD图像、结晶度与实验观测结果一致。最后,马晶马不停蹄地找到南京大学匡亚明学院董昊教授组建了马-高-朱-董团队,一口气探究了表面电荷分布、晶面形貌对纳米粒子聚集和生长过程等与生物分子结合的影响,初步揭示了为啥“窈窕肿瘤,HANP好逑”的作用机制。马-高-朱-董团队建立的上述成果近期发表于npj Computational Materials 7: 142 (2021),他们的机器学习模型具有较好的普适性,你若探究其他类型纳米粒子的形貌与表面能之间的关系,或设计、筛选各类纳米粒子/团簇,不妨用其一试。但千万记住:试出的结果务必投稿npj Computational Materials!否则,稿件若被马晶、高阳、朱向东、董昊教授以及第一作者刘子腾博士审稿话,小心他们会提醒你别浪费自己的优质科研成果… 该文近期发表于npj Computational Materials 7: 142 (2020),英文标题与摘要如下,点击左下角“阅读原文”可以自由获取论文PDF。
Machine learning on properties of multiscale multisource hydroxyapatite nanoparticles datasets with different morphologies and sizes
Ziteng Liu, Yinghuan Shi, Hongwei Chen, Tiexin Qin, Xuejie Zhou, Jun Huo, Hao Dong, Xiao Yang, Xiangdong Zhu, Xuening Chen, Li Zhang, Mingli Yang, Yang Gao & Jing Ma
Machine learning models for exploring structure-property relation for hydroxyapatite nanoparticles (HANPs) are still lacking. A multiscale multisource dataset is presented, including both experimental data (TEM/SEM, XRD/crystallinity, ROS, anti-tumor effects, and zeta potential) and computation results (containing 41,976 data samples with up to 9768 atoms) of nanoparticles with different sizes and morphologies at density functional theory (DFT), semi-empirical DFTB, and force field, respectively. Three geometric descriptors are set for the explainable machine learning methods to predict surface energies and surface stress of HANPs with satisfactory performance. To avoid the pre-determination of features, we also developed a predictive deep learning model within the framework of graph convolution neural network with good generalizability. Energies with DFT accuracy are achievable for large-sized nanoparticles from the learned correlations and scale functions for mapping different theoretical levels and particle sizes. The simulated XRD spectra and crystallinity values are in good agreement with experiments.
本文系网易新闻·网易号“各有态度”特色内容
媒体转载联系授权请看下方