橘子,生信组技术支持,特征描述:生信分析实操仅做过数据下载和差异分析
Devil Cui,生信主管,特征描述:疑难解答总是超出你以为的详细
橘子前两天有个case比较急,把方案发给Devil Cui之后,备注如下:这个case申请加急,我只用了基础分析方法,麻烦在XX天之内出结果。
然后就被Devil Cui科普了一通分析过程/实际工作量/分析耗时/运行中可能遇到的问题/应该给出的解决方案,巴拉巴拉巴拉。。。。。。这个事件的主角之一就是LASSO回归模型,鉴于近期机器学习比较火,LASSO回归堪称发文神器,接下来我们一起来看看这一非基础分析到底是个啥?LASSO回归:全称Least Absolute Shrinkage and Selection Operator,通过对所有变量进行回归惩罚,使得相对不重要的变量系数变为0,从而被排除在建模之外,进而选择出对因变量影响较大的自变量并计算出相应的回归系数,最终得到一个预测模型。
看图说话:首先根据左图曲线最低点确定惩罚值(即曲线最低点对应的上坐标),在右图的相应惩罚值的位置划上一条竖线,每一条曲线代表一个变量,与该惩罚值相交的变量即为模型最终所纳入的变量,变量所对应的纵坐标即为该变量的回归系数(在回归方程中,回归系数表示自变量对因变量影响大小的参数,也可以理解为该变量的贡献度)。分析结果:通过该分析可以得到影响疾病发生的因素(这里筛选得到的是2个基因),风险值risk score就等于各变量的(表达量*回归系数)之和。预测模型建完了,接下来就要对模型的准确性进行评估了,(恰在此时,醒木一响)欲知后事如何,请听下回分解,今天就告一段落,再见。PS:这篇推文写好之后,我的小伙伴们先行阅读了一遍,大家纷纷吐槽过于直白(虽然是事实~~)。鉴于后续将推出一系列看图说话,接下来请大家自行决定后续是否要写的严肃一点:支持直白的请在文末点赞,支持严肃的请在文末点在看(可以名正言顺让Devil Cui亲自动笔了,哈哈),不要手滑哦。注:此推文未经许可禁止转载!
阅读推荐: