投必得医学

其他

第四十二讲 R-回归预测模型的交叉验证

在“R与生物统计专题”中,我们会从介绍R的基本知识展开到生物统计原理及其在R中的实现。以从浅入深,层层递进的形式在投必得医学公众号更新。在第四十一讲中,我们讲到了判断回归模型性能的指标(第四十一讲
2020年7月14日
其他

第四十一讲 R-判断回归模型性能的指标

请注意RMSE和RSE的度量单位与结果变量是相同的。将RSE除以结果变量的平均值将得到预测误差率,该误差率应尽可能小。sigma(model1)/mean(swiss$Fertility)[1]
2020年7月13日
其他

第四十讲 R-线性回归:预测模型及可信区间

在“R与生物统计专题”中,我们会从介绍R的基本知识展开到生物统计原理及其在R中的实现。以从浅入深,层层递进的形式在投必得医学公众号更新。在前面几讲,我们介绍了线性回归及R的实现(第三十九讲
2020年7月12日
其他

第三十九讲 R-线性回归:自变量中存在分类变量时

多分类变量通常,将具有n个级别的分类变量转换为n-1个哑变量。这n-1个哑变量包含的信息与单个变量相同。重新编码将创建矩阵,称为对比矩阵。例如,Salaries数据集中的rank具有三个级别:“
2020年7月11日
其他

​第三十八讲 R-线性回归模型的假设条件检验

在“R与生物统计专题”中,我们会从介绍R的基本知识展开到生物统计原理及其在R中的实现。以从浅入深,层层递进的形式在投必得医学公众号更新。在前面几讲,我们介绍了线性回归及R的实现(第三十七讲
2020年7月9日
其他

第三十七讲 R-多元线性回归中的多重共线性和方差膨胀因子

在“R与生物统计专题”中,我们会从介绍R的基本知识展开到生物统计原理及其在R中的实现。以从浅入深,层层递进的形式在投必得医学公众号更新。在前两讲中,我们介绍了多元线性回归的概念(第三十五讲
2020年7月8日
其他

第三十六讲 R-多元线性回归中的交互作用及更优模型选择

在“R与生物统计专题”中,我们会从介绍R的基本知识展开到生物统计原理及其在R中的实现。以从浅入深,层层递进的形式在投必得医学公众号更新。在前一讲中,我们介绍了如何用多个预测变量(x)建立用于预测连续型数值的结果变量(y)的多元线性回归模型(第三十五讲
2020年7月7日
其他

第三十五讲 R-多元线性回归

0.39个单位。如果我们的模型中,存在有某个预测变量与结果变量不相关,则在最后的多元回归模型中,我们应该删除该预测变量。模型系数的置信区间可以提取如下:confint(model)输出结果
2020年7月6日
其他

第三十四讲 R-简单线性回归模型(2)

value)和相关的p值(Pr(>|t|)),其定义所述β系数的统计显着性。如果只想获取系数内容,可以使用R代码如下:summary(model)$coef输出结果Estimate
2020年7月5日
其他

第三十三讲 ​R-简单线性回归模型(1)

0.5811862相关系数测量两个变量x和y之间的关联水平。它的值介于-1(完全负相关:x增加时,y减小)和+1(完全正相关:x增加时,y增大)之间。详细内容可以参见第七讲
2020年7月4日
其他

第三十二讲 R-回归分析概述

在“R与生物统计专题”中,我们会从介绍R的基本知识展开到生物统计原理及其在R中的实现。以从浅入深,层层递进的形式在投必得医学公众号更新。回归分析回归分析(或回归模型)是机器学习中监督性学习的方法之一,它是由一个或多个预测变量/自变量(x)的值预测连续性数据类型的结果变量/因变量(y)。回归模型的目标是建立一个数学方程式,将y定义为x变量的函数。接下来,该等式可用于使得我们可以用新获得的预测变量(x)来预测结果(y)。线性回归线性回归(linear-regression)是预测连续变量的最简单,最流行的技术。它的前提假设是:结果与预测变量之间存在线性关系。线性回归方程可以写成
2020年7月3日
其他

第三十一讲 R-机器学习与回归概述

在“R与生物统计专题”中,我们会从介绍R的基本知识展开到生物统计原理及其在R中的实现。以从浅入深,层层递进的形式在投必得医学公众号更新。从第三十一讲开始,我们将正式进入机器学习的学习。很多人可能听到“机器学习”,就觉得这是多么高大上的东西。其实不然,我们比较熟悉的回归分析,以及之前的Cox比例风险模型,都算是机器学习的范畴。只是,机器学习的范畴远大于回归分析。我们在生物统计学中常用的多元线性回归分析和多元逻辑回归分析都只是机器学习的一小部分内容。我们将从机器学习和多元回归的基本概念开始给大家一一讲解,让大家明白,“高大上”的机器学习,其实我们生物统计经常使用。1.
2020年7月2日
其他

第三十讲 R-Cox比例风险模型的假设检验条件

安装和加载所需的R包我们将使用两个R包:survival用于计算生存分析survminer用于可视化生存分析的结果安装软件包install.packages(c("survival",
2020年7月1日
自由知乎 自由微博
其他

第二十九讲 R-Cox比例风险模型(2)

在“R与生物统计专题”中,我们会从介绍R的基本知识展开到生物统计原理及其在R中的实现。以从浅入深,层层递进的形式在投必得医学公众号更新。在第二十八讲中(第二十八讲
2020年6月30日
其他

第二十八讲 R-Cox比例风险模型(1)

在“R与生物统计专题”中,我们会从介绍R的基本知识展开到生物统计原理及其在R中的实现。以从浅入深,层层递进的形式在投必得医学公众号更新。在第二十五到二十七讲中,我们介绍了生存分析的基本概念(第二十五讲
2020年6月29日
其他

第二十七讲 R-生存分析:生存函数的假设检验

在“R与生物统计专题”中,我们会从介绍R的基本知识展开到生物统计原理及其在R中的实现。以从浅入深,层层递进的形式在投必得医学公众号更新。在第二十六讲中,我们讲到了KM生存曲线的绘制(第二十六讲
2020年6月28日
其他

第二十六讲 R-生存分析:绘制KM生存曲线

在“R与生物统计专题”中,我们会从介绍R的基本知识展开到生物统计原理及其在R中的实现。以从浅入深,层层递进的形式在投必得医学公众号更新。在第二十五讲,我们向大家介绍了生存分析的基本概念,并且提到了KM(Kaplan-Meier)生存曲线,它是生存概率与时间的关系图。那么,这个图形如何在R中实现呢?今天我们将带您来一一实现。1.
2020年6月27日
其他

第二十五讲 生存分析基础概念

在“R与生物统计专题”中,我们会从介绍R的基本知识展开到生物统计原理及其在R中的实现。以从浅入深,层层递进的形式在投必得医学公众号更新。从第二十五讲开始,我们将进入高级统计学的学习,其中包括生存分析、聚类分析、主因子分析及机器学习(回归分析、高级建模等)。首先,我们将从生存分析开始。1.
2020年6月26日
其他

第二十四讲 R-卡方检验之独立性检验

在“R与生物统计专题”中,我们会从介绍R的基本知识展开到生物统计原理及其在R中的实现。以从浅入深,层层递进的形式在投必得医学公众号更新。对于离散型数据,在前面几讲,我们分别介绍了卡方检验之拟合度检验(第二十三讲
2020年6月25日
其他

第二十三讲 R-卡方检验之拟合度检验

在“R与生物统计专题”中,我们会从介绍R的基本知识展开到生物统计原理及其在R中的实现。以从浅入深,层层递进的形式在投必得医学公众号更新。在前面的两讲中,我们介绍了离散数据的统计学检验时,单个频数的比值/比例与期望值进行比较,可以使用单比例的Z检验(第二十一讲
2020年6月24日
其他

第二十二讲 两比例Z检验

在“R与生物统计专题”中,我们会从介绍R的基本知识展开到生物统计原理及其在R中的实现。以从浅入深,层层递进的形式在投必得医学公众号更新。上一讲中,我们介绍了单比例的Z检验,今天,我们继续介绍针对两组独立样本的比例数据(%)进行统计学差异检验——两比例Z检验。两比例Z检验两比例Z检验用于比较两组独立(非配对)数据中比例值的差异。例如,我们有两组人:A组,患有肺癌:n
2020年6月23日
其他

第二十一讲 单比例的Z检验

在“R与生物统计专题”中,我们会从介绍R的基本知识展开到生物统计原理及其在R中的实现。以从浅入深,层层递进的形式在投必得医学公众号更新。各位同学,大家好呀!今天我们将进入一个新的领域,针对比例数据(%)进行统计学差异检验。今天我们从“
2020年6月22日
其他

第二十讲 多样本间的方差比较

在“R与生物统计专题”中,我们会从介绍R的基本知识展开到生物统计原理及其在R中的实现。以从浅入深,层层递进的形式在投必得医学公众号更新。这一讲将要介绍用于比较两个或多个样本方差的统计检验。整个样本方差相等被称为方差齐性。一些统计检验,例如两个独立样本t检验和方差分析,都需要满足方差齐性的假设条件。我们在前面的讲解中已经对两独立样本t检验和方差分析(第十讲
2020年6月21日
其他

第十九讲 F检验:两样本方差比较

在“R与生物统计专题”中,我们会从介绍R的基本知识展开到生物统计原理及其在R中的实现。以从浅入深,层层递进的形式在投必得医学公众号更新。在前面十八讲,我们介绍了R软件在生物统计学中使用入门及组间均数的比较。下面,我们将介绍两组及多组间方差的比较。F检验F检验是用于评估两个总体(A和B)的方差(数值间变异程度)是否相等。1.
2020年6月20日
其他

第十八讲 R-多元方差分析

在“R与生物统计专题”中,我们会从介绍R的基本知识展开到生物统计原理及其在R中的实现。以从浅入深,层层递进的形式在投必得医学公众号更新。在存在多个响应变量的情况下,您可以使用多元方差分析同时检测多个响应变量。例如,
2020年6月19日
其他

第十七讲 R-双向方差分析2

在“R与生物统计专题”中,我们会从介绍R的基本知识展开到生物统计原理及其在R中的实现。以从浅入深,层层递进的形式在投必得医学公众号更新。第十六讲
2020年6月18日
其他

第十六讲 R-双向方差分析1

在“R与生物统计专题”中,我们会从介绍R的基本知识展开到生物统计原理及其在R中的实现。以从浅入深,层层递进的形式在投必得医学公众号更新。前面第十四和十五讲,我们介绍了单因素方差分析及其检验假设的验证(第十四讲
2020年6月16日
其他

第十五讲 R-单因素方差分析2

在“R与生物统计专题”中,我们会从介绍R的基本知识展开到生物统计原理及其在R中的实现。以从浅入深,层层递进的形式在投必得医学公众号更新。上一讲,我们讲了方差分析的原理和R实现(第十四讲
2020年6月15日
其他

第十四讲 R-单因素方差分析1

在“R与生物统计专题”中,我们会从介绍R的基本知识展开到生物统计原理及其在R中的实现。以从浅入深,层层递进的形式在投必得医学公众号更新。前面第八到第十三讲,我们介绍了单样本与总体的比较,独立两样本的比较,以及配对两样本的比较的统计学方法及R实现。根据数据是否满足正态分布/方差齐性,又分为参数检验和非参数检验跟大家进行了介绍。从今天开始,我们将开始进入多组样本相比较的学习。单因素方差分析单因素方差分析(one-way
2020年6月14日
其他

第十三讲 R-配对样本Wilcoxon检验

在“R与生物统计专题”中,我们会从介绍R的基本知识展开到生物统计原理及其在R中的实现。以从浅入深,层层递进的形式在投必得医学公众号更新。在第十二讲
2020年6月13日
其他

第十二讲 R-配对样本t检验

在“R与生物统计专题”中,我们会从介绍R的基本知识展开到生物统计原理及其在R中的实现。以从浅入深,层层递进的形式在投必得医学公众号更新。在过去的几天里,我们分别介绍了单样本的t检验、单样本的Wilcoxon检验和两独立样本的t检验及两独立样本的Wilcoxon检验(点击文字可跳转)。今天,我们继续前面的话题,介绍用于两个配对样本的统计学检验方法。符合正态分布的配对样本,我们可以使用配对样本t检验。配对样本t检验配对样本t检验用于样品的两个相关组之间的比较手段。在这种情况下,同一样本有两个值(即一对值)。举个例子,在1个月内有20只小鼠接受了治疗X。我们想知道处理X是否会对小鼠的体重产生影响。为了回答这个问题,在治疗之前和之后测量了20只小鼠的体重。通过测量相同小鼠体重的两次,我们得到了治疗前的20组值和治疗后的20组值。在这种情况下,可以使用配对t检验比较治疗前后的平均体重。配对的t检验分析如下:计算配对的两组的差值(d),每只小鼠会有一个差值计算平均值(m)和差值(d)的标准差(s)比较平均差异与0有无差异。如果两对样本之间存在显著差异,则d的平均值(m)会远离0。注意仅当差值(d)呈正态分布时,才可以使用配对样本t检验。可以使用Shapiro-Wilk
2020年6月12日
其他

第十一讲 R-两独立样本Wilcoxon检验

两个样本的容量均大于10的检验方法当两个样本容量都大于10时,秩和T的分布接近于正态分布,因此可以用Z检验,其基本公式为:式中:T为较小的样本的秩和。我们可以为自由度(df)计算与检验统计量(|
2020年6月11日
其他

第十讲 R-两独立样本t检验

t检验的结果非常相似。如何解释结果?如果p值低于或等于显着性水平0.05,我们可以拒绝无效假设并接受备择假设。换句话说,我们得出结论,两组样本代表的总体均值间有显着差异。3.
2020年6月10日
其他

第八讲 R-单样本T检验

研究问题和统计假设典型的研究问题是:均值(m)是否等于理论平均值(μ)?均值(m)是否小于理论平均值(μ)?均值(m)是否大于理论平均值(μ)?在统计数据中,我们可以定义相应的无效假设(H0)
2020年6月10日
其他

第九讲 R-单样本Wilcoxon检验

研究问题和统计假设典型的研究问题是:中位数(m)是否等于理论值(μ)?中位数(m)是否小于理论值(μ)?中位数(m)是否大于理论值(μ)?在统计数据中,我们可以定义相应的无效假设(H0)
2020年6月9日
其他

第七讲 R-单样本T检验

研究问题和统计假设典型的研究问题是:均值(m)是否等于理论平均值(μ)?均值(m)是否小于理论平均值(μ)?均值(m)是否大于理论平均值(μ)?在统计数据中,我们可以定义相应的无效假设(H0)
2020年6月8日
其他

第七讲 R-相关性分析及作图

在“R与生物统计专题”中,我们会从介绍R的基本知识展开到生物统计原理及其在R中的实现。以从浅入深,层层递进的形式在投必得医学公众号更新。在上一讲中,我们介绍了第六讲
2020年6月7日
其他

第六讲 R-数据正态分布检验

视觉方法密度图密度图能够直观看到有关分布,如果图形呈对称钟形,我们可以初步判断数据呈正态分布。library("ggpubr")ggdensity(my_data$Sepal.Length,main
2020年6月6日
其他

第五讲 R-数据描述性统计分析作图

在“R与生物统计专题”中,我们会从介绍R的基本知识展开到生物统计原理及其在R中的实现。以从浅入深,层层递进的形式在投必得医学公众号更新。在上一讲中,我们介绍了第四讲
2020年6月5日
其他

第四讲 R-描述性统计分析

(戳这里即可跳转)。到现在为止,大家已经学完了R语言的基础知识,马上就开始进阶地学习一些R语言相关的统计学技能了。今天的更新,我们会带您学习R的基本统计学技能:描述性统计分析。1.
2020年6月4日
其他

第三讲 R编程基础-矩阵和数据框

R-编程基础-运算、数据类型和向量等基本介绍(戳这里即可跳转)。相信大家对R语言的基础知识已经有了一定的了解。今天的更新,我们会带您学习R编程基础——矩阵和数据框,今天的主要内容如下。1.
2020年6月3日
其他

第二讲 R-编程基础-运算、数据类型和向量等基本介绍

基本算术运算基本的算术运算符是:+(加法)-(减法)*(相乘)/(除以)^(取幂)好啦,接下来让我们实践一下吧!打开你的RStudio,在控制台中直接键入以下命令:4
2020年6月2日
其他

第一讲 R-基本介绍及安装

今天是第一讲,带你走进R的世界。R是用于统计计算和数据可视化的免费且功能强大的编程语言。R可用于计算各种经典的统计检验,以及各种最新的统计学建议方法。以小编使用R近10年的经验来看,论文中有什么最新最高级统计学方法,99%都能找到相应的R软件包或者功能实现。这不仅适用于我们平时对普通生物统计的需求,更是涵盖了生物信息学,高级统计学等对统计能力要求更高的学科。使用R可以绘制许多类型的图,包括:箱形图,直方图,密度曲线,散点图,线图,条形图,基本上论文上你能找到的图,95%都可以通过R轻松绘出。解决了很多小伙伴想画一个高级图而不得的麻烦。1.用R的理由1与SAS,SPSS,STATA比,R是开源的,免费的。虽然小伙伴在市面上也可以获得其他软件的破解版,但是对于有些要求严格的杂志来说,会要求作者出示软件许可信息。同时,使用破解版的软件会对自己电脑的网络安全产生影响。2通过将脚本的方式,可以将结果嵌入单个文件中,R可以实现快速重复相似分析。比如导师要求你用四个不同的人群做同样的分析,或者课题进展过程中因为一些小变动,图、表或者分析需要重新做,拥有了R的脚本代码备份,你只需要将初始的数据换成新数据即可轻松完成所有任务。3R是跨平台兼容的因此可以安装在Windows,MAC
2020年6月1日