查看原文
其他

小明的GWAS情劫

2017-03-24 呵呵哒1974 生信媛

大家好,在生信媛潜水很久了,今天出来冒个泡泡。领导让我写写GWAS方面的东西,距离deadline不足12小时了,现在写写以解燃眉之急、、、

GWAS全名Genome wide association study,也就是全基因组关联分析。简单粗暴点,可以把他理解成一种基因预测的方法。

预测的过程比较复杂,涵盖了遗传学和统计的概念,比较抽象难懂,我们可以分而食之,先来了解个概念,LD,即连锁不平衡。后面的东西后面再说、、、


本期就给大家讲讲LD,理解了LD就基本知道GWAS是如何预测基因的啦。


连锁不平衡(Linkage Disequilibrium,LD)是指同一条染色体上,两个等位基因间的非随机相关。有点抽象哈,比如说当位于同一条染色体的两个等位基因(A,B)同时存在的概率,大于他们二者因随机分布而同时存在的概率时,就称A,B两个处于LD状态。


概念的东西有点抽象,那我们换个思维模式,说说小明的事吧。。。


比方说小明和小红都喜欢吃街角的麦辣鸡腿堡,但什么时候去吃,彼此独立,各自吃堡的概率分别为P(a)和P(b),理论上同时去吃的概率P(ab)=P(a)*P(b),实际上呢,小明和小红不顾家长反对恋爱了,你侬我侬,经常一起去吃麦辣鸡腿堡,这样同时吃堡的概率不再是P(ab)了,变成了P(ab)’,不用说你肯定也就知道了,P(ab)’不等于P(ab)。

他俩现在的状态用“人话”形容就是恋爱,用“遗传话”形容就是连锁不平衡、、、

现在能理解LD是种状态了吧,状态的程度用D表示,D= P(ab)’-P(ab)。


再举一个例子,假设你是个班主任,每天都会对班上学生进行考勤。最近隔壁学校的老王办公室玻璃经常被人砸,没有监控也抓不到人,老王很苦恼。后来他把这事告诉了你,相信你也一头露水吧。

不过老王,把玻璃被砸的日期都告诉了你,你回去后拿着记录左思右想,然后发现个规律,每次玻璃被砸的时间,班上的小红总是不在。可是小红是班上学习成绩不错的乖乖女,不在的时候并没有去隔壁学校。时间虽然吻合,但是没有作案动机呀。

第二天,班上小黄跑过来告诉你,说小红最近不在是因为她早恋了,对象是隔壁学校的小明。此时的你是不是应该去找隔壁老王呀,跟老王核对一下呢?

果不其然,就是小明干的。小明本来就不爱学习,经常调皮捣蛋,现在早恋了,被老王发现给教训了一顿,然后小明也给老王点“颜色”


至此,大家有没有理解这两个例子背后的关系呢?


玻璃被砸是我们能观察的表型,背后的始作俑者是小明,也就是我要找的目的基因;小红是个已知基因,表型也已知,也可以理解成染色体上的分子mark,这个mark的出勤率和玻璃被打的频率基本吻合,相关性很高。Mark和目的基因间存在很强的LD,通过mark就可以找到这个基因。

其实GWAS预测基因的思路和这个相似,只是实际算法上复杂些,暂不在讨论范围内。

本期就到这吧,下期再配图给大家详解一下LD吧、、


大家想想,如果小红的出勤率和玻璃被砸率不是百分百吻合,或者小红处的对象不止小明一个,同时班上其他同学也有在玻璃被砸的时候缺席呢?再或者小明是团伙作案,不止一人呢?是不是情况变得复杂多了?


哈哈哈哈哈哈、例子简单粗暴、不足之处、大家一起唾沫横飞讨论哈、、、



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存