其他
一款计算亲缘关系和祖先分析的软件-AKT
一款计算亲缘关系和祖先分析的软件-AKT
检测关联样品
确定样品祖先
计算突变之间的相关性
检查孟德尔遗传一致性
进行样品聚类
在2017年,illumina开发的一款名为AKT的工具,可以很快速地进行这方面的分析,是一个很方便使用的软件。下面我们来看看吧。
软件安装
从github上下载安装
git clone https://github.com/Illumina/akt.git
cd akt/
make
使用说明
./akt COMMAND <options>
pca :对样品进行主成分分析 kin :计算两两间的亲缘关系相关性 relative:给出有家系关系的个体 unrelated:给出无关的个体 pedphase:孟德尔遗传的phasing结果
PCA
普通用法 ./akt pca multisample.bcf -R data/wgs.grch37.vcf.gz -O b -o pca.bcf > pca.txt 其中-R :区域文件,其他参数见网页说明。 结果也很易懂,pca.txt为: SAMPLE_ID0 P0 P1 P2 P3 P4
SAMPLE_ID1 P0 P1 P2 P3 P4
...添加另一个家系的用法
直接利用方法1中获得的pca.bcf进行后续的分析。
./akt pca new_multisample.bcf -W pca.bcf > projections
绘制PCA的图 使用提供的脚本进行绘图。
Rscript scripts/pca.R pca.txt
计算亲缘系数
./akt kin -R data/wgs.grch37.vcf.gz -M 1 input.bcf > kinship.txt
选择亲缘关系样品
akt relatives kinship.txt -p pedigree
选择无关样品
akt unrelated kinship.txt > unrelated.ids
性能和效果
整体而言,该软件运行速度是非常快的。使用1000GP的数据:
1000GP的2504个无关个体,总共84M的变异,代表了常见的散发样品使用场景
433个高覆盖度样品,包括129个trio和9个双胞胎家系,34.4M变异。代表了家系分析的场景。
参考文献
往期精彩