UK Biobank公布华大自主平台WGS数据
UK Biobank — BGI WGS
近日,UK Biobank在其官网上公布了使用华大基因自主平台测序的50例人样品WGS数据和分析报告,供广大研究者下载使用。此次公布的数据为2018年初UK Biobank为了测试华大基因自主平台WGS数据质量而提供的48例样品和双盲测试的两个重复样本的数据。此次,UK Biobank自主发布的数据,可以更加客观的对不同测序平台进行综合评定。
图1 UK Biobank 官网截图
数据结果展示
表1 BGISEQ WGS 50例人样品数据平均结果
高质量值,GC含量稳定,没有偏向性
对50例样品WGS数据质量值进行统计分析,Q20平均值高达98.36%, Q30平均值高达92.59%。平均GC含量为40.3%, GC含量稳定,没有偏向性。
图2 碱基质量及GC含量分布
高比对率,高覆盖度,低重复率
50例样本比对率高达99.98%,唯一比对率高达90.70%,重复率均值2.89%,覆盖度高达99.1%,图3和图4显示出所有样本的数据指标分布平稳,表明测序结果稳定,体现测序数据的高一致性。图5和图6显示单个样品测序深度分布情况良好。
图3 比对率和唯一比对率分布图
图4 测序深度和重复率分布图
图5 全基因组每个碱基的测序深度的分布
图6 全基因组测序深度分布情况
从结果可以看出,BGISEQ WGS各项指标都达到行业标准,同时在duplicate rate和Mapping rate等方面表现出明显优势。研究者可以根据UK Biobank官网的指导(http://www.ukbiobank.ac.uk/uk-biobank-access-management-system-ams-user-guide-getting-started/)申请数据下载,审核通过后即可下载全部50个样品数据。
UK Biobank是全球具有重要影响力的人类遗传队列项目,对世界卫生健康研究有诸多开创性的意义。对满足UKB质量要求的数据进行公开,是对全球顶尖测序平台技术及服务质量的认可。目前华大基因已经成功交付几万例高质量的自主平台WGS数据,普遍受到海内外业界的高度认可。更多高质量的自主平台WGS数据即将公布,敬请期待!
图7 UK Biobank 官网分析报告截图
测序及报告获取链接(复制后用浏览器打开)
测序数据:
http://biobank.ctsu.ox.ac.uk/showcase/label.cgi?id=181
分析报告:
http://biobank.ctsu.ox.ac.uk/showcase/docs/BGI_wgs_pilot_data.pdf
http://biobank.ctsu.ox.ac.uk/showcase/docs/BGI_wgs_report.pdf