查看原文
其他

新服务器的内容谍照

生信技能树 生信技能树 2022-06-07

又双叒叕买了一个服务器 (点击了解)

新买的服务器想配置成生信工程师顺手的工具也不是那么容易,这就是大家为什么喜欢云平台吧,我自己是常备一个2T的硬盘存储着这些年收集整理好的各种数据。

正好跟大家交流一下,我的其中4块的8T硬盘还在陆续拷贝中,谍照如下:

/dev/sdb1       7.3T   93M  6.9T   1% /trainee
/dev/sda1       6.8T   33G  6.4T   1% /home
/dev/sdc1       7.3T   93M  6.9T   1% /data
/dev/sdd1       7.3T  754G  6.2T  11% /public

目前我会优先把各种各样的数据拷贝在 /public里面,还有8T的其它项目的数据需要人肉翻墙。

参考基因组

如下:

/public/reference/genome/
|-- [4.0K]  hg19
|   |-- [ 380]  hg19.chr.bed
|   |-- [ 11K]  hg19.dict
|   |-- [3.0G]  hg19.fa
|   |-- [3.4K]  hg19.fa.fai
|   |-- [ 517]  jimmy.pl
|   `-- [1.4M]  nohup.out
|-- [4.0K]  hg38
|   |-- [3.0G]  hg38.fa
|   `-- [ 19K]  hg38.fa.fai
|-- [4.0K]  human_g1k_v37
|   |-- [ 11K]  human_g1k_v37.dict
|   |-- [2.9G]  human_g1k_v37.fasta
|   |-- [2.7K]  human_g1k_v37.fasta.fai
|   `-- [ 579]  README.human_g1k_v37.fasta.txt
`-- [4.0K]  mm10
    |-- [479M]  chromFaMasked.tar.gz
    |-- [1.4K]  mm10.chrom.sizes
    `-- [2.6G]  mm10.fa

4 directories, 15 files

参考基因组的各个比对软件的索引

/public/reference/index/
|-- [4.0K]  bowtie
|   |-- [925M]  hg19.1.bt2
|   |-- [691M]  hg19.2.bt2
|   |-- [4.7K]  hg19.3.bt2
|   |-- [691M]  hg19.4.bt2
|   |-- [925M]  hg19.rev.1.bt2
|   |-- [691M]  hg19.rev.2.bt2
|   |-- [973M]  hg38.1.bt2
|   |-- [727M]  hg38.2.bt2
|   |-- [ 15K]  hg38.3.bt2
|   |-- [727M]  hg38.4.bt2
|   |-- [ 12K]  hg38.bowtie_index.log
|   |-- [973M]  hg38.rev.1.bt2
|   |-- [727M]  hg38.rev.2.bt2
|   |-- [847M]  mm10.1.bt2
|   |-- [632M]  mm10.2.bt2
|   |-- [6.0K]  mm10.3.bt2
|   |-- [632M]  mm10.4.bt2
|   |-- [ 12K]  mm10.bowtie_index.log
|   |-- [847M]  mm10.rev.1.bt2
|   |-- [632M]  mm10.rev.2.bt2
|   `-- [ 12K]  nohup.out
|-- [4.0K]  bwa
|   |-- [8.4K]  hg19.amb
|   |-- [3.9K]  hg19.ann
|   |-- [6.3K]  hg19.bwa_index.log
|   |-- [2.9G]  hg19.bwt
|   |-- [748M]  hg19.pac
|   |-- [1.5G]  hg19.sa
|   |-- [ 21K]  hg38.amb
|   |-- [ 21K]  hg38.ann
|   |-- [6.5K]  hg38.bwa_index.log
|   |-- [3.0G]  hg38.bwt
|   |-- [765M]  hg38.pac
|   |-- [1.5G]  hg38.sa
|   |-- [6.4K]  human_g1k_v37.amb
|   |-- [6.7K]  human_g1k_v37.ann
|   |-- [6.2K]  human_g1k_v37.bwa_index.log
|   |-- [2.9G]  human_g1k_v37.bwt
|   |-- [740M]  human_g1k_v37.pac
|   |-- [1.4G]  human_g1k_v37.sa
|   |-- [ 11K]  mm10.amb
|   |-- [2.8K]  mm10.ann
|   |-- [5.7K]  mm10.bwa_index.log
|   |-- [2.5G]  mm10.bwt
|   |-- [651M]  mm10.pac
|   `-- [1.3G]  mm10.sa
|-- [4.0K]  hisat
|   |-- [4.0K]  grcm38
|   |   |-- [847M]  genome.1.ht2
|   |   |-- [632M]  genome.2.ht2
|   |   |-- [6.0K]  genome.3.ht2
|   |   |-- [632M]  genome.4.ht2
|   |   |-- [1.1G]  genome.5.ht2
|   |   |-- [644M]  genome.6.ht2
|   |   |-- [   8]  genome.7.ht2
|   |   |-- [   8]  genome.8.ht2
|   |   `-- [1.3K]  make_grcm38.sh
|   |-- [4.0K]  hg19
|   |   |-- [925M]  genome.1.ht2
|   |   |-- [691M]  genome.2.ht2
|   |   |-- [4.7K]  genome.3.ht2
|   |   |-- [691M]  genome.4.ht2
|   |   |-- [1.2G]  genome.5.ht2
|   |   |-- [703M]  genome.6.ht2
|   |   |-- [   8]  genome.7.ht2
|   |   |-- [   8]  genome.8.ht2
|   |   `-- [1.3K]  make_hg19.sh
|   |-- [4.0K]  hg38
|   |   |-- [973M]  genome.1.ht2
|   |   |-- [727M]  genome.2.ht2
|   |   |-- [ 15K]  genome.3.ht2
|   |   |-- [727M]  genome.4.ht2
|   |   |-- [1.2G]  genome.5.ht2
|   |   |-- [740M]  genome.6.ht2
|   |   |-- [   8]  genome.7.ht2
|   |   |-- [   8]  genome.8.ht2
|   |   `-- [1.3K]  make_hg38.sh
|   `-- [4.0K]  mm10
|       |-- [847M]  genome.1.ht2
|       |-- [632M]  genome.2.ht2
|       |-- [6.0K]  genome.3.ht2
|       |-- [632M]  genome.4.ht2
|       |-- [1.1G]  genome.5.ht2
|       |-- [644M]  genome.6.ht2
|       |-- [   8]  genome.7.ht2
|       |-- [   8]  genome.8.ht2
|       `-- [1.3K]  make_mm10.sh
|-- [4.0K]  star
|   |-- [1.2K]  create_index.sh
|   |-- [ 402]  STAR.80389.err
|   `-- [2.0K]  STAR.80389.out
`-- [4.0K]  subread
    |-- [ 712]  create_index.sh
    |-- [748M]  hg19.00.b.array
    |-- [4.8G]  hg19.00.b.tab
    |-- [5.4K]  hg19.files
    |-- [   0]  hg19.log
    |-- [2.2K]  hg19.reads
    |-- [765M]  hg38.00.b.array
    |-- [5.0G]  hg38.00.b.tab
    |-- [ 29K]  hg38.files
    |-- [   0]  hg38.log
    |-- [ 13K]  hg38.reads
    |-- [651M]  mm10.00.b.array
    |-- [4.4G]  mm10.00.b.tab
    |-- [3.8K]  mm10.files
    |-- [   0]  mm10.log
    |-- [1.6K]  mm10.reads
    |-- [ 15K]  subread.80318.err
    `-- [   0]  subread.80318.out

9 directories, 102 files

参考注释文件

/public/reference/gtf/
|-- [4.0K]  ensembl
|   `-- [4.0K]  homo_sapiens_86
|       |-- [ 44M]  Homo_sapiens.GRCh38.86.gtf.gz
|       |-- [7.6M]  MotifFeatures.gff.gz
|       `-- [5.9M]  RegulatoryFeatures.gff.gz
|-- [4.0K]  gencode
|   |-- [1.6M]  allGene.hg19.position
|   |-- [1.6M]  allGene.hg38.position
|   |-- [1.5M]  allGene.mm10.position
|   |-- [322K]  gencode.v25.2wayconspseudos.gtf.gz
|   |-- [ 37M]  gencode.v25.annotation.gtf.gz
|   |-- [1.4G]  gencode.v25lift37.annotation.gtf
|   |-- [861K]  gencode.v25lift37.metadata.EntrezGene.gz
|   |-- [981K]  gencode.v25lift37.metadata.HGNC.gz
|   |-- [502K]  gencode.v25lift37.metadata.RefSeq.gz
|   |-- [2.5M]  gencode.v25.long_noncoding_RNAs.gtf.gz
|   |-- [1.8M]  gencode.v25.polyAs.gtf.gz
|   |-- [717M]  gencode.vM12.annotation.gtf
|   |-- [ 23M]  gencode.vM12.annotation.gtf.gz
|   |-- [1.2K]  get_position.sh
|   |-- [   0]  IGHV.fa
|   |-- [5.5K]  IGHV.hg19.pos
|   |-- [558K]  lncRNA.hg38.position
|   |-- [588K]  protein_coding.hg19.position
|   |-- [587K]  protein_coding.hg38.position
|   |-- [291K]  pseudos.hg38.position
|   `-- [ 62K]  tmp.fa
|-- [817M]  hg19.gtf
|-- [ 38M]  Homo_sapiens.GRCh37.75.gtf.gz
|-- [ 44M]  Homo_sapiens.GRCh38.86.chr.gtf.gz
`-- [ 44M]  Homo_sapiens.GRCh38.86.gtf.gz

3 directories, 28 files

STAR软件的专用比对库文件

26G Jul  4 23:24 GRCh37_gencode_v19_CTAT_lib_Nov012017.plug-n-play.tar.gz
27G Jul  4 23:29 GRCh38_gencode_v26_CTAT_lib_Nov012017.plug-n-play.tar.gz
24G Jul  4 23:34 Mouse_M15_CTAT_lib_Nov012017.plug-n-play.tar.gz

GATK的不同物种专用文件

/public/biosoft/GATK/resources/bundle/hg38/
|-- [1.8G]  1000G_phase1.snps.high_confidence.hg38.vcf.gz
|-- [2.0M]  1000G_phase1.snps.high_confidence.hg38.vcf.gz.tbi
|-- [4.0K]  bwa_index
|   |-- [ 20K]  gatk_hg38.amb
|   |-- [445K]  gatk_hg38.ann
|   |-- [3.0G]  gatk_hg38.bwt
|   |-- [767M]  gatk_hg38.pac
|   |-- [1.5G]  gatk_hg38.sa
|   |-- [6.2K]  hg38.bwa_index.log
|   |-- [   0]  index.129248.err
|   |-- [   0]  index.129248.out
|   `-- [ 566]  run.sh
|-- [4.0K]  cnv
|   |-- [5.8M]  hg38.chr.bed
|   |-- [6.7M]  list.interval_list
|   |-- [ 843]  readme.txt
|   `-- [5.7M]  targets.preprocessed.interval.list
|-- [3.2G]  dbsnp_146.hg38.vcf.gz
|-- [3.0M]  dbsnp_146.hg38.vcf.gz.tbi
|-- [ 59M]  hapmap_3.3.hg38.vcf.gz
|-- [1.5M]  hapmap_3.3.hg38.vcf.gz.tbi
|-- [568K]  Homo_sapiens_assembly38.dict
|-- [3.0G]  Homo_sapiens_assembly38.fasta
|-- [157K]  Homo_sapiens_assembly38.fasta.fai
|-- [ 20M]  Mills_and_1000G_gold_standard.indels.hg38.vcf.gz
|-- [1.4M]  Mills_and_1000G_gold_standard.indels.hg38.vcf.gz.tbi
|-- [9.2M]  nohup.out
`-- [1018]  run.sh

2 directories, 26 files

ANOVAR软件的一些库

这个太多了,节选

|-- [1.5G]  hg38_AFR.sites.2015_08.txt
|-- [ 87M]  hg38_AFR.sites.2015_08.txt.idx
|-- [3.2G]  hg38_ALL.sites.2015_08.txt
|-- [ 89M]  hg38_ALL.sites.2015_08.txt.idx
|-- [1.0G]  hg38_AMR.sites.2015_08.txt
|-- [ 85M]  hg38_AMR.sites.2015_08.txt.idx
|-- [ 12G]  hg38_avsnp150.txt
|-- [918M]  hg38_avsnp150.txt.idx
|-- [ 45M]  hg38_clinvar_20170905.txt
|-- [1.1M]  hg38_clinvar_20170905.txt.idx
|-- [ 44K]  hg38_cytoBand.txt
|-- [856M]  hg38_EAS.sites.2015_08.txt
|-- [ 84M]  hg38_EAS.sites.2015_08.txt.idx
|-- [878M]  hg38_EUR.sites.2015_08.txt
|-- [ 84M]  hg38_EUR.sites.2015_08.txt.idx
|-- [ 16G]  hg38_gnomad_genome.txt
|-- [920M]  hg38_gnomad_genome.txt.idx
|-- [ 27M]  hg38_kgXref.txt
|-- [327M]  hg38_knownGeneMrna.fa
|-- [ 36M]  hg38_knownGene.txt
|-- [215M]  hg38_refGeneMrna.fa
|-- [ 19M]  hg38_refGene.txt
|-- [809K]  hg38_refGeneVersion.txt
|-- [966M]  hg38_SAS.sites.2015_08.txt
`-- [ 84M]  hg38_SAS.sites.2015_08.txt.idx

10xgenomic的官方软件cellranger必备数据

/public/biosoft/10xgenomic/
|-- [682M]  cellranger-2.1.0.tar.gz
`-- [4.0K]  db
    |-- [4.2K]  chromium-shared-sample-indexes-plate.csv
    |-- [4.2K]  chromium-single-cell-sample-indexes-plate-v1.csv
    |-- [4.3K]  gemcode-single-cell-sample-indexes-plate.csv
    |-- [647K]  refdata-cellranger-ercc92-1.2.0.tar.gz
    |-- [ 10G]  refdata-cellranger-hg19-1.2.0.tar.gz
    |-- [9.6G]  refdata-cellranger-hg19-and-mm10-1.2.0.tar.gz
    `-- [9.6G]  refdata-cellranger-mm10-1.2.0.tar.gz

1 directory, 8 files

练手数据

韩国人的WGS测序数据

节选

|   |-- [4.0K]  rawReads
|   |   |-- [5.8G]  KPGP-00001_L1_R1.fq.gz
|
   |   |-- [  32]  KPGP-00001_L1_R1.fq.gz.md5
|   |   |-- [6.2G]  KPGP-00001_L1_R2.fq.gz
|
   |   |-- [  32]  KPGP-00001_L1_R2.fq.gz.md5
|   |   |-- [5.6G]  KPGP-00001_L2_R1.fq.gz
|
   |   |-- [  32]  KPGP-00001_L2_R1.fq.gz.md5
|   |   |-- [5.9G]  KPGP-00001_L2_R2.fq.gz
|
   |   |-- [  32]  KPGP-00001_L2_R2.fq.gz.md5
|   |   |-- [5.3G]  KPGP-00001_L3_R1.fq.gz
|
   |   |-- [  32]  KPGP-00001_L3_R1.fq.gz.md5
|   |   |-- [5.5G]  KPGP-00001_L3_R2.fq.gz
|
   |   |-- [  32]  KPGP-00001_L3_R2.fq.gz.md5
|   |   |-- [5.3G]  KPGP-00001_L4_R1.fq.gz
|
   |   |-- [  32]  KPGP-00001_L4_R1.fq.gz.md5
|   |   |-- [5.5G]  KPGP-00001_L4_R2.fq.gz
|
   |   |-- [  32]  KPGP-00001_L4_R2.fq.gz.md5
|   |   |-- [5.2G]  KPGP-00001_L5_R1.fq.gz
|
   |   |-- [  32]  KPGP-00001_L5_R1.fq.gz.md5
|   |   |-- [5.4G]  KPGP-00001_L5_R2.fq.gz
|
   |   |-- [  32]  KPGP-00001_L5_R2.fq.gz.md5
|   |   |-- [5.9G]  KPGP-00001_L6_R1.fq.gz
|
   |   |-- [  32]  KPGP-00001_L6_R1.fq.gz.md5
|   |   |-- [6.1G]  KPGP-00001_L6_R2.fq.gz
|
   |   `-- [  32]  KPGP-00001_L6_R2.fq.gz.md5

家系遗传疾病WES数据

也是节选

   |-- [4.0K]  father
    |   |-- [ 14M]  bed_depth_coverage.txt
    |   |-- [297K]  DYDFN-785-10_H7Y5NCCXY_L7_1_fastqc.html
    |   |-- [373K]  DYDFN-785-10_H7Y5NCCXY_L7_1_fastqc.zip
    |   |-- [2.3G]  DYDFN-785-10_H7Y5NCCXY_L7_1.fq.gz
    |   |-- [278K]  DYDFN-785-10_H7Y5NCCXY_L7_2_fastqc.html
    |   |-- [343K]  DYDFN-785-10_H7Y5NCCXY_L7_2_fastqc.zip
    |   `-- [2.5G]  DYDFN-785-10_H7Y5NCCXY_L7_2.fq.gz
    |-- [4.0K]  mother
    |   |-- [ 14M]  bed_depth_coverage.txt
    |   |-- [275K]  DYDFN-785-11_H7Y5NCCXY_L7_1_fastqc.html
    |   |-- [339K]  DYDFN-785-11_H7Y5NCCXY_L7_1_fastqc.zip
    |   |-- [2.6G]  DYDFN-785-11_H7Y5NCCXY_L7_1.fq.gz
    |   |-- [236K]  DYDFN-785-11_H7Y5NCCXY_L7_2_fastqc.html
    |   |-- [286K]  DYDFN-785-11_H7Y5NCCXY_L7_2_fastqc.zip
    |   `-- [2.9G]  DYDFN-785-11_H7Y5NCCXY_L7_2.fq.gz
    |-- [7.1K]  nohup.out
    |-- [4.0K]  proband
    |   |-- [ 14M]  bed_depth_coverage.txt.use
    |   |-- [288K]  DYDFN-785-9_H7Y5NCCXY_L7_1_fastqc.html
    |   |-- [358K]  DYDFN-785-9_H7Y5NCCXY_L7_1_fastqc.zip
    |   |-- [2.6G]  DYDFN-785-9_H7Y5NCCXY_L7_1.fq.gz
    |   |-- [284K]  DYDFN-785-9_H7Y5NCCXY_L7_2_fastqc.html
    |   |-- [353K]  DYDFN-785-9_H7Y5NCCXY_L7_2_fastqc.zip
    |   `-- [2.8G]  DYDFN-785-9_H7Y5NCCXY_L7_2.fq.gz
    |-- [4.0K]  raw_fq_data
    |   |-- [1.7K]  multiqc_fastqc.txt
    |   |-- [ 587]  multiqc_general_stats.txt
    |   |-- [8.8K]  multiqc.log
    |   `-- [ 900]  multiqc_sources.txt
    `-- [1.1M]  raw_fq.html


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存