当 Salmon 构建 index 秒失败时应该反思哪里
生信技能树超级VIP入场券发放(点我领取)
拿到超级VIP入场券的学徒,就可以无限制参与全部生信技能树举办的线下课程,包括LINUX,R,GEO和TCGA数据挖掘,各种NGS线下大课,所以如果你想参加3个以上线下课程还不如直接报名学徒啦。
也可以获得全部的视频资源(约4000元)开通,也可以来珠海参加一个月的任务实战训练。
因为前面学徒处理人类数据airway发现了一个有趣的bug:你可能不适合做人(学徒给我的6个暴击)
所以让另外一个天资聪慧的学徒使用她的Windows电脑做一下,正好对应一下不同操作系统的差异,有趣的是salmon这样的软件,并没有Windows版本,所以无法使用conda安装在她电脑,不过还好她系统是Windows10,所以可以比较轻松的开启ubuntu子系统,也可以完成任务!
1. 下载参考转录组
关于转录组的salmon流程,需要看视频在 https://share.weiyun.com/5sh27An
参考转录组下载传送门:http://ftp.ensembl.org/pub/release-76/fasta/homo_sapiens/cdna/Homo_sapiens.GRCh38.cdna.all.fa.gz
由于 wget
下载速度太慢,用了神奇的Motrix软件分分钟成功下载到本地。
就是来自技能树推文的安利之一,推文传送门:https://mp.weixin.qq.com/s/whx-n1ktT58WHhWAUa06dw (所以下次黑粉们不要瞎留言,说老大写的教程不好!!!你的良心不会痛吗)
软件就是它👇
然后直接将 Homo_sapiens.GRCh38.cdna.all.fa.gz
拖到子系统的工作路径下。
2. Salmon 构建 index
假设已经装好了 Miniconda,按照生信技能树的教程走即可;
2.1 在小环境中安装 Salmon
conda create --name rnaseq
conda activate rnaseq
conda install -y salmon
2.2 构建 index
失败第一回
salmon index -t Homo_sapiens.GRCh38.cdna.all.fa.gz -i homo38_index
[Error reading from the FASTA/Q stream. Make sure the file is valid.]
难道是文件不完整吗,抱着这种想法甚至重新下载了1n遍。
失败第二回
看了别人构建好的 index, 里面有 .json
文件,难道是和网速有关?
开着战五渣的手机热点,依然 [Error reading from the FASTA/Q stream. Make sure the file is valid.]
.
失败最终回/成功第一回
(这个时候,必须说一下,一个经验丰富的工程师帮你排查错误是多么的有帮助,大神过来简单几个命令就找出问题所在了!)
查看文件详细信息:
ls -lh
没有权限,毫无权限。
那么就来修改权限🤦♂️
chmod 777 Homo_sapiens.GRCh38.cdna.all.fa.gz
这是坠吼的成功信息:
salmon index -t Homo_sapiens.GRCh38.cdna.all.fa.gz -i homo38_index
所以构建 index 秒失败应该反思哪里呢
文件完整性,有必要
网速,阔以,么得必要
文件权限,非常必要,尤其用了除
wget
以外的骚操作下载
全国巡讲约你
第1-11站北上广深杭,西安,郑州, 吉林,武汉,成都,港珠澳(全部结束)
一年一度的生信技能树单细胞线下培训班(已结束)
全国巡讲第12站-北京(下一站杭州)(已结束)