查看原文
其他

2022年4月_生信入门班_微信群答疑笔记

生信技能树 生信技能树 2022-08-24


做教学我们是认真的,如果你对我们的马拉松授课(直播一个月互动教学)有疑问,可以看完我们从2000多个提问互动交流里面精选的300个问答!

强烈建议你推荐给身边的博士后以及年轻生物学PI,多一点数据认知,让他们的科研上一个台阶:

下面是2022年4月_生信入门班_微信群答疑笔记

上一期答疑笔记是:2022年3月_生信入门班_微信群答疑笔记


  1. 请问老师有没有相关的书籍推荐呢,跟课程相关的书籍。


  1. 请问找个消息里面腾讯微云和百度网盘,选择其中一个就行,对吗?

内容是一致的,选一个即可


  1. 你好,遇到了一个问题

用替代软件xftp,准备工作里面的网盘里有


  1. IGV安装以后双击打开,显示我的电脑没有JAVA文件。我看了答疑里面,没有这个问题的解决方案。

试试到igv官网下载新版本


  1. 请问这两个下载哪一个?

左边的


  1. 请问一下,r code里面提到使用镜像是什么意思,不用镜像会有什么影响么

不使用下载速度会慢,甚至失败。如果你人在海外的话,在自己的电脑上安装,建议找一个离自己近的镜像地址。当然你也可以先试试看我们给大家推荐的这个,如果下载速度肉眼可见的非常慢,那再去找其他的镜像。


  1. R studio 打不开咋回事,是不是要安装在c盘才可以啊?

我们建议你R和Rstudio都装C盘


  1. 请问R之前已装在其它盘可以吗?能使用

如果你一直没有报错,而且你比较坚信自己解决问题的能力,也可以不用调整的


  1. 我这个安装r包 run的时候咋是这样的

看一下视频,从第一行开始,一下下点run,留意左下角窗口的输出信息,如果返回大于号,且没有error,就继续点run


  1. 我这个r包biomanager 一直安不上

从这个日志来看,应该是你已经安装成功了呀,没有error就不用管


  1. 15号那天的最后一部分内容,二进制文件安装,源代码安装,java编译的软件,听不懂看不懂,对下周转录组的课程影响大吗?

不大


  1. 点第一行的时候出现这个,要等大于号出现吗?

你按一下ESC键,再重新run,你的代码可能复制补全,或者你run的时候没有一行行run


  1. 助教,你好。我的Typora安不上,下载了早期版本也不行。

去typora官网下载适配版,实在不行那就先跳过,这个软件我们不用了


  1. item2需要安装吗?

termus 和 iterm2,二选一,推荐前者


  1. MacBook M1可以安装R吗?

M1 在安装R语言的时候,请选择云盘版本,而不是去官网自己下载


  1. filezilla需要安装吗

需要


  1. 还有一个jre开头的文件也需要安装吗

可以不用


  1. igv 安装网盘的还是到官网去下载呀?M1

都可以


  1. 需要安装的软件有安装位置的要求吗?必须c盘或者也可以其他盘?

R语言和Rstudio要安装C盘,其他没有要求


  1. 在R studio里安装package 需要同时把R打开吗

不需要


  1. 这个选项是选yes吧?

是的


  1. 老师,我电脑里有旧版本的R是直接卸载还是覆盖安装新版本的?

可以直接安装新版本


  1. 我安装R包时经常出现这种说某一个包是旧版本安装的  需要重新安装,这有没有更好的办法解决   还是只能手动重新安装  因为我遇到过非常多的这种错误

网络问题,你缺一个dbi包,你安装我们给你的包的时候,他需要顺便安装几十个其它依赖包,但这个过程是自动的,如果你网络比较差,很有可能在其中某一个包失败,你现在的问题就是dbi失败了,所以你需要单独把它重新给装起来


  1. 在使用limma 构建design的时候,这个公式的0是什么含义呢?

design <- model.matrix(~0+group)

design2 <- model.matrix(~group)

可以参考https://github.com/bioconductor-china/basic/blob/master/makeContrasts.md


  1. 老师,这个问题怎么弄,直接跳过?

跳过就好,你一行行run之后,最后面library代码运行没有error就好了


  1. 网络是国外的

那就重启一下Rstudio,然后跳过前面option 的代码


  1. 老师这个包我装不上,把包下下来本地装也装不上

单独运行这一句代码 BiocManager::install('GO.db')


  1. 请问老师,C盘路径有中文,R和R studio下载和卸载过几次了,安装到D盘了,文件默认位置还是C盘,现在需要把之前的卸载,安装新的到C盘这个位置吗?

C盘路径有中文,应该也是可以安装R和Rstudio,只是安装R包会有一些问题,但都可以解决的。你这个截图,显示的是工作目录在C盘,即便是有中文,也没有关系。而且和你说的安装在C盘还是两回事。建议你还是卸载干净,重新安装到C盘,就是默认的安装路径就好,然后按照视频说的,安装R包,一般有中文也是可以解决的,你遇到问题再截图群里提问即可


  1. 请问老师我这一推warning有影响吗?

你的已经成功啦~~你的是之前使用了国外网络,所以设置清华镜像反而不对,就是直接跳过设置清华镜像的代码,就可以安装R包的


  1. 老师好,我有几个R包成功,几个不成功,该怎么处理呢

找到error包对应的install代码,重新运行安装一下


  1. 请问老师,c盘路径有中文,安装的位置没有找到。需要把路径改为中文吗

把中文改掉,路径需要英文


  1. 老师好,我在C盘新建了一个文件夹,把TEMP  TMP修改了,然后需要重新跑一遍代码吗

需要,重新安装看看


  1. 老师好,请问该如何寻找对应的install代码呢?我按照网上的方法试了试,还是不行

用 BiocManager::install('')


  1. 老师 想请问一下运行了“library(GSEABase)”出现这种报错该怎么办呢 已经尝试重新运行GSEABase的install代码了

安装一下提示信息说的安装 S4Vectors 包


  1. 麻烦老师看下这是怎么回事,点击是,后面也报错

关掉Rstudio,然后用管理员身份打开,再安装


 运行截图的第14行代码


  1. 老师好,我按照这个跑了一下,最后又跑了所有代码,这样是可以了吗?但是只有GSEABase这个,而GSVA和clusterProfiler都没有

截图显示还在运行中,等左下角窗口返回一个大于号,你再选择最后的 library代码,run一下


  1. 运行library(GSEABase)出来又是一堆新错误

提示信息,并不是错误,没有关键词 error 就不用管


运行 BiocManager::install('DO.db')


  1. 老师,我安装的是微云的4.1.0的R,安装包的时候出现这个情况,是需要换其他版本吗?

看答疑文档Q15,16


  1. 老师,请问上课时需要操作么?需要准备2台电脑么

需要边操作,如果有条件的话,可以准备多台设备。当然,一台也够用了


重新安装一下


  1. 老师好,这两个R包还是一直安装不了

先切换镜像。

r语言最新镜像


options(BioC_mirror="https://mirrors.tuna.tsinghua.edu.cn/bioconductor/")

options("repos" = c(CRAN="http://mirrors.cloud.tencent.com/CRAN/"))

options(download.file.method = 'libcurl')

options(url.method='libcurl')


BiocManager::install("miRNAtap",ask = F,update = F)

BiocManager::install("topGO",ask = F,update = F)

BiocManager::install("miRNAtap.db",ask = F,update = F)


  1. 我看完公众号推文后意识到之前下载R时改变了默认的下载位置,改动到了E盘里,请问这对后续的使用有影响吗,如果现在想改的话是直接剪切粘贴,还是卸载掉重新安装好点呢?

你现在C盘还有多少空间,一般有10G就够用了,如果你现在用着没什么问题,也可以,只是以后可能会遇到问题。现在改的话卸载重装就好


  1. 老师,请问一下现在有问题还是在腾讯文档里截图反馈吗?什么时候会获得答疑呢

如果是练习题,就在腾讯文档贴截图,下节课会讲;如果是对某个知识点不理解,可以在群里提问


  1. 打扰了,盼老师空时帮忙解答一下,谢谢

单独运行一下 order(score) 就知道答案啦,另外,要改变顺序,也有参数


  1. 老师,为什么这个逻辑性数据转换成数字型的显示的1?

向量只能保存一种数据类型,数值型和逻辑型同时出现时,逻辑型会转换成数值型,TRUE 会变成 1,FALSE 变为 0


  1. 老师,R包这是安装成功了吗?

是的


  1. 老师,问下R包安装以后是自动保存吗?关闭了这个studio是不是还在

R包安装以后是自动保存的,还在


  1. 请问我安装包时出现了warning提示,对后续使用有影响吗

没有影响


  1. DNA测序是不是不能直接测 dna,直接测的rna呢?我看二代测序的原理,测的好像都是dna扩增,dna测序,但是实际上是不是rna转为dna再测序的

是rna反转录为cdna再测序,因为rna不稳定不能进pcr仪加热


  1. 请问一下,这里DESeq2安装为什么出错呀

rlang需要升级


  1. 请问在这道题中y$colnames和colnames(y)有区别吗?

单独看y$colname的运行结果,啥也没有,提取列名不是这样操作的,自创语法无效


  1. 老师,为什么我自己建的CSV放到工作目录下打不开,而另一个却可以打开

文件名里有个空格


  1. 谢谢老师,确实名字里带个空格,但是去掉后再读取,又出现个这

文件不规则,不是个方方正正的表格


  1. 老师,这个代码运行不出来,怎么一直有加号?

要一下ESC键,括号不成对或者引号不成对


  1. 老师,请问一个向量要生成矩阵时,只设置行数,默认的列数是怎样的?(已发现会循环补齐)当向量长度大于设置的行数时

向量的长度除以你设置的行数或列数,向上取整进行循环补齐的


  1. 老师 72行代码运行后y的列名没有改变怎么回事呀,74行代码运行后是对的

因为没赋值,没赋值就是没改


  1. 老师请问一下如何把标尺放在底部,做出类似下图的效果,没搜到要用哪个函数

右边那个是图例,不是标尺,然后你图里画的那个东西,它也不是正常这样画上去的,有可能是用Ai P上去的。


  1. 小洁老师,我能请教下截图悬浮的工具叫什么吗?

Snipaste


  1. 老师好,我在安装eoffice包的时候遇到了如图的报错,然后我安装了magick和Rcpp包之后重新加载eoffice包,就一直显示正在运行library(eoffice)命令(等了半个小时还是正在运行),如果中止命令或者强行退出r,再次重新library(eoffice)又会出现第一次的报错,请问该怎么办呢

管理员方式打开rstudio


  1. 这是因为电脑上M1 Pro的cpu么

没有安装 X11,OS X 10.9已不再提供此软件

需要从http://xquartz.macosforge.org下载安装


  1. 这页ppt里面::是代表不加载。但是不加载的话,后面的函数为什么能用?

你不加载 r不知道你要用啥函数,但你指定了具体的R包,他就知道了


  1. 老师,想请教个问题,数据b的结构和代码如图。但是运行出来的图片都是空的,画出来的图个数是对的。如果单次给gene赋值,画出的一张图是对,想知道代码哪里出错了

画图的代码里没有print


  1. 这个怎么解决?要手动下载吗?

是的,先单独安装这个包

命令是BiocManager::install("DO.db")


  1. 请问老师,在geo上找到的sra文件,是不是这里写了“2 reads per spot”就代表测序方法是pair-end测序

https://www.ncbi.nlm.nih.gov/sra/?term=SRR6051821你要看这里是single还是paired,这个就是paired


  1. 这种public data 要怎么知道adapter怎么trim,如果文章里没有写的话…下载的srr是原始数据,做alignment之前应该是要trim adapter吧?

如果文章里没有提供adapter的话,就按照他是universal adapter处理就好,用默认的方式处理。比如fastp之类的工具。


  1. 怎么可以看出来 这个是什么类型的数据呢 是芯片数据 还是rna-seq 还是其他

array是芯片,sequencing是测序,RNAseq数据一般是高通量测序获取的。


  1. 请问老师,如果以后自己的课题中探针注释在这个网址里面找不到,该怎么办?这里面总结了78个芯片

注释和ppt里都有


  1. 刚才离开后断网,再次进去服务器又出现密码输进去又提示要输密码。

你可以点左下角的记住密码,这样就可以不用每次重新输入。或者试试填表法


  1. 请问老师,我在练习2里面遇到了报错

文件名用 tab 补全,凡是手打的文件名都是错的, Data.tar.gz 不是 Data.rar.gz


  1. 老师,问下我做的练习最后要合成图片,生成deg文件为啥是空的,也没有图出来?

还有一句dev.off你没运行


  1. 小洁老师,我看生信技能树公众号您写的一篇文章,讲的是怎么处理GPR格式的原始数据(链接:https://mp.weixin.qq.com/s/AnXKIQrMGnnG5Td62v961w),我按照代码跑了一遍,最后生成的deg文件行名有点像entrezid,不太确定?

看样子就是Entrez ID,可以查看一下这个 https://www.biostars.org/p/208560/

你也可以查看一些管家基因,他们应该高表达


  1. 在临床信息里面找不到分组信息是不是就不能做差异性分析啦?

分组是自己的事情,跟代码无关,如果你没办法分组当然就没办法差异。都是胃癌,也有中晚期分组,性别分组,你给它一个免疫评分, 然后就是免疫高低分组了


  1. 老师好,我是Windows系统,在登录Linux服务器的时候用命令行法和填表法登录都连接不上,也没有出现弹窗,请问是哪里出问题了呢

换个网络环境


  1. 老师,问下作业里有道题,cp这个怎么复制不成功?

你的findMe.txt很可能是一个文件夹,只是你没注意到


  1. 请问各位老师同学,如果数据里面有负值,GEO数据库也没有RAW data, 这种数据还有再开发的可能么?

没有。20年前的芯片,早就停产了,而且他使用频率很低,就没有人给他开发配套的资料,这样的芯片拿到也没办法。


  1. 老师,我在R4的环境中安装R包之后library,发现有个error,该怎么处理呢

缺啥补啥就好,如果用conda安装的话,conda install r-rvcheck;可以通过搜索关键字找到安装的命令和在conda里这个包的名字


  1. 老师 我使用网页安装之后发现salmon包可以--help成功,但是当我切换环境回来之后发现还是报错了,包括安装install libstdcxx-ng=9.1.0也没用

看看error.pdf 有类似的报错,你还缺了一步


  1. 我网页安装的R4环境,然后想使用R的方法安装,弹出了这个提示:关于这个文件夹貌似没有权限,所以我可以进一步点yes来用个人文件夹来代替吗

可以


  1. 我换了好几个地方的源了,还是很卡

你截图显示只换了CRAN,没有换bioconductor


  1. 老师,关于昨天的课程有两个问题。1.开始单独安装的conda install -y libstdcxx-ng=9.1.0,结果失败并提示conflict(这边没来得及截图,刷屏信息太多翻不上去了),后来其他所有的都安装好了,又回来试了一遍conda install -y libstdcxx-ng=9.1.0,显示如图,是不是安装好了?但是我conda list查看libstdcxx-ng的版本并不是9.1.0,所以算安装成功没?

调用我们要用的软件帮助文档,salmon,hisat2等,没有报错就可以了


  1. conda配置好以后 .condarc 存在于minconda文件夹的上一级目录中,能不能把.condarc 放入minconda文件夹下(单纯强迫症心理想条理一点)

不可以,隐藏文件 .condarc 是配置文件,有特殊作用,不可以移动


conda命令属于shell,怎么能在R里运行呢?需要去shell里面哦


  1. 15号那天的最后一部分内容,二进制文件安装,源代码安装,java编译的软件,听不懂看不懂,对下周转录组的课程影响大吗?

不大


  1. 老师我想写一个当i=1时返回Hi,当i>1时返回i的命令,您能帮我看看哪里出问题了吗,谢谢

这里是多了一个fi


读取文件使用 fread函数


  1. 安装clusterProfiler遇到的问题。您看下可以帮我解决吗?

github上有这个报错的解决方案 https://github.com/YuLab-SMU/MicrobiotaProcess/issues/32

install.packages("https://cran.r-project.org/src/contrib/Archive/rvcheck/rvcheck_0.1.8.tar.gz",type = 'source',repos = NULL)

先解决这个error


  1. 老师,请问一下我们平时运行shell文件是推荐用Rstudio,还是xshell啊,我看其他老师的扩增子测序都是在用rstudio运行shell文件

我们比较少这么用,而且这和个人习惯有关


  1. 老师,GO富集的时候怎么让BP,CC,MF都出现,小洁老师给的代码只出来BP和MF

cc可能是没有富集到


  1. 老师好,我在小环境中安装小软件的时候第一个用的是手动安装的,第二个R4想通配置文件安装,但是显示出这样的,问下咋回事?

你要先把 R4.yaml 文件保存到当前文件夹下


  1. 老师为啥我的geneid还有小数点

因为gtf文件中的geneid有小数点


  1. 老师,请问featurecounts的比对率低于多少属于结果不太好呢?上课的例子比对率是80%左右,小娟老师说这是属于好的,老师请问这种有规定的范围吗?

没有,主要看什么物种,而且还要看你的测序技术和样本类型,而且featurecounts的结果并不是比对率,应该是assign率哦。

文末友情宣传

强烈建议你推荐给身边的博士后以及年轻生物学PI,多一点数据认知,让他们的科研上一个台阶:

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存