2022年4月_生信入门班_微信群答疑笔记
做教学我们是认真的,如果你对我们的马拉松授课(直播一个月互动教学)有疑问,可以看完我们从2000多个提问互动交流里面精选的300个问答!
强烈建议你推荐给身边的博士后以及年轻生物学PI,多一点数据认知,让他们的科研上一个台阶:
数据挖掘(GEO,TCGA,单细胞)2022年暑期班(收官之作),快速了解一些生物信息学应用图表 生信入门课-2022年暑期班(收官之作),你的生物信息学第一课
上一期答疑笔记是:2022年3月_生信入门班_微信群答疑笔记
请问老师有没有相关的书籍推荐呢,跟课程相关的书籍。
请问找个消息里面腾讯微云和百度网盘,选择其中一个就行,对吗?
内容是一致的,选一个即可
你好,遇到了一个问题
用替代软件xftp,准备工作里面的网盘里有
IGV安装以后双击打开,显示我的电脑没有JAVA文件。我看了答疑里面,没有这个问题的解决方案。
试试到igv官网下载新版本
请问这两个下载哪一个?
左边的
请问一下,r code里面提到使用镜像是什么意思,不用镜像会有什么影响么
不使用下载速度会慢,甚至失败。如果你人在海外的话,在自己的电脑上安装,建议找一个离自己近的镜像地址。当然你也可以先试试看我们给大家推荐的这个,如果下载速度肉眼可见的非常慢,那再去找其他的镜像。
R studio 打不开咋回事,是不是要安装在c盘才可以啊?
我们建议你R和Rstudio都装C盘
请问R之前已装在其它盘可以吗?能使用
如果你一直没有报错,而且你比较坚信自己解决问题的能力,也可以不用调整的
我这个安装r包 run的时候咋是这样的
看一下视频,从第一行开始,一下下点run,留意左下角窗口的输出信息,如果返回大于号,且没有error,就继续点run
我这个r包biomanager 一直安不上
从这个日志来看,应该是你已经安装成功了呀,没有error就不用管
15号那天的最后一部分内容,二进制文件安装,源代码安装,java编译的软件,听不懂看不懂,对下周转录组的课程影响大吗?
不大
点第一行的时候出现这个,要等大于号出现吗?
你按一下ESC键,再重新run,你的代码可能复制补全,或者你run的时候没有一行行run
助教,你好。我的Typora安不上,下载了早期版本也不行。
去typora官网下载适配版,实在不行那就先跳过,这个软件我们不用了
item2需要安装吗?
termus 和 iterm2,二选一,推荐前者
MacBook M1可以安装R吗?
M1 在安装R语言的时候,请选择云盘版本,而不是去官网自己下载
filezilla需要安装吗
需要
还有一个jre开头的文件也需要安装吗
可以不用
igv 安装网盘的还是到官网去下载呀?M1
都可以
需要安装的软件有安装位置的要求吗?必须c盘或者也可以其他盘?
R语言和Rstudio要安装C盘,其他没有要求
在R studio里安装package 需要同时把R打开吗
不需要
这个选项是选yes吧?
是的
老师,我电脑里有旧版本的R是直接卸载还是覆盖安装新版本的?
可以直接安装新版本
我安装R包时经常出现这种说某一个包是旧版本安装的 需要重新安装,这有没有更好的办法解决 还是只能手动重新安装 因为我遇到过非常多的这种错误
网络问题,你缺一个dbi包,你安装我们给你的包的时候,他需要顺便安装几十个其它依赖包,但这个过程是自动的,如果你网络比较差,很有可能在其中某一个包失败,你现在的问题就是dbi失败了,所以你需要单独把它重新给装起来
在使用limma 构建design的时候,这个公式的0是什么含义呢?
design <- model.matrix(~0+group)
design2 <- model.matrix(~group)
可以参考https://github.com/bioconductor-china/basic/blob/master/makeContrasts.md
老师,这个问题怎么弄,直接跳过?
跳过就好,你一行行run之后,最后面library代码运行没有error就好了
网络是国外的
那就重启一下Rstudio,然后跳过前面option 的代码
老师这个包我装不上,把包下下来本地装也装不上
单独运行这一句代码 BiocManager::install('GO.db')
请问老师,C盘路径有中文,R和R studio下载和卸载过几次了,安装到D盘了,文件默认位置还是C盘,现在需要把之前的卸载,安装新的到C盘这个位置吗?
C盘路径有中文,应该也是可以安装R和Rstudio,只是安装R包会有一些问题,但都可以解决的。你这个截图,显示的是工作目录在C盘,即便是有中文,也没有关系。而且和你说的安装在C盘还是两回事。建议你还是卸载干净,重新安装到C盘,就是默认的安装路径就好,然后按照视频说的,安装R包,一般有中文也是可以解决的,你遇到问题再截图群里提问即可
请问老师我这一推warning有影响吗?
你的已经成功啦~~你的是之前使用了国外网络,所以设置清华镜像反而不对,就是直接跳过设置清华镜像的代码,就可以安装R包的
老师好,我有几个R包成功,几个不成功,该怎么处理呢
找到error包对应的install代码,重新运行安装一下
请问老师,c盘路径有中文,安装的位置没有找到。需要把路径改为中文吗
把中文改掉,路径需要英文
老师好,我在C盘新建了一个文件夹,把TEMP TMP修改了,然后需要重新跑一遍代码吗
需要,重新安装看看
老师好,请问该如何寻找对应的install代码呢?我按照网上的方法试了试,还是不行
用 BiocManager::install('')
老师 想请问一下运行了“library(GSEABase)”出现这种报错该怎么办呢 已经尝试重新运行GSEABase的install代码了
安装一下提示信息说的安装 S4Vectors 包
麻烦老师看下这是怎么回事,点击是,后面也报错
关掉Rstudio,然后用管理员身份打开,再安装
运行截图的第14行代码
老师好,我按照这个跑了一下,最后又跑了所有代码,这样是可以了吗?但是只有GSEABase这个,而GSVA和clusterProfiler都没有
截图显示还在运行中,等左下角窗口返回一个大于号,你再选择最后的 library代码,run一下
运行library(GSEABase)出来又是一堆新错误
提示信息,并不是错误,没有关键词 error 就不用管
运行 BiocManager::install('DO.db')
老师,我安装的是微云的4.1.0的R,安装包的时候出现这个情况,是需要换其他版本吗?
看答疑文档Q15,16
老师,请问上课时需要操作么?需要准备2台电脑么
需要边操作,如果有条件的话,可以准备多台设备。当然,一台也够用了
重新安装一下
老师好,这两个R包还是一直安装不了
先切换镜像。
r语言最新镜像
options(BioC_mirror="https://mirrors.tuna.tsinghua.edu.cn/bioconductor/")
options("repos" = c(CRAN="http://mirrors.cloud.tencent.com/CRAN/"))
options(download.file.method = 'libcurl')
options(url.method='libcurl')
BiocManager::install("miRNAtap",ask = F,update = F)
BiocManager::install("topGO",ask = F,update = F)
BiocManager::install("miRNAtap.db",ask = F,update = F)
我看完公众号推文后意识到之前下载R时改变了默认的下载位置,改动到了E盘里,请问这对后续的使用有影响吗,如果现在想改的话是直接剪切粘贴,还是卸载掉重新安装好点呢?
你现在C盘还有多少空间,一般有10G就够用了,如果你现在用着没什么问题,也可以,只是以后可能会遇到问题。现在改的话卸载重装就好
老师,请问一下现在有问题还是在腾讯文档里截图反馈吗?什么时候会获得答疑呢
如果是练习题,就在腾讯文档贴截图,下节课会讲;如果是对某个知识点不理解,可以在群里提问
打扰了,盼老师空时帮忙解答一下,谢谢
单独运行一下 order(score) 就知道答案啦,另外,要改变顺序,也有参数
老师,为什么这个逻辑性数据转换成数字型的显示的1?
向量只能保存一种数据类型,数值型和逻辑型同时出现时,逻辑型会转换成数值型,TRUE 会变成 1,FALSE 变为 0
老师,R包这是安装成功了吗?
是的
老师,问下R包安装以后是自动保存吗?关闭了这个studio是不是还在
R包安装以后是自动保存的,还在
请问我安装包时出现了warning提示,对后续使用有影响吗
没有影响
DNA测序是不是不能直接测 dna,直接测的rna呢?我看二代测序的原理,测的好像都是dna扩增,dna测序,但是实际上是不是rna转为dna再测序的
是rna反转录为cdna再测序,因为rna不稳定不能进pcr仪加热
请问一下,这里DESeq2安装为什么出错呀
rlang需要升级
请问在这道题中y$colnames和colnames(y)有区别吗?
单独看y$colname的运行结果,啥也没有,提取列名不是这样操作的,自创语法无效
老师,为什么我自己建的CSV放到工作目录下打不开,而另一个却可以打开
文件名里有个空格
谢谢老师,确实名字里带个空格,但是去掉后再读取,又出现个这
文件不规则,不是个方方正正的表格
老师,这个代码运行不出来,怎么一直有加号?
要一下ESC键,括号不成对或者引号不成对
老师,请问一个向量要生成矩阵时,只设置行数,默认的列数是怎样的?(已发现会循环补齐)当向量长度大于设置的行数时
向量的长度除以你设置的行数或列数,向上取整进行循环补齐的
老师 72行代码运行后y的列名没有改变怎么回事呀,74行代码运行后是对的
因为没赋值,没赋值就是没改
老师请问一下如何把标尺放在底部,做出类似下图的效果,没搜到要用哪个函数
右边那个是图例,不是标尺,然后你图里画的那个东西,它也不是正常这样画上去的,有可能是用Ai P上去的。
小洁老师,我能请教下截图悬浮的工具叫什么吗?
Snipaste
老师好,我在安装eoffice包的时候遇到了如图的报错,然后我安装了magick和Rcpp包之后重新加载eoffice包,就一直显示正在运行library(eoffice)命令(等了半个小时还是正在运行),如果中止命令或者强行退出r,再次重新library(eoffice)又会出现第一次的报错,请问该怎么办呢
管理员方式打开rstudio
这是因为电脑上M1 Pro的cpu么
没有安装 X11,OS X 10.9已不再提供此软件
需要从http://xquartz.macosforge.org下载安装
这页ppt里面::是代表不加载。但是不加载的话,后面的函数为什么能用?
你不加载 r不知道你要用啥函数,但你指定了具体的R包,他就知道了
老师,想请教个问题,数据b的结构和代码如图。但是运行出来的图片都是空的,画出来的图个数是对的。如果单次给gene赋值,画出的一张图是对,想知道代码哪里出错了
画图的代码里没有print
这个怎么解决?要手动下载吗?
是的,先单独安装这个包
命令是BiocManager::install("DO.db")
请问老师,在geo上找到的sra文件,是不是这里写了“2 reads per spot”就代表测序方法是pair-end测序
https://www.ncbi.nlm.nih.gov/sra/?term=SRR6051821你要看这里是single还是paired,这个就是paired
这种public data 要怎么知道adapter怎么trim,如果文章里没有写的话…下载的srr是原始数据,做alignment之前应该是要trim adapter吧?
如果文章里没有提供adapter的话,就按照他是universal adapter处理就好,用默认的方式处理。比如fastp之类的工具。
怎么可以看出来 这个是什么类型的数据呢 是芯片数据 还是rna-seq 还是其他
array是芯片,sequencing是测序,RNAseq数据一般是高通量测序获取的。
请问老师,如果以后自己的课题中探针注释在这个网址里面找不到,该怎么办?这里面总结了78个芯片
注释和ppt里都有
刚才离开后断网,再次进去服务器又出现密码输进去又提示要输密码。
你可以点左下角的记住密码,这样就可以不用每次重新输入。或者试试填表法
请问老师,我在练习2里面遇到了报错
文件名用 tab 补全,凡是手打的文件名都是错的, Data.tar.gz 不是 Data.rar.gz
老师,问下我做的练习最后要合成图片,生成deg文件为啥是空的,也没有图出来?
还有一句dev.off你没运行
小洁老师,我看生信技能树公众号您写的一篇文章,讲的是怎么处理GPR格式的原始数据(链接:https://mp.weixin.qq.com/s/AnXKIQrMGnnG5Td62v961w),我按照代码跑了一遍,最后生成的deg文件行名有点像entrezid,不太确定?
看样子就是Entrez ID,可以查看一下这个 https://www.biostars.org/p/208560/
你也可以查看一些管家基因,他们应该高表达
在临床信息里面找不到分组信息是不是就不能做差异性分析啦?
分组是自己的事情,跟代码无关,如果你没办法分组当然就没办法差异。都是胃癌,也有中晚期分组,性别分组,你给它一个免疫评分, 然后就是免疫高低分组了
老师好,我是Windows系统,在登录Linux服务器的时候用命令行法和填表法登录都连接不上,也没有出现弹窗,请问是哪里出问题了呢
换个网络环境
老师,问下作业里有道题,cp这个怎么复制不成功?
你的findMe.txt很可能是一个文件夹,只是你没注意到
请问各位老师同学,如果数据里面有负值,GEO数据库也没有RAW data, 这种数据还有再开发的可能么?
没有。20年前的芯片,早就停产了,而且他使用频率很低,就没有人给他开发配套的资料,这样的芯片拿到也没办法。
老师,我在R4的环境中安装R包之后library,发现有个error,该怎么处理呢
缺啥补啥就好,如果用conda安装的话,conda install r-rvcheck;可以通过搜索关键字找到安装的命令和在conda里这个包的名字
老师 我使用网页安装之后发现salmon包可以--help成功,但是当我切换环境回来之后发现还是报错了,包括安装install libstdcxx-ng=9.1.0也没用
看看error.pdf 有类似的报错,你还缺了一步
我网页安装的R4环境,然后想使用R的方法安装,弹出了这个提示:关于这个文件夹貌似没有权限,所以我可以进一步点yes来用个人文件夹来代替吗
可以
我换了好几个地方的源了,还是很卡
你截图显示只换了CRAN,没有换bioconductor
老师,关于昨天的课程有两个问题。1.开始单独安装的conda install -y libstdcxx-ng=9.1.0,结果失败并提示conflict(这边没来得及截图,刷屏信息太多翻不上去了),后来其他所有的都安装好了,又回来试了一遍conda install -y libstdcxx-ng=9.1.0,显示如图,是不是安装好了?但是我conda list查看libstdcxx-ng的版本并不是9.1.0,所以算安装成功没?
调用我们要用的软件帮助文档,salmon,hisat2等,没有报错就可以了
conda配置好以后 .condarc 存在于minconda文件夹的上一级目录中,能不能把.condarc 放入minconda文件夹下(单纯强迫症心理想条理一点)
不可以,隐藏文件 .condarc 是配置文件,有特殊作用,不可以移动
conda命令属于shell,怎么能在R里运行呢?需要去shell里面哦
15号那天的最后一部分内容,二进制文件安装,源代码安装,java编译的软件,听不懂看不懂,对下周转录组的课程影响大吗?
不大
老师我想写一个当i=1时返回Hi,当i>1时返回i的命令,您能帮我看看哪里出问题了吗,谢谢
这里是多了一个fi
读取文件使用 fread函数
安装clusterProfiler遇到的问题。您看下可以帮我解决吗?
github上有这个报错的解决方案 https://github.com/YuLab-SMU/MicrobiotaProcess/issues/32
install.packages("https://cran.r-project.org/src/contrib/Archive/rvcheck/rvcheck_0.1.8.tar.gz",type = 'source',repos = NULL)
先解决这个error
老师,请问一下我们平时运行shell文件是推荐用Rstudio,还是xshell啊,我看其他老师的扩增子测序都是在用rstudio运行shell文件
我们比较少这么用,而且这和个人习惯有关
老师,GO富集的时候怎么让BP,CC,MF都出现,小洁老师给的代码只出来BP和MF
cc可能是没有富集到
老师好,我在小环境中安装小软件的时候第一个用的是手动安装的,第二个R4想通配置文件安装,但是显示出这样的,问下咋回事?
你要先把 R4.yaml 文件保存到当前文件夹下
老师为啥我的geneid还有小数点
因为gtf文件中的geneid有小数点
老师,请问featurecounts的比对率低于多少属于结果不太好呢?上课的例子比对率是80%左右,小娟老师说这是属于好的,老师请问这种有规定的范围吗?
没有,主要看什么物种,而且还要看你的测序技术和样本类型,而且featurecounts的结果并不是比对率,应该是assign率哦。
文末友情宣传
强烈建议你推荐给身边的博士后以及年轻生物学PI,多一点数据认知,让他们的科研上一个台阶:
数据挖掘(GEO,TCGA,单细胞)2022年暑期班(收官之作),快速了解一些生物信息学应用图表 生信入门课-2022年暑期班(收官之作),你的生物信息学第一课