2022年5月_生信入门班_微信群答疑笔记
做教学我们是认真的,如果你对我们的马拉松授课(直播一个月互动教学)有疑问,可以看完我们从2000多个提问互动交流里面精选的300个问答!
强烈建议你推荐给身边的博士后以及年轻生物学PI,多一点数据认知,让他们的科研上一个台阶:
数据挖掘(GEO,TCGA,单细胞)2022年暑期班(收官之作),快速了解一些生物信息学应用图表 生信入门课-2022年暑期班(收官之作),你的生物信息学第一课
上一期答疑笔记是:2022年4月_生信入门班_微信群答疑笔记
整理人:汪哲
整理时间:2022年5月
联系方式:zhewang@webmail.hzau.edu.cn
本次开课时间:2022年4月25日——5月21日
课前答疑
运行完最后的library()那几行代码没有出现报错就是安装完毕对么?
是的,有时候会提示加载其他需要调用的包
想问下这是啥情况啊
上面提示你已经安装过了,不需要重复安装。记住检查安装是否成功的唯一标准就是library,library一下看看
老师,现在用的是windows,后期转macOS,这之间会有难度吗?操作上会有很大区别吗
视每个人的习惯而定,怕麻烦可以去b站学习一下Mac电脑的常规操作
带#号的这些需要贴过去吗?
不用
我自己试了一下library WGCNA这个,是不行?但是群公告里网站上给的代码运行起来都没问题的
BiocManager::install("preprocessCore")
单独运行这一句代码即可
各位老师,请教一下。明天上课是不是最好准备两台设备,一台上课,一台电脑跟着操作?
是的。如果实在不方便,一台也可以
我已经安装了R了哇,请问是因为下载的时候我先下了Rstudio的缘故吗?这个顺序是固定的?
需要rtools,看答疑文档
软件都要装到C盘吗
R语言和rstudio要安装在C盘,其他不做要求
mac系统安装Rstudio以后没有办法自动安装git,请问该怎么解决呢?
Mac不需要安装git
这里和视频里面不一样,是要安装什么吗
不用管,你从第一行开始运行,一下下点run,留意左下角窗口的输出信息,如果返回大于号,且没有error,就继续点run
这组提示需要管吗
在左下角窗口运行这一句代码 system('defaults write org.R-project.R force.LANG en_US.UTF-8')
这次的课程的R用哪个版本讲解啊?
大于4就好
这里是不是代表报错了
下面绿框中pheatmap没有安装。
装完R包 library的时候报错
你需要安装一个包vctrs
装完我library又出现了这个...
你的Mac需要安装一个软件,xcode,安装好了之后重启电脑,再重新安装R包
安装winscp后 自动弹到了这个界面 是要点这个install安装吗?
都可以
老师,请问这一部分是需要登陆吗
后续上课会讲,安装了就行
SSH客户端哪个好使啊 我装的MobaXterm 可以不
可以,上课演示用的是xshell,不过自己习惯就好
r安装后弄出了两个快捷方式,一个32bit 一个64bit,请问我们需要的是那个呀
这两个都关掉,在Rstudio界面操作即可
我看视频里说第一次打开Rstudio的时候,会需要安装git软件,但我打开以后,没有弹出窗口询问是否安装git,我是mac的电脑
Mac电脑不需要。win才要
有几行返回的是加号
光标定位到左下角窗口,按一下ESC键,重新运行这一行。一下下点run,光标会自动跳行
请问晚上的课程可以回看吗
可以,每次直播结束后视频会自动保存在钉钉群,一年内随时可以观看,支持倍速播放。
请问这个安装不成功,是因为网速差,镜像地址没打开吗?
可能,换个网络试试。不用纠结太多,先安装成功没有error就行,课程中小洁老师也会重点讲如何安装R包,大家现在遇到问题到时候学习效果更好,加油~
老师,我跑这个library的时候,报错了
看一下报错,上面提示这个没装,找到那条安装的命令运行
课中答疑
请问这个order这个函数order(x, y)返回的结果为什么是这样啊?
代码错了,不用去理解它的运行逻辑了,错的为什么要理解?你这个就是"代码不报错,不代表真的没错"的真实写照,你不知道自己要干什么,也不知道结果是啥意思,仅仅是没有报错,你就认为这个代码是对的,是思维上的错误呦。
我在写笔记的时候用了markdown语法,也没有生成代码框呢,请问以下你们语雀笔记里的代码框是怎么弄的呀?
可以点工具栏最左边的+号,或者英文输入符下,按三下```,输入语言字符(如R),按Enter就可以出来了
请问这个df1代表的是什么意思
数据框Data frame 1,就是把一个数据框命名为df
快来帮忙看看,这是咋回事儿列
c里面的数字都去掉双引号,重新运行一遍试试
不好意思想问问这一行代码如何理解?
去掉第一列
有没有友友知道这个图怎么看呀
先看p值 在有意义的基础上看R,R代表相关程度,-就是负相关,R绝对值约靠近1,相关性越大。绝对值<0.2则认为无相关性,绝对值>0.8则认为强相关性。R为正代表正相关,R为负代表负相关
字符检测,如果需要同时查询多个字符,帮助文档中我查到了下面这样的str_detect(x2,c("e","h")),但,这貌似返回,符合e或者h的逻辑值;如果想返回符合e并且h的逻辑值的话,是不是需要多个函数计算?
分别写两个str_sectect,&
富集分析结果的内容中,GeneRatio数值的分母,仍旧没理解。“能够对应到数据库中的差异基因总数”是否可以理解为,这个数据库总的差异基因总数固定为468?如果不是,这该怎么理解嘞?
数据库里只有基因,没有差异基因,只有你的实验设计差异分析结果,才能得出差异基因,比如你的差异基因有1000个,其中被kegg数据库收录的只有500个,那么这个分母就会是500,为什么这个分母不是1000?因为人类的认知有边界,不是所有的基因都被kegg收录了
这是昨天的课,重新下载匹配line了,运行了好几遍,跟小洁老师的不一样,我脑壳好疼,有睿智的小伙伴或者助教帮忙解答一下吗
理论上单独将这个GPL改成你的数据集的平台号后直接运行这一步就可以了,如果多次尝试仍不行,可能因为注释包版本有差别。
请问一下,我的mac air的提示符是%而不是$,请问这个会影响吗?
不会,上课的时候会提供服务器进行操作,提示符会是$。
老师,termius好像是收费的,finalshell可以吗?
免费版本够用。finalshell可以的,自己用习惯了都差不多的。
linux教程会介绍一些参数和通字符的讲解吗?我经常搞半天去理解
比如:cat filename |awk -F '\t' 'NR>1 {print $4}' |tr ';' '\n' |grep '_' >fq.url
会讲一些。
请问下这个写的是表达矩阵,但是这个也不是RNA的fpkm,为什么ID是数字啊?
ID是数字没关系,能对应就好,它公司出产芯片自己的规定
我分组用治疗前、后样本,不管c3和c5,然后就有个报错,老师帮我看下
x里头是字符串,y里头是数值,所以没法inner_join。intger是整数,numeric的一种,不过不要紧,直接ids$probe_id=as.character(ids$probe_id)
求问一下,rna-seq有什么常用的看splicing检验方法吗
有很多软件哦,第四周会提到,不着急哈
想请教一下一个刚刚遇到的问题,我用str_detect按行取子集的时候为什么结果会漏掉几行?比如说这个sham组明明有4个样本,取出来却只有两个
发生循环补齐。你要用两个str_detect,OR符号,竖线连接
请问这里提取ids 的这个信息,为什么是SYMBOL而不是别的?是规定好的吗?是这些名字都代表了这个探针的对应信息吗?
点开ids就知道有什么了,因为symbol是基因名,我们后面要用所以提取他,不然画个火山图,热图,总得知道差异表达的是啥, 这些都能提
请问下,处理普通转录组最低什么配置的服务器能跑
4核心,16G内存,500G硬盘
单8核32G单细胞能勉强做么
足够啦
这个是从Linux基础.md里复制过来的,请问是有特殊的使用场合吗?
只是部分命令使用,比如 help cd,命令 --help 适用大部分情况,我们一般用这个就够了
对于cut -d 这么理解对吗,也就是后面的字段是没有r吗,r从字符变成分隔符
是的,但是当你输出多列的时候,分隔符就还会显示出来
请问file1 file2 file3这种连续的名称的命令是啥,我上课的时候没记下来
file{1..3}
他说 cannot move 但是它又执行了
你的file*匹配了三个文件和叫file的文件夹。file不能自己移动到自己里面,这就是那句提示的意义。剩下三个文件当然可以动,所以就移动了。
老师 我对比了别人的和我的 readme.txt 的文件,是我的这个文件有问题,但我不知道是什么意思
你的文件是在windows中处理过再上传到服务器的,行末的换行符编码格式已经变了
想问下加载完r包后如何退出啊
q()
subread 安装后 command not found
subread包含其它软件,但不包含一个叫subread的软件,比如你下了一个软件叫腾讯,它里面没有一个真的软件叫腾讯,他是腾讯的微信或者QQ
老师 我运行了conda install -y -c hcc aspera-cli 这句命令后,返回了这个。我wget了它那个链接 ,可以调出帮助文档,是安装成功了吗?
是的,你可以看到有3个done,还有个do,你没截到
Bam文件 用什么打开呢 有点超纲
IGV
这是啥意思啊
这是library的提示信息呀,小洁老师说了,不是error就不用管。下面的×其实你看上面的英 直译也可以看懂,title是冲突,下面解释了具体的冲突
我运行了修改配色的命令,为什么颜色还是没有变嘞
命令行配色已经改了,但是你的bashrc应该被你其他操作改错了,导致ls命令没了颜色
为什么我vim后按esc退不出来?
三步
ESC
:wq
回车
我想删除我写的代码的时候 按了Backspace键 然后出现了^H 这样 想清屏 按ctrl+L 结果出现^L 然后就这个样子了…请问该怎么办呢是直接退出软件吗
CTRL+C终止
这几行代码里的$是什么意思?最后的两行里$fastqc和$multiqc是调用程序,不过最开始讲使用绝对路径的时候没有使用$。另外$也用在了文件夹的前面,又是什么意思啊?
用变量的时候前面要加$,前面四行是定义了四个变量,后面就是在用它们
构建索引的时候出现的sa文件可以删除么?
不可以
请问这里的name变量怎么解读啊
这样子探索
【1】运行圈出来部分;【2】id=【1】的第一个结果;【3】name=${id##*/} ;【4】echo ${name}
刚开始补课,请教一个问题
外面有单引号,里面肯定不能继续单引号,不然会冲突
这个解压命令说没有空间了,是我账号下面没有空间了吗?
是的,参考基因组服务器上有,用服务器上的就行,知道怎么下载即可
请问这个no space left on device要怎么解决呢?
这个需要我们管理员来解决
老师请问这个服务器账号有效期多久,忙毕业耽误了好多课
两个月哦
文末友情宣传
强烈建议你推荐给身边的博士后以及年轻生物学PI,多一点数据认知,让他们的科研上一个台阶:
数据挖掘(GEO,TCGA,单细胞)2022年暑期班(收官之作),快速了解一些生物信息学应用图表 生信入门课-2022年暑期班(收官之作),你的生物信息学第一课