新出炉的Cytoscape视频教程
Cytoscape已成为网络图绘制的核心工具,基因表达调控网络、蛋白互作网络、miRNA-gene调节关系、分析流程、组织架构等任何与网络、结构、层级有关系的事情都可以用Cytoscape来绘制。
前期的教程中有Cytoscape的基本使用,早期录制的Cytoscape视频教程, 含安装和基本使用等。
从上次录制视频,到现在Cytoscape也有了不少更新,个人对Cytoscape的体会也有了进步,更主要的是不少人反应之前的视频不够清晰,或实名或匿名 (匿名的都没回复)的联系我要清晰版。实际我也没有,不知道为啥传上去就不清晰了,这次录制了全屏版,希望效果能好些。
本次三个视频,截图不同的角度。
基本操作
利用一个简单的组织构建图展示Cytoscape的基本使用,导入网络、导入节点属性,更改点的形状、颜色,在点上插入图片、绘制饼图、柱状图、加入颜色条纹,点的手动对齐、横向分布等。
网络文件和节点属性文件都是正常矩阵格式,若有中文需使用UTF-8编码;若非EXCEL文件,不能有xls后缀。
miRNA-mRNA调控网络
Cytoscape可用于绘制基因共表达网络,这儿选取miRNA-gene调控网络 (含miRNA-gene表达相关性数据)做为例子,涉及到根据表达变化倍数对每个点进行着色、根据表达相关性对线进行着色、miRNA和靶基因采用不同的形状表示、微调获得合适的展示图形、结果导出PDF格式、导出图例等。
不同的布局的调试和修改
网络绘制根据网络图的大小、展示的用意可以选择合适的布局。Cytoscape提供了多种布局算法,具体见http://manual.cytoscape.org/en/stable/Navigation_and_Layout.html。
下面列出几种示例
Attribute Circle Layout
属性环展示方式所有的节点都在环上,适用于点比较少的时候。环上点的顺序可以根据某一列来调整。
Group Attributes Layout
先按某一列的值对点进行分组,每个分组的点成为一个独立的环。在区分上下调基因时,可以按这个来分类,看不同类的基因的调控关系。
Prefuse Force Directed Layout
通常也可以获得比较好的结果,相连的点邻接,其它点较远。同时可以根据某一列设置边的强度作为连线的长度。
Compound Spring Embedder Layout
复杂网络适用这个,尤其是连线特别多时。
Edge-weighted Spring-Embedded Layout
所有的边视为连接2个节点的弹簧。每一个弹簧有一个松弛状态下的期望长度 (resting length)和压缩强度。算法会迭代所有的弹簧,并进行仿真模拟获得每个弹簧的最佳长度。是比较常用的一种,其获得结果也是一个环,但对空间的利用比下面两种要好。
yFiles Organic Layout
也是一种Spring-embeded的算法,可以展示网络图的聚类结构。
SlideShare上的一篇PPT, https://www.slideshare.net/keiono/introduction-to-biological-network-analysis-and-visualization-with-cytoscape-part1
2. 早期录制的Cytoscape视频教程, 含安装和基本使用
易生信GEO/TCGA专题课程 - 挖掘公共数据,发表自己文章 (2019年4月19日,北京鼓楼)
GEO是当今最大、最全的公共基因数据资源库,包括基因的表达、突变、修饰等信息,涵盖几乎所有的疾病,且单个实验检测样品数目较多。TCGA数据库包含11,000
个病人的33
种肿瘤的7
个不同层面的基因数据 (包括基因表达、CNV,SNP,DNA甲基化,miRNA,外显子组等)和临床数据,意在解析癌症发生的分子机制、肿瘤的亚型和治疗靶点等。
这两个来源的数据都是对外公开的,是学习、研究和应用的一个资源宝库。从2006年TCGA计划启动以来,基于TCGA数据发表的文章呈指数增加,一大部分来源于对TCGA数据的再次挖掘。因此学习利用生物信息技术挖掘GEO/TCGA公共数据中疾病的分子特征、合适的检测指标具有重要的临床和科研价值。本课程将从GEO/TCGA的表达、突变数据入手,探索公共数据挖掘的基本套路,分享数据分析和可视化的思路和代码,以便应用于自己的研究。开课时间2019年4月19-21日,地点北京鼓楼。
课程涉及主要内容如下:
每节课1小时一个主题,理论结合实战,学懂原理,实战实操,全是老司机多年经验和代码的无私分享。利用自己电脑,轻松实现整套分析。如果有基础,可以多理解代码内容,做更多定制。如果基础弱一些,只需修改几个备注的变量,即可完成全部分析。下面是课程安排,如11代表第一天第一节课,26代表第二天第六节课,(实际上课会有调整,理论和实战穿插调和),41为两周后的线上集中视频答疑。
编号 | 主题 | 简介 | |
---|---|---|---|
11 | GEO挖掘案例介绍和结果解读 | 学习套路和宏观把控 | |
12 | R语言基础知识介绍 | 基础变量和数据操作 | |
13 | ggplot2绘图基础 | 热图、火山图等常见图绘制 | |
14 | GEO数据库使用介绍 | 数据查找、下载、清洗、批次校正、可视化 | |
15 | 芯片全套分析 | 差异基因、GO GSEA(时间序列)富集分析、可视化 | |
16 | WGCNA共表达网络 | KEGG/Reactome通路可视化 | |
21 | 实战重现2018 纯公共数据Science文章 | 文章整体解读和亮点分析 | |
22 | 实战重现2018 纯公共数据Science文章 | 表达模式评估,样品差异分析 | |
23 | 实战重现2018 纯公共数据Science文章 | 不同来源数据校正和比较的原理和操作 | |
24 | 实战重现2018 纯公共数据Science文章 | WGCNA共表达模块分析、网络可视化、模块性状关联 | |
25 | 实战重现2018 纯公共数据Science文章 | 基因表达和突变数据关联 | |
26 | 常见图快速绘制、解读和排版 | 见图 | |
31 | TCGA数据 | 案例介绍和结果解读 | |
32 | 实战重现2018 JAMA文章 | TCGA数据下载和整理 | |
33 | 实战重现2018 JAMA文章 | TCGA数据表达分析全套 | |
34 | 实战重现2018 JAMA文章 | 突变模式, 突变负荷和生存分析 | |
35 | 实战重现2018 JAMA文章 | 突变与临床因素相关性分析以森林图展示 | |
36 | 考试、圆桌论坛 | 自评学习效果、知识点回顾 | |
41 | 答疑-线上 | 答疑、考试内容串讲 |
R基础知识和图形绘制
GEO数据分析
GEO数据库使用介绍, 数据查找、下载、清洗、批次校正、可视化
芯片全套分析, 差异基因、GO GSEA(时间序列)富集分析、可视化
实战重现纯公共数据Science文章, 整体解读, 亮点分析, 结果重现
TCGA数据分析
TCGA数据,案例介绍和结果解读
TCGA数据下载和整理,临床数据获取和整理
TCGA数据表达分析全套,差异基因富集分析等
实战重现2018 JAMA文章, 突变模式, 突变负荷和生存分析, 突变与临床因素相关性分析以森林图展示, 新队列数据验证结果
希望大家报名时,给出自己想重复的文章或结果,我们综合评估,优先照顾,定制专属课程。如果当时不能满足的,也会在后续讨论群提供解决方案,毕竟我们为所有线下学员提供免费绘图。
(如果基础薄弱,报名付款成功后,可免费领取基础程序课,做好准备工作, 让程序成为我们的得力工具而不是学习新知识的绊脚石。)
往期精彩回顾
主讲教师
陈同,博士,2015毕业于中科院遗传与发育生物学研究所,生物信息专业博士,在Cell Stem Cell(IF=23.2,第一作者兼封面文章),Nucleic Acids Research,Stem Cells and Development等高水平杂志以第一作者或主要作者发表文章,运营有数万人关注的《生信宝典》微信公众号,给你不一样的学习生信体验。
刘永鑫,博士。2008年毕业于东北农大微生物学专业。2014年中科院遗传发育所获生物信息学博士学位,2016年博士后出站留所工作,任宏基因组学实验室工程师,目前主要研究方向为宏基因组学数据分析与可重复计算。发表论文10余篇,SCI收录7篇。2017年7月创办“宏基因组”公众号,目前分享宏基因组、扩增子原创文章185篇,关注人数2.3万人,累计阅读近300万次。
授课模式
本课程以讲解流程和实际操作为主,采用独创四段式教学,封装好的代码全部分享,随处可用:
第一阶段 3天集中授课;
第二阶段 自行练习2周;
第三阶段 在线直播答疑;
第四阶段 培训视频继续学习;
实现教-练-答-用四个环节的统一协调。
培训时间
2019-04-19 到 2019-04-21 (线下讲解实战)
每天早9点到晚6点,半封闭式教学 (最后1小时为集中讨论时间,最后一天会稍微提前一些,多留出时间讨论,也方便老师乘车返回)
报到时间:培训当天
授课地点
北京市西城区鼓楼附近 (具体开课前一周通知)
课程价格
截止 2019-04-12前 4500 元/人
名额有限,每次课程报名满40人后自动关闭报名通道
提供易汉博基因科技实习机会或工作机会
课程连报有优惠,具体见报名网站
课程福利
座位按报名并缴费或预付款成功顺序从前到后龙摆尾式排序
赠送程序基础课一份 (http://bioinfo.ke.qq.com)
多人 (N,10>N>1) 组团报名并同时缴费,每人还可减免N-1百元 (最高500)
赠送金士顿U盘一个(32G含培训数据和脚本)
附推荐语分享对应的招生信息到朋友圈,截图发到train@ehbio.com 可获得200元生信宝典腾讯课堂课程优惠券(可拆分供多个课程使用)
注意事项 *
需自备笔记本电脑,推荐使用win10系统,4G以上内存 (推荐8G)。课程实践根据需要会提供云计算平台
培训班所有数据,文档为内部资料,仅供参阅,未经允许不得翻印外传登刊
上课期间禁止录音,录像
成功付款的学员,若临时有紧急事情不能到来的,可申请延期,更换后续培训班;也可申请退款
若开课2周 (含) 前申请退款可退还85%费用;开课3个工作日 (含) 前申请退款退还70%的费用 (若已开发票需承担相应手续费)
不可先延期再退款
更多课程的详细介绍,请扫描下方二维码。
复制以下链接http://www.ehbio.com/Training/ 或 点击阅读原文跳转报名页,成为实验中不可或缺的人,赶快报名吧!
易生信系列培训课程,扫码获取免费资料
更多阅读
后台回复“生信宝典福利第一波”获取教程合集
听说分享到朋友圈的朋友会在公众号周年庆时中奖 (大家还记得去年的大放送吧,不记得查查历史