云平台表格操作-信息提取专栏| 云课堂(24)
一直关注联川公众号的小伙伴们都知道,联川云平台已于2018年12月6日正式上线(http://www.lc-bio.cn/index.html);
还没使用过的小伙伴,赶紧点开大显身手一番~使用指南详情请戳此链接:联川生物云平台使用指南;
联川云平台包含FAQ/SOP和云平台双重功能:丰富的FAQ/SOP,助你快速上手入门,更有详尽的分析技能小技巧等你来学习;云平台中包含科研中经常用到的分析绘图软件,可对实验数据进行统计分析、绘图等。
今天小编将与大家一起分享云平台里的表格操作-信息提取,一起学起来吧~
1. 下载示例数据
默认显示的文件名是默认图片的输入数据,可以点击“示例文件下载”查看。上传的文件必须是 xlsx格式,否则会报错。
2. 输入文件格式
A. 必须有列名。上传文件后会自动读取列名作为提取信息的对象,同时在表格中高亮提示选择进行筛选的列。
B. 若需要进行批量筛选,需先检查每个文件是否列名相同,否则设定的筛选条件可能对某些表格不适用。
【案例一(仅提取一列中的信息):提取包含特定基因的行】
以云平台内置的默认数据为例(可下载示例文件以查看):
“信息提取(取并集)”和“信息提取(取交集)”的界面都可以进行单列信息的提取,其结果是一样的。
1. 选择要筛选的列(选择列会高亮显示),并填入要提取的信息,点击确认:
拖拽右下角可以调整文本框,方便查看文本内容:
2. 点击确认后,会新增“提取结果”界面和“下载”相关内容。可以查看“提取结果”确定是否需要下载。
3. 点击“下载结果文件”下载。
【案例二(同时提取多列中的信息):提取包含特定基因或 GO 信息的行】
以云平台内置的默认数据为例(可下载示例文件以查看):
“信息提取(取并集)”和“信息提取(取交集)”的界面的区别:“取并集”- 但凡在一列中匹配到信息,就输出;此案例使用这个方案;
“取交集”- 在多列信息中同时匹配到信息,才输出。
1. 在填好一列信息的情况下(见如下“gene_name”参数栏),点击加号,在新增的参数栏中选择 KEGG 列,填写在 KEGG 列中需要提取的信息:nucleus、protein-DNA complex 和 GO:0009408。
2. 默认情况下,会对需要提取的信息进行精确匹配(整个单元的字符完全匹配),但是参见右上图, GO 列的单元格内容很多,我们希望的是:输入一个关键字,从而把 GO 列中包含这个关键字的行提取出来。所以我们勾选模糊匹配,见左上图绿色圆圈。
3. 在左侧“提取结果”页面确认结果后,点击“下载结果文件”下载。
【案例三(同时提取多列中的信息):提取包含特定基因和GO信息的行】
以云平台内置的默认数据为例(可下载示例文件以查看):
“信息提取(取并集)”和“信息提取(取交集)”的界面的区别:“取并集”-但凡在一列中匹配到信息,就输出;
“取交集”-在多列信息中同时匹配到信息,才输出。此案例使用这个方案。
其它操作同【案例二(同时提取多列中的信息):提取包含特定基因或GO信息的行】
1. 批量上传文件:
2. 上传完成后,左侧红框处会提示上传的文件名,用以检查是否上传了正确的文件;右侧红框处会提示展示数据的信息来源。
3. 选择进行筛选的列(“在此列中提取信息”)和提取的关键字(“需提取的信息”),具体参见【如何进行表格信息提取?】。
上述筛选条件会应用于所有的文件。
4. 点击“开始分析”后,右侧的“提取结果”页会展示第一个输入文件的结果供参考,方便即时调整。
同时跳出下载选项,所有文件的筛选后结果会打包下载(zip 格式),输出文件与输入文件同名。
“信息提取(取并集)”- 但凡在一列中匹配到信息,就输出;“信息提取(取交集)”- 同时在多列(做多 5 列)信息中匹配到信息,才输出。
文本框中的信息,一行为一个关键字,循环搜索该列直到遍历完所有关键字。
精确匹配:默认。若整个单元格匹配到任一关键字,认为该行匹配到。
模糊匹配:需勾选“模糊”才进行。若整个单元格“包含”任一关键字(大小写敏感),认为该行匹配 到。
大小写敏感:需在“模糊匹配”模式下才进行。若整个单元格“包含”任一关键字(忽略大小写的差异), 认为该行匹配到。
表格操作-信息提取就分享完了,除了本教程联川云平台还有很多小技能供学习哦~下载本教程请至云平台:http://www.lc-bio.cn/faq/sop_detail.php?id=213或直接点击文末左下角“阅读原文”下载~
云平台目前只针对联川客户开放,注册需用正确的合同号进行注册哦,有多个合同的填写任意一个合同号即可。暂不能体验的小伙伴也别着急,随着平台的优化,也会逐步对全员开发的~注册链接如下:
http://www.lc-bio.cn/index.html
也欢迎给位给我们的云平台留言、提建议
在大家的督促下,我们的云平台会越做越好
MEGA软件下载安装&序列处理&进化树绘制&Newick格式介绍
云课堂(8)|MetaboAnalyst使用教程-Enrichment Analysis模块
云课堂(9)|MetaboAnalyst使用教程-Pathway Analysis模块
云课堂(10) | MicrobiomeAnalyst在线绘图教程
云课堂(13) | 高通量测序数据NCBI GEO数据库上传指南
云课堂(17) | Cytoscape内插stringAPP完成PPI蛋白互作分析指南
Enrichment Analysis 模块 | 云课堂(18)