查看原文
其他

云平台表格操作-信息提取专栏| 云课堂(24)

联川生物 2022-05-21

一直关注联川公众号的小伙伴们都知道,联川云平台已于2018年12月6日正式上线(http://www.lc-bio.cn/index.html);

还没使用过的小伙伴,赶紧点开大显身手一番~使用指南详情请戳此链接:联川生物云平台使用指南

联川云平台包含FAQ/SOP和云平台双重功能:丰富的FAQ/SOP,助你快速上手入门,更有详尽的分析技能小技巧等你来学习;云平台中包含科研中经常用到的分析绘图软件,可对实验数据进行统计分析、绘图等。

今天小编将与大家一起分享云平台里的表格操作-信息提取,一起学起来吧~


需要什么样的输入文件?

1. 下载示例数据

默认显示的文件名是默认图片的输入数据,可以点击“示例文件下载”查看。上传的文件必须是 xlsx格式,否则会报错。


 

2. 输入文件格式

A. 必须有列名。上传文件后会自动读取列名作为提取信息的对象,同时在表格中高亮提示选择进行筛选的列。


B. 若需要进行批量筛选,需先检查每个文件是否列名相同,否则设定的筛选条件可能对某些表格不适用。


【案例一(仅提取一列中的信息):提取包含特定基因的行】

以云平台内置的默认数据为例(可下载示例文件以查看):


“信息提取(取并集)”和“信息提取(取交集)”的界面都可以进行单列信息的提取,其结果是一样的。

1. 选择要筛选的列(选择列会高亮显示),并填入要提取的信息,点击确认:


拖拽右下角可以调整文本框,方便查看文本内容:


2. 点击确认后,会新增“提取结果”界面和“下载”相关内容。可以查看“提取结果”确定是否需要下载。


3. 点击“下载结果文件”下载。


【案例二(同时提取多列中的信息):提取包含特定基因或 GO 信息的行】

以云平台内置的默认数据为例(可下载示例文件以查看):


“信息提取(取并集)”和“信息提取(取交集)”的界面的区别:“取并集”- 但凡在一列中匹配到信息,就输出;此案例使用这个方案

“取交集”-  在多列信息中同时匹配到信息,才输出。



1. 在填好一列信息的情况下(见如下“gene_name”参数栏),点击加号,在新增的参数栏中选择 KEGG 列,填写在 KEGG 列中需要提取的信息:nucleus、protein-DNA complex 和 GO:0009408。  


2. 默认情况下,会对需要提取的信息进行精确匹配(整个单元的字符完全匹配),但是参见右上图, GO 列的单元格内容很多,我们希望的是:输入一个关键字,从而把 GO 列中包含这个关键字的行提取出来。所以我们勾选模糊匹配,见左上图绿色圆圈。

3. 在左侧“提取结果”页面确认结果后,点击“下载结果文件”下载。


【案例三(同时提取多列中的信息):提取包含特定基因和GO信息的行】

以云平台内置的默认数据为例(可下载示例文件以查看):


“信息提取(取并集)”和“信息提取(取交集)”的界面的区别:“取并集”-但凡在一列中匹配到信息,就输出;

“取交集”-在多列信息中同时匹配到信息,才输出。此案例使用这个方案。



其它操作同【案例二(同时提取多列中的信息):提取包含特定基因或GO信息的行】

如何进行批量分析?

1. 批量上传文件:


2. 上传完成后,左侧红框处会提示上传的文件名,用以检查是否上传了正确的文件;右侧红框处会提示展示数据的信息来源。


3. 选择进行筛选的列(“在此列中提取信息”)和提取的关键字(“需提取的信息”),具体参见【如何进行表格信息提取?】。


上述筛选条件会应用于所有的文件。

4. 点击“开始分析”后,右侧的“提取结果”页会展示第一个输入文件的结果供参考,方便即时调整。

同时跳出下载选项,所有文件的筛选后结果会打包下载(zip 格式),输出文件与输入文件同名。



筛选模式

“信息提取(取并集)”- 但凡在一列中匹配到信息,就输出;“信息提取(取交集)”-  同时在多列(做多 5 列)信息中匹配到信息,才输出。



匹配模式

文本框中的信息,一行为一个关键字,循环搜索该列直到遍历完所有关键字。

精确匹配:默认。若整个单元格匹配到任一关键字,认为该行匹配到。

模糊匹配:需勾选“模糊”才进行。若整个单元格“包含”任一关键字(大小写敏感),认为该行匹配 到。 

大小写敏感:需在“模糊匹配”模式下才进行。若整个单元格“包含”任一关键字(忽略大小写的差异), 认为该行匹配到。


表格操作-信息提取就分享完了,除了本教程联川云平台还有很多小技能供学习哦~下载本教程请至云平台:http://www.lc-bio.cn/faq/sop_detail.php?id=213或直接点击文末左下角“阅读原文”下载~



云平台登录和注册的流程


云平台目前只针对联川客户开放,注册需用正确的合同号进行注册哦,有多个合同的填写任意一个合同号即可。暂不能体验的小伙伴也别着急,随着平台的优化,也会逐步对全员开发的~注册链接如下:

http://www.lc-bio.cn/index.html


也欢迎给位给我们的云平台留言、提建议

在大家的督促下,我们的云平台会越做越好


相关阅读

 

脚踏七彩祥“云”为您打造生物信息分析的“梦幻花园”

联川生物云平台使用指南

云平台|Haploview绘制曼哈顿图小技巧

云平台 | LEfSe在线分析教程

MEGA软件下载安装&序列处理&进化树绘制&Newick格式介绍

云平台|bio-Venn在线绘制Venn图

云课堂(5) | Circos画图入门教程

云课堂(6) | FigTree构建进化树(圆形)教程

云课堂(7) | FigTree构建进化树(柱状)教程

云课堂(8)|MetaboAnalyst使用教程-Enrichment Analysis模块

云课堂(9)|MetaboAnalyst使用教程-Pathway Analysis模块

云课堂(10) | MicrobiomeAnalyst在线绘图教程

云课堂(11) | 真菌FUNGuide功能预测使用指南

云课堂(12) | 如何通过PS软件设置图片分辨率及拼图

云课堂(13) | 高通量测序数据NCBI GEO数据库上传指南

蛋白质组数据上传指南 | 云课堂(14)

NCBI-SRA数据上传指南 | 云课堂(15)

微生物基因组数据上传指南 | 云课堂(16)

云课堂(17) | Cytoscape内插stringAPP完成PPI蛋白互作分析指南

Enrichment Analysis 模块 | 云课堂(18)

蛋白质组学搜库数据下载 | 云课堂(19)

干货合集|2018年的科研技巧全在这儿了

干货合集|2017年的科研小技巧全在这儿了

干货合集|2017年的案例解析全在这儿了

科研圈高质量公众号大汇总|资料篇

联川生物2018年最全新品&用户文章汇总|年终盘点

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存