看到一个比较古老的生物学领域的研究文献,文章标题是:《Analysis of CUL-5 expression in breast epithelial cells, breast cancer cell lines, normal tissues and tumor tissues》,于2003年发表在 Molecular Cancer 杂志,如题,研究者就分别在乳腺癌和正常乳腺的细胞系里面测定了几个基因的表达量情况。
The Journal Impact 2019-2020 of Molecular Cancer is 11.350, which is just updated in 2020.
研究课题涉及到的癌症和正常细胞系是:
breast epithelial cells (HMEC, MCF-10A), breast cancer cells (MCF-7, MDA-MB-231)
检测的基因是 CUL-5: 以及 other CUL family members (CUL-1, -2, -3, -4A, and -4B) 。实际上哺乳动物有:seven related cullins (Cul1, Cul2, Cul3, Cul4A, Cul4B, Cul5 and Cul7)
也有临床队列验证:
The cancer profiling array revealed that 82% (41/50) of the breast cancers demonstrated a decrease in CUL-5 expression versus the matched normal tissue. For the 50 cases of matched breast tissue there was a statistically significant ~2.2 fold decreased expression of CUL-5 in tumor tissue versus normal tissue (P < 0.0001).
技术是 RT-PCR :,使用 :
a 411-bp PCR product for ribosomal protein S9 905-bp mouse GAPDH cDNA (Ambion) actin (~42 kDa)
实际上看表达量远不止 RT-PCR 技术,在临床病人队列,现在用得更多的是:Tissue microarray (TMA) 和 immunohistochemistry analysis (IHC)。而且文章里面的 RT-PCR ,进化成为了 Quantitative real-time polymerase chain reaction (qPCR) ,实时荧光定量PCR.值得注意的是不同物种的不同组织器官样品的qRT-PCR内参基因也不一样。
我前些天在《生信技能树》介绍过一个网页工具DrBioRight ,见:聊个天就把生存分析给做了?,现在演示一下聊个天就把这个课题做了,进入主页:(https://drbioright.org),然后尝试使用以下对话进行聊天:
CUL5 gene expression in breast related cellline of CCLE database
发现这个网页工具DrBioRight 简直就是一个人工智障啊,还不如自己去CCLE数据库官网去查询:
https://portals.broadinstitute.org/ccle/page?gene=CUL5
而且可以下载数据自己去R里面进行统计可视化。
不知道是不是我还是不是很会玩那个网页工具DrBioRight ,目前看来我的需求是很难通过聊天被满足的。我仍然是推荐大家自己学习R语言把R的知识点路线图搞定,如下:
了解常量和变量概念 加减乘除等运算(计算器) 多种数据类型(数值,字符,逻辑,因子) 多种数据结构(向量,矩阵,数组,数据框,列表) 文件读取和写出 简单统计可视化 无限量函数学习
起码需要一个月!!!详见:《生信分析人员如何系统入门R(2019更新版)》。
同样的策略今年仍然是有效
我看到公众号《上海国际乳腺癌论坛(SIBCS)》发布的 :《切断三阴性乳腺癌细胞生长的营养来源》就提到了一个类似的研究:
比如2020年10月8日,英国癌症研究基金会《英国癌症杂志》在线发表英国牛津大学、诺丁汉大学、伦敦大学癌症研究院的研究报告,探讨了不同谷氨酰胺转运蛋白对不同乳腺癌细胞的影响。就是分析了 5种钠偶联中性氨基酸转运蛋白(SLC1A4、SLC1A5、SLC7A5、SLC38A1、SLC38A2)在谷氨酰胺缺乏或药物刺激下对6种乳腺癌细胞(激素受体阳性MCF7、激素受体阳性T47D、HER2阳性SKBR3、三阴性HCC1806、三阴性MDA-MB-231、三阴性MDA-MB-468) 的作用和分布。
同样的,前面介绍过的网页工具DrBioRight ,见:聊个天就把生存分析给做了?, 仍然是无法完成这样的分析!
但是可以自己在CCLE数据库官网去查询这些基因在这些细胞系的表达量,作为一个学徒作业哈!完成下面的图表
结果,SLC38A2(又称SNAT2)被确定为高表达于6种乳腺癌细胞的氨基酸转运蛋白。通过自噬作用,SLC38A2可被溶酶体降解。对于谷氨酰胺敏感细胞,敲低SLC38A2编码基因表达可减少谷氨酰胺摄入、诱发自噬作用、引起氧自由基产生、抑制乳腺癌细胞生长。
142例SLC38A2高表达与1338例SLC38A2低表达乳腺癌患者相比,乳腺癌相关生存显著较差(P=0.004);其中,33例SLC38A2高表达与75例SLC38A2低表达三阴性乳腺癌患者相比,乳腺癌相关生存显著较差(P=0.02)。
可以看到是自己的临床队列:
有临床意义这个课题就升华了。我在生信技能树多次分享过生存分析的细节;
基因表达量高低分组的cox和连续变量cox回归计算的HR值差异太大? 学徒作业-两个基因突变联合看生存效应 TCGA数据库里面你的基因生存分析不显著那就TMA吧 对“不同数据来源的生存分析比较”的补充说明 批量cox生存分析结果也可以火山图可视化 既然可以看感兴趣基因的生存情况,当然就可以批量做完全部基因的生存分析 多测试几个数据集生存效应应该是可以找到统计学显著的! 我不相信kmplot这个网页工具的结果(生存分析免费做) 为什么不用TCGA数据库来看感兴趣基因的生存情况 200块的代码我的学徒免费送给你,GSVA和生存分析 集思广益-生存分析可以随心所欲根据表达量分组吗 生存分析时间点问题 寻找生存分析的最佳基因表达分组阈值 apply家族函数和for循环还是有区别的(批量生存分析出图bug) TCGA数据库生存分析的网页工具哪家强 KM生存曲线经logRNA检验后也可以计算HR值
认真学习其中的细节还是很有必要的,如果大家没有时间自行慢慢摸索着学习,可以考虑我们生信技能树官方举办的学习班马上10月12日就开课):
数据挖掘学习班第7期(线上直播3周,马拉松式陪伴,带你入门),原价4800的数据挖掘全套课程, 疫情期间半价即可抢购。 生信爆款入门-第9期(线上直播4周,马拉松式陪伴,带你入门),原价9600的生信入门全套课程,疫情期间3.3折即可抢购。
如果你课题涉及到转录组,欢迎添加一对一客服:详见:你还在花三五万做一个单细胞转录组吗?
号外:生信技能树知识整理实习生招募,长期招募,也可以简单参与软件测评笔记撰写,开启你的分享人生!