查看原文
其他

国产单细胞技术大比拼(数据分析测评)

生信技能树 生信技能树 2023-04-28

转眼间接触单细胞也快十年了,大约2014我还在上海的时候跟CEL-seq技术创始人聊过合作,虽然没有开展下去。

后来2017开创《单细胞天地》公众号时候分享的绝大部分文献仍然是SMART-seq2的单细胞技术文章,但是到2018年情况就变了,因为10x的商业的成功基本上把单细胞跟它化等号了,所以我们2019年后分享的90%以上的文献都是10x单细胞转录组。而且有大量的单细胞技术测评数据集和文献,都表明了它们技术上其实是差异可以抹平,作为用户的我们其实并不需要过多纠结具体的单细胞技术,对我们来说,都是表达量矩阵(行是基因,列是细胞的矩阵)而已。在satijalab的seurat-data示例数据里面就有一个数据集是pbmcsca,它里面就有多种单细胞技术产出的pbmc单细胞数据:

# 如果你有 pbmcsca 数据集,就无需重新下载啦。
if(F){
  install.packages('devtools')
  devtools::install_github('satijalab/seurat-data')
  library(SeuratData) #加载seurat数据集  
  getOption('timeout')
  options(timeout=10000)
  InstallData("pbmcsca")    
  # 值得注意的是,中国大陆地区有一些地方无法下载它,自己想办法哦!
# 试开URL’http://seurat.nygenome.org/src/contrib/pbmcsca.SeuratData_3.0.0.tar.gz'
# Content type 'application/octet-stream' length 58634290 bytes (55.9 MB)
}

library(SeuratData) #加载seurat数据集  
data("pbmcsca")
# 把单细胞数据集对象,按照Method进行拆分成为多个对象。
pbmcsca.list <- SplitObject(pbmcsca, split.by="Method")
# 针对每个单细胞对象都运行 SCTransform 方法
pbmcsca.list <- lapply(X = pbmcsca.list, 
                       FUN = SCTransform, 
                       method = "glmGamPoi"
                       return.only.var.genes = FALSE)
var.features <- SelectIntegrationFeatures(object.list = pbmcsca.list, nfeatures = 3000)
# 然后合并多个已经SCTransform处理过的单细胞对象
pbmcsca.sct <- merge(x = pbmcsca.list[[1]], y = pbmcsca.list[2:length(pbmcsca.list)], merge.data=TRUE)
VariableFeatures(pbmcsca.sct) <- var.features
pbmcsca.sct <- RunPCA(pbmcsca.sct, verbose = FALSE)
# 然后走 Harmony  整合多个单细胞数据集
pbmcsca.sct <- RunHarmony(pbmcsca.sct, assay.use="SCT", group.by.vars = "Method")
pbmcsca.sct <- RunUMAP(pbmcsca.sct, reduction = "harmony", dims = 1:30)
pbmcsca.sct <- FindNeighbors(pbmcsca.sct, reduction = "harmony", dims = 1:30) %>% FindClusters()
DimPlot(pbmcsca.sct, group.by = c("Method""ident""CellType"), ncol = 3)

很容易看到不同单细胞技术产出的PBMC单细胞矩阵是可以比较好整合的:

不同单细胞技术产出的PBMC单细胞矩阵是可以整合的

这样大家就不需要耗费时间精力在单细胞技术底层了,反正是选择市场占比最高的10x单细胞转录组就足够了。

其实10x单细胞转录组商业上的大获成功是有道理的, 首先它从测序数据到表达量矩阵的就非常简洁,正常走cellranger的定量流程即可,代码我已经是多次分享了。参考:

然后,它下游数据分析也是走seurat即可,每个样品就会得到3个表达量矩阵文件(barcodes.tsv.gz,matrix.mtx.gz,genes.tsv.gz或者features.tsv.gz),然后就可以走seurat流程进行单细胞降维聚类分群。这样的基础分析,也可以看基础10讲:

但是10x单细胞转录组的价格也确实居高不下

从我们十几万粉丝的反馈来看,2020基本上都是3.5万左右一个样品,到2022虽然也可以半价,但是也高达1.75 万一个10x单细胞转录组样品,其中10x公司收取建库1万左右,illumina测序公司收取5千左右,科研服务公司盈利已经是只有两千五了。并不算是很好的收益,钱都被10x和illumina这样的海外公司赚走了

所以今年就涌现了大批的优秀的国产单细胞公司,之前看过一个国产单细胞技术大比拼的文章,但主要是从市场角度在剖析,不符合我们技术极客的审美,详见:12家公司的单细胞测序平台,究竟谁更胜一筹? , 大概有如下技术:

  • 华大智造-DNBelab C4便携式单细胞系统
  • 新格元-Singleron Matrix单细胞测序文库构建系统
  • 寻因生物-Seekone DD数字液滴仪
  • 万乘基因-10K Genomics液滴微流控单细胞测序仪
  • 达普生物-Galaxy星海单细胞测序建库仪
  • 墨卓生物-MobiNova-100单细胞测序建库系统
  • 百迈客-百创DG1000单细胞微液滴系统

我们来从数据角度测评一下这些国产单细胞技术吧,因为测评过程太真实所以我们的推文有可能会被各个公司给抹黑,毕竟对部分“滥竽充数”或者说能力不足的公司来说, 测评它们的数据只会是让他们难堪,妥妥的打脸现场。

百迈客-百创DG1000单细胞微液滴系统

在其官方公众号可以看到:发布 || 百创DG1000单细胞Demo数据更新,百创智造 百迈客生物 2022-07-28 18:06 发表于北京

  • 轻巧便携:背包即走,携带方便,便于实地取样,应用场景更广
  • 极速:110秒即可完成整个反应,减少环境对细胞状态的应激影响
  • 芯片使用灵活:芯片2X4独立设计,1~8样本灵活上机
  • 兼容更大的细胞直径:最大已成功支持到60 μm 的细胞直径

Demo数据结果展示,在百创DG1000单细胞Demo数据更新 可以看到;

  • 物种:小鼠
  • 组织类型:药物处理后的皮肤组织
  • 单细胞分选平台:百创DG1000
  • 测序平台:Illumina
  • 文库设计:PE150
  • 数据量:56.10G
活动一:百创DG1000单细胞转录组买二赠一
限30个名额
活动二:签单10个百创DG1000单细胞转录组赠送1个百创S1000空间转录组
限10个名额

并没有看到这个56.10G的fastq测序数据下载链接,也没有其表达量矩阵分享链接。所以这个测评有点难。

墨卓生物-MobiNova-100单细胞测序建库系统也没有公开

2022年4月15日下午2点,墨卓生物线上发布了其自产自研的单细胞测序系统MobiNova®-100。同时上市的还有MobiCube®单细胞转录组建库试剂和芯片,以及MobiVision®生信分析软件。发布会同期,墨卓开通了产品试用申请通道。(关注墨卓公众号,在对话框回复“合作报名”,审批通过即可免费完成1-4样本单细胞转录组文库构建。)

虽然没有公开数据,但是在  新技术平台免费试用,墨卓生物MobiNova-100单细胞系统上市 给了一些他们demo数据的图表

达普生物-Galaxy星海单细胞测序建库仪

2021 年 10 月,达普生物成功发布潜心多年研发的 Galaxy 星海单细胞测序建库仪及其配套的转录试剂盒,上市之后服务于各大科服公司及医院系统,广受好评!同样的,也没有看到公开数据,但是有达普生物现开通全国 Galaxy 星海单细胞测序建库仪免费建库试用通道 ,需要关注 “达普生物ThunderBio” 公众号即可获得资格申请通道,PC 端需点击发送消息获取通道,审批通过后,将会获得仪器免费投放和 4 个样本的免费单细胞转录组测序建库试剂盒。本次免费样本数量有限(共 40 个样本),先到先得!

虽然没有公开数据,但是在   达普Galaxy带您畅游单细胞的星辰大海  给了一些他们demo数据的图表,以及其优点 :

  • 基于专利微流控油包水快速高通量单细胞包裹;
  • 细胞捕获率:≥50%;
  • 捕获细胞数:单次实验可捕获400-20000个细胞;
  • 单细胞包裹时间:20 min;
  • 宽范围细胞检测:标准芯片可兼容最大50μm细胞 (定制芯片可兼容更大细胞);
  • 凝胶编码微球高效捕获单细胞mRNA;
  • 商品化建库kit:无门槛的高质量单细胞cDNA文库构建;
  • 灵活设计芯片:1-4样本,单次可灵活选择样本数,节省实验成本;
  • 高效、高质量、低成本数据呈现:从样本到建库,只需8小时。

似乎是只有新格元有公开可以获取的数据集

我还拿到了新格元出品的国产单细胞已经发表文献合辑(恰好截图里面的前两个乳腺癌数据我就下载过表达量矩阵以及其测序数据):

已经发表文献合辑

其他公司还在demo数据阶段,新格元基本上是一骑绝尘了,一百多篇使用了他们新格元平台的单细胞文章发表了,而且不少文章都公开表达量矩阵或者测序数据的。很简单的就可以搜索到很多:

GSE148071 Platform: GPL20795 42 Samples
GSE155900 Platform: GPL20795 10 Samples
GSE159713 Platform: GPL21273 9 Samples
GSE203360 Platform: GPL20795 6 Samples
GSE128982 Platform: GPL26363 2 Samples

我们可以任意选择一个数据集,比如:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE159713

读取作者给出来了的表达量矩阵文件,走单细胞降维聚类分群流程,GSE159713_epididymis_umi_matrix.tsv.gz 87.8 Mb

更多精彩欢迎加入交流群

前面提到过,因为测评过程太真实所以我们的推文有可能会被各个公司给抹黑,毕竟对部分“滥竽充数”或者说能力不足的公司来说, 测评它们的数据只会是让他们难堪,妥妥的打脸现场。但又确实有必要从数据角度测评一下这些国产单细胞技术让大家提前避坑。所以接下来对这些国产单细胞技术公司的公开数据测评会在特定交流群进行,欢迎大家加入哈!

入群方式

同样的,本次交流群并没有公开课,就是一个简单的微信交流群哦!群聊组建费用18.8元,一个简单的门槛隔绝那些不怀好意的广告营销号! 前200名可以直接扫描(仍然需要18.8)群聊二维码进群,满200人后我们会统一收款!(每个人都是18.8 元,如果你不同意这个象征性收费,请不要进群哈!)

如果上面的二维码无法进群,说明已经满员了,需要我们生信技能树的官方拉群小助手帮忙拉群哦!!!(名额有限,先到先得!!!)

这个时候请直接付款28元给小助手,就可以进群,或者你转发此推文到朋友圈然后截图给小助手,就可以仍然以18.8元进群!

一个简单的门槛,隔绝那些营销号!我们也会在群里分享关于这个文章的单细胞数据分析分析代码的理解,仅此而已,考虑清楚哦! 

长按识别二维码


烦请备注姓名学校单位信息


不过,实事求是的说,虽然国产这些平台的数据整体上和10x还有一定的差距,但是对于大部分科研的应用场景是足够的,可见在新型应用领域国产力量逐渐成为了一股不可忽视的力量。同时国产的价格(单个样品低于1万)要远低于10x平台(单个样品均价1.7万),对于科研经费不足、科研中对稀有细胞群、稀有基因要求不高的客户是完全可以考虑的。一方面能够促进自主产品的升级优化,另一方面也能够节约不少成本。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存