推广 热搜: 行业  机械  设备    教师  系统    经纪  参数  蒸汽 

【原】scRepertoire||单细胞免疫组库分析:R语言应用(一)

   日期:2024-11-14     移动:http://mip.riyuangf.com/quote/1079.html

10× Genomics单细胞免疫组库VDJ分析必知必会(https://www.jianshu.com/p/db4831091a5c)免疫组库数据分析||immunarch教程:快速开始(https://www.jianshu.com/p/9d7711879bf5)免疫组库数据分析||immunarch教程:克隆型分析(https://www.jianshu.com/p/287f890d7ef4)免疫组库数据分析||immunarch教程:探索性数据分析(https://www.jianshu.com/p/dd4fcfb63627)免疫组库数据分析||immunarch教程:载入10X数据(https://www.jianshu.com/p/7379d0a809a8)免疫组库数据分析||immunarch教程:GeneUsage分析(https://www.jianshu.com/p/0dbdd6733b34)免疫组库数据分析||immunarch教程:Diversity 分析(https://www.jianshu.com/p/8b846094c092)免疫组库数据分析||immunarch教程:Clonotype tracking(https://www.jianshu.com/p/79ee2c5871a7)免疫组库数据分析||immunarch教程:Clonotypes annotation(https://www.jianshu.com/p/effc2ad05f47)免疫组库数据分析||immunarch教程:Kmer 与 Motif 分析(https://www.jianshu.com/p/f2b7d0153432)

【原】scRepertoire||单细胞免疫组库分析:R语言应用(一)

https://ncborcherdinghttp://www.360doc.com/content/21/0715/15/vignettes/vignette.html


scRepertoire: An R-based toolkit for single-cell immune receptor analysis
https://ncborcherdinghttp://www.360doc.com/content/21/0715/15/vignettes/vignette.html

好了,到了你们家运来哥哥展示搬砖工基本功的时候了。

scRepertoire旨在获取来自10x Genomics Cell Ranger管道的过滤contig输出(),处理这些数据以基于两个TCR或Ig链分配克隆型,并分析克隆型动力学。后者可分为

  • 1)单独克隆型分析功能,如独特克隆型或克隆空间定量;
  • 2)与mRNA表达数据的相互作用,使用Seurat、singlecelperperor Monocle 3包。

一如往常我们先把环境配置好:

scRepertoire提供了一组示例数据,这些数据来自于三个肾透明细胞癌患者的T细胞,目的是为了展示R包的功能。更多关于数据集的信息可以在预印1和预印2中找到(preprint 1(https://wwwhttp://www.360doc.com/content/21/0715/15/content/10.1101/478628v1.abstract) and preprint 2(https://wwwhttp://www.360doc.com/content/21/0715/15/content/10.1101/824482v1.abstract) )。这些样本由成对的外周血和肿瘤浸润组成,有效地为T细胞受体(TCR)富集创造了6个不同的runs。我们可以使用head函数预览列表中的元素,并查看第一个contig注释。:这里注意条码贴上PX_P_ # # # # # # # # # # # # # -这是指患者X (PX)和外周血(P)。

如果你是filtered_contig_annotation.csv文件加载到R环境创建列表,您还需要调用stringsAsFactors 为 FALSE ,这将防止分类变量的转换为内置的因素和必要的一些scRepertoire的函数。代码应该看起来像这样:

对象“contig_list”是从10x Genomics Cell Ranger中的6个filtered_contig_annotation.csv文件中创建的。该对象是用contig_list <- list(csv1, csv2,…)创建的。

一些工作流中将有标准条形码标签额外的标签。在继续之前,我们将使用函数stripBarcode()来避免任何标签问题。重要的是,stripBarcode()用于删除来自其他管道的条形码上的前缀。所以你需要先看看有什么标签,以及标签的格式,同时建议对比10X的filtered_contig_annotation文件。

如果条形码为+ AAACGGGAGATGGCGT-1 + AAACGGGAGATGGCGT,则不需要stripBarcode功能。

CellRanger的输出是对TCRA和TCRB链的量化,下一步是通过细胞条形码创建一个带有TCR基因和CDR3序列的单一列表对象。这是使用combineTCR()执行的,其中的输入的是contig_list。还可以根据样本和身份信息重新标记条形码,以防止重复。如果是BCR该用什么呢?combineBCR。

cells + T-AB - T cells, alpha-beta TCR + T-GD - T cells, gamma-delta TCR

removeNA + TRUE -这是一个严格的过滤器,用于移除至少有一个NA值的细胞条码+ FALSE -包含和合并NA值为1的细胞的默认设置。

removeMulti + TRUE -这是一个严格的过滤器,可以移除任何超过2个免疫受体链的细胞条码+ FALSE -包含和合并带有> 2链的细胞的默认设置。

filterMulti + TRUE -用多个链分离细胞条形码中前2个表达的链+ FALSE -包含和合并细胞与> 2链的默认设置。

combineTCR()的输出将是一个contig数据帧列表,该列表将被简化为与单个细胞条码相关联的reads。它还会通过核苷酸序列(CTnt)、氨基酸序列(CTaa)、基因序列(CTgene)或核苷酸和基因序列的组合(CTstrict)将多个读码组合成克隆型调用。B细胞的类似函数,combineBCR()函数与2个主要注意事项类似:1)每个条码最多只能有2个序列,如果有更大的存在,选择reads值最高的2个。2)严格定义克隆型(clonotype, CTstrict)是基于v基因和>85%标准化的核苷酸序列汉明距离。汉明距离计算所有恢复的BCR序列,而不考虑运行runs。

如果除了sample和ID之外还需要添加更多的变量呢?我们可以使用addVariable()函数来添加它们。我们需要的只是要添加的变量的名称和特定的字符或数字值(变量)。作为一个例子,这里我们添加样品被处理和测序的批次。

同样,我们可以使用subsetContig()函数在combineTCR()之后删除特定的列表元素。为了进行子集化,我们需要确定要用于子集化的向量(名称)和要子集化的变量值(变量)。下面你可以看到我们从PX和PY中分离出4个测序结果。

cloneCall +“gene”-使用由TCR/Ig +“nt”组成的基因-使用CDR3区域的核苷酸序列+“aa”-使用由CDR3区域的氨基酸序列+“gene+nt”-使用由TCR/Ig组成的基因+ CDR3区域的核苷酸序列。

关于克隆型的正确定义。

需要注意的是,克隆型基本上是利用两个位点的基因组合或nt/aa CDR3序列来命名的。在scRepertoire实现中,clonotype调用没有在CDR3序列中包含小的变化。因此,gene方法将是最敏感的,而使用nt或aa则是适度敏感的,并且对克隆型最具特异性的则是gene+nt。此外,克隆型calling试图合并两个位点,即TCRA和TCRB链,以及如果单个细胞条码有多个序列被识别(即一个细胞中表达2个TCRA链)。使用10x方法有一个条形码子集,只返回一个免疫受体链,未返回链被分配一个NA值。

本文地址:http://fmiwue.riyuangf.com/quote/1079.html    迅易网 http://fmiwue.riyuangf.com/ , 查看更多

特别提示:本信息由相关企业自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。


0相关评论
相关行业动态
推荐行业动态
点击排行
网站首页  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  鄂ICP备2020018471号