肿瘤免疫疗法在非小细胞肺癌(non-samll-cell lung cancer, NSCLC)中表现出持续性的效果,但其效率部分依赖于肿瘤浸润淋巴细胞(tumor infiltrating lymphocytes, TIL)的数量和组成。为了描绘 TIL 组成,谱系和功能状态的基准图谱,作者对从14位未经治疗的 NSCLC 患者中提取的12346个 T 细胞进行深度单细胞转录组测序。
通过匹配共同最近邻居校正 scRNA-seq 数据中的批次效应
大型 scRNA-seq 数据集包含来自不同时间点,不同实验室得到的数据,其中存在的批次效应可能干扰数据的整合和解释。现有的 scRNA-seq 分析技术错误地假设不同批次细胞群的组成是已知的或相同的,为此,本文献中作者提出了一种从高维表达谱数据中寻找共同最近邻居(mutual nearest neighbors, MNNs)进行批次效应校正的策略。该方法不依赖先前所提及的假设,只需批次之间存在共享的群体。不管是在模拟数据还是真实数据中,该方法表现均更加优秀
头颈部癌症原位和转移肿瘤生态系统的单细胞转录组学分析
针对头颈癌患者的单细胞转录组分析发现肿瘤微环境中存在良性和恶性细胞,并将一种部分 EMT 状态与转移联系起来。
免疫学基础知识
免疫学基本概念等背景知识介绍。
pybedtools 使用
bed 文件是我们在生物信息学中常会碰到的一种格式,一般我们会通过 bedtools 等工具对这类文件进行处理。Pybedtools 对 bedtools 的各种功能进行了封装和拓展,从而实现在 python 中对基因组区间进行各种类型的操作。本文中我们将对 pybedtools 进行介绍。
Linux 软链接和硬链接
理解 Linux 中的软链接和硬链接。
初识 Linux 系统
生信中常进行的分析任务基本上都是在 Linux 系统上进行的,因此了解 Linux 系统相关的基本知识有助于我们日常的工作。本文我们将对系统的基本知识进行学习。
GEO 数据库概览
GEO (Gene Expression Omnibus) 是一个公共的功能基因组学数据库,最初是为了存储芯片数据,后期随着 NGS 的广泛应用纳入了各种平台的高通量组学数据。很多文献都会将实验数据上传至 GEO,并在文献结尾处给出对应的 GSE ID 号,方便其他人下载数据进行研究。本文将对 GEO 数据库进行一个简单的介绍,包括数据库的架构,数据存放规律以及如何下载数据等。
基于不同条件,技术和物种中共有的变异来源整合单细胞转录组数据
在单个条件,技术或者物种中,scRNA-seq 计算方法能够成功地发现和鉴定细胞表型。但是,跨数据集的细胞亚群的鉴定仍极具挑战性。在本文中,作者基于不同 scRNA-seq 数据集中共有的变异来源,实现对不同数据集中共有的细胞群体的鉴定以及下游的比较分析,并在 Seurat 包中实现了该方法,从而实现不同 scRNA-seq 数据集的一般化比较,有望加深我们对不同细胞状态对干扰,疾病以及进化等应答的理解。
单细胞测序揭示肝癌中浸润 T 细胞图谱
针对肿瘤浸润淋巴细胞进行系统性的研究是发展免疫治疗以及预测其在肿瘤临床治疗效果的关键。本文献中,作者从6个肝癌患者的外周血,肿瘤及邻近正常组织在分离出5063个 T 细胞,进行高深度 scRNA-seq。利用这些细胞的转录组图谱和组装的 T 细胞受体序列,作者鉴定出11个 T 细胞亚组,描绘了其发育轨迹,并确定了每个亚组的特征基因。这些转录组数据为我们理解癌症中的免疫图谱提供了非常重要和丰富的信息。