中国乳腺癌报告_国内乳腺癌数据集

乳腺癌(Breast Cancer)是女性最常见的恶性肿瘤,也是女性癌症死亡的主要原因。乳腺癌是发生在乳腺上皮组织的恶性肿瘤,是一种高度异质性的肿瘤,深入了解其组织内在异质性及其生物学功能的是剖析肿瘤发生机制的重要一步。目前,单细胞测序技术已广泛应用于解析乳腺癌肿瘤异质性、肿瘤微环境、转移侵袭、治疗耐药等方面。本期,将通过展示单细胞测序研究乳腺癌的部分已发表研究成果,从乳腺癌单细胞图谱构建、肿瘤微环境解析及肿瘤多样化异质性探究等层面,帮助各位在单细胞层面理解该疾病的复杂细胞组成及肿瘤异质性~

1.样本选取

26例原发乳腺癌(11例ER+,5例HER2+和10例TNBC)进行sc RNA-seq;6例乳腺癌(2例ER+,4例TNBC)进行空间转录组测序;4例乳腺癌(1例luminal,1例HER2+和2例TNBC)进行CITE-seq。

2.肿瘤亚型

ER+,HER2+和TNBC。

3.研究思路

4.主要结论

本文结合单细胞RNA测序、空间转录组测序构建了迄今最全面乳腺癌单细胞和空间图谱,并开发了一种与sc RNA-seq 兼容的内在亚型分类方法(SCSuype),揭示了复发性肿瘤细胞异质性。通过 CITE-seq 免疫表型分析提供了高分辨率的免疫特征,并发现与临床结果相关的新 PD-L1/PD-L2+巨噬细胞群。使用单细胞特征,对大型乳腺癌队列进行解卷积分析,并将它们分为九个 “生态型”,不同生态型显示出与肿瘤样本的临床亚型、SCSuype亚型及细胞类型的多样化关联,且不同生态型之间的预后也存在明显差异。该项研究提供的乳腺癌细胞结构的综合单细胞和空间图谱,有助对肿瘤异质性的认识,促进乳腺癌的个体化治疗进展。

1.样本选取

8例原发性乳腺癌女性患者的肿瘤样本及配对的正常血液、乳腺和淋巴结样本,通过流式细胞荧光分选技术(FACS)分选的CD45+细胞进行sc RNA-seq;3个额外乳腺癌组织(BC9-11)用于sc TCR-seq和5’ sc RNA-seq。

2.肿瘤亚型

包括表达雌激素受体(ER+)的肿瘤、表达孕激素受体(PR+)的肿瘤、表达人表皮生长因子受体2(Her2+)的肿瘤,以及三者都不表达的三阴肿瘤(TNBC)。

3.研究思路

4.主要结论

利用单细胞转录组对乳腺癌组织中免疫细胞的异质性进行了广泛表征,发现了各种免疫细胞类型,包括单核细胞、巨噬细胞、肥大细胞、 T 细胞、 B 细胞、树突状细胞和嗜中性粒细胞。通过亚群细分,共鉴定出83个不同的免疫细胞簇,包括38个T细胞簇、27个骨髓谱系细胞簇、9个B细胞簇和9个自然杀伤细胞簇。相对于正常乳腺组织,仅在肿瘤中出现的细胞簇包含14个髓细胞簇和17个T细胞簇(比正常组织观察到的细胞簇数增加约一倍)。通过T细胞分化轨迹研究发现T 细胞状态发生了连续性变化,颠覆了之前较少分化或激活离散状态形成的肿瘤微环境经典概念。该研究中sc RNA-seq和sc TCR-seq数据集的综合分析,将有助于更好地理解免疫细胞促进和抑制肿瘤进展潜在的功能机制。

1.样本选取

正常乳腺、癌前 BRCA1 +/–组织、主要乳腺癌亚型( TNBC、ER+、HER2+、男性乳腺癌)、成对肿瘤和受累淋巴结(LN),共55例患者的69个不同的手术组织样本。

2.肿瘤亚型

ER+,HER2+和TNBC。

3.研究思路

4.主要结论

该研究提供了迄今为止关于人类乳腺组织的最全面的单细胞RNA图谱,提供了科学家们理解其中所包含的不同细胞类型的框架。此外,根据不同分组研究了多层面分组的生物学问题:如发现绝经前到绝经后的转变与显著的间质改变有关,成纤维细胞中的PDGFRb和基质相关基因减少;癌前病变到肿瘤的进展与 BRCA1 突变携带者中免疫浸润的增加有关;在不同的乳腺癌亚型中,肿瘤的上皮细胞显示出类似的多样性;组织常驻记忆T细胞(TRM)在TNBC和HER2+中明显,但在ER+肿瘤中不明显;TNBC包括最大的CD8+细胞群,而ER+肿瘤CD8+T细胞减少,提示不同的免疫调节模式;与TNBC和HER2+肿瘤相比,ER+肿瘤具有活跃的循环肿瘤相关巨噬细胞(TAM);在ER+肿瘤患者中,克隆选择和大量迁移都是淋巴结转移的原因等。本文研究结果对于理解乳腺癌的产生机制,以及对于理解周围环境中的细胞如何促进乳腺癌进展、扩散和对治疗的反应具有非常重要的意义。

针对肿瘤组织等异质性高的样本,传统的高通量测序技术仅能提供样本中所有细胞转录水平的平均值,而单细胞转录组突破了传统Bulk测序技术的限制,实现了在单个细胞层面解析其基因表达状态和功能的研究目的,特别适用于解析多种细胞组成、研究复杂细胞功能、追溯细胞发育和探究细胞间相互作用等研究。上述文章用单细胞测序技术,解析了高度异质性乳腺癌的复杂细胞组成,并深入探究了肿瘤微环境和不同组织学意义的异质性,从而解决了肿瘤异质性的难题,为进一步阐明肿瘤的起源发生、转移播散、治疗耐药等问题奠定了基础。

参考文献

1. Wu SZ, Al-Eryani G, Roden DL, et al. A single-cell and spatially resolved atlas of human breast cancers[J]. Nature Genetics , 2021, 53(9):1334-1347.

2. Azizi E, Carr AJ, Plitas G, et al. Single-cell map of diverse immune phenotypes in the breast tumor microenvironment[J]. Cell , 2018, 174(5):1293-1308.

3. Pal B, Chen Y, Vaillant F, et al. A single-cell RNA expression atlas of normal, preneoplastic and tumorigenic states in the human breast[J].? The EMBO Journal , 2021, 40(11):e107333.

An independent poor-prognosis suype of breast cancer defined by a distinct tumor immune microenvironment

一种由独特的肿瘤免疫微环境定义的独立贫血亚型乳腺癌

发表期刊:Nat Commun

发表日期:2019 Dec 3

影响因子:12.121

DOI:?10.1038/s41467-019-13329-5

一、研究背景

肿瘤微环境影响癌症的起始和进展。在乳腺癌中,临床病理特征,如年龄,等级,阶段和分子亚型与预后有关,并驱动治疗决策。5种临床相关的分子亚型:Luminal A、Luminal B、Her2富集型、基底样型和正常样型,其发病率、生存率、预后和肿瘤生物学特性各不相同。

除了癌细胞生物学因素外,炎症微环境也影响着肿瘤的起始和进展。癌细胞周围的免疫微环境可以识别和抑制肿瘤生长或促进进展。在乳腺癌中,高免疫浸润已与更好的临床结果。此外,高免疫浸润已与新和化疗的反应增加相关。

二、材料与方法

? 1 ? 数据来源

1)基因表达:手术收集的MicMa队列(其中的子集用于分析, MicMa-nCounter(n = 96,FFPE),MicMa-Agilent(n=104,新鲜冷冻组织))

2)RNA-seq:OSLO2-EMIT0队列(GSE135298,原始数据在EGAS00001003631)

3)公开的数据:表达数据从GEO、European Genome-phenome Archive、ArrayExpress或TCGA获得;METABRIC队列

? 2 ? 分析流程

1)基因集富集分析

2)无监督聚类获得免疫簇:基于509个基因,使用R包pheatmap对患者的相关性矩阵进行层次聚类

3)Nanodissect:用于淋巴和髓细胞浸润的预测,淋巴细胞或骨髓细胞浸润的nanodissect分数反映了样本中各自基因的平均表达量

4)CIBERSORT(22种类型的浸润性免疫细胞的绝对比例)、ssGSEA(上皮间质转化、干细胞、增殖和细胞周期相关途径的基因集)

5)二项式逻辑回归预测免疫集群:R包glmnet (构建模型公式)

6)免疫浸润的病理评估

7)ROR评分:ROR-Score=0.05×Basal+0.12×Her2-enriched0.34×Luminal A+0.23×Luminal B;其中,基底、Her2富集、管腔A和管腔B是每个样本与R中使用genefu软件包获得的质心的相关性

8)统计学、生存分析、多变量Cox回归分析

三、结果展示

01 -?乳腺癌的免疫簇并反映了逐渐的免疫浸润

测量了MicMa队列的95个肿瘤样本中760个基因的表达,该阵列旨在剖析实体肿瘤中的免疫浸润。这95个样本中的79个样本之前已经通过Agilent全基因组4×44K寡核阵列进行了剖析。首先使用Pearson和Spearman相关性比较了两个平台获得的表达,发现基因的表达值之间存在高度的正相关(补充图1A)。

为了根据免疫相关基因表达的相似性对患者进行分组,对相关矩阵进行了无监督的分层聚类(图1a和补充图1B)。从3到10个聚类的轮廓图分析表明,3个聚类最好地捕获了nCounter和Agilent数据集的分割(补充图1C,D)。比较了两个数据集MicMa-nCounter和MicMa-Agilent的聚类结果。在这两个数据集中,有79个样本是重叠的。随着用于测量基因表达的不同平台,以及基因列表和用于执行无监督聚类的样本的不完全重叠,仍然发现79个重叠样本的聚类分配显著相似。

为了确认集群与肿瘤免疫微环境相关(图1b),使用算法Nanodissect为总淋巴细胞和骨髓细胞浸润打分。Nanodissect评分首先在MicMa队列中使用有经验的病理学家分析的匹配苏木精和曙红切片的免疫浸润评估进行验证(图1c和补充图1E)。发现这三个簇与Nanodissect淋巴细胞(图1b)和骨髓细胞(补充图1F)评分显著相关。得出结论,簇A-C反映了逐渐的免疫浸润,因此被称为免疫簇。

使用其他9个队列的表达数据验证了这些簇与淋巴/髓细胞浸润之间的关联。有509个基因在所有研究的数据集中被发现,被用于无监督聚类(图1d和补充图2A,分别用于METABRIC和TCGA队列的聚类)。在每个队列中,所得到的三个聚类与淋巴和骨髓Nanodissect评分显著相关(图1e;补充图2B)。淋巴和髓细胞浸润从簇A(蓝色;低浸润;冷肿瘤)逐渐增加到簇B(浅蓝色;中等浸润)和簇C(粉红色;高浸润;热肿瘤)。

对于额外的一层验证,使用METABRIC队列中免疫浸润的病理评估,这与Nanodissect评分(图1f和补充图2C)和免疫簇显著相关。使用PanCancer免疫剖析阵列的基因进行无监督分层聚类,可以根据免疫浸润的渐进水平对乳腺癌肿瘤进行分组。

02 -?免疫簇与预后相关

对于两个最大的队列METABRIC(n = 1904)和TCGA(n = 981),发现簇B(具有中等水平的免疫浸润)与更差的预后相关(补充图3A,B)。当分别对ER阴性(补充图3C,D)和ER阳性(补充图3E,F)的病例进行分层时,也观察到簇B病例的这种更差的结果。为了完善观察结果,根据簇B(浅蓝色)与簇A和簇C(紫色)绘制了患者生存期图,并证实簇B患者的预后明显且显著恶化(图2)。用相关生存数据在另外四个队列中进一步验证了这一结果。结论是免疫簇与ER阴性和ER阳性乳腺癌的预后相关。

03 - 用二项式逻辑回归预测免疫簇

基于免疫聚类的临床相关性,旨在开发一种通用的方法,能够准确而敏感地预测患者的预后较差的分类,而不必依赖于无监督聚类。作者使用二项式逻辑回归,通过lasso进行惩罚,得到一组基因,这些基因可以敏感和特异地预测一个样本是否属于簇B,通过接收者操作特征曲线和曲线下面积(AUC)分析评估(图3a)。96.3%的样本被模型预测为簇A和簇C,而68.8%的样本分到了簇B(图3b)。

通过比较生存期对数秩检验p值,发现lasso分类普遍改善了免疫簇与生存期之间的显著关联。lasso模型在另外5个队列中得到了验证。图3c-e为STAM(n = 856)、MAINZ(n= 200)和UPSA(n = 289),补充图5A、B为CAL(n = 118)和PNC(n= 92)。

由于二项式逻辑回归只预测了两个簇(簇B与簇A和簇C),进行了另一轮二项式逻辑回归,以高准确度区分簇A和簇C(补充图5C,D)。

04 -?免疫簇,一个独立的预后因素

作者进一步研究了免疫簇与乳腺癌中著名的临床病理特征(大小、年龄、等级、阶段、淋巴结受累和分子亚型(PAM50))的关系。簇A(免疫浸润度低)富含ER阳性和Luminal病例,而簇C(免疫浸润度高)中ER阴性和Basal样病例比例较高,ER阴性和ER阳性样本以及PAM50亚型在预后不良的簇B中同样占有一定比例(图4a,b)。

使用多变量Cox回归分析测试了免疫簇的预后影响,同时考虑了其他预后因素。发现免疫簇是模型生存的重要因素,如每个队列Cox模型中与免疫群相关的显著p值所示。为了进一步检验免疫簇作为重要的预后生物标志物的优势,用了逐步回溯选择的方法。对于所有队列,免疫簇被保留在最佳拟合的最小模型中,在11个队列中的9个队列中,免疫簇是一个显著的预后变量。

05 -?具有复发风险(ROR)评分的新RNA-seq数据集的验证

EMIT0,这是OSLO2队列研究的一个子集,OSLO2-EMIT0由食品和药物管理局批准的Prosigna复发风险(ROR)分数评估,ROR评分在标准的临床病理特征之上增加了重要的预后信息。发现簇B组成的样本与簇A和C相比具有中间的ROR评分(图4c),表明与簇B相关的不良预后不可能由ROR评分中包含的信息来解释。当分别评估ER阴性(补充图7A)和ER阳性(补充图7B)病例时有同样结果。对于所有队列通过已有方法计算ROR评分,该方法与PAM50亚型有关,并证实簇B由中间ROR评分组成(图4d和补充图7C,D)。

多变量回归分析证实,免疫簇为ROR评分带来了额外的预后价值,这体现在用ROR评分和免疫簇建立生存模型时,免疫簇的p值显著。通过计算净重分类改善(NRI)和综合判别改善(IDI)指数,强调了免疫簇与ROR评分一起使用时,根据生存率对患者进行分类的额外价值,正如所有队列中NRI和IDI系数为正值所示。NRI和IDI的置信区间(CI)构建的Bootstring显示,对于几个队列,免疫簇与ROR评分相加时,显著改善了患者根据预后的分类。

06 - 免疫簇和对新化疗的反应

进一步评估了免疫簇与新化疗反应之间的关系,使用了来自8项研究(1377个样本)的基因表达数据,并使用lasso将每个样本分配给其所属的免疫簇。如图4e,发现簇C应答者百分比最高,其次是簇A,簇B应答者百分比最低。还计算了每个组中应答者的百分比:簇C平均有42%的应答者和58%的残余疾病患者,而簇B有18%/82%的应答者和13%/87%的残余疾病患者。由于pCR率作为ER状态的函数不同,还独立计算了ER阳性和ER阴例的应答者比例,发现无论ER状态如何,簇B的应答者比例最低(分别为补充图8A、B)。

对于每个对新化疗有反应的队列,评估了pCR和非pCR病例在各免疫群中的分布。当考虑整个队列时,发现应答者在各免疫群组的分布有显著不同,簇B的应答者较少,簇C组的应答者居多;当按ER状态拆分时,虽然并非总是显著,但也观察到同样的趋势。这些结果表明,簇C中的患者有更高的概率成为应答者。研究结果还突出了簇B的低响应率,表明这类患者可能是新的新治疗方案测试的候选人。

07 - 免疫簇的计算机剖析

为了评估集群中的逐渐免疫浸润是否可以解释与预后的关联,在Cox多变量回归分析中测试了免疫集群或总免疫浸润评分中哪一个对生存更有预测性。作者设特定的免疫细胞类型混合物,而不是肿瘤微环境中的免疫细胞总数,可能是簇B预后差的原因。

使用CIBERSORT算法估计22种不同的免疫细胞类型的比例,对这种细胞类型特异性中位数浸润分数进行无监督聚类(图5a)。簇C病例中,富集了巨噬细胞M1、记忆激活T细胞和滤泡T细胞(图5a),METABRIC和TCGA队列中CIBERSORT评分的分布也说明了这一点(图5b)。簇A如预期的那样,免疫细胞的水平非常低。在反应和预后较差的簇B中,发现巨噬细胞M2、静止肥大细胞和静止记忆T细胞的水平较高(图5a,图5b)。

使用广义线性模型,指定了区分簇B与簇A-C的免疫细胞类型(图5c)。还测试了哪些免疫细胞类型解释了簇A与簇B之间的差异和簇B与簇C之间的差异。

08 - 免疫簇的表型分析

通过差异基因表达分析确定了簇B中显著过度表达的基因,与簇A和簇C相比,簇B中有909个基因分别上调。这些基因与干细胞生物学和EMT相关,如使用MsigDB31的H和C2集合的基因集富集分析(GSEA)所示(图6a)。

为了进一步描述免疫簇与癌细胞表型之间的关系,使用了与EMT、干细胞、缺氧和增殖相关的基因集。使用GSVA方法计算了每个集群和队列的平均基因集富集分数,该分数反映了免疫集群中每个路径/基因集的活动。平均基因集分数的无监督聚类将免疫簇A和C分开,而簇B被分为两个亚组(图6b)。这些结果表明免疫簇与干细胞/EMT相关基因特征之间存在关联。

通过GSVA富集分数的无监督聚类,确定了乳腺癌中两个相互排斥的基因特征:(i)一个与增殖和胚胎干细胞样表型相关,(ii)另一个与EMT和乳腺干细胞表型相关。增殖表型在簇C中占主导地位(补充图11A),当计算每个代谢样品的基因集得分时也观察到了同样的情况(补充图11B)。在簇B中,EMT或增殖相关特征的平均基因集得分较高(补充图11C)。在代谢物组的样品水平上,我们观察到一个或另一个状态被激活的样品的类似模式(补充图11D)。簇A显示EMT和增殖状态得分较低(补充图11E,F)。

为了正式确定哪些基因集分数解释簇B,使用广义线性模型测试每个基因集的贡献程度。EMT标志对簇B有积极贡献,而增殖和细胞运动性与簇A和C相关(图6c)。还测试了当单独与簇A或簇C比较时,哪种基因集得分可以解释簇B。

09?- 肿瘤表型与免疫浸润的相关性

由于免疫簇与(i)免疫细胞类型和(ii)基因集特征相关,评估了免疫浸润(CIBERSORT)和癌细胞特征(基因集分数)之间的关系。图6d显示增殖和EMT分数与不同类型的免疫细胞显著相关。高EMT分数与巨噬细胞M2、静息肥大细胞和静息记忆T细胞相关,而高增殖与更活跃的适应性肿瘤微环境相关。这些数据表明癌细胞表型和肿瘤微环境的组成之间存在连续性。

簇B以致瘤免疫浸润为主,EMT信号高,但约35%的簇B也表现为增殖表型。为了探索簇B中的这种异质性,以无监督的方式根据基因特征分数将样本分组为B1以EMT表型为主,B2以增殖为主(图6e)。

在METABRIC和TCGA中,具有增殖表型的B2病例的预后较差(图6f,g)。为了进一步评估基因集评分的异质性是否伴随着免疫环境的异质性,作者寻求B1和B2亚群之间特异性免疫细胞类型的差异。补充图14中的无监督聚类显示,两个子聚类B1和B2都具有促肿瘤/静息免疫微环境。总而言之,簇B中两种相互排斥的状态可能与预后有关;然而,簇B的一个统一因素是存在促肿瘤/静息免疫微环境。

四、结论

在本研究中,发现了与临床相关的免疫簇与渐进性免疫浸润。在15个乳腺癌队列中,跨越6101个乳腺癌样本,肿瘤免疫浸润中等水平的患者群预后较差,与已知的预后分子和临床病理学特征无关。通过对群组免疫成分的表征,发现亲肿瘤免疫浸润与不良预后组相关。进一步的表型分析显示乳腺癌中存在两种相互排斥的侵袭性肿瘤表型,一种与EMT有关,另一种与增殖有关。这两种表型都是在不活跃/促肿瘤免疫微环境上发现的不良预后群。