|
交叉应用 | 长读长Isoform测序+靶向质谱策略提供了新肽预测方法2024-06-05 16:14
长读长的转录本测序已被证明可以在单核苷酸水平上直接测定转录异构体,并将其作为蛋白质的前体,经开放阅读框(ORF)预测,随后编译成潜在的全长蛋白质异构体序列(该方法研究人员称之为长读长蛋白质基因组学/LRP)。但受限于技术,多数在蛋白质水平上仍未得到证明。一是异构体往往丰度较低,缺乏独特的定位肽,并伴随进化过程的突变,在剪接连接上产生较少的蛋白型胰蛋白酶肽段。二是技术上采用质谱分析蛋白质基因组学,肽的采样不是直接的,而是半随机的,其中使用DDA或DIA模式会优先采样最丰富的肽质谱分析(MS1)峰。由于参考蛋白质数据库的不完善,许多蛋白质异构体仍然是未知的。 最近,一项称为内标平行反应监测(internal standard parallel reaction monitoring, IS-PRM)的靶向质谱策略已经证明了可对感兴趣的肽进行多重且灵敏的检测。但这种方法尚未用于确认新肽的存在。 在“IS-PRM-based peptide targeting informed by long-read sequencing for alternative proteome detection”这项研究中,研究人员**展示了从蛋白质基因组工作流程中大规模靶向检测预测肽的方法,称为LRP-IS-PRM。与质谱DDA模式相比,该策略将同种异构体的可检测性提高了3.6倍,并鉴定出5种以前未注释的同种异构体,为异构体提供了蛋白水平的证据。 结果与分析 1 基于人类细胞系建立蛋白异构体混合物分析标准 首先,研究人员选定诱导多能细胞系WTC11作为复杂基质背景下确定蛋白异构体混合物分析标准的模型系统,使用细胞系进行长读长RNA测序和MS实验,深入了解样品特异性转录组和预测蛋白质组。蛋白质异构体及其相关的WTC11异构体特异性肽的选择过程如图1A所示。 用LRP方法(Sequel II平台)对WTC11的转录组进行了表征,并预测了异构体水平的蛋白组(图1A)。在WTC11样本中,研究人员预测了来自11,755个基因的40,846个蛋白质编码异构体,平均每个基因存在3.5个异构体。并且经SQANTI Protein评估,有24,648个(56%)蛋白质编码异构体是新发现的。经图1A流程选择的肽被命名为AS192肽,由192个肽组成,对应55个基因,具有一个主要的异构体和至少一个次要的异构体。 2 Tomahto可提高异构体特异性肽的检出率 研究人员建立了Tomahto(一种IS-PRM)作为检测先前观察到的靶肽的工具后,应用Tomahto检测WTC11样品中的异构体特异性肽(内源性AS192肽)。实验流程如图1B所示:将超重型TMTpro(shTMTpro)标记的AS192合成触发肽加入TMTpro标记的WTC11肽消化液中,将样品分为不分离及高ph值下分离成8个部分两种类型(各3个重复,图2D)。 利用Tomahto CID对分离的WTC11样品进行分析,鉴定出192个AS192靶肽中的65个,是DDA HCD鉴定数目(21个肽)的3倍。另外,在未分离和分离的WTC11肽样品中以及在不同的片段化模式下,Tomahto都返回了更高数量的确认肽鉴定(图3A)。WTC11中主要和次要蛋白质同种异构体检测结果如图3B所示。根据定义,与主要异构体相比,次要异构体的转录物丰度较低,理论上分析鉴定更具挑战性。值得注意的是,研究人员通过MS2采集扫描检测触发肽(而非MS1信号)检测到一种内源性的异构体特异性肽(缺乏MS1信号):EQPGSYSDAPEYLWSGTL(见图3B箭头)。触发点和靶点对应的MS1谱图和MS2碎片图如图3C所示,这增加了检测低丰度肽的灵敏度,这对于检测低丰度次要异构体至关重要。 3 长读长测序提供了对蛋白质异构体表达的深入了解 为了标注检测到的肽支持的异构体,研究人员创建了一个UCSC基因组浏览器track63来可视化RNA转录本、它们的预测蛋白和相关的异构体特异性肽,提供多肽鉴定的基因组和可变剪接背景(图4)。值得注意的是,研究人员捕获了与AP1S2、ARFIP1、CIRBP、ASB6、CHTF8、LTA4H、NUP50、FBXL15、SF3B1和FBXO44基因对应的主要和次要异构体特异性肽对(表1)。除ARFIP1和AP1S2外,所有主要和次要异构体对都是仅可经Tomahto鉴定。特别的是,从基因SF3B1中发现了一个编码剪接体核心复合体的**亚基的异构体,介导选择性剪接(图4B)。SF3B1突变发生在恶性肿瘤中与不良患者预后相关,因此SF3B1突变蛋白可能作为患者的生物标志物,这使得检测SF3B1的特异性异构体十分重要。综上,通过使用Tomahto等方法,研究人员可以确认在病理或生理状态下剪接变化引起的稳定表达的同种异构体。 此外,研究人员从以前未注释的异构体中检测到5个肽,定义为在WTC11蛋白质组中发现,但在GENCODE v42参考蛋白质组中未注释(表1)。其中,C1orf52是一个未被充分研究的蛋白质编码基因,其变异与多发性硬化症的风险有关(图4C)。C1orf52已被确定为一种RNA结合蛋白,在调节基因表达中起关键作用,这些蛋白的突变与许多疾病有关。 最后,研究人员评估了质谱检测AS192目标肽的能力,研究人员交叉检查了UCSD MassIVE (https://massive.ucsd.edu)和PeptideAtlas68质谱数据库,以寻找在之前的蛋白质组学实验中观察到AS192肽的证据。共有141个AS192多肽有先前MS观察的证据,而51个在这些数据库中缺失(表2)。研究人员检测到8种以前未检测到的肽,包括来自SF3B1的次要异构体特异性肽(表1)。检测到以前未注释的异构体和肽,这些未在质谱数据库中报道,突出了将长读长测序信息预测的蛋白质数据库与靶向质谱相结合的能力。 讨论与展望 通过将长读长蛋白质基因组学与内标平行反应监测(LRP-IS-PRM)相结合,研究人员可以系统地探索不同条件下的可变蛋白质组。例如,广泛存在于从细胞分化到癌症的各种生理和病理状态中的异构体转换。通过利用LRP-IS-PRM,这些差异剪接事件可以在更大范围内的蛋白质异构体水平上进行量化。这项研究**成功地将蛋白质基因组学方法与基于触发器的肽靶向软件Tomahto结合起来以表征可变蛋白质组。 PacBio HiFi测序系统 HiFi测序读长能达到10-25 kb,准确度也在Q30(99.9%)以上,Iso-seq方法可提供全长转录本异构体,无需组装即可表征转录组的完整多样性,探索不同剪接机制生成的不同异构体是如何导致健康和疾病间的表型差异: ü 发现可变起始位点和终止位点,检测可变多聚腺苷化 ü 揭示复杂可变剪接、融合事件以及转录通读 ü 鉴定等位基因特异性异构体 PacBio推出了Kinnex试剂盒!!! Kinnex试剂盒基于MAS-Seq方法,可将较小的DNA片段连接成较长的HiFi可用文库,提高测序通量,使长读长 RNA -seq更具成本效益。 Kinnex 单细胞RNA试剂盒以现有的 MAS-Seq for Single Cell 3'试剂盒为基础,增加了对 10x Genomics 5'试剂盒和文库复用的额外支持。可使测序通量提高16倍,获得基因表达及全长isoform信息,在单细胞水平上揭示RNA异构体多样性。 ü Kinnex 全长RNA试剂盒可进行全长RNA 测序,与典型的Iso-seq文库相比,其通量提高了8倍,可实现从5'端到3'端全长异构体测序,准确表征剪接位点,发现新基因和新异构体,鉴定融合基因,并获得基因及异构体read计数信息进而分析表达量。
本网站所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。 上一篇: PCR实验室如何避免样本污染
|