September 2024

一口气讲完糖肽搜索引擎

第五期 一口气讲完 糖肽搜索引擎 Protein Metrics 高准 Database search engine Glycan-first search engine Peptide-first search engine 本文简要介绍糖肽搜索引擎的分类和特点,帮助分析学家快速了解各类搜库软件。 简介 糖肽表征需要确定多肽序列,糖基化位点以及聚糖的组成和结构。与其他翻译后修饰不同,糖基化引起的质量增加通常大于2~3个氨基酸,往往会与漏切肽段或共享碎片离子但序列不同的肽段相互混淆,造成糖肽匹配错误;手动解析费时费力,无法推广到大规模糖肽组学。因此,科学家们开发了大量的糖肽搜库软件以实现自动化的糖肽分析。 按照搜库原理,糖肽搜索引擎大致可以分为3类:database search, glycan-first和peptide-first。Database search需要提供蛋白数据库和聚糖库,通过组合多肽和聚糖信息与串联质谱数据进行匹配,灵敏度高;后两类将糖肽串联质谱数据分割成多肽和聚糖两部分,先完成其中一个搜库,并以此为基础限制另外一个搜库空间,速度快。 01 Database search engine Database search engine将糖肽作为一个整体进行搜索,这就意味着需要考虑所有可能的多肽和聚糖组合。这种搜索的复杂性,往往需要限制蛋白质和聚糖数据库大小,以便在合理的时间内完成搜库。但随着质谱技术和AI技术发展,database search engine的速度得到了大幅度的提高。以Byonic为例,可利用B离子筛选出糖肽二级谱和isobar_score_filter=50智能打分系统过滤掉质量差的糖肽二级谱,最终加快搜库速度并给出高质量的糖肽结果。 在2021年,HUPO启动了糖肽信息化解决方案评估,有众多软件的开发者和用户参与。其中Byonic的N/O糖搜库性能最好,并得益于用户友好界面,精确的图谱标识和灵活的报告模板,Byonic拥有最广泛的用户基础。 02 Glycan-first search engine Glycan-first的典型特征是先用Y离子确定肽质量,并以此来限制肽的搜库空间。MAGIC和pGlyco是这个算法的典型代表,但实现方式不同。 pGlyco3采用两步法,首先使用Y离子和B离子将完整的聚糖与聚糖数据库进行匹配,然后利用前体离子质量减去聚糖质量来确定肽质量,从而在大大减少的搜索空间中匹配肽序列。 MAGIC采用三步法,首先利用五糖核心系列Y离子推测肽质量,然后在限制的搜库空间中匹配肽序列,最后深入表征聚糖的组成和结构。由于三步法依赖五糖核心,该算法主要用于N糖搜库。 03 Peptide-first search engine MSFragger-Glyco是Peptide-first的典型代表,首先利用b/y离子进行肽匹配,然后利用前体离子质量减去肽质量来确定聚糖质量,最后在大大减少的搜库空间中匹配聚糖的组成和结构。与Glycan-first相比,该方法不依赖于Y离子,因此可以大大提高O糖的搜索灵敏度。 糖肽搜索引擎示例 结语 本文是糖蛋白系列文章完成篇,系统介绍了糖肽搜索引擎的分类和特点,方便科研和企业用户选择适合自己的软件。 参考文献: [1] Polasky, Daniel A., and Alexey I. …

一口气讲完糖肽搜索引擎 Read More »

解析糖肽搜库结果

第四期 解析糖肽搜库结果 Protein Metrics 高准 一般思路 搜索设置 检查肽段组 评估MS2 MS2质谱示例 本文主要介绍糖肽搜库结果的解析思路,帮助分析学家从复杂的质谱数据中快速筛选出正确的糖肽结果。 01 一般思路 由于糖基化的复杂性,分析学家需要从更广泛的视角进行数据判别,包括聚糖的数据库选择,生物学意义,MS2光谱等。 当您获得了糖肽搜库结果,可按照如下步骤进行数据分析: 首先根据肽段对结果进行排序,再根据保留时间进行排序。您可以将肽段的电荷态Combine,看看其分布是否符合预期? 查看肽段组的聚糖是否与某个合理的构建途径相关?糖肽的保留时间是否合理? 检查那些归属不明确的MS2,以确保分配了正确的聚糖。糖基化的肽段往往会导致肽骨架的碎裂效果不佳,因此仅依靠打分来进行解析可能会忽略掉一些真正的阳性谱图。因此,通常需要对MS2质谱图进行手动解析。 02 搜索设置 选择正确的数据库:一种组织表达系统可能会产生与另一种系统不同的聚糖。最常见的错误原因之一,就是正确聚糖不在搜库范围内。 03 检查肽段组 聚糖生物学意义 查看组中评分最高的结果,并确保所有其他结果在该背景下都有意义。 肽段组中鉴定出的聚糖相互之间是否存在依存关系?如您经常会在同一位点看到高甘露糖和复杂的唾液酸化形式。 糖肽保留时间 NeuAc和其他唾液酸可导致色谱峰向更酸性的区域偏移。您在数据中看到这种情况了吗?如果没有,则表明鉴定结果可能存在问题。 评估其他通过洗脱时间提供的信息,例如当取代基(如唾液酸)从一个天线移动到另一个天线时出现的双峰。 04 评估MS2 在大多数糖肽的碰撞MS2质谱中,您应能看到 HexNAc (204) 和 HexNAcHex (366) 的信号。如果您没有看到这些碎片,但是鉴定结果包含这些结构单元,可能就不是糖肽。 确保肽段的N端和C端正确。如果末端不正确,那么一个被认为是截短的肽段可能实际上是一个全长肽链,只是携带了不同的糖基修饰。寻找覆盖末端的 b/y 离子;或者携带小聚糖碎片的完整肽,在合适的能量下进行HCD/QTOF碎裂,Y0和Y1均为可靠的峰。 仔细检查Delta Score较低的谱图,因为这表明Byonic找到了另一种不同的匹配结果。 请注意标有波浪号(例如 ~y5)的碎片,这表明这些碎片已经完全丢失了聚糖(或其他不稳定的物质)。虽然这是合理且预料之中的,但在缺乏其他确认信息的情况下,这也有助于定位糖基化位点。 05 MS2质谱示例 结语 本文介绍了糖肽二级谱的解析思路和方法,致力于提供高质量的糖肽结果。后面还有更多精彩内容,敬请期待吧! 关于Protein Metrics Protein Metrics LLC是一家全球领先的质谱数据解析软件供应商,公司总部位于美国波士顿。我们为科研和企业用户提供高效准确的一站式质谱数据解析方案,帮助用户发现、解决问题。Protein Metrics在全球范围内提供销售和支持,目前已为超过200个企业和300个科研单位提供服务。 …

解析糖肽搜库结果 Read More »

Byos中的糖肽搜库策略

第三期 Byos中的 糖肽搜库策略 Protein Metrics 高准 数据库选择 N糖策略 O糖策略 未知糖策略 加速糖肽搜库策略 本文详细介绍了Byos中N糖,O糖和未知糖的搜库策略以及如何优化糖肽的搜库空间,帮助用户实现更好的糖肽分析。 01 数据库选择 到目前位置,数据库搜索仍然是糖肽分析最有效手段。选择合适的糖库是糖肽研究成功的第一步。Byos提供3种不同的糖输入方式:数据库,糖组成以及自定义编辑,如下所示: Byos内置大量N/O糖库,易于编辑和拓展。默认使用糖库,如果糖库不足,可按照上述方法B/C自定义添加聚糖。 Byonic 支持大量关键字,包括 HexNAc、Hex、Fuc、dHex、NeuAc、NeuGc、Pent、GlcA、IdoA、DiNAcBac、Acetyl、Sulfo、Phospho、Na 和 Sodium。如方法B表示硫酸化N糖。 如果用户做的是衍生化糖或者含有加合物,那么delta mass可以添加在方法C的additional mass单元格中。 02 N糖策略 搜索任意N糖 Byos中N糖输入方式是HexNAc(2)Hex(2)Fuc(1) @ NGlycan | common1,其中NGlycan表示NXS/T 基序。如果用户想搜索任意天冬酰胺上的 N-糖,以发现 NXC 或反向基序上的 N 糖,可用N替换NGlycan,如HexNAc(2)Hex(2)Fuc(1) @ N | common1。 18O水中脱糖 Delta:H(1)O(-1)18O(1) / +2.988261 @ NGlycan | common1 03 O糖策略 Byos中O糖输入方式是HexNAc(1) @ OGlycan …

Byos中的糖肽搜库策略 Read More »

糖肽的RPLC-MS/MS行为

第二期 糖肽的RPLC -MS/MS行为 Protein Metrics 高准 RPLC行为 离子活化 糖肽裂解规律 分子重排 错误匹配来源 Byos中糖肽结果验证 本文简要介绍糖肽的RPLC-MS/MS行为,主要包括色谱保留,离子活化,质谱裂解规律,分子重排和错误匹配来源等,帮助分析学家快速读懂糖肽LC-MS/MS图谱。 01 RPLC行为 一个糖肽二级谱往往可以匹配多个不同的聚糖和肽段组合,尤其是当质谱数据质量较差(缺少特征诊断离子或者前体离子测定不正确),保留时间就为糖肽鉴定提供非常重要的互补信息。 糖肽疏水性越强,在RPLC上的保留时间越长。通常糖链上引入中性单糖,如Hex和HexNAc,会增加糖肽亲水性,导致保留减弱。不改变电荷的翻译后修饰,对保留时间影响不大,蛋氨酸氧化除外。有研究发现,如果聚糖链上存在 NeuAc 或磷酸基团,则会导致保留时间增加,因为带负电荷的 NeuAc 和磷酸基团会抵消糖肽质子的正电荷,从而与反相色谱柱更紧密地结合。 02 离子活化 目前糖肽常用的解离方法有CID,HCD和ETD等,根据需求选择合适的碎裂方法。 CID 由于解离能低和1/3 cut-off,离子阱CID主要产生Y离子,伴有少量的B离子和b/y离子。该技术可识别结合的聚糖,但无法给出准确的糖基化位点和肽序列,可用于简单样品中的糖肽分析。 HCD HCD可以生成丰富的B/Y互补离子鉴定糖部分;随着碰撞能量增加,b/y系列离子会增多,可鉴定肽部分。研究表明,HCD–MS/MS以20-30-40%的能量可生成信息量最多的聚糖和肽相关碎片离子。 ETD ETD主要产生c/z离子,可用于鉴定糖基化位点和肽序列。由于ETD效率较低,通常与HCD或者CID结合使用,即EThcD。随着离子触发技术发展,避免了ETD在非糖肽解离上浪费的反应时间。 03 糖肽裂解规律 在糖质谱命名法中,A/B/C是非还原端离子,X/Y/Z是还原端离子。 B离子是糖肽重要的诊断离子,可用于糖型判断,触发ETD,二级谱过滤等。常见的B离子,如下图所示: B离子在碰撞池中会发生进一步碎裂,通常会丢失H2O,CH2=C=O,HCOH等,我们以HexNAc为例,展示单糖的质谱裂解规律,如下图所示: 在糖肽结构中,往往是糖的还原端与肽段直接相连,因此Y离子由Peptide+Glycan两部分组成。HCD二级谱中Y离子连续的单糖丢失,可用于糖组成和拓扑结构鉴定。 04 分子重排 质子化糖肽在碰撞池中容易发生分子重排,如单糖迁移(Fuc和其他单糖)和内部残基丢失(可以是单个单糖,也可以是多个单糖,通常以中性碎片形式离去),进一步复杂化糖肽二级谱,导致糖链拓扑结构鉴定错误。全甲基化和乙酰化的糖肽也容易发生分子重排。 Y2*表示还原端第二个糖丢失,Y3Y2*表示还原端第二个和第三个糖丢失。 为了消除重排干扰,可通过去质子化糖肽或者糖肽碱金属加合物来分析糖链结构。研究表明,去质子化和碱金属加合物糖肽在质谱中不会发生重排反应。 05 错误匹配来源 常见的糖肽匹配错误来源有两个:单同位素峰鉴定错误(如NeuAc与2Fuc质量差为1)和肽段修饰分子量与单糖分子量之差相等(如氧化+NeuAc与NeuGc质量相等)。 06 Byos中糖肽结果验证 Byos软件提供多个维度自动化的糖肽结果验证指标,如MS1 Correlation,Score,PEP2D等,释放手动解谱压力,使大规模糖肽组分析成为可能。 MS1 Correlation评估实际观测糖肽同位素峰分布与理论同位素峰分布的相关性,降低单同位素峰鉴定错误导致的糖肽错配概率。Byos 3.7及后续版本引入了惩罚性打分,如NeuAc不含有274,NeuGc不含有290等,最小化修饰肽造成糖肽匹配错误。 通常Score与PEP2D搭配使用,Score > 200,PEP2D …

糖肽的RPLC-MS/MS行为 Read More »