September 2024 – Binocular Vision

一口气讲完糖肽搜索引擎

第五期一口气讲完糖肽搜索引擎 Protein Metrics 高准 Database search engine Glycan-first search engine Peptide-first search engine 本文简要介绍糖肽搜索引擎的分类和特点，帮助分析学家快速了解各类搜库软件。简介糖肽表征需要确定多肽序列，糖基化位点以及聚糖的组成和结构。与其他翻译后修饰不同，糖基化引起的质量增加通常大于2~3个氨基酸，往往会与漏切肽段或共享碎片离子但序列不同的肽段相互混淆，造成糖肽匹配错误；手动解析费时费力，无法推广到大规模糖肽组学。因此，科学家们开发了大量的糖肽搜库软件以实现自动化的糖肽分析。按照搜库原理，糖肽搜索引擎大致可以分为3类：database search, glycan-first和peptide-first。Database search需要提供蛋白数据库和聚糖库，通过组合多肽和聚糖信息与串联质谱数据进行匹配，灵敏度高；后两类将糖肽串联质谱数据分割成多肽和聚糖两部分，先完成其中一个搜库，并以此为基础限制另外一个搜库空间，速度快。 01 Database search engine Database search engine将糖肽作为一个整体进行搜索，这就意味着需要考虑所有可能的多肽和聚糖组合。这种搜索的复杂性，往往需要限制蛋白质和聚糖数据库大小，以便在合理的时间内完成搜库。但随着质谱技术和AI技术发展，database search engine的速度得到了大幅度的提高。以Byonic为例，可利用B离子筛选出糖肽二级谱和isobar_score_filter=50智能打分系统过滤掉质量差的糖肽二级谱，最终加快搜库速度并给出高质量的糖肽结果。在2021年，HUPO启动了糖肽信息化解决方案评估，有众多软件的开发者和用户参与。其中Byonic的N/O糖搜库性能最好，并得益于用户友好界面，精确的图谱标识和灵活的报告模板，Byonic拥有最广泛的用户基础。 02 Glycan-first search engine Glycan-first的典型特征是先用Y离子确定肽质量，并以此来限制肽的搜库空间。MAGIC和pGlyco是这个算法的典型代表，但实现方式不同。 pGlyco3采用两步法，首先使用Y离子和B离子将完整的聚糖与聚糖数据库进行匹配，然后利用前体离子质量减去聚糖质量来确定肽质量，从而在大大减少的搜索空间中匹配肽序列。 MAGIC采用三步法，首先利用五糖核心系列Y离子推测肽质量，然后在限制的搜库空间中匹配肽序列，最后深入表征聚糖的组成和结构。由于三步法依赖五糖核心，该算法主要用于N糖搜库。 03 Peptide-first search engine MSFragger-Glyco是Peptide-first的典型代表，首先利用b/y离子进行肽匹配，然后利用前体离子质量减去肽质量来确定聚糖质量，最后在大大减少的搜库空间中匹配聚糖的组成和结构。与Glycan-first相比，该方法不依赖于Y离子，因此可以大大提高O糖的搜索灵敏度。糖肽搜索引擎示例结语本文是糖蛋白系列文章完成篇，系统介绍了糖肽搜索引擎的分类和特点，方便科研和企业用户选择适合自己的软件。参考文献： [1] Polasky, Daniel A., and Alexey I. …

一口气讲完糖肽搜索引擎 Read More »

解析糖肽搜库结果

Uncategorized / By yundic

第四期解析糖肽搜库结果 Protein Metrics 高准一般思路搜索设置检查肽段组评估MS2 MS2质谱示例本文主要介绍糖肽搜库结果的解析思路，帮助分析学家从复杂的质谱数据中快速筛选出正确的糖肽结果。 01 一般思路由于糖基化的复杂性，分析学家需要从更广泛的视角进行数据判别，包括聚糖的数据库选择，生物学意义，MS2光谱等。当您获得了糖肽搜库结果，可按照如下步骤进行数据分析：首先根据肽段对结果进行排序，再根据保留时间进行排序。您可以将肽段的电荷态Combine，看看其分布是否符合预期？查看肽段组的聚糖是否与某个合理的构建途径相关？糖肽的保留时间是否合理？检查那些归属不明确的MS2，以确保分配了正确的聚糖。糖基化的肽段往往会导致肽骨架的碎裂效果不佳，因此仅依靠打分来进行解析可能会忽略掉一些真正的阳性谱图。因此，通常需要对MS2质谱图进行手动解析。 02 搜索设置选择正确的数据库：一种组织表达系统可能会产生与另一种系统不同的聚糖。最常见的错误原因之一，就是正确聚糖不在搜库范围内。 03 检查肽段组聚糖生物学意义查看组中评分最高的结果，并确保所有其他结果在该背景下都有意义。肽段组中鉴定出的聚糖相互之间是否存在依存关系？如您经常会在同一位点看到高甘露糖和复杂的唾液酸化形式。糖肽保留时间 NeuAc和其他唾液酸可导致色谱峰向更酸性的区域偏移。您在数据中看到这种情况了吗？如果没有，则表明鉴定结果可能存在问题。评估其他通过洗脱时间提供的信息，例如当取代基（如唾液酸）从一个天线移动到另一个天线时出现的双峰。 04 评估MS2 在大多数糖肽的碰撞MS2质谱中，您应能看到 HexNAc (204) 和 HexNAcHex (366) 的信号。如果您没有看到这些碎片，但是鉴定结果包含这些结构单元，可能就不是糖肽。确保肽段的N端和C端正确。如果末端不正确，那么一个被认为是截短的肽段可能实际上是一个全长肽链，只是携带了不同的糖基修饰。寻找覆盖末端的 b/y 离子；或者携带小聚糖碎片的完整肽，在合适的能量下进行HCD/QTOF碎裂，Y0和Y1均为可靠的峰。仔细检查Delta Score较低的谱图，因为这表明Byonic找到了另一种不同的匹配结果。请注意标有波浪号（例如 ~y5）的碎片，这表明这些碎片已经完全丢失了聚糖（或其他不稳定的物质）。虽然这是合理且预料之中的，但在缺乏其他确认信息的情况下，这也有助于定位糖基化位点。 05 MS2质谱示例结语本文介绍了糖肽二级谱的解析思路和方法，致力于提供高质量的糖肽结果。后面还有更多精彩内容，敬请期待吧！关于Protein Metrics Protein Metrics LLC是一家全球领先的质谱数据解析软件供应商，公司总部位于美国波士顿。我们为科研和企业用户提供高效准确的一站式质谱数据解析方案，帮助用户发现、解决问题。Protein Metrics在全球范围内提供销售和支持，目前已为超过200个企业和300个科研单位提供服务。 …

解析糖肽搜库结果 Read More »

Byos中的糖肽搜库策略

Uncategorized / By yundic

第三期 Byos中的糖肽搜库策略 Protein Metrics 高准数据库选择 N糖策略 O糖策略未知糖策略加速糖肽搜库策略本文详细介绍了Byos中N糖，O糖和未知糖的搜库策略以及如何优化糖肽的搜库空间，帮助用户实现更好的糖肽分析。 01 数据库选择到目前位置，数据库搜索仍然是糖肽分析最有效手段。选择合适的糖库是糖肽研究成功的第一步。Byos提供3种不同的糖输入方式：数据库，糖组成以及自定义编辑，如下所示： Byos内置大量N/O糖库，易于编辑和拓展。默认使用糖库，如果糖库不足，可按照上述方法B/C自定义添加聚糖。 Byonic 支持大量关键字，包括 HexNAc、Hex、Fuc、dHex、NeuAc、NeuGc、Pent、GlcA、IdoA、DiNAcBac、Acetyl、Sulfo、Phospho、Na 和 Sodium。如方法B表示硫酸化N糖。如果用户做的是衍生化糖或者含有加合物，那么delta mass可以添加在方法C的additional mass单元格中。 02 N糖策略搜索任意N糖 Byos中N糖输入方式是HexNAc(2)Hex(2)Fuc(1) @ NGlycan | common1，其中NGlycan表示NXS/T 基序。如果用户想搜索任意天冬酰胺上的 N-糖，以发现 NXC 或反向基序上的 N 糖，可用N替换NGlycan，如HexNAc(2)Hex(2)Fuc(1) @ N | common1。 18O水中脱糖 Delta:H(1)O(-1)18O(1) / +2.988261 @ NGlycan | common1 03 O糖策略 Byos中O糖输入方式是HexNAc(1) @ OGlycan …

Byos中的糖肽搜库策略 Read More »

糖肽的RPLC-MS/MS行为

Uncategorized / By yundic

第二期糖肽的RPLC -MS/MS行为 Protein Metrics 高准 RPLC行为离子活化糖肽裂解规律分子重排错误匹配来源 Byos中糖肽结果验证本文简要介绍糖肽的RPLC-MS/MS行为，主要包括色谱保留，离子活化，质谱裂解规律，分子重排和错误匹配来源等，帮助分析学家快速读懂糖肽LC-MS/MS图谱。 01 RPLC行为一个糖肽二级谱往往可以匹配多个不同的聚糖和肽段组合，尤其是当质谱数据质量较差（缺少特征诊断离子或者前体离子测定不正确），保留时间就为糖肽鉴定提供非常重要的互补信息。糖肽疏水性越强，在RPLC上的保留时间越长。通常糖链上引入中性单糖，如Hex和HexNAc，会增加糖肽亲水性，导致保留减弱。不改变电荷的翻译后修饰，对保留时间影响不大，蛋氨酸氧化除外。有研究发现，如果聚糖链上存在 NeuAc 或磷酸基团，则会导致保留时间增加，因为带负电荷的 NeuAc 和磷酸基团会抵消糖肽质子的正电荷，从而与反相色谱柱更紧密地结合。 02 离子活化目前糖肽常用的解离方法有CID，HCD和ETD等，根据需求选择合适的碎裂方法。 CID 由于解离能低和1/3 cut-off，离子阱CID主要产生Y离子，伴有少量的B离子和b/y离子。该技术可识别结合的聚糖，但无法给出准确的糖基化位点和肽序列，可用于简单样品中的糖肽分析。 HCD HCD可以生成丰富的B/Y互补离子鉴定糖部分；随着碰撞能量增加，b/y系列离子会增多，可鉴定肽部分。研究表明，HCD–MS/MS以20-30-40%的能量可生成信息量最多的聚糖和肽相关碎片离子。 ETD ETD主要产生c/z离子，可用于鉴定糖基化位点和肽序列。由于ETD效率较低，通常与HCD或者CID结合使用，即EThcD。随着离子触发技术发展，避免了ETD在非糖肽解离上浪费的反应时间。 03 糖肽裂解规律在糖质谱命名法中，A/B/C是非还原端离子，X/Y/Z是还原端离子。 B离子是糖肽重要的诊断离子，可用于糖型判断，触发ETD，二级谱过滤等。常见的B离子，如下图所示： B离子在碰撞池中会发生进一步碎裂，通常会丢失H2O，CH2=C=O，HCOH等，我们以HexNAc为例，展示单糖的质谱裂解规律，如下图所示：在糖肽结构中，往往是糖的还原端与肽段直接相连，因此Y离子由Peptide+Glycan两部分组成。HCD二级谱中Y离子连续的单糖丢失，可用于糖组成和拓扑结构鉴定。 04 分子重排质子化糖肽在碰撞池中容易发生分子重排，如单糖迁移（Fuc和其他单糖）和内部残基丢失（可以是单个单糖，也可以是多个单糖，通常以中性碎片形式离去），进一步复杂化糖肽二级谱，导致糖链拓扑结构鉴定错误。全甲基化和乙酰化的糖肽也容易发生分子重排。 Y2*表示还原端第二个糖丢失，Y3Y2*表示还原端第二个和第三个糖丢失。为了消除重排干扰，可通过去质子化糖肽或者糖肽碱金属加合物来分析糖链结构。研究表明，去质子化和碱金属加合物糖肽在质谱中不会发生重排反应。 05 错误匹配来源常见的糖肽匹配错误来源有两个：单同位素峰鉴定错误（如NeuAc与2Fuc质量差为1）和肽段修饰分子量与单糖分子量之差相等（如氧化+NeuAc与NeuGc质量相等）。 06 Byos中糖肽结果验证 Byos软件提供多个维度自动化的糖肽结果验证指标，如MS1 Correlation，Score，PEP2D等，释放手动解谱压力，使大规模糖肽组分析成为可能。 MS1 Correlation评估实际观测糖肽同位素峰分布与理论同位素峰分布的相关性，降低单同位素峰鉴定错误导致的糖肽错配概率。Byos 3.7及后续版本引入了惩罚性打分，如NeuAc不含有274，NeuGc不含有290等，最小化修饰肽造成糖肽匹配错误。通常Score与PEP2D搭配使用，Score > 200，PEP2D …

糖肽的RPLC-MS/MS行为 Read More »