• 相关产品 +
  • 相关服务 +
  • 相关应用 +
  • 相关案例 +
  • 相关下载 +

咨询信息

我们的产品覆盖了化学信息学,生物信息学,以及实验室信息管理
针对您的研究需求

我们为您选择最适合您的产品
上传时间:2016-04-13 15:02:57

Mascot 翻译后修饰设置技巧

Mascot中大部分的复杂操作都跟修饰相关。除非你知道你想要找的是何种修饰,要不然要找到关于如何设定修饰的信息是很困难的。本文将详细讨论相关内容。

搜索中可变修饰设定的上限值
 



  对于标准搜索及error tolerant 搜索,我们可以设置的可变修饰上限是不一样的。如果Mascot security 未开启,可以在Configuration Editor中的Configuration Options中修改MaxPepNumVarMods (默认 9) 和 MaxEtVarMods (默认 2)。如果Mascot security开启,上限可以在security group level上设定,在这种情况下,Configuration Options中的任何修改都是无效的。上限2个可变修饰对于error tolerant 搜索来说有点严苛,我一般会提高至4或6个。上限9个对于标准搜索是合理的。不过一般进行ErrorTolerant搜索时不需要加入非常见修饰进行搜索,Error Tolerant会自行报告,如下左图,不加如Oxidation搜索和右图,加入Oxidation搜索。

  可变修饰越多,就会产生非常多种可能的结果组合,这会导致搜索时间延长,灵敏度严重丢失。一般来说,增加修饰只会额外获得很少一部分匹配的修饰肽段,但同时会丢失大量没有修饰的肽段匹配。因为修饰越多,判定显著匹配的打分阈值就越高。另一方面,只在总数上限制可变修饰是一种较粗陋的方式,因为不同的修饰会产生非常不同的效果。那些只在蛋白末端发生的修饰,例如:Acetyl(蛋白N-端),或者那些只在肽段末端特定残基上的修饰,例如:Gln->pyro-Glu (N-term Q),对搜索空间的增加是微乎其微的。那些在多种残基上,与位置无关的修饰才会对搜索空间的增加产生巨大的影响,例如:磷酸化修饰(ST)或者甲基化修饰(DE ),因而在设定这些修饰时,需要非常谨慎。

  同一个位点上发生的多种固定修饰或可变修饰

  你不能在一次搜索中对同一个位点设定两种固定修饰。也就是说,你不能在C上既设定Carbamidomethyl固定修饰,又设定Propionamide 为固定修饰。如果您将其中一个设定为固定修饰,另一个为可变修饰,那么您得到的匹配中,C上的固定修饰是其中一种,但绝不会得到没有修饰的匹配。如果您想得到C上没有修饰的匹配,那么您必须将两种修饰都设定为可变修饰。

  当提交iTRAQ 或 TMT搜索的时候,经常碰到的问题是出现一种错误报告“"Modification conflict"。那是因为这两种标记手段被设定为固定修饰,您要么在其他地方第二次选择了这种修饰,要么就是在K或者N-端设定了另一种固定修饰。

  添加新的修饰

  Mascot从Unimod database提取修饰信息。在免费的,公开的Mascot Server 的search form中添加新修饰的唯一方法,就是将其添加至公开的Unimod中。对于in-house的MascotServer,如果您没有找到您想要的修饰,首先检查Unimod database。如果修饰在Unimod database中,您只要下载新的unimod.xml文件到您的本地Mascot Server中。如果修饰不在Unimod database中,你可以将其添加到Unimod database中,等待可下载文件的重建,或者使用Mascotconfiguration editor将其添加到您本地的unimod.xml file中(本地Mascot home page---Mascot Utilities)

  修饰的归类

 


  你会注意到,有些修饰有多种修饰位点,比如磷酸化修饰(ST)以及甲基环修饰(DE)。这类修饰被归为一类,赋予一个非零的组号,在生物体中这些修饰发生在多个位点上的可能性是等同的时候,我们就可以将它们归为一类。如果您在configuration editor的查看磷酸化的entry,您会发现S和T在组1中,但是Y在组2中。如下图:

  归类的规则如下:

  ·只有简单的残基位点可以归类(修饰位点是任意的)。你不能将有特定位点的修饰归类,例如:N-term Q或者末端特定的残基修饰。

  ·中性丢失的定义必须是一致的。这就是为什么Y点的磷酸化不能与ST位点的磷酸化归为一组。

  非特异性修饰

  有的时候,我们需要设定非特异性或者未知特异性的修饰。在读了之前有关归类的内容,您可能想创建一个诸如 FuzzyMod((ACDEFGHIKLMNPQRSTVWY)的修饰。如果您试图使用该修饰,Mascot 会几乎耗尽所有的内存或者崩溃,因为组合的种类太多太多了。

  考虑数目。如果任何残基都可能发生修饰,那么对于数据库中一个有20个残基的肽段来说,有220种可能的修饰肽段需要进行测试,来判定它们是否符合母离子质量。如果它们符合,将它们与MS/MS图进行匹配,这会将搜索空间增加100万倍。在合理的内存条件下,即使代码可以处理,匹配结果必须比没有修饰的结果好100万倍,才可能达到显著性匹配的效果。

  如果预期一个肽段有多种修饰,对数据库搜索来说,这是一个棘手的,很可能是难于驾驭的问题。非特异性修饰会产生一群修饰方式不同的肽段。修饰会有多种组合,并且会产生一批相同质量的肽段。这样,每一个MS/MS图谱都会去匹配一群混合的母离子碎片,这样会导致匹配质量下降。

  如果修饰相对来说很少发生,很多肽段都不会找到一个肽段有这种修饰,比如用于研究蛋白-蛋白相互作用的cross-linker。这样,问题就容易多了:

  ·将这个修饰加入到您本地的Mascot server中,所有位点都可能发生,但是不要将它归类。最多可以创建20个独立的新修饰。

  ·确保MS/MS数据中包含一些没有修饰的肽段,这样你可以找到这个蛋白。如果必要,在样品中添加一些没有修饰的蛋白。

  ·运行自动error-tolerant search。

  如果图谱很好,最高打分的匹配肽段会在正确位置包含这个修饰。如果图谱没有那么好,你会得到一些打分相似的匹配,这些匹配的修饰位点不同。需要注意的是,error-tolerant search不会给出一条肽段上有不同种类型的修饰;你会得到有两个FuzzyMod(H)的肽段,但是你不会得到一个有FuzzyMod (H) 和FuzzyMod (M)的匹配。

  中性丢失

  如果你之前尚未了解过中性丢失的类型,那么你可能在设置中性丢失参数时比较迷茫,中性丢失设置模块大致有以下几个重要参数:

  Scoring

  来自MS/MS 片段的中性丢失。中性丢失以后的片段会用来进行打分,例如:磷酸化肽段中的y-98或者b-98。最多可以给10个中性丢打分。在搜索中,Mascot通过打分的中性丢失进行迭代计算。打分最高的会被选择,其他的中性丢失会被让认为是Satellite。

  Satellite

  被认为是Satellite的中性丢失不会用于计算。如果Satellite的中性丢失匹配一个peak,这个peak就会从杂峰中去除,这样就会提高打分。

  Peptide

  来自于完整肽段母离子的中性丢失。该谱峰将被正确识别而不会作为噪音处理。

  Required Peptide

  设置为Required peptide的 neutral loss必须出现在谱图中。这会带来一些风险也就是匹配很好的谱图可能不一定有该中性丢失峰,这种情况Mascot会将该结果去除。

  为什么氨基酸替代没有列举在搜索框中?

  氨基酸替代很少发生,并且种类很多,所以唯一一种切合实际的方法就是在error tolerant search中使用。将它们列举在搜索框中,只会增添混乱。如果在特殊情况下,您确实需要在搜索框中使用某个氨基酸的替换,您只需使用 configuration editor将AA 替换成任何其他可能的氨基酸。

  Exclusive modifications

  Exclusive modifications可以认为是固定修饰。在许多定量实验中,各个样品被独立标记后混合,所以对于一个给定的肽段,只可能携带其中一组修饰,而不能两组修饰同时具有。一些人会用 “binary”这个词来形容这种特异性。我们更喜欢用exclusive,因为binary暗示这只有两种可能性。专门修饰的价值在于,它可以让搜索空间变得很小,这样就避免了因为太多可变修饰而造成的多种组合爆棚。

  Exclusive modifications只能特异性的被归为定量方法的一部分;它们不能在搜索框中选择。这里有一个相关的参数,叫做“Constrain search”。如果设置为true,那么在搜索中,Exclusive modifications就被认为是一种固定修饰。这样让搜索空间变小,从而加快搜索,降低显著性打分的阈值。如果Constrain search设定为false,那么Exclusivemodifications在搜索中就会被认为是可变修饰,而且只有在定量中,它们才会被认为是固定修饰。如果你怀疑有化学问题,想查看只有部分修饰的肽段匹配,后者会很有帮助。

  有时,你可能强制要求将Constrain search设定为false, 因为Mascot 不允许有一个或更多的修饰是固定修饰。一个例子就是在蛋白N-端的修饰或者有多个中性丢失的修饰。只有残基或者肽段末端,没有中性丢失的 修饰才能是固定修饰,

  一个位点的多种修饰

  不考虑定量的时候,很少需要匹配一个残基或者末端有多种修饰的肽段。在大部分情况下,因为化学特性,一个位点不会出现多种修饰,例如,你不可能在同一个 cysteine位点既具有Carbamidomethyl修饰,又有Propionamide修饰。在其他情况下,叠加的修饰是通过各自独立的修饰完成的,例如:Methyl (K), Dimethyl (K), and Trimethyl (K)。

  SILAC定量不一样,因为SILAC本身就是通过修饰来进行的。直到最近,如果你想搜索某个标记残基的修饰,你必须定义组合修饰,并且将这些设定为可变修饰。例如,在Unimod中,你会发现这样的修饰:13C(4)+Oxidation 以及Label:13C(6)+Acetyl。这样的做法是不太令人满意的,因为它将需要的可变修饰数目增加了一倍。

  在Mascot 2.4之后,我们增加了对多种修饰的支持,但是只有在定量方法中。这些限制是:

  ·一个位点的两个修饰是允许的,但只能其中一个是可变修饰,另一个必须定义为专门的修饰,例如SILAC 标记。

  ·Constrain search在定量方法中一定设定归为true。

  ·一定要使用Distiller进行处理。

  当进行非SILAC 定量的时候,需要稍稍小心一些。比如,如果你正在使用dimethyl 标记法,同时你还想在K 或者N-端设定其他的可变修饰,Mascot无法从化学特性角度判断该可变修饰与dimethyl 标记可否同时出现在同一个位点。如果肽段的质量符合这两种修饰,Mascot 会尝试这种组合修饰。当然,如果肽段不存在,那么你自然不会得到显著性的匹配,但是如果你想从低打分的垃圾结果中挖掘匹配的肽段,那么你可能会找到一些看起来不可能的组合修饰匹配。

  代谢标记

  与SILAC相反,在代谢标记法中,标记是贯穿于肽段的所有骨架中。15N是最常用的标记,因为价格原因,13C使用的会少一些。因为所有氨基酸残基的质量都发生了偏移,所以设定修饰是不实际的。即使你不想用MascotDistiller 来处理定量,你也需选择一种合适的定量方法,例如,15N metabolic [MD]。谱图会被搜索两次,一次使用14N的质量,另一次使用15N的质量。

  需要注意的是,由于15N 标记肽段会有一小部分未标记上,导致其同位素谱峰会有拖尾现象,这样就无法准确获知其准确的母离子m/z。对于定量实验来说,这不是一个大问题,因为轻标肽段的存在,重标的肽段就可以被识别出来。但是,如果你只分析重标的肽段,而不是轻标和重标混合的肽段,那么你可能需要将母离子的mass tolerance设得非常宽。

  如何在代谢标记数据中以最好的方式处理修饰,还没有非常成熟的流程。如果修饰是样品处理时的衍生物或者人为产生的,那么该修饰本身通常不会被标记。如果该修饰出现在标记的培养基中,那么在蛋白生成的过程中,该修饰可能会被加入到标记中。在目前的Mascot中,代谢标记同时应用于残基以及修饰。如果你想获得没有标记的修饰,该修饰包含标记的元素,那么你需要使用或者创建一个有着同样质量漂移(mass shift),但是没有该元素的修饰。这不是一个理想的做法,而且可能在将来会改变。所以你可以在搜索水平定义该修饰(修饰没有标记),或者在定量水平定义该修饰(修饰有标记),从而控制标记是否应用于该修饰上。

  大部分的代谢标记都是15N, 而非常常见的修饰中,大部分都是不包含N元素的。例外就是Carbamidomethyl(C),但是正常情况下,它不会被标记,还有 Deamidation(NQ)。一种解决方法是用碘乙酸(idoacetic acid)代替碘乙酰胺(iodoacetamide)。如果不行的话,那么就创建一个修饰,组成成分是C(4)H(2)Li, 用该修饰代替Carbamidomethyl(C),因为质量差只有0.01Da。

  Deamidation既可能在翻译后修饰产生,又可能人为产生,因为它是丢失N 造成的,但是Mascot通常会正确处理两种情况。需要注意的是,样品中一个15N 的deamidation会导致没有质量偏差,如果修饰的肽段和没有修饰的肽段无法在色谱中被区分开,那么对于定量,这就是一个头疼的问题,因为色谱峰中包含了两个轻标的组分,但实际上,其中一个是重标的。(除非你有FT-ICR,可以区分只有0.013Da的质量偏差!)