關(guān)鍵詞
QE HF; DDA; DIA; Hela;蛋白質(zhì)鑒定;定量蛋白質(zhì)組學
引言
數(shù)據(jù)非依賴性的掃描模式(data-independent acquisition, DIA)是近幾年來發(fā)展的一種新的質(zhì)譜數(shù)據(jù)采集方式[1]。它的理念是用二級碎片離子進行蛋白相對/絕對定量。 DIA 掃描模式中,超高分辨質(zhì)譜對特定質(zhì)量范圍內(nèi)的所有母離子進行碎裂,采集所有母離子的碎片離子,并快速地依次掃描相鄰的母離子寬口內(nèi)的所有碎片離子。 DIA 的數(shù)據(jù)中包含了所有碎片離子的保留時間和強度信息。用非常小的質(zhì)量偏差寬口(如 10 ppm)目標性地抽提同一肽段的多個子離子,計算子離子的強度,就能對該肽段進行鑒定和定量。 DIA 定量相比傳統(tǒng)的基于母離子強度的 DDA 定量有選擇性好,定量準確等優(yōu)點[1],所以 DIA 成為定量蛋白組學新的發(fā)展方向。
Q Exactive HF 是賽默飛世爾科技在 2014 年的 ASMS 上推出的全新靜電場軌道阱超高分辨質(zhì)譜儀(圖 1)[2,3]。 Q Exactive HF 采用了分段式四極桿技術(shù)(Advanced Quadrupole Technology, AQT)使離子傳輸效率至少提高了 2 倍;超高場 Orbitrap 技術(shù),提高了Orbitrap 掃描速度,在 15000 分辨率時,二級譜圖的掃描速度是20 Hz。這兩項技術(shù)提高了 QE HF 進行 DDA、 DIA 數(shù)據(jù)的采集能力。本文用 1 小時快速色譜梯度對 QE HF 的 DDA 鑒定能力和 DIA定量能力進行考察,同時從定量肽段數(shù)目和 CV 兩方面對 DDA 定量和 DIA 定量能力進行比較。
實驗條件
實驗材料和方法
Pierce HeLa Protein Digest Standard(貨號: 88329),稀釋至500 ng/µl, EASY-nLC 進樣 1µl, 500 ng進行 DDA、 DIA 數(shù)據(jù)采集,每種采集模式重復 3 遍。
高效液相色譜分離
高效液相色譜儀: EASY-nLC 1000 (Thermo ScientificTM)
分析柱:實驗室自制 C18, 15 cm, ID 75 µm, 3 µm
流動相: A: 0.1% 甲酸水溶液; B: 0.1% 甲酸乙腈溶液
梯度: 60 min, 3/0 – 6/2 – 22/48 – 40/53 – 80/55 – 80/60(%B/min)
流速: 300 nL/min
質(zhì)譜分析
DDA 數(shù)據(jù)采集:
質(zhì)譜儀: Q Exactive HF (Thermo ScientificTM);
離子源: NanoFlex 離子源;離子模式:正離子;
噴霧電壓: 1.8 kV;毛細管溫度: 275° C; S-Lens RF: 55%;
分辨率:一級 120000@m/z 200,二級 15000@m/z 200;一級
AGC: 3e6, Maximum IT: 50ms;
碰撞能量: NCE 27%; Fixed first mass: 110 m/z
DIA數(shù)據(jù)采集:
質(zhì)譜儀: Q Exactive HF (Thermo ScientificTM);
離子源: NanoFlex 離子源;離子模式:正離子;
噴霧電壓: 1.8 kV;毛細管溫度: 275℃; S-Lens RF: 55%;
目標 m/z 窗口: 400–1000; isolation window: 12Da;
碰撞能量: 27%; fixed first mass: 200 m/z; AGC target: 1e6;
Maximum ion injection time: atuo; loop count: 50
數(shù)據(jù)處理
Proteome Discoverer 蛋白鑒定流程:人蛋白數(shù)據(jù)庫(uniprot human_201309),母離子質(zhì)量偏差: 10 ppm;碎片離子質(zhì)量偏差: 0.02 Da;固定修飾:半胱氨酸烷基化(+57.021 Da);動態(tài)修飾:甲硫氨酸氧化(+15.995 Da);天冬酰胺和谷氨酰胺脫氨基化(+0.984 Da);酶: trypsin;漏切位點: 2; FDR< 0.01
Skyline DDA、 DIA 蛋白定量流程: DDA 定量用 skyline MS1 filtering 功能,對每個肽段強度最高的 3 個母離子同位素峰進行抽提, idotp ≥ 0.8; DIA 定量用 skyline DIA 功能,設(shè)置隔離窗口 12 Da,對給個肽段強度最高的 5 個子離子進行峰抽提, mProphet 打分,控制 FDR < 0.01。
實驗結(jié)果
1. DIA 數(shù)據(jù)采集以及分析流程
圖 1. DDA 定量和 DIA 定量實驗流程
500 ng Hela 細胞裂解液進行 3 次 1 h 梯度 DDA 分析, Proteome Discoverer 1.4 數(shù)據(jù)庫檢索。將鑒定到的蛋白和肽段信息導入 skyline作為候選定量蛋白和肽段。基于母離子的定量用 skyline 中 MS1 filtering 功能對DDA 數(shù)據(jù)進行母離子強度抽提。 500 ng Hela 細胞裂解液進行 3 次目標 m/z 窗口 400–1000,隔離窗口 12 Da 的 DIA 分析;诙壸与x子的定量用 skyline DIA 功能對子離子進行峰抽提, mProphet 打分,篩選 Q value < 0.01 的肽段為定量肽段。
在分析 DIA 數(shù)據(jù)之前,需要建立譜圖庫,譜圖庫中包含所有蛋白在質(zhì)譜中鑒定到的肽段,以及肽段的保留時間、碎片離子質(zhì)荷比、碎片離子強度等信息。數(shù)據(jù)依賴性掃描是最好的建立譜圖庫的數(shù)據(jù)采集方式。 500 ng Hela 細胞裂解液進行三次DDA 數(shù)據(jù)采集。原始數(shù)據(jù)經(jīng) Proteome Discoverer 檢索并控制FDR < 1%。將三次 DDA 鑒定結(jié)果合并,導入 skyline 建立譜圖庫。 DDA 數(shù)據(jù)除了能給出蛋白和肽段的鑒定信息,還能基于母離子的強度/峰面積進行定量。 Skyline 中 MS1 filtering 功能對母離子的多個同位素峰進行抽提,并且根據(jù)同位素分布進行打分(idotp 值)[4]。 Idotp 代表測定的同位分布和理論同位素分布的相似度。篩選 idotp 值大于 0.8 的母離子作為可信的定量肽段。
500 ng Hela 細胞裂解液用相同的色譜柱,相同的色譜梯度,將 QE HF 切換至 DIA 掃描模式進行 3 次 DIA 數(shù)據(jù)采集。在一次掃描循環(huán)中,目標母離子質(zhì)核比范圍 400–1000,四極桿的隔離窗口為 12 Da,包含 50 次 MS/MS 掃描。每一張 MS/MS譜圖中包含了 12 Da 窗口內(nèi)的所有母離子的碎片離子信息。 QEHF 使用了超高場的 Orbitrap,掃描速度是 20 Hz,所以每次循環(huán)所用的時間約為 2.4–3 s,與色譜兼容(圖 2)。 Skyline 處理DIA 數(shù)據(jù)時從譜圖庫中選取強度最高的多個碎片離子進行色譜峰抽提。 Skyline 中嵌入的 mProphet 軟件會根據(jù)同一肽段的多個子離子峰的 feature 進行打分。 Feature 包括子離子共流出峰形、保留時間偏差、 dotp 值、信噪比等。為了區(qū)分假陽性的子離子峰, mProphet 可以建立 decoy 庫,也可以將打分排名第二的肽段作為decoy,計算 FDR[5,6]。篩選 FDR < 0.01 的肽段段作為可信的定量肽段(圖 1)。
圖 2. QE HF 掃描目標質(zhì)核比窗口 400–1000 采集 50 張 MS/MS 所需時間在 2.4–3 s
2. DDA 鑒定結(jié)果以及譜圖庫建立
500 ng Hela 細胞進行 60 min 色譜梯度進行 DDA 數(shù)據(jù)采集。在 60 min 內(nèi),三次重復, QE HF 分別采集到49065、 49031、 48885張譜圖,鑒定到 22030、 21820、 21654 個肽段,對應到約 3909、 3900、 3878 個蛋白。將三次的肽段和蛋白合并,一共鑒定到32446 個肽段, 4510 個蛋白(圖 3)。蛋白和肽段鑒定結(jié)果導入 skyline 建立譜圖庫。通過該譜圖庫,在 skyline 中建立需定量的候選肽段和蛋白。為了提高蛋白定量的準確性,在 skyline 中設(shè)置一些肽段的限制條件, m/z 400–1000,母離子電荷 2+– 4+,無漏切位點。 32446 個肽段中符合這些條件的肽段有 29686 個,對應 4296 個蛋白。在 DDA 定量實驗中,為每個候選肽段添加強度最高的3 個同位素峰(M、 M+1、 M+2)作為定量離子,共生成 89027 個定量離子。在 DIA 定量實驗中,為每個肽段添加 5 個強度最高的子離子(b3-bn, y3-yn),共生成 145736 個定量離子。
圖 3. 500 ng Hela 細胞裂解液 3 次 DDA 鑒定結(jié)果(A)鑒定到的蛋白交蓋圖(B)鑒定到的肽段的交蓋圖
3. 基于母離子的 DDA 定量和基于子離子的 DIA 定量結(jié)果比較
對于 DDA 定量, skyline 會從 DDA 數(shù)據(jù)一級譜圖中進行母離子同位素峰抽提。篩選同位素分布與理論同位素分布較好的肽段作為可靠的定量肽段,即 idotp > 0.8。由于 DDA、 DIA 實驗中用的是相同的色譜梯度, DDA 實驗中肽段的保留時間信息可以傳遞給 DIA 實驗。所以在 DIA 定量時,限制 skyline 只抽提該肽段譜庫中保留時間 5 min 范圍內(nèi)的子離子。通過保留時間限制可以降低 DIA 數(shù)據(jù)處理的復雜度和提高定量的準確度。同時篩選 Q value < 0.01 的肽段最為可靠的定量肽段。
三次 DDA 實驗從一級譜圖中分別定量到 25214、 25515、 24873個肽段; 3969、 3975、 3917 個蛋白;定量到的肽段占總候選肽段的 84%;峰面積的 CV 值在 20% 以下的占總定量肽段的58.81%; CV 值在 10% 以下的占 25.25%(圖 4)。三次 DIA 定量分別定量到 27558、 27604、 27483 個肽段; 4067、 4080、 4073 個蛋白。定量到的肽段張總候選肽段的 93%;峰面積的CV 值在 20% 以下的占總定量肽段的 90.3%; CV 值在 10% 以下的占 69.01%(圖 5)?梢钥闯 DIA 能夠定量到更多的肽段,而且定量肽段的峰面積 CV 值遠遠小于 DDA。
圖 4. 3 次 DDA 實驗和 3 次 DIA 實驗定量到的肽段和蛋白
圖 5. DDA 定量和 DIA 定量母離子和子離子峰面積 CV
結(jié)論
DDA 一般用于蛋白/肽段鑒定,同時可以基于母離子進行的定量,在非常復雜的基質(zhì)中,非常容易受到其他肽段的干擾,導致定量不準確, CV 值過大。 DIA 定量是基于二級子離子的定量,用子離子定量會提高定量的選擇性,降低其他肽段的干擾,定量會比基于一級峰面積的定量更加準確, CV 值較小。該實驗中,用 500 ng Hela 細胞裂解液評價 DDA 定量和 DIA 定量能力。 3 次 DDA 實驗鑒定到 32446 個肽段, 4510 個蛋白。將鑒定到的蛋白和肽段導入 skyline 建立譜圖庫,篩選出 4296個候選定量蛋白, 29686 個候選定量肽段,作為 DDA 和 DIA共同定量目標。 DDA 定量到了 84% 的肽段, 92% 的蛋白;而DIA 定量到了 93% 的肽段, 95% 的蛋白。 DIA 比 DDA 能定量到更多的肽段和蛋白,同時 DIA 定量子離子峰面積的 CV 遠遠小于 DDA 定量母離子峰面積的 CV。結(jié)果表明,基于二級子離子的定量要由于基于一級母離子的定量。
QE HF 在一小時梯度內(nèi)就能從 500 ng Hela 細胞裂解液鑒定并定量 4000 個蛋白,這得益于 QE HF 較好的離子傳輸效率,超快的掃描速度。目前 DIA 定量基于一維反向色譜質(zhì)譜聯(lián)用分析還不適用于二維色譜質(zhì)譜聯(lián)用分析。但是可以通過延長一維反向色譜的梯度,提高分離效率達到細胞蛋白質(zhì)組的全覆蓋。 Matthais Mann 研究小組 2014 年用一維反向色譜在小鼠NSC-34 和 N2a 細胞裂解液 240 min 色譜圖梯度,就鑒定到了8000 多蛋白,基本上達到細胞系蛋白組全覆蓋[7]。通過 DDA鑒定肽段蛋白,建立譜圖庫, DIA 進行蛋白定量可能成為定量蛋白質(zhì)組學新的發(fā)展方向。
參考文獻
1. Gillet, L C. et al. Targeted data extraction of the MS/MS spectra generated by data-independent acquisition: a new concept forconsistent and accurate proteome analysis. Mol Cell Proteomics, 2012, 11(6): O111 016717.
2. Kelstrup, C D. et al. Rapid and deep proteomes by faster sequencing on a benchtop quadrupole ultra-high-field orbitrap mass spectrometer. J Proteome Res, 2014,13(12):6187-6195.
3. Scheltema R A. et al. The Q Exactive HF, a benchtop massspectrometer with a pre-filter, high performance quadrupole andan ultra-high field orbitrap analyzer. Mol Cell Proteomics, 2014,
13(12):3698-3708
4. Abbatiello S E. et al. Design, implementation, and multi-site evaluation of a system suitability protocol for the quantitative assessment of instrument performance in LC-MRM-MS. Mol Cell Proteomics, 2013, 12(9):2623-2639
5. Reiter, L. et al. mProphet: automated data processing and statistical validation for large-scale SRM experiments. Nat. Methods.2011, 8 (5):430-435
6. Röst H L. et al. OpenSWATH enables automated, targeted analysis of data-independent acquisition MS-data. Nat. Biotechnol. 2014,32(3):219-223
7. Horburg D. et al. Deep Proteomic Evaluation of Primary and Cell Line Motoneuron Disease Models Delineates Major Differences in Neuronal Characteristics. Mol Cell Proteomics, 2014, 13(12):3410-3420