數(shù)據(jù)非依賴采集(DIA)質(zhì)譜法的發(fā)展是為了提高復雜數(shù)據(jù)集中蛋白質(zhì)鑒定的重現(xiàn)性。PEAKS提供專門的DIA數(shù)據(jù)分析工作流,其中包括譜圖庫搜索(SL search)和數(shù)據(jù)庫搜索(DB search)算法,這些算法是為DIA質(zhì)譜的復雜性而專門設計的。通過對人胚胎腎(HEK)細胞DIA數(shù)據(jù)的分析,譜圖庫搜索比常規(guī)DDA數(shù)據(jù)方法具有更好的重現(xiàn)性。與測試的其他方法相比,使用DIA數(shù)據(jù)進行直接數(shù)據(jù)庫搜索的靈敏度最高。而譜圖庫搜索和直接數(shù)據(jù)庫搜索在PEAKS工作流中的結(jié)合提供了一種既準確、重現(xiàn)性又高的方法。
DIA是采集預設定m/z窗口范圍內(nèi)的所有母離子進行二級碎裂,因此即使樣本不進行二維組份分離,也能基本上涵蓋所有質(zhì)量范圍。而DDA是通過Top N的方式選擇母離子進行碎裂,即使設定多輪掃描,也會丟失一些信號。因此,DIA生成的是無偏的、高度可重復的,但復雜度比較高的譜圖數(shù)據(jù),通常包含來自幾個共洗脫肽段的碎片離子(Fig 1)。
Fig 1. DDA-MS vs. DIA-MS comparison
為了分析DIA數(shù)據(jù)集的復雜譜圖,PEAKS提供了兩種分析方法:譜圖庫搜索(SL search)和直接數(shù)據(jù)庫搜索(DB search)。PEAKS的SL search是從DDA譜圖庫中找到與DIA數(shù)據(jù)中特征相匹配的多肽,從而實現(xiàn)鑒定,包括碎片離子特征、索引保留時間(iRT)和離子遷移率(IM)等。PEAKS DIA DB search工作流是直接根據(jù)蛋白質(zhì)序列數(shù)據(jù)庫生成預測的譜圖庫,然后進行DIA數(shù)據(jù)的解析。
深度學習預測的多肽信息包括碎片離子、iRT、IM等。SL search和DB search可以單獨運行,也可以同時運行。當同時運行時,首先使用SL search進行匹配,然后,在選定的錯誤發(fā)現(xiàn)率(FDR)范圍內(nèi)沒有可信匹配的譜圖再使用DB search進行分析。
Fig 2. PEAKS Online DIA Workflow
Table1 DDA analysis and Spectral library generation parameters
Parameter | Parameter |
---|---|
Precursor mass tolerance | 10 ppm |
Fragment mass tolerance | 0.02 Da |
Modifications | Carbamidomethylation(Fix) |
Enzyme | Trypsin |
Digestmode | Specific |
Maximum missed cleavage | 3 |
Database | Revieweduniprot human-20230906 |
PSM FDR | 1% |
Protein FDR | 1 |
Minimum unique peptides | 1 |
Table 2 DIA Spectral Library search parameters
Parameter | Parameter |
---|---|
Precursor mass tolerance | 10 ppm |
Fragment mass tolerance | 0.02 Da |
Peptide length | 7-30 |
PSM FDR | 1% |
Protein Group FDR | 1% |
Database |
Reviewed uniprot human-20230906 |
Spectral library | From table 1 |
Table 3 DIA database search parameters
Parameter | Parameter |
---|---|
Precursor mass tolerance | 10 ppm |
Fragment mass tolerance | 0.02 Da |
Modifications | Carbamidomethylation(Fix) |
Enzyme | Trypsin |
Digestmode | Specific |
Maximummissed cleavage | 3 |
Peptide length | 7-30 |
Database | Reviewed uniprothuman-20230906 |
PSM FDR | 1% |
Protein FDR | 1% |
Minimum unique peptides | 1 |
Fig 3. Protein and peptide total number of identifications. Protein and PSM were both within 1% FDR.
Fig 4. DIA library search protein (A) and peptide (B) reproducibility.
Fig 5. DIA database search protein (A) and peptide (B) reproducibility.
Fig 6. DIA Workflow (Spectral library search then DB search) protein (A) and peptide(B) reproducibility.
Fig 7. DDA Database search protein (A) and peptide (B) reproducibility.
PEAKS Online的DIA全工作流(包括譜圖庫搜索和直接數(shù)據(jù)庫搜索)鑒定到最多的蛋白和多肽(Fig 3)。分別選取三個replicates,對每種方法的定性結(jié)果及重現(xiàn)性進行了評估。結(jié)果顯示譜圖庫搜索的重現(xiàn)性最高,在蛋白質(zhì)水平上有95.1%的重復率,在肽段水平上有75.5%的重復率(Fig 4)。
在DIA數(shù)據(jù)庫搜索結(jié)果中,靈敏度和重現(xiàn)性之間必然是需要權衡的,它最靈敏,但是重現(xiàn)性相對來說就會比譜圖庫搜索稍微低一些(92.7%, Fig 5a)。DIA全工作流在重現(xiàn)性和靈敏度之間達成了最佳組合 (Fig 6)。與DDA數(shù)據(jù)庫搜索方法相比,DIA搜索方法的靈敏度和重現(xiàn)性都更高(Fig 4-7)。
若您想了解更多PEAKS軟件的功能和應用,歡迎掃描下方二維碼關注我們!
1.Fernández-Costa C, Martínez-Bartolomé S, McClatchy DB, Saviola AJ, Yu NK, Yates JR 3rd. Impact of the Identification Strategy on the Reproducibility of the DDA and DIA Results. J Proteome Res. 2020 Aug 7;19(8):3153-3161.doi: 10.1021/acs.jproteome.0c00153. Epub 2020 Jun 19. PMID: 32510229; PMCID: PMC7898222.
www.bioinfor.com (EN)
www.deepproteomics.cn(CN)
作為生物信息學的領軍企業(yè),BSI專注于蛋白質(zhì)組學和生物藥領域,通過機器學習和先進算法提供世界領先的質(zhì)譜數(shù)據(jù)分析軟件和蛋白質(zhì)組學服務解決方案,以推進生物學研究和藥物發(fā)現(xiàn)。我們通過基于AI的計算方案,為您提供對蛋白質(zhì)組學、基因組學和醫(yī)學的卓越洞見。旗下著名的PEAKS系列軟件在全世界擁有數(shù)千家學術和工業(yè)用戶,包括:PEAKS Studio,PEAKS Online,PEAKS GlycanFinder, PEAKS AB及抗體綜合表征服務等。
聯(lián)系方式:021-60919891;sales-china@bioinfor.com