Plant Phenomics | GenoDrawing:用于SNP的圖像預(yù)測自動編碼框架
高通量基因組測序和基因分型方法的進步,使許多植物物種(包括模型和作物)的全基因組鑒定以及種群水平的多樣性分析成為現(xiàn)實。在這種海量基因型數(shù)據(jù)的情況下,作物基因型和表型之間的聯(lián)系具有巨大的潛力,可以識別與相關(guān)農(nóng)業(yè)性狀自然變異有關(guān)的基因或基因組區(qū)域,并預(yù)測后代在特定環(huán)境中的表現(xiàn)。但由多個數(shù)量性狀位點調(diào)控的復(fù)雜數(shù)量性狀,由于其效應(yīng)較小,用較少的標(biāo)記難以預(yù)測。而利用深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)進行基因組預(yù)測,有望克服傳統(tǒng)方法中的一些挑戰(zhàn)。
2023年11月,Plant Phenomics在線發(fā)表了西班牙Center for Research in Agricultural Genomics (CRAG)單位Federico Jurado-Ruiz 和 Maria José Aranzana等人題為GenoDrawing: An Autoencoder Framework for Image Prediction from SNP Markers 的研究論文。
本研究引入了一種自動編碼器框架GenoDrawing,用于從低深度單核苷酸多態(tài)性(SNP)陣列中預(yù)測和檢索蘋果圖像,可能有助于預(yù)測難以定義的性狀。作者基于該框架,使用蘋果形狀相關(guān)的SNP預(yù)測其表型,結(jié)果顯示,使用與視覺性狀相關(guān)的SNPs會對生成的圖像產(chǎn)生顯著影響,與生物學(xué)解釋一致。另外,使用大量相關(guān)的SNPs能提升性能,但加入不相關(guān)的SNPs會導(dǎo)致性能下降。
圖1 圖形摘要。(1)將蘋果基因型數(shù)據(jù)集分為訓(xùn)練和驗證兩個子集,每個子集保留了蘋果整體形狀分布。(2) SNP基因型矩陣分為2個,每個數(shù)據(jù)集1個。(3和4)使用訓(xùn)練數(shù)據(jù)集中的圖像來擬合自動編碼器模型。(5和6)每張圖像(64個嵌入)的編碼值按基因型平均,并與SNP矩陣一起用于訓(xùn)練嵌入預(yù)測模型。(7) GenoDrawing的結(jié)果不是一個訓(xùn)練模型,而是一個自動編碼器、解碼器和嵌入預(yù)測器的集合。(8) GenoDrawing預(yù)測的圖像示例。
圖2 (左)蘋果原始圖像。(右)蘋果預(yù)測圖像。
總的來說,盡管GenoDrawing存在一定的局限性,但其為未來基于基因組標(biāo)記的圖像預(yù)測研究奠定了基礎(chǔ)。另外,該框架被證實可用于果樹表型預(yù)測研究,可用于預(yù)測相關(guān)的遺傳性狀。
作者介紹
本文的主要作者為Federico Jurado-Ruiz和Maria José Aranzana,所屬單位為西班牙農(nóng)業(yè)基因組學(xué)研究中心和農(nóng)業(yè)食品技術(shù)研究所。該工作由Federico Jurado-Ruiz和Maria José Aranzana構(gòu)思和設(shè)計;Federico Jurado-Ruiz進行實驗;Federico Jurado-Ruiz和Maria José Aranzana完成手稿。
論文鏈接:
https://spj.science.org/doi/10.34133/plantphenomics.0113
——推薦閱讀——
https://doi.org/10.34133/plantphenomics.0127
Plant Phenomics | 華盛頓大學(xué)基于時間序列圖像表型與植物功能結(jié)構(gòu)模型相結(jié)合預(yù)測不定根構(gòu)型
https://spj.science.org/doi/10.34133/plantphenomics.0146
Plant Phenomics | 東京大學(xué)利用高光譜圖像預(yù)測番茄葉片中元素含量的多目標(biāo)回歸方法
加入作者交流群
掃碼添加小編微信,拉您進入《植物表型組學(xué)》作者交流群,群內(nèi)不定期開展作者分享會、專刊發(fā)布會等高質(zhì)量活動。
添加小編微信,備注姓名+單位+PP,加入作者交流群
About Plant Phenomics
《植物表型組學(xué)》(Plant Phenomics)是由南京農(nóng)業(yè)大學(xué)和美國科學(xué)促進會(AAAS)合作創(chuàng)辦的英文學(xué)術(shù)期刊,于2019年1月正式上線發(fā)行。采用開放獲取形式,刊載植物表型組學(xué)交叉學(xué)科熱點領(lǐng)域具有突破性科研進展的原創(chuàng)性研究論文、綜述、數(shù)據(jù)集和觀點。具體范圍涵蓋高通量表型分析的最新技術(shù),基于圖像分析和機器學(xué)習(xí)的表型分析研究,提取表型信息的新算法,作物栽培、植物育種和農(nóng)業(yè)實踐中的表型組學(xué)新應(yīng)用,與植物表型相結(jié)合的分子生物學(xué)、植物生理學(xué)、統(tǒng)計學(xué)、作物模型和其他組學(xué)研究,表型組學(xué)相關(guān)的植物生物學(xué)等。期刊已被DOAJ、Scopus、PMC、EI和SCIE等數(shù)據(jù)庫收錄?祁Nò睯CR2022影響因子為6.5,位于農(nóng)藝學(xué)、植物科學(xué)、遙感一區(qū)。2023年中科院期刊分區(qū)位于農(nóng)林科學(xué)大類一區(qū)。2020年入選中國科技期刊卓越行動計劃高起點新刊項目。
說明:本文由《植物表型組學(xué)》編輯部負(fù)責(zé)組稿。
中文內(nèi)容僅供參考,一切內(nèi)容以英文原版為準(zhǔn)。
排版:李芯蕊(南京農(nóng)業(yè)大學(xué))
審核:孔敏、王平