深度學(xué)習(xí)模型已經(jīng)成為現(xiàn)代基于計(jì)算機(jī)視覺(jué)的農(nóng)業(yè)任務(wù)的標(biāo)準(zhǔn)�,F(xiàn)在,通過(guò)深度學(xué)習(xí)實(shí)現(xiàn)自動(dòng)化的常見(jiàn)標(biāo)準(zhǔn)任務(wù)包括水果檢測(cè)、作物和雜草分割以及植物疾病分類和預(yù)測(cè)。深度學(xué)習(xí)模型通常情況下最初并非應(yīng)用于場(chǎng)景復(fù)雜的農(nóng)業(yè),因此數(shù)據(jù)集的模型權(quán)重會(huì)針對(duì)農(nóng)業(yè)任務(wù)進(jìn)行微調(diào)。缺乏針對(duì)農(nóng)業(yè)的微調(diào)可能會(huì)增加培訓(xùn)時(shí)間和資源使用,并降低模型性能,從而導(dǎo)致數(shù)據(jù)效率的總體下降。
2023年8月,Plant Phenomics在線發(fā)表了加州大學(xué)戴維斯分校等單位題為Standardizing and Centralizing Datasets for Efficient Training of Agricultural Deep Learning Models 的研究論文。
為了克服這一限制,我們將數(shù)據(jù)集限制為三個(gè)任務(wù):圖像分類,語(yǔ)義分割和目標(biāo)檢測(cè)。此外,我們專注于只有單個(gè)3通道RGB圖像輸入的數(shù)據(jù)集,以便于使用標(biāo)準(zhǔn)深度學(xué)習(xí)模型為各種數(shù)據(jù)集創(chuàng)建基準(zhǔn),而無(wú)需進(jìn)行任何架構(gòu)修改,從而可以更輕松地訪問(wèn)更廣泛的未來(lái)應(yīng)用。然后,我們使用深度學(xué)習(xí)任務(wù)中常用的方法進(jìn)行了許多實(shí)驗(yàn),但這些方法在農(nóng)業(yè)領(lǐng)域的特定應(yīng)用中尚未被探索。我們的實(shí)驗(yàn)指導(dǎo)我們開(kāi)發(fā)了許多改進(jìn)數(shù)據(jù)的方法訓(xùn)練農(nóng)業(yè)深度學(xué)習(xí)模型時(shí)的效率,無(wú)需對(duì)現(xiàn)有管道進(jìn)行大規(guī)模修改。
圖1 從本研究中使用的語(yǔ)義分割數(shù)據(jù)集的樣本圖像,分別為甜菜草、蘿卜草和蘋(píng)果花三種植物的圖像。包含帶有注釋分割掩碼的原始圖像。每個(gè)圖像來(lái)源的數(shù)據(jù)集在它上面進(jìn)行了注釋。這些圖像以其原始的高寬比顯示。
圖2 一個(gè)來(lái)自加州葡萄檢測(cè)的例子圖像與本研究中使用的每一個(gè)增強(qiáng)應(yīng)用于它。原始圖像沒(méi)有調(diào)整大小,而增強(qiáng)圖像大小調(diào)整了(為了實(shí)際的訓(xùn)練)
本研究所構(gòu)建的標(biāo)準(zhǔn)管道使深度學(xué)習(xí)模型能夠在本研究所采集和整理的數(shù)據(jù)集上獲得與現(xiàn)有基準(zhǔn)相當(dāng)?shù)男阅�,在某些情況下甚至超過(guò)它們。這些數(shù)據(jù)集以及達(dá)到這些基準(zhǔn)的預(yù)訓(xùn)練模型可以通過(guò)開(kāi)源框架AgML獲得,從而可以進(jìn)一步研究開(kāi)發(fā)更高效的數(shù)據(jù)和模型管道。下圖(圖3)總結(jié)了農(nóng)業(yè)預(yù)訓(xùn)練權(quán)重的實(shí)驗(yàn)結(jié)果,每個(gè)結(jié)果代表7個(gè)單類模型,完整代表一個(gè)7類模型。對(duì)于所有的7類模型,預(yù)訓(xùn)練的農(nóng)業(yè)模型顯著優(yōu)于COCO和NONE基線。
圖3比較來(lái)自全球水果檢測(cè)數(shù)據(jù)集的7個(gè)不同個(gè)體水果的[email protected]值,以及完整的數(shù)據(jù)集
本研究結(jié)果表明,即使是很小的訓(xùn)練修改,如使用農(nóng)業(yè)預(yù)訓(xùn)練模型權(quán)值,或在數(shù)據(jù)處理管道中采用特定的空間增強(qiáng),也可以顯著提高模型性能,縮短收斂時(shí)間,節(jié)省訓(xùn)練資源。此外,本研究發(fā)現(xiàn)即使是在低質(zhì)量注釋上訓(xùn)練的模型也能產(chǎn)生與高質(zhì)量注釋相當(dāng)?shù)男阅芩�,這表明具有低質(zhì)量注釋的數(shù)據(jù)集仍然可以用于訓(xùn)練,擴(kuò)大當(dāng)前可用數(shù)據(jù)集的池。本研究所提出的方法廣泛適用于整個(gè)農(nóng)業(yè)深度學(xué)習(xí),并呈現(xiàn)出顯著提高數(shù)據(jù)效率的巨大潛力。
本文的主要作者為Amogh Joshi博士和Dario Guevara博士,所屬單位加州大學(xué)戴維斯分校和下一代食品系統(tǒng)人工智能研究所。該項(xiàng)目部分得到了美國(guó)農(nóng)業(yè)部人工智能下一代食品系統(tǒng)研究所(AIFS)的支持,美國(guó)農(nóng)業(yè)部的獎(jiǎng)項(xiàng)編號(hào)為2020-67021-32855。該項(xiàng)目主要由加州大學(xué)戴維斯分校葡萄栽培與釀酒學(xué)系和加州大學(xué)生物與農(nóng)業(yè)工程學(xué)協(xié)完成,實(shí)驗(yàn)數(shù)據(jù)為AgML收集的公共數(shù)據(jù)。
論文鏈接:
https://doi.org/10.34133/plantphenomics.0084
——推薦閱讀——
Enhancing green fraction estimation in rice and wheat crops: a self-supervised deep learning semantic segmentation approach
https://doi.org/10.34133/plantphenomics.0064
Plant Phenomics | 虛擬圖像“以假亂真”,無(wú)需人工標(biāo)注,自監(jiān)督創(chuàng)建小麥表型算法
Analyzing Nitrogen Effects on Rice Panicle Development by Panicle Detection and Time-Series Tracking
https://doi.org/10.34133/plantphenomics.0048
Plant Phenomics | 南京農(nóng)業(yè)大學(xué)基于目標(biāo)檢測(cè)與追蹤算法在提取水稻抽穗開(kāi)花期表型上的應(yīng)用
加入作者交流群
掃碼添加小編微信,拉您進(jìn)入《植物表型組學(xué)》作者交流群,群內(nèi)不定期開(kāi)展作者分享會(huì)、專刊發(fā)布會(huì)等高質(zhì)量活動(dòng)。
添加小編微信,備注姓名+單位+PP,加入作者交流群
About Plant Phenomics
《植物表型組學(xué)》(Plant Phenomics)是由南京農(nóng)業(yè)大學(xué)和美國(guó)科學(xué)促進(jìn)會(huì)(AAAS)合作創(chuàng)辦的英文學(xué)術(shù)期刊,于2019年1月正式上線發(fā)行。采用開(kāi)放獲取形式,刊載植物表型組學(xué)交叉學(xué)科熱點(diǎn)領(lǐng)域具有突破性科研進(jìn)展的原創(chuàng)性研究論文、綜述、數(shù)據(jù)集和觀點(diǎn)。具體范圍涵蓋高通量表型分析的最新技術(shù),基于圖像分析和機(jī)器學(xué)習(xí)的表型分析研究,提取表型信息的新算法,作物栽培、植物育種和農(nóng)業(yè)實(shí)踐中的表型組學(xué)新應(yīng)用,與植物表型相結(jié)合的分子生物學(xué)、植物生理學(xué)、統(tǒng)計(jì)學(xué)、作物模型和其他組學(xué)研究,表型組學(xué)相關(guān)的植物生物學(xué)等。期刊已被DOAJ、Scopus、PMC、EI和SCIE等數(shù)據(jù)庫(kù)收錄�?祁Nò睯CR2022影響因子為6.5,位于農(nóng)藝學(xué)、植物科學(xué)、遙感一區(qū)。中科院農(nóng)藝學(xué)、植物科學(xué)一區(qū),遙感二區(qū),生物大類一區(qū)(TOP期刊)。2020年入選中國(guó)科技期刊卓越行動(dòng)計(jì)劃高起點(diǎn)新刊項(xiàng)目。
說(shuō)明:本文由《植物表型組學(xué)》編輯部負(fù)責(zé)組稿。
中文內(nèi)容僅供參考,一切內(nèi)容以英文原版為準(zhǔn)。
撰稿:吳庚宸(南京農(nóng)業(yè)大學(xué))
排版:張婕(上海交通大學(xué))
審核:孔敏、王平