責任編輯:左彬彬 來源:農藥工業網 日期:2021-09-30
利用基因組數據來預測農業和醫學的結果對系統生物學來說既是一個希望也是一個挑戰。研究人員一直致力于確定如何最好地利用現有的大量基因組數據來預測生物體如何對營養、毒素和病原體暴露的變化作出反應,從而為作物改良、疾病預后、流行病學和公共衛生提供信息。然而,從基因組規模的信息中準確預測農業和醫學領域如此復雜的結果仍然是一個重大挑戰。
在《自然通訊》的研究中,紐約大學的研究人員和美國與臺灣的合作者利用機器學習(一種用于檢測數據模式的人工智能)解決了這一挑戰。
玉米生長在紐約大學基因組學和系統生物學中心屋頂的Rose Sohn Zegar溫室。圖片來源:紐約大學Coruzzi實驗室
“我們的研究表明,專注于跨物種表達模式進化保守的基因,可以提高我們學習和預測主要作物生長性能和動物疾病結果的‘重要基因’的能力,”紐約大學生物學系和基因組學和系統生物學中心的卡羅爾和米爾頓.皮特里教授,同時也是這篇論文的資深作者解釋道。
“我們的方法利用了物種內或跨物種的全基因組表達和相關表型的自然變異,”紐約大學基因組學和系統生物學中心和國立臺灣大學的鄭家義補充說,他是這項研究的主要作者。“我們表明,刪繁就簡基因組內基因的表達模式是守恒的輸入和跨物種是一個生物原則方法來減少基因數據的維數,這極大地提高了我們的機器學習模型的能力來確定哪些基因是重要的特征。”
作為概念的證明,研究人員證明了兩種不同植物(擬南芥,一種被廣泛用作植物生物學模式生物的小型開花植物;以及不同品種的玉米,美國種植最為廣泛的作物)之間對氮響應的基因在進化上是保守的,大大提高了機器學習模型預測對植物有效利用氮有重要意義的基因的能力。氮是植物的重要養分,是肥料的主要成分;能更有效地利用氮的作物生長得更好,需要的肥料更少,這對經濟和環境都有好處。
研究人員通過實驗驗證了8個主轉錄因子對氮利用效率的重要性。他們證明,改變擬南芥或玉米的基因表達可以促進植物在低氮土壤中的生長,他們在紐約大學的實驗室和伊利諾伊大學的玉米地中進行了測試。
伊利諾伊大學作物科學研究人員表示:“現在我們可以更準確地預測哪些玉米雜交種更善于在田間使用氮肥,我們可以迅速改進這一性狀。提高玉米和其他作物的氮素利用效率可以帶來三個主要好處:降低農民成本,減少環境污染,減少農業溫室氣體排放。”
此外,研究人員證明,通過預測植物的其他性狀,包括擬南芥和玉米的生物量和產量,這種基于進化的機器學習方法可以應用于其他性狀和物種。他們還表明,通過研究小鼠模型,這種方法可以預測另一種主要作物水稻的抗旱性的重要基因,以及動物的疾病結果。
Coruzzi指出:“因為我們展示了我們的進化信息管道也可以應用于動物,這突出了它的潛力,揭示了生物學、農業或醫學中任何感興趣的生理或臨床特征的重要基因。”
許多重要的農學或臨床特征在遺傳上一般非常復雜,因此很難確定它們的控制和遺傳。其研究證明了大數據和系統層面的思考可以讓這些困難挑戰變得容易應對。