Briefings in Bioinformatics-2021 知識圖譜-生物信息學-醫學頂刊論文:生物信息學中的圖表示學習:趨勢、方法和應用( 六 )


2.5.4 圖生成對抗性網絡(GGAN)生成對抗性網絡(GAN)也能夠擴展到圖域 。GAN背后的主要理念是對抗性訓練 。生成器的目的是生成負類樣本以欺騙鑒別器,而鑒別器的設計目的是識破負類樣本,正確區分真實樣本和生成的負類樣本 。最終,這兩種模式都將從這場零和博弈的聯合訓練中受益 。對數正則化圖自動編碼器采用對抗性訓練原理對基于GCN的GAE進行正則化,以學習穩健的節點嵌入 。具有對抗性正則化自動編碼器的網絡表示(Netra)提出了一個用于學習網絡表示的編解碼器框架,而Netra的輸入是以每個節點為根的隨機游動,并且通過對抗性訓練在先驗分布內將學習到的嵌入正則化 。GraphGAN通過使用GAN增強了節點圖嵌入的推理能力 。通過采用對抗性訓練策略,對抗性網絡嵌入通過將先驗分布作為真實數據并將嵌入向量作為生成的負類樣本來增強現有的圖嵌入方法,其中GAN被用作附加的正則化項 。同時 , 一些研究也證明了對抗性訓練也可以提高GNN的泛化能力 。為了解決分子圖的生成問題,分子GAN結合了GCN、GAN和強化學習方案來生成具有所需性質的分子圖 。NetGan將圖生成任務視為學習有偏隨機游走的分布,生成器使用LSTM網絡產生可能的隨機游動,鑒別器試圖確定虛假的隨機游動 。
此外,最近一些GNN模型的預訓練和加速的研究也值得注意 , 例如 。GPT-GNN , Graph-BERT,RevGNN-Deep(具有大于1000層的最深GNN)和Graph-MLP,一種新的無需消息傳遞的圖學習框架 。
2.5.5 開源為了方便研究人員實現和開發圖表示學習算法,我們首先在表1中提供了圖表示學習和圖計算平臺和庫 。這些平臺和庫幫助研究人員快速對圖表示學習算法進行基準測試并開發自己的模型 。我們還總結了圖嵌入的實現和表2中回顧的GNN,其中大部分是官方實現 。

Briefings in Bioinformatics-2021 知識圖譜-生物信息學-醫學頂刊論文:生物信息學中的圖表示學習:趨勢、方法和應用

文章插圖
表1:圖計算和圖表示學習的平臺和庫 。

Briefings in Bioinformatics-2021 知識圖譜-生物信息學-醫學頂刊論文:生物信息學中的圖表示學習:趨勢、方法和應用

文章插圖

Briefings in Bioinformatics-2021 知識圖譜-生物信息學-醫學頂刊論文:生物信息學中的圖表示學習:趨勢、方法和應用

文章插圖
表2:圖表示學習算法的開源實現總結 。
3.在生物信息學中的應用從分子水平到醫療水平,圖被廣泛應用于表示和建模多通道的生物和醫療系統 。圖4顯示了不同尺度的生物醫學圖 。盡管一些開創性的工作已經將圖表示學習技術應用于生物醫學任務,如分子生成、藥物再利用、相互作用預測,但圖表示學習在生物醫學任務中的應用還沒有得到深入的探索 。在這一部分中 , 我們介紹了圖表示學習在分子圖分析、多組學圖分析、醫藥保健圖分析中的一系列代表性應用 。
Briefings in Bioinformatics-2021 知識圖譜-生物信息學-醫學頂刊論文:生物信息學中的圖表示學習:趨勢、方法和應用

文章插圖
圖4:不同尺度的生物醫學圖表概覽 。從分子到醫療保健系統,圖在生物醫學領域無處不在,具有多種類型的類內和類間關系 。蛋白質和藥物化合物的結構和功能可以看作是分子圖 。蛋白質和非編碼轉錄物(包括 miRNA、lncRNA、circRNA等)之間的綜合關聯對多組學圖進行了建模 。藥物、蛋白質靶點、ncRNA、微生物、疾病適應癥及其相互作用構成了藥物圖 。并且電子病歷、個性化組學和其他數據可以進一步集成到醫療保健系統級的知識圖譜中 。這些相互關聯的多模態圖可以基于整體的視角進行系統的整合和充分理解 。
3.1 分子圖的表示學習蛋白質和化合物等分子的結構可以看作是由原子和鍵組成的分子圖 。節點是原子或氨基酸,邊是化學鍵或肽鍵 。分子圖的表示學習的目標是高效、自動地生成具有優化性質的新型分子 。
3.1.1 分子表示學習學習分子的高效表示在蛋白質功能預測、分子性質預測和藥物發現等下游任務中起著基礎性的作用 。除了基于字符串的表示,圖表示學習還提供了更靈活、更好的分子表示,這些分子對于特殊任務來說是最佳的 。例如,Duvenaud等人提出了一個端到端的框架,通過使用GNN來學習可區分的分子指紋 ?;趲缀紊疃葘W習,Gainza等人提出了分子表面相互作用指紋圖譜,在蛋白質參與相似相互作用可能共享共同指紋的假設下,捕捉針對特定生物分子相互作用而優化的指紋 。最近 , Li等人利用自適應GCN學習分子表示,同時考慮了三維分子結構的拓撲不變性和旋轉不變性 。
3.1.2 分子性質預測分子性質的準確預測對化合物設計和藥物開發至關重要 。Gilmer等人提出了一個統一的框架消息傳遞神經網絡(MPNN),并在分子性質預測基準上展示了優越的性能 。為了保留分子的空間聯系信息,Wang等人利用分子圖數據引入了卷積空間圖嵌入層(C-SGEL)來研究分子的性質 。多層C-SGEL被集成為卷積空間圖嵌入模型,并融合分子指紋來預測分子性質 。Wieder等人對具有不同結構的GNN進行了一項關于預測分子性質的綜述 。

推薦閱讀