Briefings in Bioinformatics-2021 知識圖譜-生物信息學-醫學頂刊論文:生物信息學中的圖表示學習:趨勢、方法和應用( 七 )


3.1.3 分子圖生成設計或生成具有所需性質的分子是藥物發現和開發中的一個具有挑戰性的問題 ?,F有的圖生成模型的目標是直接對聯合分布進行建模 。Jin等人提出了一種基于VAES的方法來生成連接樹結構的化學子結構,然后使用圖消息傳遞網絡將它們組合成圖 。Shih等生成分子圖的自回歸模型 。他們將圖的生成描述為一個連續的決策過程 , 在每一步中生成一個新原子,然后確定生成的原子與現有原子之間的鍵 。Zang等人提出了一個基于可逆流的分子圖生成模型,在分子圖生成和重構、性質優化等方面取得了最好的性能 。最近,Mahmod等人提出了一個分子圖生成模型,該模型使用簡單的MPNN-GNN學習掩蔽圖分量的條件分布,給定圖的其余部分 。
3.2 多組學中的圖表示學習

多組學(Multi-omics)研究是探究生物系統中多種物質之間相互作用的方法 。
多組學數據的綜合分析已成為生命機制研究的新方向 。圖表示學習是加速關系多組學數據分析的有價值的工具,包括基因組學、蛋白質組學和轉錄組學 。
3.2.1 基因組學圖分析Li等人提出了一種基于LINE的單細胞表示學習方法,通過從基因表達數據和路徑先驗中考慮基因與基因的關聯來學習對單細胞高通量RNA測序(scRNA-Seq)數據有意義的表示 。Li等人將各種基因組和表型圖合并到一個異構多重圖中,并開發了一種基于隨機游走的疾病基因識別方法 。GCN-MF結合了GCN和矩陣因式分解來發現基因與疾病的關聯 。通過使用基因表達矩陣的一個子集,Yang等人提出了一個統一的圖變分生成對抗性網絡模型(CONDGEN) , 該模型集成了GCN、VAE和GAN生成圖的框架 。Rhee等人將基因表達數據組合成PPI圖,并將其作為GCN的輸入,定義了一個關系網絡,以圖卷積層加權的邊為優先,表示關聯的基因集 。
3.2.2 蛋白質組圖分析蛋白質是生命活動的直接載體,蛋白質組學在闡明生命活動和復雜疾病的分子機制方面發揮著重要作用 。
You等人利用基于IsoMap的嵌入方法對PPI網絡中的蛋白質節點進行編碼 。他們在嵌入空間中測量蛋白質之間的相似性以預測PPI 。屬性網絡嵌入方法Graph2Go融合了蛋白質的屬性特征和圖嵌入,采用VGAE和GCN進行蛋白質功能推斷和GO 。姚等人通過去除用于蛋白質復合體檢測的可靠性低的PPI來堆疊GCN,以便構建更可靠的PPI網絡 。
3.2.3 轉錄組圖分析生物體的轉錄組含有大量的非編碼RNA,包括miRNA、lncRNA、CircRNA等,它們在基因表達、細胞發育和各種生命活動中發揮著重要作用,與復雜的人類疾病密切相關 。
MMGCN開發了一種基于多視角、多通道注意力的GCN來預測miRNA與疾病的關聯 。Sheng等人構建了一個三層異構圖 , 以整合miRNA、lncRNA和疾病之間的相似性和關聯性 。他們還提出了結合隨機游走、卷積自動編碼器和VAE的異構屬性嵌入方法VADLP,利用注意力機制學習節點特征來預測lncRNA與疾病的關聯 。Wang等人提出了一種基于FastGCN的方法GCNCDA , 通過合并疾病語義相似性信息和CircRNA的GIP來預測CircRNA與疾病的關聯 。在我們以前的工作中,我們提出了一個分子關聯網絡,系統地集成了miRNA、lncRNA、CircRNA、mRNA、蛋白質、微生物、藥物和疾病之間的全面關聯,并提出了基于SDNE和node2vec的學習節點嵌入的方法 。融合節點嵌入和節點屬性來預測分子間關系 , 如lncRNA-蛋白質相互作用和miRNA-疾病關聯 。
3.3 藥學中的圖表示學習現代制藥投資大、周期長、失敗風險高 。圖表示學習通過集成化合物化學信息、靶點相互作用和臨床數據(如副作用和藥物組合信息) , 可以加速藥物發現和藥物重新定位 。
3.3.1 藥物-靶點相互作用(DTI)預測Zong等人應用藥物-靶點-疾病三邊圖的Deepwalk來預測藥物-靶點相互作用(DTI) 。趙等人融合了DTI和藥物-蛋白質對之間的聯系,并提出了一種基于GCN的方法來編碼藥物-蛋白質對的特征來推斷DTI 。基于異構圖表示學習,Peng等人提出了一種基于GCN的端到端學習方法來預測DTI 。他們考慮了藥物、蛋白質、疾病和副作用之間的聯系 。塔法爾等人使用node2vec學習藥物和靶標的表示,并計算藥物-藥物、藥物-靶標和靶標-靶標之間的相似性 。阮等人介紹了將藥物編碼為圖的GraphDTA , 并應用GNN預測藥物與靶標的結合親和力 。藥物-疾病關聯預測能準確預測出藥物合疾病之間的關聯,可以發現現有藥物的新適應癥或推廣新藥治療疾病,即所謂的藥物重定位 。Zhang等人提出了一種基于相似性約束圖因式分解的方法,利用已知的藥物-疾病關聯、藥物特征和疾病語義信息來預測藥物-疾病關聯 。通過使用Deepwalk、LINE、SDNE和HOPE等圖嵌入方法,郭等人將醫學主題詞表示為藥物-疾病圖 , 以學習藥物和疾病的嵌入 。Yu等人構建了一個由已知的藥物-疾病關聯、藥物-藥物相似性和疾病-疾病相似性組成的異構圖,并提出了分層注意力GCN來學習藥物和疾病的嵌入,以預測藥物-疾病關聯 。

推薦閱讀