Briefings in Bioinformatics-2021 知識圖譜-生物信息學-醫學頂刊論文:生物信息學中的圖表示學習:趨勢、方法和應用( 二 )

  • 多關系生物學圖 。這是一個更復雜的多層異構網絡,用于描述多個生物元素之間的復雜協同作用 。新出現的研究證實,分子之間存在相互調節和競爭,即競爭內源RNA假說 。對于藥物發現和疾病治療,需要綜合研究藥物與靶點、藥物與疾病、藥物與基因、疾病與基因、藥物與藥物的相互作用 。這些復雜系統可以很好地形成異構多關系生物學圖,如用于"miRNA-疾病"關聯預測的"lncRNA-mRNA-miRNA"圖、"藥物-靶標-疾病"圖、"miRNA-基因-疾病"三邊圖、"化學-基因-疾病"圖和"miRNA-基因-lncRNA-疾病"圖;
  • 生物醫學知識圖 。知識圖在歷史上有很多名稱,如語義網絡、知識庫或本體 。它從大量分散的文檔和數據庫中的大量信息中挖掘“知識”,并以圖的形式將這些實體關系鏈接在一起 。每一段知識都表示為"主體-謂語-客體"三元組 。知識圖被認為是下一代人工智能的基礎設施 , 在生物信息學領域具有許多前沿應用,包括用于臨床決策支持的醫療保健知識圖、用于疾病治療的全局分子關聯圖和生物醫學知識圖(例如:PharmGKB、DrugBank、基因本體論(GO)、疾病本體論和KEGG) 。
  • 為了將快速積累的生物醫學大數據轉化為有價值的知識,機器學習,特別是深度學習,成功地應用于生物信息學的廣泛場景 , 如序列分析、結構預測、生物醫學圖像處理和診斷 。這些任務中的數據直接表示在歐幾里德空間中 , 例如序列(1-D)、生物醫學圖像(2-D)和結構(3-D) 。深度學習模型是為了處理這些常規的歐幾里得數據(例如文本、序列和拍攝的圖像)而設計的,以前的工作已經很好地回顧了這些數據 。然而,在非歐幾里得生物圖和典型的深度學習模型之間存在明顯的挑戰 。例如 , 圖中的節點具有多樣的連接、任意的鄰域大小、復雜的拓撲結構以及沒有固定的節點順序 。為了滿足這些需求,圖表示學習將豐富的有價值的生物圖和先進的機器學習技術結合起來,包括淺層圖嵌入方法和新興的圖神經網絡(GNN) 。圖表示學習的主要范例如圖1所示 。其中,圖嵌入的目的是學習節點、鏈接或子圖的低維表示,同時最大限度地保留適合于下游圖分析任務的現成機器學習方法的圖拓撲和固有屬性,例如節點分類、鏈接預測、社區檢測和可視化 。然而,GNN不僅可以通過一系列消息聚合和傳播來學習保留圖拓撲和節點屬性的嵌入 , 而且可以直接端到端地完成圖上的任務(如圖2所示) 。根據前人對圖嵌入技術的研究,圖嵌入方法可以分為同構圖嵌入、異構圖嵌入和屬性圖嵌入方法 。基于模型結構和訓練策略,GNN可以概括為圖遞歸網絡(GRN)、圖卷積網絡(GCN)、圖自動編碼器(GAE)和圖生成對抗網絡(GGAN) 。
    Briefings in Bioinformatics-2021 知識圖譜-生物信息學-醫學頂刊論文:生物信息學中的圖表示學習:趨勢、方法和應用

    文章插圖
    圖1:圖表示學習范例 。圖表示學習連接了非歐幾里得圖數據和現代機器學習技術 。在這里 , 我們總結了圖嵌入方法和圖神經網絡 。(a)類似網格的歐幾里得數據與非歐幾里得圖的對比(不利于學習) 。(b)圖嵌入方法通過將原始圖中的節點直接投影到低維表示空間來生成節點表示 。(c)圖神經網絡通過不同的消息聚合和傳播來學習圖表示 。(d)圖生成模型學習輸入樣本的分布以生成具有所需屬性的分子圖 。

    Briefings in Bioinformatics-2021 知識圖譜-生物信息學-醫學頂刊論文:生物信息學中的圖表示學習:趨勢、方法和應用

    文章插圖
    圖2:圖嵌入方法和圖神經網絡的比較 。圖嵌入方法生成節點表示,可以與機器學習模型結合來執行下游任務,而圖神經網絡融合圖拓撲和屬性來執行端到端圖任務 。
    在這項工作中,我們對圖表示學習及其在生物信息學中的輝煌應用進行了全面的回顧 。
    1. 我們首先對圖表示學習中的淺圖嵌入算法和新興的GNN進行了詳細的總結和討論 。
    2. 然后,介紹了圖表示學習在各生物信息學問題中的典型應用 。
    3. 此外,我們還討論了圖表示學習方法在生物信息學中的挑戰和機遇 。
    4. 最后,我們總結了用于圖計算和圖表示學習、以及文中所述的圖嵌入和GNN模型的開源平臺和庫 。
    這個工作對新興圖表示學習及其在生物信息學中的應用進行了全面的調查,旨在為研究人員在生物信息學研究中應用圖表示學習方法提供有用的引導 。
    2.圖表示學習概述在本節中,我們將簡要概述圖表示學習方法 。圖表示學習的目的是將圖中的節點編碼成低維的向量表示,從而最大限度地保持圖的拓撲結構和節點屬性信息 。首先描述了重定標圖和鄰近度的符號和定義 。然后概述了淺圖嵌入方法(包括同構圖嵌入、異構嵌入和屬性圖嵌入)和GNN的關鍵類型 。圖3總結了本節中回顧的不同方法之間的層次關系 。

    推薦閱讀