Briefings in Bioinformatics-2021 知識圖譜-生物信息學-醫學頂刊論文:生物信息學中的圖表示學習:趨勢、方法和應用

4.(2021.6.24)Briefings-生物信息學中的圖表示學習:趨勢、方法和應用論文標題: Graph representation learning in bioinformatics: trends, methods and applications論文期刊: Briefings in Bioinformatics 2021論文地址: https://www.researchgate.net/profile/Haicheng-Yi/publication/354327323_Graph_representation_learning_in_bioinformatics_trends_methods_and_applications/links/625c158c709c5c2adb836141/Graph-representation-learning-in-bioinformatics-trends-methods-and-applications.pdf

  • 4.(2021.6.24)Briefings-生物信息學中的圖表示學習:趨勢、方法和應用
    • 摘要
    • 1.引言
    • 2.圖表示學習概述
      • 2.1 基本定義
        • 2.1.1 定義1:同構圖和異構圖
        • 2.1.2 定義2:屬性圖
        • 2.1.3 定義3:元路徑
        • 2.1.4 定義4:一階鄰近度
        • 2.1.5 定義5:高階鄰近度
        • 2.1.6 定義6:語義鄰近
      • 2.2 同構圖嵌入
        • 2.2.1 基于矩陣分解的方法
        • 2.2.2 基于隨機游走的方法
        • 2.2.3 基于傳統深度學習的方法
      • 2.3 異構圖嵌入
        • 2.3.1 基于元路徑的方法
        • 2.3.2 基于分解的方法
        • 2.3.3 基于傳統深度學習的方法
      • 2.4 屬性圖嵌入
      • 2.5 圖神經網絡(GNN)
        • 2.5.1 圖遞歸神經網絡(GRN)
        • 2.5.2 圖卷積神經網絡(GCN)
        • 2.5.3 圖自動編碼器(GAE)
        • 2.5.4 圖生成對抗性網絡(GGAN)
        • 2.5.5 開源
    • 3.在生物信息學中的應用
      • 3.1 分子圖的表示學習
        • 3.1.1 分子表示學習
        • 3.1.2 分子性質預測
        • 3.1.3 分子圖生成
      • 3.2 多組學中的圖表示學習
        • 3.2.1 基因組學圖分析
        • 3.2.2 蛋白質組圖分析
        • 3.2.3 轉錄組圖分析
      • 3.3 藥學中的圖表示學習
        • 3.3.1 藥物-靶點相互作用(DTI)預測
        • 3.3.2 藥物-藥物相互作用(DDI)預測
      • 3.4 醫療保健中的圖表示學習
    • 4.挑戰和機遇
      • 4.1 數據質量
      • 4.2 復雜的圖結構
      • 4.3 可解釋性和魯棒性
    • 結論
摘要圖是描述復雜系統的一種天然數據結構,它包含一系列對象和關系 。無處不在的現實生活中的生物醫學問題可以建模為圖分析任務 。機器學習,特別是深度學習,在大量的生物信息學場景中取得成功 , 數據以歐氏空間表示 。然而,非歐幾里德生物醫學圖中保留了豐富的生物元素之間的關系信息,這對經典的機器學習方法來說并不友好 。圖表示學習的目的是將圖嵌入到低維空間中,同時保持圖的拓撲和節點屬性 。它連接了生物醫學圖和現代機器學習方法,最近引起了機器學習和生物信息學領域的廣泛關注 。本文綜述了圖表示學習及其在生物信息學中的代表性應用 。為了提供全面和結構化的分析和視角,我們首先對圖嵌入方法(同構圖嵌入、異構圖嵌入、屬性圖嵌入)和圖神經網絡進行了分類和分析 。從分子水平到基因學、制藥和醫療保健系統水平,總結了它們的代表性應用 。此外,我們為實現這些圖表示學習方法總結了相關方法的開源平臺和庫 , 并討論了生物信息學中圖表示學習的挑戰和機遇 。這項工作對新興的圖表示學習算法及其在生物信息學中的應用做了一個全面的調查 。預計它將為研究人員提供有價值的見解,以協助他們為圖表示學習和面向未來的生物信息學研究做出貢獻 。
1.引言圖是一種自然的數據結構,它包含一組對象和對象之間的兩兩關系的集合,是描述和建?,F實生活中普遍存在的復雜系統的通用語言,如社交網絡、學術引文網絡和詞語同現網絡(不同單詞出現在同一句子中) 。從分子結構到醫療保健系統,生物醫學圖在生物醫學和生命科學領域無處不在,例如,基因調控網絡、蛋白質相互作用(PPI)網絡、人腦連接體和生物醫學知識圖譜 。圖正日益成為生物醫學系統建模、學習和推理的主要工具 。
分子生物學、生理學和組學(例如基因組學、蛋白質組學等)的快速發展促進了人們對生物分子、細胞、器官如何協同進行重要的生化或生理活動的理解 。將生物組件表示為節點 , 將節點之間的相互作用表示為邊 , 可以自然地將復雜的生物系統建模為圖 。這一簡潔的概念正逐漸被研究人員接受和推廣 。為解決生物問題而建模和分析生物圖的趨勢可以分為三個階段:雙邊生物圖、多關系生物圖和多模態生物醫學知識圖 。我們對它們作如下簡要介紹:
  1. 雙邊生物圖 。它包含兩種生物對象以及它們之間的聯系 。它已經應用于許多重要的生物學任務,例如基于PPI圖的蛋白質功能注釋,從DTI圖推斷藥物的新適應癥,"miRNA-疾病"關聯預測,"lncRNA-疾病"關聯預測和"CircRNA-疾病"關聯檢測;

    推薦閱讀