基因序列是什么


基因序列是什么

文章插圖
基因序列就是使用一串字母表示的真實的或者假設的攜帶基因信息的DNA分子的一級結構 。
基因序列中的字母只有四種,即A、C、G、T,分別代表組成DNA的四種核苷酸——腺嘌呤,胞嘧啶,鳥嘌呤,胸腺嘧啶,任意長度大于4的一串核苷酸被稱做一個序列,每個字母代表一種堿基,兩個堿基形成一個堿基對,堿基對的配對規律是固定的,即A-T,C-G 。
生物信息學的研究重點主要體現在基因組學和蛋白質學兩方面,具體地說就是從核酸和蛋白質序列出發, 分析序列中表達結構和功能的生物信息。生物信息學的基本任務是對各種生物分析序列進行分析, 也就是研究新的計算機方法, 從大量的序列信息中獲取基因結構、功能和進化等知識 。而在序列分析中, 將未知序列同已知序列進行相似性比較是一種強有力的研究手段,從序列的片段測定, 拼接, 基因的表達分析, 到RNA和蛋白質的結構功能預測 。物種親緣樹的構建都需要進行生物分子序列的相似性比較 。生物信息學中的序列比對算法的研究具有非常重要的理論意義和實踐意義 。
【基因序列是什么】基因組中由寡核苷酸串聯,重復排列的DNA序列,構成數量可變的串聯重復序列,其中,微衛星DNA又稱為短串聯重復片列,是一種可遺傳的不穩定的且具有高度多態性的短核苷酸重復序列,具有種類多,分布廣,高度多態性等特點,這種多態性標志已廣泛用于遺傳病及親子鑒定等.
短序列比對中,一般常用的算法主要有三個:
(1) 空位種子片段索引法,首先將讀段切分,并選取其中一段或幾段作為種子建立搜索索引,再通過查找索引、延展匹配來實現讀段定位,通過輪換種子考慮允許出現錯配)的各種可能的位置組合;
無論在發育期還是在成人體內,既有大量的新細胞產生,也有大量的舊細胞死亡,這是生物體的一種自然現象 。為了維持機體組織中適宜的細胞數量,在細胞分裂和細胞死亡之間需要一種精確的動態平衡 。由于這種生成與死亡的有序流程,在胚胎和成人期便維持著人體組織的適宜細胞數量 。而這種精密地控制細胞的消亡過程就稱為程序性細胞死亡 。正常的生命需要細胞分裂以產生新細胞,并且也要有細胞的死亡,由此人體和生物的器官才得以維持平衡 。

    推薦閱讀