single_nucleotide_polymorphism_snp [生物資訊實驗室]
 

HI

SNP的定義

  單一核苷酸多型性(英文簡稱:SNP,念法:snip)所代表的意思是「DNA序列中的單一鹼基對(base pair)變異」,也就是DNA序列中A、T、C、G的改變,即基因組(genome)的一個特異和定位的位點出現兩個或多個的核苷酸可能性,會造成這樣的變異原因為基因發生刪除、插入或是取代反應。舉例,兩不同個體相對應的DNA區段分別是AAGCTA和AAGCTA其包含有一單一鹼基對變異(粗體字之兩等位基因(allele)位置之值C和T)。圖一為此例之完整示意圖。在目前已知的SNPs中,所佔比例最多的,亦即最常發生的單一鹼基對變異,就是以T(thymin)取代C(cytosine),約佔已知總數的三分之二。

<圖一> SNP示意圖


參照:
Wikipedia SNP
http://www.duerinck.com/snp.html
http://content.sp.npu.edu.tw/teacher/thchiu/962/%E5%9F%BA%E7%A4%8E%E7%94%9F% E7%89%A9%E6%8A%80%E8%A1%93%E7%AC%AC%E5%8D%81%E4%B8%80%E7%AB%A0.ppt

SNP與mutation(突變)之比較

  在過去,如SNP發生頻率佔對應的等位基因小於或等於1%,我們將這極少發生之等位基因產生變化之頻率稱之為mutation,意謂著SNP與mutation的差異為:

但依照現代生物資訊對演化較好的見解,此定義已不再需要。例如dbSNP【註1】之SNP亦包含小於等於1%的等位基因變異頻率在內。


【註1】dbSNP:Single Nucleotide Polymorphisms資料庫,是來自於National Center for Biotechnology Information (NCBI)。其用來收集單一核酸變異資料,所涵蓋的資料類型包含SNP、小規模插入/刪除、多型性重覆元素(Polymorphic repetitive elements)與衛星體變異。dbSNP的多型性資料是來自於實驗、計算與雜交(Hybrid),資料獲得(網址:NCBI)。


參照:
Wikipedia SNP
Russ page

SNP佔DNA序列差異性之比例

  於所有可能的DNA序列差異性(sequence differenciation)中,SNP是最普遍發生的一種遺傳變異。在人體中,SNP的發生機率大約是0.1%,也就是每1200至1500個鹼基對中,就可能有一個SNP。目前科學界已發現了約400萬個SNPs。平均而言,每1kb長的DNA中,就有一個SNP存在;換言之每個人的DNA序列中,每隔1kb單位長度,就至少會發生一個「單一鹼基變異」。由於SNP的發生頻率非常之高,故SNP常被當作一種基因標記(genetic marker),已用來進行研究。

  但必須注意的是,並非所有的SNP都有臨床意義。對疾病發生和藥物治療有重大影響的SNP,估計只佔數以百萬計SNP的很小一部分。即使產生了SNP,也不一定造成蛋白質氨基酸編碼改變或基因表達調控改變,或導致蛋白質結構或活性,而造成對於藥物的特殊影響。怎樣從數百萬SNP中,找到確有臨床意義的功能性SNP,是藥物遺傳學和個體化醫學所面臨的重大挑戰。


參照:
http://brc.se.fju.edu.tw/plans/homework/10.doc

SNP的型態

SNP標記分布如下:

  1. noncoding SNP:
    指SNP位點發生在非基因編碼的區域,包括無基因表現的區域、啟動子(promoter)以及非轉譯區域(untranslated region)…等等,其可用來操控基因的表達(gene expression)。
  2. coding SNP:
    定義則與noncoding SNP相反,SNP位置僅發生在基因序列中的編碼序列,或稱轉譯序列(translated region),其可改變蛋白質的結構和功能,使個人體質傾向於「易患上某種疾病」或改變個人「對某些藥物的反應」。存在在編碼區的SNP約有20萬個,簡稱為cSNP(coding SNP)。
  3. synonymous SNP:
    主要發生在coding SNP,代表著即使用SNP變異,轉譯出來的蛋白質依然不變,這邊可以遺傳密碼-CUUACUCGU-為例子,其序列所轉譯的多肽序列依序為Leucine-Threonine-Arginine,此時有另一條則是-CUCACUCGU-在第三個核苷酸有SNP,可是轉譯出的多肽序列仍為Leucine-Threonine-Arginine,這種SNP就稱為synonymous SNP。
  4. nonsynonymous SNP:
    就跟synonymous SNP定義相對,很簡單,就因為SNP變異,導致轉譯出的多肽序列有變異。


參照:
Wikipedia SNP
奇摩知識+ SNP

SNP的重要性

  從演化的觀點來看,SNP具有相當程度的穩定性,即使經過代代相傳,SNP所引起的改變卻不大,因此可用以研究族群演化。

  SNP決定著群體和個體基因序列的細微差別,科學家將可憑此找到疾病的易感基因,並使個體化醫療成為可能。先前的研究證實,人類的大部分疾病,如三分之二的腫瘤可以被預防;而通過基因易感性分析,我們便能夠確認特定疾病的好發性人群,以對該群人進行生活或飲食方式的干預、促進其健康。這些研究將會為全人類的疾病預防產生巨大貢獻。此外,通過對藥物代謝相關基因的SNP研究,還能夠闡明不同患者間藥物代謝及藥效差別的遺傳基礎,可根據不同患者的遺傳背景,來優化治療方案。


參照:
http://www.duerinck.com/snp.html
http://brc.se.fju.edu.tw/plans/homework/10.doc

SNP的應用

  1. 尋找致病基因:
    個體間的基因差異主要在於SNP,遺傳疾病中已發現SNP的例子,如鐮刀型血球性貧血、APOE ε4【註2】等位基因參與晚期突發老年性癡呆、V因子1691G→A等位基因(FV Leiden)參與深靜脈血栓形成、以及細胞色素P450(CYp)【註3】基因的幾種形態影響藥物代謝等,原因都出在SNP。但必須注意的是,並非所有的SNP都有臨床意義。對疾病發生和藥物治療有重大影響的SNP,估計只佔數以百萬計SNP的很小一部分。
  2. 診斷及預測致病風險:
    藉由對致病基因的瞭解與認識,可進行比對,更正確地診斷與預測潛在的或遺傳性疾病。
  3. 藥物基因體學及新藥的發現:
    臨床治療實踐清楚地表明,藥物的有效劑量有著極大的個體差異,可以視為一種基因的表型(phenotype)。藥物目標的基因變異,會改變藥物與目標蛋白間的相互作用;負責運輸藥物的蛋白其基因變異,會影響藥物的吸收、運送和排出;藥物代謝酶的基因變異,會改變藥物的代謝;DNA修復酶的基因變異,則可改變藥物的安全性。利用SNP與現有的基因診斷體系接軌,能加速檢驗醫學從表型診斷轉向基因型診斷,並預防藥物副作用,提高療效。此外,對於藥物效果也可有進一步的認識,甚至可以預測用藥結果,減少藥物誤用或濫用的情況。
  4. 生物晶片快速檢測:
    目前DNA微陣列或基因晶片要進行大量的SNP篩檢已可自動化,並可應用於親子鑑定及最有效、精確的身分識別(ID)。
  5. 研究族群演化:
    SNP具有相當程度的穩定性,即使經過代代相傳,SNP所引起的改變卻不大,可用來研究族群演化。


【註2】可參見http://www.beinu1972.org/ApoE.doc
【註3】可參見http://big5.51daifu.com/documents/2007/0305/29BBBFAC1822D761H118594.shtml


參照:
http://brc.se.fju.edu.tw/plans/homework/10.doc

如何檢測SNP

  SNPs的發現,主要還是要靠生物資訊學的方法。目前的資料庫裡有大量的SNPs,來源不外乎分為三種,其中最多的,約占57%是經由生物資訊方法EST(Expressed Sequence Tag,為大量一次解讀cDNA序列資料庫殖株,所得的cDNA序列資訊。)比對而來,另外少量來自基因體的定序計劃(只有約1%),剩下的42%是經由實驗產生,而後還是需要生物資訊方法來進行序列的比對才能得到。

  EST序列比對需要藉由各種生物資訊軟體來進行,例如PolyBayes就是一個好例子,PolyBayes是以人類染色體的基因體序列作為參考序列,再將資料庫中所有的EST序列做多序列間的比對,比對後便可知道出哪些EST是同一群,檢查出SNPs及不是SNPs而可能是定序上的錯誤。

  經由實驗的方法要如何找出SNPs呢?首先選定想要分析的特殊基因或是一段序列,設計適當的Primers,再以聚合酶連鎖反應(Polymerase Chain Reaction; PCR),增加核酸序列的數量,等數量夠大,就可以以電腦及軟體進行多序列的比對分析,就能找出可能的SNPs。

  建立了SNPs的資料庫以後,就可以利用其中的資料,和自己的樣品加以比對,來確認樣品中是否帶有這個SNP。這時就需要在樣品中作SNP的檢測,檢測的方法因應需要而發展得十分多樣,在各種檢測方法競爭日趨激烈之下,該如何選擇呢?一個好的檢測方法應具有下列幾個條件:

  1. 準確:
    新方法必須經的起舊有的「標準」方法加以驗證,而且準確率必須 >99%。
  2. 可靠:
    此技術必須不易失敗,以免重複進行實驗使花費上升,耽誤結果,浪費寶貴的樣品。
  3. 簡便:
    步驟簡單,操作時間短。這樣可以降低時間及金錢上的花費,並減低出錯的可能。
  4. 經濟:
    時間及金錢上的花費要少越好,例如試劑費,設備需求,使用費等,花費過高就無法測試大量的樣品。


  以下介紹的READIT™ SNP基因多型性系統即為一種基因多型性和SNP檢測的新技術,製造公司為Promega。

  READIT™ 測試可檢測PCR樣品的特異序列,確定特異序列存在時便產生信號。具有特定序列的片段,經由特異性雜交及兩個熱穩定酶的作用(READase™ 聚合酶和READase™ 激酶),產生擴增作用並產生ATP。再加入螢光素酶/螢光素試劑,即可產生儀器能檢測的螢光,再經由配備的READIT™ 計算軟體,可將螢光加以分析,並確認每個樣品的基因型,因此便可簡單地找出SNP基因多型性的存在。這個系統還可以對擴增的樣品作插入、缺失、移位及進行病原菌的檢測。底下圖二為分析儀器外觀,圖三表示出READIT™分析的兩步驟,圖四表示READIT™分析後結果,由於更細部的內容並不在此次課程的討論範圍,對READIT™分析有興趣者可參見【註4】READIT™ SNP基因分型系统技術手冊(TM053)之連結。

 <圖二> 分析儀器外觀

 <圖三> READIT™分析的兩步驟。READaseTM 聚合酶催化焦磷酸反應產生dNTPs(反應 1a); READIT™ 激酶作用於dNTP產生ATP(反應1b)。
        螢光素酶/螢光素反應(反應2)產生與第一步反應產生的ATP量成比例的光信號。

 <圖四> READIT™分析後結果



【註4】READIT™ SNP基因分型系统技術手冊:http://www.promega.com/tbs/tbs.htm 中的TM053

參照:
http://brc.se.fju.edu.tw/plans/homework/10.doc
Promoga 北京

SNP的進展

  由於SNP在醫藥上的重要性,美國國家衛生研究院(National Institute of Health; NIH)提供約三千萬美元的經費給序列定序中心,進行搜尋並定位人類的SNPs的計劃,定位一百萬個人類的SNPs。由各大藥廠等組成的單核苷酸多型性協會(The SNP Consortium; TSC)也出資尋找定位出約三十萬個人類的SNPs。私人公司如CeleraGenomics及InCyte Pharmaceutical也決定分別投入資金,目前至少已有3,895,421個人類SNPs被定位,定位的資料收錄於美國國家生物技術資訊中心(National Center for Biotechnology Information; NCBI)【註5】的單核苷酸多型性資料庫(dbSNP),減去重複登錄的資料不算,現有的人類SNPs總數約為2,421,261個,這數字還會繼續增加。

  至於其他物種的SNPs就不是那麼熱門,目前還不超過700筆。這是因為其他物種的基因體相關定序計劃(如基因體解序、EST解序、SNP尋找及定位),本來就比人類基因體相關的定序計劃少和慢,畢竟人類基因體相關的定序計劃對我們來說才是最重要最有用的。

  在台灣,以基因體研發為主軸的賽亞基因科技公司,已於2002年7月完成亞洲人種的SNP資料庫初稿,接下來的目標將針對肝炎、氣喘、乳癌、二型糖尿病等亞洲地區的多發性疾病,積極進行相關基因體研究,包括臨床基因體學、微衛星基因定型分析、SNP定型分析、高效能定序、基因微陣列及生物資訊多項中心等。


【註5】可參見NCBI


參照:
http://brc.se.fju.edu.tw/plans/homework/10.doc

SNP的展望

  SNP雖然列於基因體學的範疇內,但若能結合多重學科,將可發展個體化醫學,也就是針對個人基因特質的醫藥方式除了人類基因組的DNA序列資料以外,尚需藥物遺傳學、臨床藥理學、毒理學、生物信息學、蛋白質體學、生物資訊學等的參與。蛋白質體學的研究目標,是確定所有的機體內蛋白質及蛋白質間的相互關係,可望對個體化醫學的發展作出重大貢獻;而決定個體間蛋白差異的基因就在於SNP。

  簡單的說,個體化醫學的理想是:病人就醫時隨身帶著一張智能卡,上面除了姓名、性別、年齡、生活史等常規資料外,還有與藥物代謝以及與療效有關的各種基因型資料。據此,醫生可以預測各種藥物的效應,充分運用適當的藥物,達到更高的療效,並減少醫療資源浪費。

  但個體化醫學還有很長的路要走,除了SNP的研究外,必須配合上述多種學科的進展,相輔相成,以求早日達到個體化醫學的遠大目標。


參照:
http://brc.se.fju.edu.tw/plans/homework/10.doc

SNP資訊相關網站

以下介紹幾個重要的SNP資訊網站:

  TSC(The SNP Consortium Ltd.)是一個非營利性基金會,其組成目的是發展在人類基因體中超過300萬個以上的SNPs的資料、將數據收集成資料庫,並且不以智慧財產權法律為限制(without intellectual property restrictions)、公開地向大眾提供資訊。網站的主要功能如下:

 (1) Allele Frequency/Genotype Project:提供三個世界主要人類族群的6萬個SNPs frequency。
 (2) The SNP Consortium Linkage Map Project:提供human chromosome的TSC-linkage map查詢服務。
 (3) All TSC protocols:提供所有SNP實驗的相關protocols。
 (4) Search the TSC database:提供由internal TSC IDs來搜尋SNPs的服務。
 (5) News related to The SNP Consortium:持續提供SNP的相關研究訊息。其網站內亦提供Glossary,
     以及其他資料查詢,是個很豐富的網站。重點是,其一切資訊都是免費的。

  此網站是由NIH之下的NCBI所架設。在網站具有非常龐大的資料庫,提供許多不同項目的搜尋服務,且不侷限於人類SNP資訊,也提供其他生物的SNP資訊。值得一提的是,NCBI在網站中對SNP有簡單的介紹,可幫助了解SNP的意義及在各種生物方面的應用。是非常有用的資料庫網站。



其他的SNP資訊網站:

  可由SNP名稱或序列免費查詢相關資料,並附有人類23條染色體的chromosome marker map(但沒有Y染色體的)。

  日本人的SNP資料庫,有SNP的chromosome map(22+X、Y),並可利用BLAST作序列比對。


參照:
http://brc.se.fju.edu.tw/plans/homework/10.doc

 
single_nucleotide_polymorphism_snp.txt · 上一次變更: 2014/06/05 16:33 (external edit)
 
Recent changes RSS feed Creative Commons License Donate Powered by PHP Valid XHTML 1.0 Valid CSS Driven by DokuWiki