近來天昊生物為多家合作單位介紹了SNP聯(lián)合expression數(shù)據(jù)進行表達數(shù)量性狀位點分析(eQTL),以及SNP聯(lián)合methylation數(shù)據(jù)進行甲基化數(shù)量性狀位點分析(meQTL),旨在從多組學(xué)數(shù)據(jù)分析和挖掘中尋找新的研究思路,同時可以將以往的SNP/GWAS數(shù)據(jù)重新利用起來。這樣的研究思路可以應(yīng)用在多種復(fù)雜疾病中,包括癌癥,從文獻檢索結(jié)果中看,類似思路的文章并不多,然而實現(xiàn)這樣的QTL分析文章檔次均很高。今天小編就為您介紹兩款數(shù)據(jù)庫:泛癌種中SNP如何影響基因表達和甲基化,進行QTL數(shù)據(jù)分析。
華中科技大學(xué)及德克薩斯大學(xué)休斯頓健康科學(xué)中心的團隊合作于2018年1月4日及9月7日在《Nucleic Acids Research》雜志上分別發(fā)表了PancanQTL和Pancan-meQTL兩款數(shù)據(jù)庫文章1,2。
PancanQTL和Pancan-meQTL兩款數(shù)據(jù)庫的數(shù)據(jù)均來源于The Cancer Genome Atlas (TCGA)數(shù)據(jù)庫,分別介紹了33種癌癥的eQTL數(shù)據(jù)以及23種癌癥的meQTL數(shù)據(jù),QTL數(shù)據(jù)又分為cis-QTL和trans-QTL,數(shù)據(jù)處理過程類似,包括基因型數(shù)據(jù)、表達數(shù)據(jù)及甲基化數(shù)據(jù)收集和處理;協(xié)變量分析;eQTL及meQTL識別;survival相關(guān)的eQTL/meQTL及GWAS相關(guān)的eQTL/meQTL分析等。
(一)
PancanQTL數(shù)據(jù)庫鏈接為http://bioinfo.life.hust.edu.cn/PancanQTL/,如下圖所示主要包含四類數(shù)據(jù):Cis-eQTLs, Trans-eQTLs, Survival-eQTLs及GWAS-eQTLs。
在進行eQTL識別分析中包含一系列SNP及表達數(shù)據(jù)過濾的過程,利用Cis-eQTLs和Trans-eQTLs,結(jié)合TCGA中臨床數(shù)據(jù)得到Survival-associated eQTLs,結(jié)合GWAS catalog數(shù)據(jù)得到GWAS-related eQTLs。
從網(wǎng)站鏈接中我們點擊Cis-eQTLs,Cancer type中選擇肺腺癌LUAD(N=514),可以輸入SNP ID或Gene symbol,比如這里輸入KRAS基因,點擊search,會顯示顯著性結(jié)果。這些結(jié)果提示4個SNP位點會顯著影響KRAS基因的表達水平,這樣的信息可能對相關(guān)的研究有一定的輔助作用,我們可以針對多個目的基因驗證其SNP和表達數(shù)據(jù),結(jié)合前期研究及其它數(shù)據(jù)找到新的線索。
比如我們點擊第一個Box Plot,發(fā)現(xiàn)該位點不同基因型下KRAS基因表達存在顯著差異,圖的信息可以下載PDF格式直接利用。
當(dāng)然也可以對Cis-eQTLs和Trans-eQTLs數(shù)據(jù)進行下載,或者按SNP, gene or region進行搜索。
(二)
Pancan-meQTL數(shù)據(jù)庫鏈接為http://bioinfo.life.hust.edu.cn/Pancan-meQTL/,與PancanQTL類似,數(shù)據(jù)主要包括Pancan-meQTLs, Cis-meQTLs, Trans-meQTLs, Survival-meQTLs及GWAS-meQTLs。
SNP和甲基化數(shù)據(jù)分析流程及使用的軟件如下。
點擊鏈接中pancan-meQTLs,例如在Gene symbol中輸入KRAS基因,同時勾選Cis-meQTL和Trans-meQTL提交能夠顯示KRAS基因在23個癌種中SNP-methylation的Cis-及Trans-數(shù)據(jù),這些結(jié)果可以直接下載。
其它的功能類似于PancanQTL數(shù)據(jù)庫,例如點擊Cis-meQTLs,Cancer type中選擇肺腺癌LUAD(N=448),可以輸入SNP ID、Methylation Probe或Gene symbol,比如這里輸入EGFR基因,點擊search,會顯示顯著性結(jié)果。
結(jié)果中我們能夠看到多個SNP位點及甲基化探針數(shù)據(jù),相關(guān)系數(shù)以及對應(yīng)p值,點擊第一個Box Plot,發(fā)現(xiàn)該SNP位點不同基因型對應(yīng)的甲基化位點其甲基化水平有顯著差異,同樣的位點基因的表達水平又如何呢,相應(yīng)的甲基化位點是否影響該基因的表達?這就需要進一步探索了。
天昊生物在SNP分型及數(shù)據(jù)分析上擁有無可比擬的優(yōu)勢,多項專利技術(shù)能夠滿足各種通量的SNP分型研究。同時擁有目的區(qū)域甲基化測序MethylTarget?專利技術(shù),因此完全滿足針對今天介紹的兩款數(shù)據(jù)庫中批量數(shù)據(jù)的驗證,滿足您在復(fù)雜疾病研究中有關(guān)eQTL/meQTL分析的科研需求,而類似研究思路的文章在某些疾病中確實罕見!
參考文獻
1. Gong J, Mei S, Liu C, et al. PancanQTL: systematic identification of cis-eQTLs and trans-eQTLs in 33 cancer types. Nucleic acids research 2018;46:D971-D6.
2. Gong J, Wan H, Mei S, et al. Pancan-meQTL: a database to systematically evaluate the effects of genetic variants on methylation in human cancer. Nucleic acids research 2018.