數(shù)據(jù)庫(kù)背景信息
由于越來(lái)越多的測(cè)序研究不斷擴(kuò)充癌癥基因的相關(guān)數(shù)據(jù),研究者急需一個(gè)能時(shí)時(shí)更新的癌癥基因綜合信息數(shù)據(jù)庫(kù)。因此,研究者在2010年開(kāi)始建立The Network of Cancer Genes (NCG)數(shù)據(jù)庫(kù),旨在從大量癌癥測(cè)序數(shù)據(jù)中收集匯總癌癥基因并給予詳細(xì)注釋。
NCG基于專家對(duì)癌癥測(cè)序篩查研究的分析總結(jié),提取出原始文獻(xiàn)中癌癥基因,并且收集分析該基因各方面的特征性質(zhì)信息(簡(jiǎn)單來(lái)說(shuō),這是一個(gè)基于測(cè)序研究手動(dòng)整理的癌癥候選基因百科全書(shū))。目前最新版NCG,共包括了2372個(gè)癌癥基因。基于275篇已發(fā)表文章,這些基因的體細(xì)胞改變具有已知或預(yù)測(cè)具有癌癥驅(qū)動(dòng)作用。NCG同時(shí)注釋了癌癥基因的特性,例如多倍性,進(jìn)化起源,RNA和蛋白表達(dá),miRNA和蛋白互做,以及蛋白功能和其它一些基本特性。NCG目前已更新到第六版,與舊版相比,新版囊括的內(nèi)容增加了1.5倍,可在以下地址訪問(wèn)http://ncg.kcl.ac.uk/。
圖:2372個(gè)癌癥候選基因來(lái)源(2個(gè)癌癥數(shù)據(jù)庫(kù)+273篇癌癥測(cè)序文章)。
數(shù)據(jù)庫(kù)使用體驗(yàn)
基本信息模塊(各種NCBI序列編號(hào)與鏈接“一網(wǎng)打盡”)
癌癥基因信息模塊
1 Cancer information:提示BRCA1為腫瘤驅(qū)動(dòng)基因的文獻(xiàn)列表(包括技術(shù)平臺(tái),分析平臺(tái),癌種等信息)
2 Duplicability(倍性):體現(xiàn)BRCA1基因編碼蛋白序列在基因組的比對(duì)情況
3 Orthology BRCA1基因的直系同源情況
4Network Properties:BRCA1蛋白互做情況
5Gene Expression in Normal Tissues:包括2個(gè)基因表達(dá)數(shù)據(jù)(GTEx和Protein Atlas)和1個(gè)蛋白表達(dá)數(shù)據(jù)(Protein Atlas)
6 Gene Expression in Cancer Cell Lines:列舉了三個(gè)數(shù)據(jù)庫(kù)中腫瘤細(xì)胞系中該基因表達(dá)情況(Cancer Cell Lines Encyclopedia (CCLE);Cosmic Cancer Cell Lines Project (CLP);Genentech dataset (GNE))
7 Essentiality:BRCA1基因?qū)τ诩?xì)胞系存活的必須性(來(lái)源于OGEE和PICKLES 數(shù)據(jù)庫(kù))
8 Protein Function:蛋白參與的通路信息(來(lái)源于KEGG,Reactome,BioCarta三個(gè)數(shù)據(jù)庫(kù))
9 miRNA-gene interactions:互做miRNA信息
結(jié)語(yǔ):如果準(zhǔn)備開(kāi)展一個(gè)腫瘤基因的功能研究,先來(lái)NCG數(shù)據(jù)逛一逛,一定可以少走很多彎路哦~