最近又有很多在線數(shù)據(jù)庫進行了發(fā)布和更新,及時了解并巧妙運用這些免費的網(wǎng)上資源,會讓我們的研究事半功倍。今天小編就跟大家總結(jié)一下Nucleic Acids Research 10月以來最新發(fā)布和更新的一些數(shù)據(jù)庫信息。
DNA相關(guān):
1、CAGm:千人基因組計劃中germline微衛(wèi)星變異的數(shù)據(jù)庫
CAGm: a repository of germline microsatellite variations in the 1000 genomes project
網(wǎng)址:http://www.cagmdb.org/
Published:18 October 2018
人類基因組含有大量微衛(wèi)星(一類短串聯(lián)重復(fù)),被認(rèn)為是遺傳變異的重要來源,其長度變異會影響基因表達等。但是,微衛(wèi)星變異往往受到測序深度和樣本量限制。本網(wǎng)站提供了千人基因組項目中2529個人germline微衛(wèi)星的比較分析(CAGm)。CAGm的一個關(guān)鍵創(chuàng)新之處是能夠按群體、種族(超級群體)和性別匯總微衛(wèi)星變異。該數(shù)據(jù)庫提供了對嵌入基因和功能元件中的微衛(wèi)星的高級搜索。所有數(shù)據(jù)都可以作為Microsoft Excel電子表格下載,并且是免費的。
2、了解KEGG基因組變異的新方法
New approach for understanding genome variations in KEGG
網(wǎng)址:https://www.kegg.jp/和https://www.genome.jp/kegg/
Published:13 October 2018
KEGG(京都基因和基因組百科全書)是常用的分析生物基因組序列和其他高通量數(shù)據(jù)的參考知識庫。它是一個綜合性數(shù)據(jù)庫,由基因組信息、化學(xué)信息,以及人類特有的健康信息這三類遺傳系統(tǒng)信息組成。KEGG路徑圖、BRITE層次結(jié)構(gòu)和KEGG模塊已經(jīng)被開發(fā)為具有功能性正交節(jié)點的通用分子網(wǎng)絡(luò)圖。但是這種通用方法不能很好代表健康信息類別,未考慮人類基因組的變異,特別是與疾病相關(guān)的變異。因此,在最近發(fā)布的KEGG網(wǎng)絡(luò)數(shù)據(jù)庫中引入了一種新的方法,人類基因變異被明確地整合到稱之為“網(wǎng)絡(luò)變體”之中。這使得人們能夠積累有關(guān)疾病相關(guān)擾動分子網(wǎng)絡(luò)的知識,這些擾動分子網(wǎng)絡(luò)不僅是由基因變異引起的,也可能由病毒和其他病原體、環(huán)境因素和藥物引起的。這將使KEGG數(shù)據(jù)庫將成為另一個參考知識庫,用于疾病機制以及臨床測序和藥物開發(fā)中得到實際應(yīng)用。
3、CellMarker: 人類和老鼠細(xì)胞標(biāo)記的人工收集資源
CellMarker: a manually curated resource of cell markers in human and mouse
網(wǎng)址:http://biocc.hrbmu.edu.cn/CellMarker/和http://bio-bigdata.hrbmu.edu.cn/CellMarker/
Published:5 October 2018
生物學(xué)中最基本的問題之一是什么類型的細(xì)胞以功能協(xié)調(diào)的方式形成不同的組織和器官。更大規(guī)模的單細(xì)胞測序和生物學(xué)實驗研究正在開辟解決這一問題的新途徑,揭示了用于區(qū)分組織中不同細(xì)胞類型的大量細(xì)胞標(biāo)記。CellMarker即為細(xì)胞標(biāo)記數(shù)據(jù)庫,旨在為人類和小鼠組織中各種細(xì)胞類型提供全面、準(zhǔn)確的細(xì)胞標(biāo)記資源。通過手動整理超過10萬篇已發(fā)表的論文,記錄了4124條條目,包括細(xì)胞標(biāo)記信息、組織類型、細(xì)胞類型、癌癥信息和來源。最后,收集了158個人組織/亞組織中467種細(xì)胞類型的13605個細(xì)胞標(biāo)記,以及81個小鼠組織/亞組織中389種細(xì)胞類型的9148個細(xì)胞標(biāo)記。CellMarker提供了一個用戶友好的界面,用于瀏覽、搜索和下載不同組織的不同細(xì)胞類型的標(biāo)記。CellMarker是細(xì)胞研究的一個全面和有價值的資源,可以精確識別和表征細(xì)胞,特別是在單細(xì)胞水平。
4、CancerSEA:癌癥單細(xì)胞狀態(tài)圖譜
CancerSEA: a cancer single-cell state atlas
網(wǎng)址:http://biocc.hrbmu.edu.cn/CancerSEA/或http://202.97.205.69/CancerSEA/
Published:18 October 2018
癌細(xì)胞的高度功能異質(zhì)性是癌癥研究的一大挑戰(zhàn)。單細(xì)胞測序技術(shù)提供了一個前所未有的機會,以單細(xì)胞分辨率破譯癌細(xì)胞的不同功能狀態(tài),癌癥scRNA-seq數(shù)據(jù)集已經(jīng)大量積累。這就迫切需要建立一種專用資源來解碼癌細(xì)胞的功能狀態(tài)。CancerSEA是第一個專門的數(shù)據(jù)庫,旨在全面探索單細(xì)胞水平上癌細(xì)胞的不同功能狀態(tài)。CancerSEA描繪了癌癥單細(xì)胞功能狀態(tài)圖譜,涉及來自25種癌癥類型的41900個癌癥單細(xì)胞的14種功能狀態(tài)(包括干細(xì)胞、侵襲、轉(zhuǎn)移、增殖、EMT、血管生成、凋亡、細(xì)胞周期、分化、DNA損傷、DNA修復(fù)、缺氧、炎癥和終止)。它允許查詢哪些功能狀態(tài)與不同癌癥中感興趣的基因(或基因列表)相關(guān)聯(lián)。CancerSEA還提供了所有癌癥、特定癌癥和單個癌癥單細(xì)胞數(shù)據(jù)集中與功能狀態(tài)相關(guān)的PCG/lncRNA庫。CancerSEA提供了一個用戶友好的界面,用于全面搜索、瀏覽、可視化和下載成千上萬個癌細(xì)胞的功能狀態(tài)和相應(yīng)的PCGs / lncRNAs表達信息。
5、CancerSplicingQTL: 人類全基因組鑒定癌癥剪接QTLs數(shù)據(jù)庫
CancerSplicingQTL: a database for genome-wide identification of splicing QTLs in human cancer
網(wǎng)址:http://www.cancersplicingqtl-hust.com/
Published:18 October 2018
在癌癥的發(fā)生、發(fā)展、預(yù)后和治療中經(jīng)常觀察到異常選擇性剪接(AS)模式。AS可能會受到基因變異的調(diào)節(jié)。剪接數(shù)量性狀基因座(sQTLs)是一種影響該事件的遺傳變異,它的鑒定可能是全面理解遺傳變異體在疾病發(fā)展中的貢獻的重要一步。利用來自癌癥基因組圖譜的基因型數(shù)據(jù)和TCGASpliceSeq計算的相應(yīng)AS值,研究者開發(fā)了一個計算管道,從33種癌癥類型的9026個腫瘤樣本中識別sQTLs,鑒定出所有癌癥類型的4599598 sQTLs。通過生存分析,確定了17072個與患者總生存時間相關(guān)的sQTLs。此外,使用全基因組關(guān)聯(lián)研究( GWAS )目錄數(shù)據(jù),發(fā)現(xiàn)了1180132個sQTLs與已知GWAS連鎖不平衡區(qū)域重疊。最終根據(jù)上述數(shù)據(jù)構(gòu)建了一個用戶友好的數(shù)據(jù)庫CancerSplicingQTL供用戶方便地瀏覽、搜索和下載感興趣的數(shù)據(jù)。這個數(shù)據(jù)庫提供了一個信息豐富的sQTL資源,用于進一步描述控制人類癌癥轉(zhuǎn)錄異構(gòu)體的SNPs的潛在功能作用。
RNA相關(guān):
6、LncRNADisease 2.0:長鏈非編碼RNA相關(guān)疾病更新數(shù)據(jù)庫
LncRNADisease 2.0: an updated database of long non-coding RNA-associated diseases
網(wǎng)址:http://www.rnanut.net/lncrnadisease/
Published:4 October 2018
越來越多的證據(jù)表明,長鏈非編碼RNAs (lncRNAs)功能障礙與多種疾病有關(guān)。一個系統(tǒng)收集和治療lncRNA疾病關(guān)聯(lián)的知識庫對于進一步研究潛在分子機制至關(guān)重要。2013年, LncRNADisease第一版發(fā)布,代表了收集實驗支持的lncRNA疾病關(guān)聯(lián)的數(shù)據(jù)庫。這次研究者對該數(shù)據(jù)庫進行了更新。LncRNADisease 2.0新功能包括: (i)與此前版本相比,lncRNA疾病關(guān)聯(lián)提高了40倍以上;(ii)提供lncRNA、mRNA和miRNA之間的轉(zhuǎn)錄調(diào)節(jié)關(guān)系;(iii)為每個疾病關(guān)聯(lián)lncRNA提供一個置信度得分;(iv)整合實驗支持的circRNA疾病關(guān)聯(lián)。LncRNADisease 2.0記錄了20多萬個疾病關(guān)聯(lián)lncRNA。這個數(shù)據(jù)庫將繼續(xù)作為與lncRNAs相關(guān)的潛在臨床應(yīng)用的寶貴來源。
7、RPFdb v2.0:核糖體印跡產(chǎn)生翻譯mRNA的全基因組信息更新數(shù)據(jù)庫
RPFdb v2.0: an updated database for genome-wide information of translated mRNA generated from ribosome profiling
網(wǎng)址:http://www.rpfdb.org或http://sysbio.sysu.edu.cn/rpfdb
Published:18 October 2018
RPFdb是一個用于托管、分析和可視化核糖體印跡測序(ribo-seq)數(shù)據(jù)的公共數(shù)據(jù)庫。研究者此次更新的版本RPFdb 2.0帶來了顯著的數(shù)據(jù)擴展、特征改進和功能優(yōu)化:(i) RPFdb 2.0目前托管著來自293項研究的2884個ribo-seq數(shù)據(jù)集,涵蓋29個不同物種;(ii)采用了具有多步質(zhì)量控制的精細(xì)分析管道,以改進核糖序列數(shù)據(jù)的預(yù)處理和比對;(iii)增加了新的功能模塊,為每個核糖序列數(shù)據(jù)提供主動翻譯的開放閱讀框信息;(iv)提供了更多功能來提高數(shù)據(jù)庫的可用性。隨著這些添加和增強,RPFdb 2.0將成為基因調(diào)控社區(qū)更有價值和更全面的數(shù)據(jù)庫。
8、EVmiRNA:胞外囊泡miRNA譜的數(shù)據(jù)庫
EVmiRNA: a database of miRNA profiling in extracellular vesicles
網(wǎng)址:http://bioinfo.life.hust.edu.cn/EVmiRNA
Published:18 October 2018
胞外囊泡(EVs),如外泌體和微泡,可以作為細(xì)胞間的交流載體和疾病潛在生物標(biāo)志物。miRNAs是EVs中研究最深入的分子,因此對EVs中miRNA表達譜的全面研究將有助于探索它們的功能和生物標(biāo)志物。研究者從17種來源/疾病中收集了462個EVs miRNA測序樣本,構(gòu)建了EVmiRNA數(shù)據(jù)庫,以展示miRNA表達譜。研究者發(fā)現(xiàn)超過1000個miRNAs在這些EVs中表達,并檢測到每種來源/疾病的EVs的特異性miRNAs。EVmiRNA提供三個功能模塊:(i)來自不同來源(如血液、母乳等)的EVs的miRNA表達譜和樣本信息。 (ii)在不同的EVs中特異性表達的miRNAs,這將有助于生物標(biāo)志物的鑒定;(iii) miRNA注釋,包括EVs和TCGA癌癥類型中的miRNA表達、miRNA調(diào)控途徑以及miRNA功能和文獻。EVmiRNA具有用戶友好的網(wǎng)頁界面,具有強大的瀏覽和搜索功能以及數(shù)據(jù)下載功能。這是第一個關(guān)注EVs中miRNA表達譜的數(shù)據(jù)庫,將有助于EVs生物標(biāo)志物、miRNA功能和液體活組織檢查的研究和應(yīng)用。
9、LncBook: 人類長鏈非編碼RNAs的精選知識庫
LncBook: a curated knowledgebase of human long non-coding RNAs
網(wǎng)址:http://bigd.big.ac.cn/lncbook
Published:17 October 2018
長鏈非編碼RNAs(lncRNAs)在許多生物過程中具有重要的功能。盡管已知人類lncRNAs的數(shù)量急劇增加,但卻注釋不足。研究者提供了一個全面收集和通過多組學(xué)數(shù)據(jù)整合、功能注釋和疾病關(guān)聯(lián)的數(shù)據(jù)庫LncBook,它容納了大量270044個lncRNA,包括1867個具有3762個功能關(guān)聯(lián)的特征lncRNA。它還整合了大量來自表達、甲基化、基因組變異和lncRNA-miRNA相互作用的多組學(xué)數(shù)據(jù)。此外,LncBook整合了3772個實驗驗證的lncRNA疾病關(guān)聯(lián),并進一步鑒定了總共97998個lncRNA,這些lncRNA被認(rèn)為與疾病相關(guān)。LncBook致力于人類lncRNAs及其相關(guān)數(shù)據(jù)的集成和管理,將成為全世界研究人員的寶貴知識庫。
表觀相關(guān):
10、EWASdb: 表觀組學(xué)范圍的關(guān)聯(lián)研究數(shù)據(jù)庫
EWASdb: epigenome-wide association study database
網(wǎng)址:http://www.ewas.org.cn/ewasdb和http://www.bioapp.org/ewasdb
Published:13 October 2018
DNA甲基化是目前研究最深入的表觀遺傳修飾,在理解疾病的分子機制方面發(fā)揮著重要作用。此外,表觀組范圍的關(guān)聯(lián)研究(EWAS)提供了一種系統(tǒng)的方法來識別常見疾病/表型背后的表觀遺傳變異。然而,沒有一個全面的數(shù)據(jù)庫來存儲EWAS的結(jié)果。為了填補這個空白,人們開發(fā)出了EWASdb數(shù)據(jù)庫,用于存儲EWAS DNA甲基化的表觀遺傳關(guān)聯(lián)結(jié)果,目前已經(jīng)儲存1319個與302種疾病/表型相關(guān)的EWAS。EWASdb數(shù)據(jù)庫有三種類型的EWAS結(jié)果:(i)單一標(biāo)記的EWAS;(ii)用于KEGG途徑的EWAS和(iii)用于GO (基因本體)類別的EWAS。迄今為止,來自43個國家的研究人員已經(jīng)搜索或下載了第一個全面的EWAS數(shù)據(jù)庫。EWASdb將成為一種寶貴的資源,對疾病/表型的表觀遺傳學(xué)研究做出重大貢獻。
11、NucMap:一個跨物種全基因組核小體定位圖數(shù)據(jù)庫
NucMap: a database of genome-wide nucleosome positioning map across species
網(wǎng)址:http://bigd.big.ac.cn/nucmap/
Published:18 October 2018
核小體定位動力學(xué)影響染色質(zhì)狀態(tài)、轉(zhuǎn)錄和基因組DNA上發(fā)生的所有其他生物過程。雖然MNase-Seq在過去幾年中被用于描述真核生物中的核小體定位圖,但是核小體定位數(shù)據(jù)正在急劇增加。為了便于在研究中使用已發(fā)表的數(shù)據(jù),研究者開發(fā)了一個名為核小體定位圖的數(shù)據(jù)庫NucMap,它包括來自15個物種的477個樣本的798個MNase-Seq實驗數(shù)據(jù)。通過一系列功能模塊,用戶可以搜索所有樣本中每個基因啟動子區(qū)域核小體定位的概況,并對所有基因組區(qū)域的核小體定位數(shù)據(jù)進行富集分析。構(gòu)建核小體瀏覽器來可視化核小體定位的輪廓。用戶還可以使用核小體瀏覽器可視化多種omics數(shù)據(jù)源,并進行并排比較。數(shù)據(jù)庫中所有處理過的數(shù)據(jù)都是免費提供的。NucMap是第一個全面的核小體定位平臺,它將作為一個重要的資源來促進對染色質(zhì)調(diào)節(jié)的理解。