複製鏈接
請複製以下鏈接發送給好友

分子生物信息數據庫

鎖定
分子生物信息數據庫種類繁多。歸納起來,大體可以分為4個大類,即基因組數據庫、核酸和蛋白質一級結構序列數據庫、生物大分子(主要是蛋白質)三維空間結構數據庫、以上述3類數據庫和文獻資料為基礎構建的二次數據庫。
中文名
分子生物信息數據庫
性    質
二次數據庫
特    徵
分子生物信息數據庫種類繁多
優    點
數據庫和文獻資料為基礎構建

分子生物信息數據庫數據庫分類

基因組數據庫來自基因組作圖,序列數據庫來自序列測定,結構數據庫來自X-衍射和核磁共振結構測定。這些數據庫是分子生物信息學的基本數據資源,通常稱為基本數據庫,初始數據庫,也稱一次數據庫。
根據生命科學不同研究領域的實際需要,對基因組圖譜、核酸和蛋白質序列、蛋白質結構以及文獻等數據進行分析、整理、歸納、註釋,構建具有特殊生物學意義和專門用途的二次數據庫,是數據庫開發的有效途徑。
近年來,世界各國的生物學家和計算機科學家合作,已經開發了幾百個二次數據庫和複合數據庫,也稱專門數據庫、專業數據庫、專用數據庫

分子生物信息數據庫一次數據庫

一般説來,一次數據庫的數據庫量大,更新速度快,用户面廣,通常需要高性能的計算機硬件、大容量的磁盤空間和專門的數據庫管理系統支撐。例如,歐洲生物信息學研究所用Oracle數據庫軟件管理、維護核酸數據庫EMBL。
基因組數據庫GDB的管理、運行則基於Sybase數據庫系統,即使是安裝其鏡象。也需要有Sybase支撐。Oracle和Sybase均為流行的數據庫管理商業軟件。
而二次數據庫的容量則要小得多,更新速度也不象一次數據庫那樣快,也可以不用大型商業數據庫軟件支撐。許多二次數據庫的開發基於Web瀏覽器,使用超文本語言HTML和Java程序編寫的圖形界面,有的還帶有搜索程序。
這類針對不同問題開發的二次數據庫的最大特點是使用方便,特別適用於計算機使用經驗並不豐富的生物學家。

分子生物信息數據庫二次數據庫

二次數據庫種類繁多,以核酸數據庫為基礎構建的二次數據庫有基因調控轉錄因子數據庫TransFac,真核生物啓動子數據庫EPD,克隆載體數據庫Vector,密碼子使用表數據庫CUTG等。以蛋白質序列數據庫為基礎構建的二次數據庫有蛋白質功能位點數據庫Prosite,蛋白質功能位點序列片段數據庫Prints,同源蛋白家族數據庫Pfam,同源蛋白結構域數據庫Blocks。以具有特殊功能的蛋白為基礎構建的二次數據庫有免疫球蛋白數據庫Kabat,蛋白激酶數據庫PKinase等。
以三維結構原子座標為基礎構建的數據庫為結構分子生物學研究提供了有效的工具,如蛋白質二級結構構象參數數據庫DSSP,已知空間結構的蛋白質家族數據庫FSSP,已知空間結構的蛋白質及其同源蛋白數據庫HSSP等。蛋白質迴環分類數據庫則是用於蛋白質結構、功能和分子設計研究的專門數據庫。
此外,酶、限制性內切酶、輻射雜交、氨基酸特性表、序列分析文獻等,也屬於二次數據庫或專門數據庫。
法國生物信息研究中心Infobiogen生物信息數據庫目錄DBCat蒐集了主要400多個數據庫的名稱、內容、數據格式、聯繫地址、網址等詳細信息,使用户對生物信息數據庫有一個詳盡的瞭解。

分子生物信息數據庫DBCat

DBCat本身也是一個具有一定數據格式的數據庫。
DBCat按DNA、RNA、蛋白質、基因圖譜、結構、文獻等分類,其中大部分數據庫是可以免費下載的公用數據庫。
此外,國際上許多生物信息中心建有生物信息學和基因組信息資源網絡導航系統其中美國Oak Ride國家實驗室人類基因組信息資源導航系統和英國基因組圖譜資源中心(Human Genome Mapping Resource Centere,簡稱HGMP)的GenomeWeb所列網址最為詳盡,蒐集了世界各地基因組中心、基因組數據庫、基因組圖譜、基因組實驗材料、基因突變、遺傳疾病、以及生物技術公司、實驗規程、網絡教程、用户手冊等幾百個網址。