複製鏈接
請複製以下鏈接發送給好友

基本科學指標數據庫

鎖定
基本科學指標數據庫(Essential Science Indicators,簡稱ESI),是由科睿唯安(Clarivate Analytics,原湯森路透知識產權與科技事業部)在彙集和分析Web of Science核心合集所收錄的學術文獻及其所引用的參考文獻的基礎上建立起來的分析型數據庫。ESI由學術信息出版機構美國科學信息研究所(ISI)於2001年推出的衡量科學研究績效、跟蹤科學發展趨勢基本分析評價工具,現已成為世界範圍內普遍用以評價高校、學術機構、國家/地區國際學術水平及影響力的重要評價指標工具。 [3] 
ESI由引文排位(Citation Rankings)、高被引論文(Most Cited Papers)、引文分析(Citation Analysis)和評論報道(Commentary)4部分構成。 [3]  ESI從引文分析的角度,將全部科學分為22個專業領域,分別對國家、研究機構、期刊、論文以及科學家進行統計分析和排序。 [1-2]  數據一年更新6次,更新週期為2個月。 [2-3] 
中文名
基本科學指標數據庫
外文名
Essential Science Indicators
性    質
計量分析數據庫
功    能
測定特定研究領域研究產出與影響

基本科學指標數據庫功能

研究人員可以系統地、有針對性地分析國際科技文獻,從而瞭解一些著名的科學家、研究機構(或大學)、國家(或區域)和學術期刊在某一學科領域的發展和影響;同時科研管理人員也可以利用該資源找到影響決策分析基礎數據
Essential Science Indicators可以幫助使用者進行很多工作:
1、分析特定研究機構、國家、公司和學術期刊的研究績效和影響力;
2、在22個專業領域內分別對國家、研究機構、期刊、論文、科學家進行統
計分析和排序;
3、跟蹤自然科學和社會科學領域內的研究發展趨勢,給出衡量研究績效的
4、評估潛在的合作者、評論家、同行和僱員;
5、測定特定研究領域的研究產出與影響;
6、及時獲知各領域內高被引論文和近期最關注的話題;
7、通過共引分析方法,揭示各個學科當前的研究前沿,鎖定隱含的突破性研究;
8、通過引文數據庫揭示不同學科發展的趨勢。

基本科學指標數據庫檢索指南

引文排名(Citation Rankings)
(1)查閲引文排名
在ESI數據庫中可以查閲在22個學科領域中以下4種引文排名:
1)科學家Scientists(取排名前1%);
2)研究機構Institutions(取排名前1%);
3)國家/地區Countries/Territories(取排名前50%);
4)期刊Journals(取排名前50%)。
選擇任意一種排名,如研究機構Institutions,可以進一步按學科(BY FIELD)瀏覽某個學科下的研究機構排名,或檢索指定的研究機構(BY NAME)在22個學科領域中的排名,檢索支持通配符“*”(表示任何字符組,包括空字符)。
(2)檢索結果的瀏覽
1)各種排名的結果可以依據引文數(citation(s)),論文數(paper(s))或篇均引文數(citation(s) per paper)限定至少多少數目才顯示(Display items with at least),並且還可按Citations(引文數),Papers(論文數),Citations per Paper(篇均引文數),Journal,or Field(期刊,科學家,研究機構或國家/地區)排序瀏覽(Sorted by)。
2)點擊論文圖標(Paper icon),可以瀏覽期刊(或科學家,研究機構,國家/地區)在某個學科領域中所對應的高被引論文(TOP PAPERS)。
3)點擊圖圖標(Graph icon),可以瀏覽按照時間的走勢圖
4)點擊期刊(或科學家,研究機構,國家/地區)名稱,可以查閲其學科排名。點擊學科名稱,顯示該學科下期刊(或科學家,研究機構,國家/地區)的排名。
高被引論文(Most Cited Papers)
(1)通過兩種途徑可以瀏覽高被引論文:
1)10年來的高被引文章(Highly Cited Papers(last 10 years)):發表於十年內各領域中被引用次數Top1%的文章。可以瀏覽單一學科或者綜合所有學科的高被引的論文(BY FIELD),或某一科學家、某一研究機構、國家/地區或者期刊的高被引文章(BY NAME),或通過檢索創建相關高被引文章列表(BY SEARCHING)。
2)近兩年來高被引的文章(Hot Papers(last 2 years)):發表於兩年內最近兩個月被引用次數為各領域Top0.1%的文章。
(2)檢索結果的瀏覽
1)檢索結果可以按引文數(Citations),出版年份(Publication Year),期刊名(Journal Title)排序。
2)點擊圖圖標(Graph icon),可以瀏覽按照時間的走勢圖。
3)點擊WEB OF SCIENCE按鈕,鏈接到Web of Science,瞭解更多的細節,最新的引文統計和獲取出版社全文等。
4)點擊COMMENTARY按鈕,查看相關研究領域的話題討論。
引文分析(Citation Analysis)
1)基線數值(Baselines)為引文統計數據提供了比較分析的依據。進入BASELINES MENU,可以查看平均引文率(Average Citation Rates)——按照10年間各年進行統計,表示各學科中每年發表論文的篇均被引次數;或Percentiles——每年發表的論文達到某個百分點基準應被引用的次數;或Field Rankings——顯示某個學科中的論文總數和引文總數。
2)研究前沿(Research Fronts)按照共引關係聚類高被引論文,用以瞭解新的突破可能出現的領域以及科學家之間的非正式交流的關係。可以進一步按學科(BY FIELD)瀏覽研究前沿,或查看指定的主題(BY NAME)的研究前沿。
專家評述(Commentary)
(可以免費獲取)
1)in-cites:提供進入科學社區的門户,提供多個學科領域中高被引研究人員、論文、機構、期刊和國家的採訪資料等。
2)Special Topics:在某個的學科領域中取得重大研究進展或者引起特別興趣的論文的引文分析和專家意見。
3)Science Watch:提供Thomson Scientific快訊的編輯材料。

基本科學指標數據庫結構組成

ESI由引文排位(Citation Rankings)、高被引論文(Most Cited Papers)、引文分析(Citation Analysis)和評論報道(Commentary)4部分構成。
  • 引文排位部分依據論文總被引量,排出位居國際前1%科學家、前1%科研機構、前50%國家/地區以及前50%期刊。高被引論文部分依據論文總被引頻次,排出國際1%頂尖論文和1%熱門論文。
  • 引文分析部分中Baselines(基準線)用來測度論文組的累積被引頻次,Averages(平均被引頻次)基於從論文出版年到當前的被引累積數,列出了近10年的年平均被引頻次和10年的總平均被引值。以Percentiles(百分點)為被引基準,給出了每一年每一學科領域進入前0.01%,0.10%,1.00%,10.00%,20.00%和50.00%所需達到的引文量,Field Rankings依據總被引頻次給出了22個學科的總體排序,並用圖表描述了以5年為單位的連續時間段內該學科的論文數、引文數、篇均被引數變化的數量趨勢。
  • 引文分析部分中Research Fronts(研究前沿)基於5年時間段多學科範圍內被引頻次高的論文,通過聚類分析、共引分析列出各學科領域研究前沿。該部分指標包括高被引論文數(即分析的文獻量)、引文數(即高被引論文被引次數,反映了研究前沿的規模)、平均引文數(表明前沿研究的集中度)和平均年份(Mean Year,越近表示研究越前沿)。
  • 評論報道部分對ESI中涉及的特定領域、科研成果等進行採訪報道與評論。其中,In-Cites對ESI中重要論文、發現的幕後細節進行報道、評述分析及展望。Special Topics對選定專題領域的文獻進行深入剖析並提供相關內容。Science Watch基於熱點,追蹤基礎科學研究領域的發展趨勢和研究現狀。

基本科學指標數據庫指標與原理

ESI處理的數據僅限於ESI收錄的期刊論文科技論文、評述論文、會議論文以及研究報告)。編輯信件、更正通知、摘要、圖書、圖書的章節以及未被ESI索引的期刊論文,均不被考慮在內。數據一年更新6次,更新週期為2個月。
ESI以引文分析為基礎,出版和引文活動可以衡量各國科研水平、期刊的聲譽和影響力,也可以反映科研機構和科學家的學術水平。其中,被引頻次作為同行認知(Peer Recognition)的一種形式,反映科研羣體對科學家的依賴程度。
(一)論文數與引文數
論文數是描述科學家、期刊、機構、國家發表論文能力的一個基本指標,是在給定時期或給定領域內發表或刊載論文的數量。引文數是從使用者的角度評價科學家、期刊、機構、國家科學水平的一個基本指標,是論文被引用的全部次數,它用客觀使用的數量反映了科學體在科學發展和文獻交流中的作用。這兩個指標都是絕對數量指標,一般來説,其值越大,表明該科學家、期刊、機構、國家的作用越重要。
ESI將論文數和引文數作為指標,針對不同對象,對期刊論文的第一作者和非第一作者平等對待,論文引用和被引頻次平等歸於所有作者,體現了對科學參與者的公平評價。時間段為10年(包括當前更新時間),從ESI收錄該論文的實際年份算起,反映了文獻從發表到引用高峯再到引用稀少的客觀過程。熱點論文計算的時間段為2年,計算國際上過去2年中各領域論文在近2個月被引用的次數,也是依熱點問題的生命週期和人們的關注程度而定。
(二)篇均被引頻次和平均被引頻次
篇均被引頻次(Average Citations Per Paper)是給定時間內,期刊所載文獻被引數量除以該刊全部論文數。以科學家為例,它表示科學家所發表每篇論文被引用的平均水平,其值高則一般代表該科學家水平高。它同樣適用於用於期刊、機構和國家。作為一個相對數量指標,它彌補了絕對數量指標中馬太效應導致的偏差。在ESI中篇均被引頻次即引文數除以論文數,表示每篇論文被引用的平均水平,針對不同對象,篇均被引頻次反映該對象的學術水平高低。
ESI中平均被引頻次(Averages)與篇均被引頻次不同,ESI的Baselines中給出了各領域論文每年的年平均被引頻次和10年累積平均被引頻次Averages值由某領域總引文數除以總論文數得到。這些平均值可以被用作科學家、機構、國家以及期刊排位表給出的單篇被引值的基線,獨立年份的學科領域平均值可用於該年份出版的論文的比較。
(三)平均年份(Mean Year)
該指標出現在Research Fronts中,它是引文發表的平均年份,是衡量學術界對相關主題研究的活躍(Currency)程度的一個指標,其核心思想是:引文發表的平均年份越近,表示當前對該主題開展的研究越多。Mean Year離當前年份越近越能表明該主題處於當前學科熱點或研究前沿。即Mean Year就是前沿課題研究興起的時間點
計算其值,要從論文的發表年份開始到當前引用年份,將年月轉變成數字:1-12月分別對應0,1/12,2/12,......11/12,年份為整數部分,然後對所有數字求算術平均即可。
(四)標準共引閾值(Normalized Co-citation)
引用表現學科領域間的聯繫,共引反映科學領域內重要問題之間的聯繫。所謂共引,是在給定論文的參考文獻中,對某一論文的引用伴隨着對另一論文的引用。Research Fronts是引文網絡結構根據若干篇原創性成果的核心文獻來描述某個特定研究領域現狀的應用。它彙集特定領域核心文獻和研究焦點,追蹤學科發展趨勢,辨析科學家、研究機構、國家對科學發展的貢獻。
ESI採用單連接聚類算法(Single-Linkage),其基本思想是兩個簇之間的距離為從兩個簇中抽取的每對樣本的最小距離。通俗地講,樣本點離哪個類近就劃入哪一類,表達關係密切、性質相近的意思。Research Fronts的聚類分析共引強度為基本計量單位,分析之前需要先為論文設定共引強度閾值(Integer Co-citation Frequency),目的是去除大量弱相關論文(噪音),然後形成學科強相關的論文簇,進而定量分析。為篩選具有一定共引強度的論文,設定了標準共引閾值。假設有論文A和B,其共引閾值的計算公式如下:
標準共引閾值=論文A和B的共引強度閾值/(論文A的引文數×論文B的引文數)0.5
該公式通過聚類分析推導而來,其中共引強度閾值一般以專家打分的方式給出,然後通過該公式轉換成標準共引閾值。ESI在處理數據時將Integer Co-citation Frequency賦值為2,為Normalized Co-citation賦予0.3的值。
(五)引文閾值
引文閾值作為篩選標準,用來從各領域中選出一定比例的科學家、科研機構、國家和期刊,引文數大於等於閾值者均可入選。針對不同學科、學科特點及引文率的不同,各領域設定不同的引文閾值。ESI設定了國際頂尖論文引文閾值,考慮到學科不同和時間上新舊文獻的可比性,將每個學科每年分別設定不同的值,將某論文10年內累積引文數與閾值比較,大於等於則可以入選。熱點論文引文閾值,每個領域每兩個月設定不同的值,將某論文2個月內的累積引文數與閾值比較,大於等於則可以入選。
(六)All Fields(全部領域)
ESI多處從“All Fields”全學科領域的角度出發,向研究者展示科學全貌、科學前沿全貌。引文排位部分裏,直接在“Select a Scientist From This Field”的下拉列表中選擇“All fields”點擊“GO”按鈕,不分領域依據引文數列出了居前科學家,由此可以觀察判斷排在科學發展前列的科學家及其所研究的領域,也可以判斷學科研究間的關係。同理,對於科研機構、國家/地區以及期刊,高被引論文部分“All Fields”可以判斷出科學發展的熱點和重點。
(七)跨學科期刊歸類
ESI中任何一種專業期刊都只能歸入唯一領域。對於跨學科期刊,如Nature、Science等,之前全部歸入Multidisciplinary Field。現在ESI對約60種跨學科期刊論文按照其引文對其進行歸類,即論文的歸類取決於其引文和參考文獻的歸類。其主要依據引文的特點,引文是一篇論文對另一篇論文的應用,一定程度上反映學科內容之間的引證關係。例如,一篇刊載在跨學科期刊上的論文,如果其大多數引文屬於神經系統科學(Neuroscience)領域,且大多數參考文獻來自神經系統科學領域,那麼該論文就被歸入Neuroscience。
跨學科期刊論文的歸類情況因期刊而異,如Nature、Science的再分類率可達95%。採取此法,60種期刊約17萬篇論文中近半數被歸入具體領域。重新歸類為科學家、機構、國家、期刊論文排序提供了更準確的統計數據,可更準確地反映各學科領域的研究情況、學術成果、影響力。
(八)ESI指標值校正
ESI對科學家、科研機構、國家和期刊在一定時期內分別進行排序。時間序列以5年為一段,有部分重疊依次連續後推,即1995-1999年、1996-2000年。這樣採用5年期的移動平均Moving Average, MA)方法對一個科學家、機構、國家或期刊的科研能力進行評估,旨在減少異常值的影響。這樣評價保持了評級結果的穩定性。
ESI每2個月更新一次,所以當前年份各項指標值都不夠完全,不能反映實際情況。ESI根據長期觀察總結髮現:假設有穩定的出版量,整個數據庫中,每5年最後一年的引文數平均佔該時期全部引文數的41%,而這41%的引文又近似平均分佈在這一年的6個時間段內。 [3] 
參考資料