複製鏈接
請複製以下鏈接發送給好友

數據學

(研究探索數據界的理論、方法和技術)

鎖定
數據學(Dataology)是關於數據的科學或者研究數據的科學,定義為:研究探索信息空間(Cyberspace)中數據界(datanature)奧秘的理論、方法和技術,研究的對象是數據界中的數據。與自然科學社會科學不同,數據學和數據科學的研究對象是信息空間的數據,是新的科學。數據學和數據科學主要有兩個內涵:一個是研究數據本身,研究數據的各種類型、狀態、屬性及變化形式和變化規律;另一個是為自然科學和社會科學研究提供一種新的方法,稱為科學研究的數據方法,其目的在於揭示自然界和人類行為現象和規律。 [1-2] 
中文名
數據學
外文名
Dataology
適用領域
數據處理與數據應用
所屬學科
數據科學與數據學(Datalogy)

目錄

數據學定義

數據學(Dataology)是關於數據的科學或者研究數據的科學,定義為:研究探索信息空間(Cyberspace)中數據界(datanature)奧秘的理論、方法和技術,研究的對象是數據界中的數據。 [1-2] 
1974年彼得·諾爾(Peter Naur)出版了《計算機方法的簡明調研(Concise Survey of Computer Methods)》中將數據科學定義為:“處理數據的科學,一旦數據與其代表事物的關係被建立起來,將為其他領域與科學提供借鑑”。彼得·諾爾在《計算機方法的簡明調研》的前言中首次明確提出了數據科學(Data Science)的概念,“數據科學是一門基於數據處理的科學”,並提到了數據科學與數據學(Datalogy)的區別——前者是解決數據(問題)的科學(the science of dealing with data),而後者側重於數據處理及其在教育領域中的應用(the science of data and of data processes and its place in education)。 [3] 

數據學發展歷史

自上世紀60年代,彼得·諾爾(Peter Naur)首次提議要用“數據科學、數據學(Data science、Datalogy)”替代“計算機科學(Computer science)”,國際分類社團聯盟在上世紀90年代中期採用了這一建議。2001年,William S.Cleveland在其Visualizing Data一書中提議將數據科學作為一個新的學科,吸收計算機在數據處理方面取得的進展作為統計學的延伸。側重於互聯網數據和音像數據的《數據科學》(Data Science Journal)期刊以及側重於統計方法大規模應用的The Journal of Data Science分別於2002年與2003年開始發行。
2005前後,數據科學開始由學術向行業大規模遷移,一些Web公司開始開發大數據技術,並對其收集的數據進行挖掘利用。2005年,美國國家科學委員會發表了《數字數據收集萬歲:促進21世紀的研究與教育》,文中定義了數據科學家一詞。Greylock Partners的數據科學家D.J.Patil跟Jeff Hammerbacher一起在FacebookLinkedIn上建立了數據與分析小組,這一舉動被視為是數據科學走向職業化的標誌。伴隨而來的是,Natahn Yau於2009年首次提及“數據科學家”這一職業。2009年1月,數字化數據跨機構工作組發表的名為《駕馭科學與社會數字化數據之力》的報告也提到“數據科學家”一詞。2009年6月,一個在學術性崗位工作的澳大利亞人Troy Sadkowsky在LinkedIn建立了一個數據科學家小組,作為其datasceintists網站的輔佐,成為數據科學職業化的正式標誌。 [4] 
參考資料