-
數據分析
(統計分析方法)
鎖定
數據分析是指用適當的統計分析方法對收集來的大量數據進行分析,將它們加以彙總和理解並消化,以求最大化地開發數據的功能,發揮數據的作用。數據分析是為了提取有用信息和形成結論而對數據加以詳細研究和概括總結的過程。
[1]
- 中文名
- 數據分析
- 外文名
- Data Analysis
- 別 名
- 數據挖掘
- 目 的
- 最大化地開發數據的功能
- 數據也稱
- 觀測值,實驗、測量、觀察結果
數據分析數據
數據也稱為觀測值,是實驗、測量、觀察、調查等的結果。數據分析中所處理的數據分為定性數據和定量數據。只能歸入某一類而不能用數值進行測度的數據稱為定性數據。定性數據中表現為類別,但不區分順序的,是定類數據,如性別、品牌等;定性數據中表現為類別,但區分順序的,是定序數據,如學歷、商品的質量等級等。
[1]
數據分析目的
數據分析的目的是把隱藏在一大批看來雜亂無章的數據中的信息集中和提煉出來,從而找出所研究對象的內在規律。在實際應用中,數據分析可幫助人們做出判斷,以便採取適當行動。數據分析是有組織有目的地收集數據、分析數據,使之成為信息的過程。這一過程是質量管理體系的支持過程。在產品的整個壽命週期,包括從市場調研到售後服務和最終處置的各個過程都需要適當運用數據分析過程,以提升有效性。例如設計人員在開始一個新的設計以前,要通過廣泛的設計調查,分析所得數據以判定設計方向,因此數據分析在工業設計中具有極其重要的地位。
[3]
數據分析類型
探索性數據分析
定性數據分析
離線數據分析
離線數據分析用於較複雜和耗時的數據分析和處理,一般通常構建在雲計算平台之上,如開源的HDFS文件系統和MapReduce運算框架。Hadoop機羣包含數百台乃至數千台服務器,存儲了數PB乃至數十PB的數據,每天運行着成千上萬的離線數據分析作業,每個作業處理幾百MB到幾百TB甚至更多的數據,運行時間為幾分鐘、幾小時、幾天甚至更長。
[1]
在線數據分析
在線數據分析也稱為聯機分析處理,用來處理用户的在線請求,它對響應時間的要求比較高(通常不超過若干秒)。與離線數據分析相比,在線數據分析能夠實時處理用户的請求,允許用户隨時更改分析的約束和限制條件。與離線數據分析相比,在線數據分析能夠處理的數據量要小得多,但隨着技術的發展,當前的在線分析系統已經能夠實時地處理數千萬條甚至數億條記錄。傳統的在線數據分析系統構建在以關係數據庫為核心的數據倉庫之上,而在線大數據分析系統構建在雲計算平台的NoSQL系統上。如果沒有大數據的在線分析和處理,則無法存儲和索引數量龐大的互聯網網頁,就不會有當今的高效搜索引擎,也不會有構建在大數據處理基礎上的微博、博客、社交網絡等的蓬勃發展。
[4]
數據分析分析方法
1、列表法
將數據按一定規律用列表方式表達出來,是記錄和處理最常用的方法。表格的設計要求對應關係清楚,簡單明瞭,有利於發現相關量之間的相關關係;此外還要求在標題欄中註明各個量的名稱、符號、數量級和單位等:根據需要還可以列出除原始數據以外的計算欄目和統計欄目等。
[3]
2、作圖法
圖表和圖形的生成方式主要有兩種:手動製表和用程序自動生成,其中用程序製表是通過相應的軟件,例如SPSS、Excel、MATLAB等。將調查的數據輸入程序中,通過對這些軟件進行操作,得出最後結果,結果可以用圖表或者圖形的方式表現出來。圖形和圖表可以直接反映出調研結果,這樣大大節省了設計師的時間,幫助設計者們更好地分析和預測市場所需要的產品,為進一步的設計做鋪墊。同時這些分析形式也運用在產品銷售統計中,這樣可以直觀地給出最近的產品銷售情況,並可以及時地分析和預測未來的市場銷售情況等。所以數據分析法在工業設計中運用非常廣泛,而且是極為重要的。
[3]
數據分析分析工具
使用Excel自帶的數據分析功能可以完成很多專業軟件才有的數據統計、分析,其中包括:直方圖、相關係數、協方差、各種概率分佈、抽樣與動態模擬、總體均值判斷,均值推斷、線性、非線性迴歸、多元迴歸分析、移動平均等內容。在商業智能領域Cognos、Style Intelligence、Microstrategy、Brio、BO和Oracle以及國內產品如Yonghong Z-Suite BI套件等。
[5]
數據分析分析步驟
1、探索性數據分析:當數據剛取得時,可能雜亂無章,看不出規律,通過作圖、造表、用各種形式的方程擬合,計算某些特徵量等手段探索規律性的可能形式,即往什麼方向和用何種方式去尋找和揭示隱含在數據中的規律性。
[6]
數據分析數據分析過程
識別信息需求是確保數據分析過程有效性的首要條件,可以為收集數據、分析數據提供清晰的目標。識別信息需求是管理者的職責管理者應根據決策和過程控制的需求,提出對信息的需求。就過程控制而言,管理者應識別需求要利用那些信息支持評審過程輸入、過程輸出、資源配置的合理性、過程活動的優化方案和過程異常變異的發現。
[6]
收集數據
分析數據
數據分析案例分析
“啤酒與尿布”的故事產生於20世紀90年代的美國沃爾瑪超市中,沃爾瑪的超市管理人員分析銷售數據時發現了一個令人難於理解的現象:在某些特定的情況下,“啤酒”與“尿布”兩件看上去毫無關係的商品會經常出現同一個購物籃中,這種獨特的銷售現象引起了管理人員的注意,經過後續調查發現,這種現象出現年輕的父親身上。
[7]
在美國有嬰兒的家庭中,一般是母親在家中照看嬰兒,年輕的父親前去超市購買尿布。父親在購買尿布的同時,往往會順便為自己購買啤酒,這樣就會出現啤酒與尿布這兩件看上去不相干的商品經常會出現同一個購物籃的現象。如果這個年輕的父親在賣場只能買到兩件商品之一,則他很有可能會放棄購物而到另一家商店, 直到可以一次同時買到啤酒與尿布為止。沃爾瑪發現了這一獨特的現象,開始在賣場嘗試將啤酒與尿布擺放在相同的區域,讓年輕的父親可以同時找到這兩件商品,並很快地完成購物;而沃爾瑪超市也可以讓這些客户一次購買兩件商品、而不是一件,從而獲得了很好的商品銷售收入,這就是“啤酒與尿布” 故事的由來。
[7]
當然“啤酒與尿布”的故事必須具有技術方面的支持。1993年美國學者Agrawal提出通過分析購物籃中的商品集合,從而找出商品之間關聯關係的關聯算法,並根據商品之間的關係,找出客户的購買行為。艾格拉沃從數學及計算機算法角度提 出了商品關聯關係的計算方法——Aprior算法。沃爾瑪從上個世紀 90 年代嘗試將 Aprior 算 法引入到 POS機數據分析中,並獲得了成功,於是產生了“啤酒與尿布”的故事。
[7]
2、Suncorp-Metway使用數據分析實現智慧營銷
Suncorp-Metway是澳大利亞一家提供普通保險、銀行業、壽險和理財服務的多元化金融服務集團, 旗下擁有5個業務部門,管理着14類商品,由公司及共享服務部門提供支持,其在澳大利亞和新西蘭的運營業務與900多萬名客户有合作關係。
[8]
該公司過去十年間的合併與收購,使客户羣增長了200%,這極大增加了客户羣數據管理的複雜性,如果解決不好,必將對公司利潤產生負面影響.為此,IBM公司為其提供了一套解決方案,組件包括:IBM Cognos 8 BI、IBMInitiate Master Data Service與IBM Unica。
[8]
- 參考資料
-
- 1. 陶皖主編.雲計算與大數據:西安電子科技大學出版社,2017.01:第44頁
- 2. 顧君忠,楊靜主編.英漢多媒體技術辭典:上海交通大學出版社,2016.09:第154頁
- 3. 李娟莉主編;趙靜,王學文,張琳副主編.設計調查:國防工業出版社,2015.01:第176頁
- 4. 邊馥苓主編;孟小帝,崔曉暉副主編.時空大數據的技術與方法:測繪出版社,2016.05:第24頁
- 5. 張軍翔,吳祖珍,汪洋慧編著.EXCEL 2013實戰應用:中國鐵道出版社,2015.06:第212頁
- 6. 趙凱,李瑋瑤著.大數據與雲計算技術漫談:光明日報出版社,2016.10:第18頁
- 7. 楊旭 湯海京.數據科學導論:北京理工大學出版社,2014:17-18
- 8. 趙守香,唐胡鑫,熊海濤著.大數據分析與應用:航空工業出版社,2015.12:第95頁