複製鏈接
請複製以下鏈接發送給好友

推論統計學

鎖定
推論統計學是指在統計學中,研究如何根據樣本數據去推斷總體數量特徵的方法。它是在對樣本數據進行描述的基礎上,對統計總體的未知數量特徵做出以概率形式表述的推斷。更概括地説,是在一段有限的時間內,通過對一個隨機過程的觀察來進行推斷的。
中文名
推論統計學
外文名
inferential statistics
介    紹
在統計學中利用樣本推斷總體特徵
涉及學科
數學
基    礎
統計學

推論統計學相關信息

推論統計學具備歸納預測性質的數據通常使用此統計方法來處理,在20世紀20年代,R. A. Fisher的工作奠定了今天統計推論理論的基礎,他的研究課題主要是從生物學(如物種學、遺傳分類及其在農產品上的應用等)中提出來的。豐要説明如何歸納樣本數據進而推論出母體性質,並標示出誤差發生的機率。推論統計學在實際作業中應用層級相當廣泛,可謂現代統計學中最重要的部分。

推論統計學分類

推論統計學依照母體條件的差異性又可分為“有參數統計學”(Parametric Statistics)和“無參數統計學”(Non-Parametric Statistics)。其中有參數統計學是指母體呈常態分配(Normal Distridbution)的統計推論方法;其他所有應用於非常態分配母體的統計推論方法,都稱為無參數統計學。有參數統計學比無參數統計學發展得早,其經典課題有“點估計”、“區間估計”與“假設檢驗”等。

推論統計學異同點

一、描述統計學與推論統計學的同點:
兩者都以概率論為理論基礎,都是數理統計學,都是應用數學的一個分支,都可分為數理統計([數理]統計理論與方法)與應用統計(專業統計)兩部分,都屬於。研究自然與社會現象的通用科學。
二、描述統計學與推論統計學的異點:
第一,產生年代不同:一般認為描述統計學產生於二十世紀二十年代以前,以K.畢爾生為代表;推斷統計學產生於二十世紀二十年代以後,以費雪為代表。一説以費雪為分界點,費雪以前為描述統計學,費雪以後為推斷統計學;這兩個階段並無明確的分界時間,其發展是漸進的,不是突變的。
第二,研究特點不同:描述統計學研究如何簡縮數據並描述這些數據的方法,一般包括:統計調查方法,分類原理,彙總,統計表,統計圖,頻數分配,時間數列,指數,相關,估計推算等。推斷統計學研究如何在隨機抽樣的基礎上推論有關總體數量特徵的方法,一般包括:統計推斷原上推論有關總體數量特徵的方法,一般包括:統計推斷原理,實驗設計,估計理論,抽樣調查,復變數分析,序列分析,誤差理論,假設檢驗,決策理論等。
第三,研究樣本不同:描述統計學研究大樣本理論,所謂大樣本即包括多數個體或多數數值的樣本;推斷統計學肝究小樣本理論,所謂小樣本即包括少數個體或少數數惱的樣本。應當指出,大小或多少之分也是相對的,缺乏嚴格的劃分標消。據多數統計學者的意見:如果研究的是一個糧純項目,則包含三十項以上的數值或個體的樣本即可視為大樣本;但也有人主張採用五十或一百為劃分標準的。
第四,應用統計的性質不完全相同。描述統計學派和推斷統計學派都把其統計學看作是通用科學,可以用來研究自然與社會現象;但在其應用統計方面則略有不同。描述統計學派在應用統計——生物統計、經濟統計等方面,仍殘留者凱特勒的實質科學的影響;推斷統計學在應用統計——物理統計、田間設計、質量管理、經濟預測等方面,基本上已轉變為通用的方法論科學。

推論統計學必要性

1、在產品可靠性領域,研究某種產品在規定條件下和規定時間內完成規定功能的概率時,通常要做破壞性檢驗和試驗,如燈泡的壽命測試、焊縫的強度檢驗、電視機無故障工作時間的確定等。我們只能通過抽取樣本,對樣本進行破壞性試驗後,推斷總體的可靠性指標。如果對所有產品進行破壞性檢測,就沒有產品可供銷售了,這違背了我們研究的本來目的。
2、還有一些研究對象,組成其整體的個體是無限多的,客觀上對全部個體進行觀察和檢驗是根本不可能的。如研究海水中微生物的情況時,不可能將全部海水都裝入試管中;分析魚池中全部活魚的重量與長度時,不能將池水抽乾、逐條過秤等。因此,只能用隨機取樣統計推斷的方法。
3、有些情況對全部個體逐一研究、檢測是可以的,但需要付出非常多的財力、物力和時間。如自動化流水作業的生產過程,對每個產品進行檢測需要停機等。因此,我們也只能依賴於抽樣檢驗和調查,分析樣本後對整體做出判斷。
4、由於整體的不均勻性和樣本的隨機性,利用分析樣本得到的數據來推斷總體的情況必然會產生偏差。但是,在大多數情況下這種估計誤差的存在是合理的,也是可以容忍的。因為不同的問題有不同的精度要求,並不是所有問題都需要一個絕對準確的估量,也不是一切問題都能得到一個非常精確的結果,所以統計推斷是不可缺少的研究手段 [1] 

推論統計學準確性

個體是總體的一部分,局部的特性能反映全局的特點,但是,由於總體的不均勻性和樣本的隨機性,又使得樣本不能精確地反映總體。因此,抽取部分個體經分析得出有關總體的結論存在着差錯和不可靠。從理論上講有兩種途徑可以消除和減少這種差錯。其一,使總體最大限度地均勻。總體是我們要研究的未知事物,我們往往不可能改變他的均勻性,當能夠使其達到理想的均勻時,已經完全掌握了它,沒有研究的必要了。其二,採取適當的抽樣方法確保抽樣的“代表性”,可有效地控制和提高統計推斷的可靠性和正確性。
隨機抽樣的方法很多,常用的有:
簡單隨機抽樣,是指抽樣過程應獨立進行並且總體中每個個體被抽到的機會均等。隨機抽樣不是隨便抽取,隨便抽取容易受到個人好惡的影響。為實現隨機化,可採取抽籤、擲隨機數骰子或查隨機數值表等辦法。如從100件產品中隨機抽取10件組成樣本,可以把這100件產品從l開始編號直到100號,然後用抓鬮的辦法任意抽出10個編號,由這10個編號代表的產品組成樣本。此種抽樣方法的優點是抽樣誤差小,缺點是手續繁雜。在實踐中真正做到每個個體被抽到的機會相等是不容易的。
週期系統抽樣,又叫等距抽樣或機械抽樣,即將總體按順序編號,用抽籤或查隨機數值表的方法確定首件,進而按等距原則依次抽取樣本。如從120個零件中取五個做樣本,先按生產順序給產品編號,用簡單隨機抽樣法確定首件,然後按每隔24(由120÷5=24得)個號碼抽取一個,共抽取五個組成樣本。這種方法特別適用於流水線上取樣,操作簡便,實施起來不易出現差錯。但抽樣起點一經確定,整個樣本就完全固定。對總體質量特性含有某種週期性變化,而當抽樣間隔恰好與質量特性變化週期吻合時,就可能得到一個偏差很大的樣本。
分層抽樣法,即從一個可以分成不同子總體的總體中,按規定比例從不同層中隨機抽取個體的方法。當不同設備、不同環境生產同一種產品時,由於條件差別產品質量可能有較大差異,為了使所抽取的樣本具有代表性,可以將不同條件下生產的產品組成組,使同一組內產品質量均勻,然後在各組內按比例隨機抽取樣品合成一個樣本。這種抽樣方法得到的樣本代表性比較好,抽樣誤差較小,缺點是抽樣手續較繁,常用於產品質量檢驗。
這種方法是先將總體按一定方式分成多個羣,然後隨機地抽取若干羣並由這些羣中的所有個體組成樣本。如按照生產過程將1000個零件分別裝入20個箱中,每箱50個,然後隨機抽取一箱,此箱中50個零件組成樣本。這種抽樣方法實施方便,但樣本來自個別羣體而不能均勻分佈在總體中,因而代表性差,抽樣誤差較大。
參考資料
  • 1.    李惠村著.歐美統計學派發展簡史[M].ISBN:C8-095.中國統計出版社,1984