-
Logistic分佈
鎖定
Logistic分佈指當n趨向於無窮大時,從指數分佈(exponential distribution)中抽取的容量n的隨機樣本的最大與最小樣本值的平均的極限分佈。密度函數為:f(x)=exp[-(x-α)/β]/β{1+exp[-(x-α)/β]}2,-∞0,分佈函數為:1/f(x)=exp[-(x-α)/β]。位置參數α為均值。分佈的方差為π2β2/3,它的偏斜度為0,峯度為4.2。α=o,β=1時為標準logistic分佈(standard logistic distribution),它的累積概率分佈函數(cumulative distribution function)F(x)與概率分佈f(x)之間滿足:f(x)=F(x)[1-F(x)]。
- 中文名
- Logistic分佈
- 外文名
- Logistic Distribution
- 所屬學科
- 數學(數理統計)
- 別 名
- 羅吉斯蒂克分佈
- 相關概念
- Logistic函數等
目錄
- 1 基本介紹
- ▪ 定義一
- ▪ 定義二
- 2 一元logistic函數
Logistic分佈基本介紹
Logistic分佈定義一
如果一個隨機變量
,它的分佈函數為
由圖可見
的期望值
,密度函數對
對稱。分佈函數F(x)在
處等於005。(0,0,5)為曲線F(x)的對稱點,而F(x)=0及F(x)=1為其漸近線。在(0,0,5)點處F(x)的斜率m=0.25。這是logistic函數的最簡單的形式
[1]
。
Logistic分佈定義二
Logistic分佈函數為
其中
。
Logistic分佈一元logistic函數
一般地,一元logistic函數可表為
Logistic分佈多元logistic函數
更一般的logistic函數為多元的(設為m元)
在研究來自同一總體的兩個變量(設為X和Y)間的關係時,採得容量為n的樣本
。畫出這組數據的散點圖,如曲線接近S形,可試用logistic曲線去擬合它。
Logistic分佈Logistic迴歸模型
模型概念
Logistic迴歸模型是分析二分類型變量時常用的非線性統計模型,是最重要且應用最廣泛的非線性模型之一。該模型的因變量為二分類變量(y=0或y=1),結果變量與自變量間是非線性關係。形式如方程(1):
模型優缺點
優點:
第一,對變量要求低,可以接受非正態分佈的數據;
第二,總體預測準確率較高;
第三,數據來源直接,操作簡便;
第四,判斷標準明確;
第五,模型穩定,利於推廣創新。
缺點:
第一,大多數時候對ST企業預測準確率較低;
第二,P值臨界點的選擇影響模型預測結果;
模型原理
模型構造的原理簡單來説是運用對數運算將事件發生與否(即事件發生概率
或1)與自變量x間的非線性關係轉化為線性關係。以單一自變量為例,具體轉化步驟如下:
第一步,將上述Logistic模型方程(1)轉化為如下一個非線性方程(2)。
第二步,方程(2)化簡轉化為如下方程(3)。
第三步,方程(3)等式兩邊同時取對數轉化為如下方程(4)。
模型(4)得出
與x間的線性關係方程。
此時,
與
雖然不存在線性關係,但是關於P的函數記作logistic(Pi)與
存在線性關係。同理,自變量可拓展為m個,則有如下模型方程(5)。
模型基本假設
第一,數據必須來自隨機樣本;
第二,
為m個自變量
的函數;
第三,
或1;
模型應用步驟
第一步,選取樣本、確定初始指標;
第二步,篩選指標;
運用SPSS軟件對所有指標進行Kolmogorov-Smirnov正態分佈檢驗。符合正態分佈的指標進行顯著性T檢驗,不符合正態分佈的數據進行Mann-Whitney顯著性檢驗,去除不顯著指標。進行Pearson檢驗,去除與其他指標存在高度相關性的指標。進行多重共線性檢驗,去除與其他指標存在多重共線性的指標;
第三步,進行KMO檢驗,確定是否進行因子分析;
第四步,進行Logistic迴歸,得到模型,觀察模型擬合程度及預測準確率;
第五步,用檢驗樣本檢驗模型預測能力;
模型參數解釋
當參數b大於0時,自變量x增大,
減小,
增大;
當參數b小於0時,自變量x增大,
增大,
減小;
當參數b等於0時,自變量x增加對
無影響,
不變。