反饋

Logistic分佈

Logistic分佈指當n趨向於無窮大時，從指數分佈(exponential distribution)中抽取的容量n的隨機樣本的最大與最小樣本值的平均的極限分佈。密度函數為：f(x)=exp[-(x-α)/β]/β{1+exp[-(x-α)/β]}²，-∞0，分佈函數為：1/f(x)=exp[-(x-α)/β]。位置參數α為均值。分佈的方差為π²β²/3，它的偏斜度為0，峯度為4.2。α=o，β=1時為標準logistic分佈(standard logistic distribution)，它的累積概率分佈函數(cumulative distribution function)F(x)與概率分佈f(x)之間滿足：f(x)=F(x)[1-F(x)]。

中文名: Logistic分佈
外文名: Logistic Distribution

所屬學科: 數學（數理統計）
別名: 羅吉斯蒂克分佈
相關概念: Logistic函數等

目錄

3 多元logistic函數
4 Logistic迴歸模型

Logistic分佈基本介紹

Logistic分佈定義一

如果一個隨機變量

，它的分佈函數為

則稱

服從logistic分佈，這個分佈函數叫做logistic函數，其圖形見圖1，此曲線叫做logistic曲線。其密度函數為

圖1a logistic分佈函數

圖1a logistic分佈函數

圖1b logistic密度函數

圖1b logistic密度函數

由圖可見

的期望值

，密度函數對

對稱。分佈函數F(x)在

處等於005。(0，0，5)為曲線F(x)的對稱點，而F(x)=0及F(x)=1為其漸近線。在(0，0，5)點處F(x)的斜率m=0.25。這是logistic函數的最簡單的形式^[1] 。

Logistic分佈定義二

Logistic分佈函數為

的分佈稱為Logistic分佈^[2] 。

其中

。

式也可寫成

它的密度函數為

式還告訴我們，Logistic分佈仍然是屬於位置-尺度參數族，其中

是位置參數。

是尺度參數，這樣凡與位置-尺度參數族有關的結果，均對Logistic分佈有效。當

時，相應的分佈稱為標準Logistic分佈，它的分佈函數

與分佈密度

為

很明顯，如考慮

則

也是一個分佈函數，且有關係式

因此有時上也從

出發，以它作為標準分佈，經隨機變量線性變換後導出的分佈作為一般的Logistic分佈^[2] 。

Logistic分佈一元logistic函數

一般地，一元logistic函數可表為

式中

為二常值參數，隨

取值不同，分佈的期望值

，以及對稱點，及對稱點處的斜率取值也不同，從而可形成一些不同的S形曲線；因此可依式(2)擬合某些S形曲線。不過此式中y的值域總是區間(0，1)，且以y=0及y=1為其漸近線^[1] 。

Logistic分佈多元logistic函數

更一般的logistic函數為多元的(設為m元)

其中

皆為m+1維向量，

為參數向量，

，

到

則分別為變量

所可取的值，這些變量可以是連續的也可以是離散的。這個函數在不同條件下，或經不同的變換，可應用於不同的統計分析問題^[1] 。

在研究來自同一總體的兩個變量(設為X和Y)間的關係時，採得容量為n的樣本

。畫出這組數據的散點圖，如曲線接近S形，可試用logistic曲線去擬合它。

Logistic分佈Logistic迴歸模型

模型概念

Logistic迴歸模型是分析二分類型變量時常用的非線性統計模型，是最重要且應用最廣泛的非線性模型之一。該模型的因變量為二分類變量(y=0或y=1)，結果變量與自變量間是非線性關係。形式如方程(1)：

指事件發生的概率，取0～1^[1] 。

模型優缺點

優點：

第一，對變量要求低，可以接受非正態分佈的數據；

第二，總體預測準確率較高；

第三，數據來源直接，操作簡便；

第四，判斷標準明確；

第五，模型穩定，利於推廣創新。

缺點：

第一，大多數時候對ST企業預測準確率較低；

第二，P值臨界點的選擇影響模型預測結果；

第三，違約樣本與正常樣本的比例影響預測結果^[1] 。

模型原理

模型構造的原理簡單來説是運用對數運算將事件發生與否(即事件發生概率

或1)與自變量x間的非線性關係轉化為線性關係。以單一自變量為例，具體轉化步驟如下：

第一步，將上述Logistic模型方程(1)轉化為如下一個非線性方程(2)。

第二步，方程(2)化簡轉化為如下方程(3)。

第三步，方程(3)等式兩邊同時取對數轉化為如下方程(4)。

模型(4)得出

與x間的線性關係方程。

此時，

與

雖然不存在線性關係，但是關於P的函數記作logistic(P_i)與

存在線性關係。同理，自變量可拓展為m個，則有如下模型方程(5)。

以上得到的模型同樣可以用來預測事件的發生。預測時根據已知自變量與模型方程得出

，可以進一步計算事件發生的概率P。P處於0與1之間，越接近1表示發生的概率越大^[1] 。

模型基本假設

第一，數據必須來自隨機樣本；

第二，

為m個自變量

的函數；

第三，

或1；

第四，自變量不需要呈正態分佈^[1] 。

模型應用步驟

第一步，選取樣本、確定初始指標；

第二步，篩選指標；

運用SPSS軟件對所有指標進行Kolmogorov-Smirnov正態分佈檢驗。符合正態分佈的指標進行顯著性T檢驗，不符合正態分佈的數據進行Mann-Whitney顯著性檢驗，去除不顯著指標。進行Pearson檢驗，去除與其他指標存在高度相關性的指標。進行多重共線性檢驗，去除與其他指標存在多重共線性的指標；

第三步，進行KMO檢驗，確定是否進行因子分析；

第四步，進行Logistic迴歸，得到模型，觀察模型擬合程度及預測準確率；

第五步，用檢驗樣本檢驗模型預測能力；

第六步，利用模型預測事件的發生概率^[1] 。

模型參數解釋

當參數b大於0時，自變量x增大，

減小，

增大；

當參數b小於0時，自變量x增大，

增大，

減小；

當參數b等於0時，自變量x增加對

無影響，

不變。

因此，模型參量係數可以反映自變量x與事件發生概率P的關係。係數為正表明自變量x的增長促進事件的發生，係數為負表明自變量x的增長抑制事件的發生^[1] 。

參考資料

1. 苑錫光等．以電子計算機為工具的：醫用統計分析：四川科學技術出版社，1985年12月第1版：第178頁
2. 謝邦昌，朱建平，王小燕．EXCEL在大數據挖掘中的應用=THE APPLICATION OT EXCEL IN BIG DATA MINING：廈門大學出版社，2016.05：第157頁

Logistic分佈的概述圖

Logistic分佈的概述圖（1張）

詞條統計

瀏覽次數：次
編輯次數：8次歷史版本
最近更新：衣尊堂（2023-05-14）

1 基本介紹: 1.1 定義一; 1.2 定義二
2 一元logistic函數
3 多元logistic函數
4 Logistic迴歸模型

百科協議隱私協議意見反饋

清除歷史記錄關閉