logit回歸和線性回歸區(qū)別
一、二者說明
1.線性回歸
線性回歸作為統(tǒng)計(jì)學(xué)領(lǐng)域的一個(gè)重要的方法,主要被應(yīng)用于描述自變量與因變量之間的關(guān)系,一般分為一元線性回歸以及多元線性回歸分析,一元線性回歸分析就是指因變量和一個(gè)自變量之間的關(guān)系,多元線性回歸分析因變量和兩個(gè)或者兩個(gè)以上自變量之間的關(guān)系,線性回歸的一般表示形式如下:
其中y為因變量,x1…xk為k個(gè)自變量。
相互獨(dú)立? ? ?
2.Logistic回歸
Logistic(邏輯)回歸是一種監(jiān)督式學(xué)習(xí)的分類回歸算法,本質(zhì)上與線性回歸同屬于廣義線性模型,在logistic回歸中可以直接預(yù)測(cè)觀測(cè)相對(duì)于某一事件的發(fā)生概率。其中l(wèi)ogistic回歸分析一般包括二元logistic回歸分析、多分類logistic回歸分析以及有序logistic回歸分析。三者區(qū)別如下:
二、二者區(qū)別
線性回歸分析和logistic回歸有什么區(qū)別呢?以下從數(shù)據(jù)類型、前提條件、分析和應(yīng)用場(chǎng)景四個(gè)方面進(jìn)行說明。
1.數(shù)據(jù)類型不同
線性回歸要求因變量為定量變量而logistic回歸要求因變量為分類變量,如果是二元logistic回歸分析因變量要求是二分類變量,并且只能為0和1,比如是否購(gòu)買,1代表是,2代表否,多分類logistic回歸分析,因變量要求是分類變量且無序,比如“踢足球”、“打籃球”以及“打羽毛球”等等,有序logistic回歸分析因變量要求是分類變量且有序,比如“不愿意”、“愿意”、“非常愿意”等等。
2.前提條件不同
線性回歸要求因變量服從正態(tài)分布,但是logistic回歸沒有要求,并且線性回歸要求自變量和因變量呈現(xiàn)線性關(guān)系,而logistic回歸沒有要求自變量和因變量呈線性關(guān)系。
3.分析關(guān)系不同
線性回歸是分析整個(gè)因變臉與自變量之間的關(guān)系,但是logistic回歸是分析因變量取某個(gè)值的概率與自變量之間的關(guān)系。比如二元logistic回歸分析,最后分析因變量為1的概率與自變量之間的關(guān)系。
4.應(yīng)用場(chǎng)景不同
線性回歸分析和logistic回歸分析因變量不同所以導(dǎo)致二者應(yīng)用也不同,在實(shí)際生活中,線性回歸一般用于數(shù)量統(tǒng)計(jì)方法的基礎(chǔ),常常用于對(duì)定量數(shù)據(jù)的預(yù)測(cè),比如用于預(yù)測(cè)房?jī)r(jià),logistic回歸分析更適合預(yù)測(cè)分類問題,比如預(yù)測(cè)某件事情的發(fā)生,預(yù)測(cè)貸款是否違約等等,線性回歸一般還可以解決線性問題,logistic回歸可以解決非線性問題。
三、二者操作
線性回歸分析
操作路徑:通用方法→線性回歸
Logistic回歸分析
操作路徑:進(jìn)階方法→二元logit/多分類logit/有序logit
四、分析案例
1.線性回歸分析
https://zhuanlan.zhihu.com/p/608170831
2.Logistic回歸分析
以二元logit回歸舉例進(jìn)行說明。
二元logistic回歸分析全流程分析 - 知乎 (zhihu.com)
五、總結(jié)
本篇文章主要講述了線性回歸和logistic回歸,包括二者說明,二者區(qū)別,如何操作,以及分析案例四個(gè)方面,其中發(fā)現(xiàn)二者的數(shù)據(jù)類型不同、前提條件不同,分析關(guān)系不同以及應(yīng)用場(chǎng)景不同。歡迎補(bǔ)充。