算法淺談之邏輯斯蒂回歸

一 起因
邏輯回歸是一種統(tǒng)計(jì)方法,用于分析一組自變量與二元因變量之間的關(guān)系。?該方法的目的是根據(jù)輸入變量的值找到能夠描述特定結(jié)果概率的最佳擬合模型。這個(gè)方法可以用于天氣預(yù)測(cè),疾病預(yù)測(cè)等方面(雖然預(yù)測(cè)能力有限)。
二?正文2.1 算法解析
邏輯回歸是一種分類(lèi)算法,可以簡(jiǎn)單分為四步
首先,根據(jù)訓(xùn)練數(shù)據(jù)建立回歸公式。
隨后,利用回歸公式將輸入變量轉(zhuǎn)換為特定值。
接著,通過(guò)邏輯函數(shù)(也稱(chēng)為 sigmoid 函數(shù))將特定值映射到 0 到 1 之間的概率值。
最后,通過(guò)概率值估計(jì)該變量分屬于兩個(gè)類(lèi)別之一的概率(例如,通過(guò)/失敗、是/否等)。
2.2 算法優(yōu)點(diǎn)
邏輯回歸的優(yōu)點(diǎn)之一是簡(jiǎn)單易行。它的輸出可以用有意義的方式解釋為屬于某個(gè)類(lèi)別的概率。?另外,邏輯回歸還可以處理定量和定性輸入變量。
2.3?算法缺點(diǎn)
然而,邏輯回歸有一些局限性。
主要缺點(diǎn)之一是它假設(shè)輸入變量與優(yōu)勢(shì)比的對(duì)數(shù)之間存在線(xiàn)性關(guān)系。如果輸入變量和結(jié)果變量之間存在非線(xiàn)性或者非常復(fù)雜的關(guān)系,邏輯斯蒂回歸也達(dá)不到較好的效果。?
主要缺點(diǎn)之二,對(duì)于高度相關(guān)的輸入變量或結(jié)果變量中存在罕見(jiàn)事件(即不平衡類(lèi)別),邏輯回歸可能表現(xiàn)不佳。
2.4?算法可視化

三?慣例小結(jié)
總體而言,邏輯回歸是解決二元分類(lèi)問(wèn)題的有用工具,尤其是當(dāng)輸入變量與結(jié)果變量具有線(xiàn)性關(guān)系時(shí)。?但是呢,這類(lèi)算法能夠解決的問(wèn)題非常有限,因此,不適于復(fù)雜問(wèn)題的分析。
四 公眾號(hào)其他資源(方便讀者使用)
本公眾號(hào)開(kāi)發(fā)的相關(guān)軟件,Multi-omics Hammer軟件和Multi-omics Visual軟件歡迎大家使用。
Multi-omics Hammer軟件下載地址:
https://github.com/wangjun258/Multi-omics-Hammer
Multi-omics Visual軟件下載地址:https://github.com/wangjun258/Multi_omics_Visual/releases/tag/Multi_omics_Visual_v1.03
PS:因?yàn)楸拒浖怯胮ython腳本撰寫(xiě),調(diào)用了部分依賴(lài)包,用戶(hù)首次使用需要安裝python以及對(duì)應(yīng)的包,安裝之后便可永久使用。
下面是本號(hào)在其他平臺(tái)的賬戶(hù),也歡迎大家關(guān)注并多提意見(jiàn)。
簡(jiǎn)書(shū):WJ的生信小院
公眾號(hào):生信小院
博客園:生信小院
最后,也歡迎各位大佬能夠在本平臺(tái)上:1傳播和講解自己發(fā)表的論文;2:發(fā)表對(duì)某一科研領(lǐng)域的看法;3:想要達(dá)成的合作或者相應(yīng)的招聘信息;4:展示自己以尋找博后工作或者博士就讀的機(jī)會(huì);5:博導(dǎo)提供博后工作或者博士攻讀機(jī)會(huì),都可以后臺(tái)給筆者留言。希望本平臺(tái)在進(jìn)行生信知識(shí)分享的同時(shí),能夠成為生信分析者的交流平臺(tái),能夠?qū)崿F(xiàn)相應(yīng)的利益互補(bǔ)和雙贏(不一定能實(shí)現(xiàn),但是夢(mèng)想總得是有的吧)。?
五 封面圖?
