生信入門書籍推薦系列一

最近也分享了一些教程給大家,分享了如何用已有的流程進(jìn)行分析,相信這些流程可以幫大家在干實(shí)驗(yàn)分析上起到一定的幫助。然而,考慮到許多讀者可能是濕實(shí)驗(yàn)出身,沒有計(jì)算機(jī)方面的知識(shí),僅分享教程可能并不能完全達(dá)到一個(gè)理想的效果,并且讀者本身可能也對(duì)計(jì)算機(jī)較為感興趣,想在這方面深入了解。因此,這一期作為書籍推薦,分別為《鳥哥的linux私房菜》、《python學(xué)習(xí)手冊(cè)》、《R語言實(shí)戰(zhàn)》、《機(jī)器學(xué)習(xí)實(shí)戰(zhàn)》、《深度學(xué)習(xí)》、《Lewin?基因X》。如果讀者都已經(jīng)讀過的話,那么可以自動(dòng)過濾掉余下的內(nèi)容,如果沒有讀過的話,讀者也可以根據(jù)自己的需要進(jìn)行了解,。所推薦的書籍都是自己曾經(jīng)翻過的,不屬于那種從網(wǎng)上照搬的,雖然不能說一定有用,但是至少可以幫大家避雷吧!
一?書籍推薦
對(duì)于一本書的了解而言,作者說第二,那么應(yīng)該很少有人說第一吧。所以下面每本書的介紹都會(huì)包含兩個(gè)部分,一個(gè)是作者在書籍中的導(dǎo)讀介紹,另一個(gè)則是本人的閱讀感受。當(dāng)然,本人的閱讀感受不代表所有人,也不代表希望讀書的你在讀完這本書能夠相同的閱讀感受,所以還是需要大家自行判定,按需了解吧。另外,考慮到很多讀者太長不看的原則,每本書的優(yōu)點(diǎn)我也有重點(diǎn)標(biāo)注了,大家可以快速閱讀。

作者導(dǎo)讀節(jié)選:Linux的基礎(chǔ)知識(shí)在各大主流Linux安裝版本中基本相同,如賬號(hào)管理、硬盤文件格式、數(shù)據(jù)管理與核心編譯等。本書深入淺出地介紹了Linux操作系統(tǒng)的基本原理與架構(gòu),適合當(dāng)前所有主流Linux版本的學(xué)習(xí)。全書共分5大篇。第1篇主要介紹Linux操作系統(tǒng)的規(guī)劃與安裝;第2篇介紹Linux的基本文件權(quán)限與系統(tǒng)架構(gòu);第3篇介紹非常重要的Shell與Shellscripts的基本內(nèi)容,這是所有以文字界面操控主機(jī)的基礎(chǔ);第4篇著重介紹Linux用戶管理,包括賬號(hào)管理、磁盤配額與用戶的例行性工作流程介紹等;第5篇注重于Linux系統(tǒng)管理,如套件管理員RPM與Tarball、核心的重新編譯、開關(guān)機(jī)與多重啟動(dòng)的設(shè)定技巧、系統(tǒng)登錄文件的分析,以及X-Window的基本設(shè)定的網(wǎng)絡(luò)參數(shù)設(shè)定細(xì)節(jié)。
推薦理由:對(duì)筆者而言,本書堪稱linux的入門書籍吧。那是剛接觸linux,筆者覺得特別新奇,覺得除了windows外竟然還有第二種操作系統(tǒng)(原諒當(dāng)時(shí)筆者的才疏學(xué)淺,那時(shí)剛剛生物信息)。而且,這個(gè)系統(tǒng)全是黑窗,看起來很高級(jí)的樣子,但是苦于沒有l(wèi)inux的操作經(jīng)驗(yàn)。然而,大部分的服務(wù)器都采用的linux操作系統(tǒng),如果不會(huì),則沒有辦法進(jìn)行數(shù)據(jù)分析,因此筆者也花了挺久把這本書啃下來了。當(dāng)然,現(xiàn)在看起來,這本書能夠提供的知識(shí)對(duì)于生信小白而言,是非常友好的,可以快速入門Linux進(jìn)行數(shù)據(jù)分析。然而,筆者也認(rèn)為如果能在windows條件下完成數(shù)據(jù)分析則最好,比較黑窗操作很多時(shí)間還是不夠太直觀。也有人說ubtuntu等許多l(xiāng)inux系統(tǒng)有操作界面啊,但是這些操作系統(tǒng)不兼容windows下的許多軟件如office(重點(diǎn))等,非常影響筆者的辦公效率。所以,讀者開發(fā)了兩個(gè)小軟件Multi-omics Hammer軟件和Multi-omics Visual軟件,可以將一些需要linux黑窗操作的任務(wù)以windows下java軟件運(yùn)行的方式解決,讀者可以嘗試一下(順便給筆者的軟件做一個(gè)推廣)。

作者導(dǎo)讀節(jié)選:數(shù)據(jù)時(shí)代已經(jīng)到來,但數(shù)據(jù)分析、數(shù)據(jù)挖掘人才卻十分短缺。由于“大數(shù)據(jù)”對(duì)每個(gè)領(lǐng)域的決定性影響,相對(duì)于經(jīng)驗(yàn)和直覺,在商業(yè)、經(jīng)濟(jì)及其他領(lǐng)域中基于數(shù)據(jù)和分析去發(fā)現(xiàn)問題并作出科學(xué)、客觀的決策越來越重要。開源軟件R是世界上最流行的數(shù)據(jù)分析、統(tǒng)計(jì)計(jì)算及制圖語言,幾乎能夠完成任何數(shù)據(jù)處理任務(wù),可安裝并運(yùn)行于所有主流平臺(tái),為我們提供了成千上萬的專業(yè)模塊和實(shí)用工具,是從大數(shù)據(jù)中獲取有用信息的絕佳工具。本書從解決實(shí)際問題入手,盡量跳脫統(tǒng)計(jì)學(xué)的理論闡述來討論R語言及其應(yīng)用,講解清晰透澈,極具實(shí)用性。作者不僅高度概括了R語言的強(qiáng)大功能、展示了各種實(shí)用的統(tǒng)計(jì)示例,而且對(duì)于難以用傳統(tǒng)方法分析的凌亂、不完整和非正態(tài)的數(shù)據(jù)也給出了完備的處理方法。通讀本書,你將全面掌握使用R語言進(jìn)行數(shù)據(jù)分析、數(shù)據(jù)挖掘的技巧,并領(lǐng)略大量探索和展示數(shù)據(jù)的圖形功能,從而更加高效地進(jìn)行分析與溝通。想要成為倍受高科技企業(yè)追捧的、炙手可熱的數(shù)據(jù)分析師嗎?想要科學(xué)分析數(shù)據(jù)并正確決策嗎?不妨從本書開始,挑戰(zhàn)大數(shù)據(jù),用R開始炫酷的數(shù)據(jù)統(tǒng)計(jì)與分析吧!
推薦理由:對(duì)筆者而言,本書是筆者接觸的第二個(gè)編程語言(第一個(gè)為perl,大家應(yīng)該都懂)。當(dāng)時(shí)就很驚訝于R語言的生態(tài)環(huán)境。眾多的統(tǒng)計(jì)學(xué)家提供了各種各樣的分析和繪圖供大家直接調(diào)用,包括但不限于edgeR、Deseq、wgcnag、ggplot等等。也正是因?yàn)檫@些包,使得R語言在生物信息中的作用越來越大,以至于不懂R,可能在許多生信流程中都會(huì)變得異常困難。因此,對(duì)于想要入門生物信息的讀者而言,學(xué)習(xí)R或許會(huì)是一個(gè)非常不錯(cuò)的開頭。

作者導(dǎo)讀節(jié)選:如果你想動(dòng)手編寫高效、高質(zhì)量并且很容易與其他語言和工具集成的代碼,本書將快速地幫助你利用Python提高效率。本書基于Python專家的流程培訓(xùn)課程編寫,內(nèi)容通俗易懂。本書包含很多注釋的例子和插圖,以幫助你開始使用Python2.7和3.3。每章都包含關(guān)于Python語言的重要組成部分的一節(jié)課。
推薦理由:對(duì)筆者而言,本書堪稱python學(xué)習(xí)的入門書籍吧,當(dāng)時(shí)應(yīng)該也是零零散散花了一個(gè)月的時(shí)間去閱讀吧??赡苁且?yàn)楣P者在學(xué)習(xí)python前曾自學(xué)過R、java和perl,所以本書并沒有什么難度,只能是說作為其他語言編程習(xí)慣的一個(gè)更改吧,所以說當(dāng)時(shí)讀完基本就能快速上手了。

作者導(dǎo)讀節(jié)選:機(jī)器學(xué)習(xí)是計(jì)算機(jī)科學(xué)與人工智能的重要分支領(lǐng)域. 本書作為該領(lǐng)域的入門教材,在內(nèi)容上盡可能涵蓋機(jī)器學(xué)習(xí)基礎(chǔ)知識(shí)的各方面。為了使盡可能多的讀者通過本書對(duì)機(jī)器學(xué)習(xí)有所了解, 作者試圖盡可能少地使用數(shù)學(xué)知識(shí). 然而, 少量的概率、統(tǒng)計(jì)、代數(shù)、優(yōu)化、邏輯知識(shí)似乎不可避免. 因此, 本書更適合大學(xué)三年級(jí)以上的理工科本科生和研究生, 以及具有類似背景的對(duì)機(jī)器學(xué)習(xí)感興趣的人士. 為方便讀者, 本書附錄給出了一些相關(guān)數(shù)學(xué)基礎(chǔ)知識(shí)簡介.
推薦理由:機(jī)器學(xué)習(xí)應(yīng)該是當(dāng)下生物信息方面比較火的一個(gè)方向吧。先如今許多算法的設(shè)計(jì)都繞不開這個(gè)話題。對(duì)于想要徹底入門生信的讀者而言,這本書應(yīng)該還是能夠起到非常重要的作用的。這本書有許多的數(shù)學(xué)公式,比較難以理解,建議沒有數(shù)學(xué)背景的讀者第一遍先從整體進(jìn)行了解,忽略數(shù)學(xué)公式。隨后等到自己的經(jīng)驗(yàn)和數(shù)學(xué)功底漸漸起來之后再去理解書中的公式。

作者導(dǎo)讀節(jié)選:《深度學(xué)習(xí)》由全球知名的三位專家Ian Goodfellow、Yoshua Bengio 和Aaron Courville撰寫,是深度學(xué)習(xí)領(lǐng)域奠基性的經(jīng)典教材。全書的內(nèi)容包括3個(gè)部分:第1部分介紹基本的數(shù)學(xué)工具和機(jī)器學(xué)習(xí)的概念,它們是深度學(xué)習(xí)的預(yù)備知識(shí);第2部分系統(tǒng)深入地講解現(xiàn)今已成熟的深度學(xué)習(xí)方法和技術(shù);第3部分討論某些具有前瞻性的方向和想法,它們被公認(rèn)為是深度學(xué)習(xí)未來的研究重點(diǎn)。《深度學(xué)習(xí)》適合各類讀者閱讀,包括相關(guān)專業(yè)的大學(xué)生或研究生,以及不具有機(jī)器學(xué)習(xí)或統(tǒng)計(jì)背景、但是想要快速補(bǔ)充深度學(xué)習(xí)知識(shí),以便在實(shí)際產(chǎn)品或平臺(tái)中應(yīng)用的軟件工程師。
推薦理由:深度學(xué)習(xí)應(yīng)該是當(dāng)下生物信息方面比較火的一個(gè)方向吧。近些年,大家應(yīng)該都被AlphaGo、AlphaFold和AlphaCode刷屏過吧。其實(shí),這些技術(shù)的實(shí)現(xiàn)背后都有深度學(xué)習(xí)的影子。不過這些技術(shù)對(duì)于非科班出身的筆者而言,也過于艱澀難懂。然而,讀者或許可以通過閱讀其中的一些章節(jié),對(duì)深度學(xué)習(xí)的現(xiàn)狀有一個(gè)基本的了解。

作者導(dǎo)讀節(jié)選:《Lewin 基因X(中文版)》對(duì)分子生物學(xué)和分子遺傳學(xué)進(jìn)行了精彩的論述,內(nèi)容涵蓋了基因的結(jié)構(gòu)、序列、組織和表達(dá)。21位科學(xué)家編寫和修正了其各自領(lǐng)域的相關(guān)內(nèi)容,使得本書成為相關(guān)領(lǐng)域當(dāng)今最新穎、全面的參考書。其中大部分修訂和重新編排是基于Lewin的《基因精要》第二版,并在內(nèi)容上額外增加了一些新的章節(jié),結(jié)構(gòu)也進(jìn)行了一些調(diào)整,使得全書各個(gè)主題在排列上更加富有邏輯性。許多章節(jié)也重新命名,以便更好地體現(xiàn)它們包含的內(nèi)容
推薦理由:生物信息,生物信息,光會(huì)計(jì)算機(jī)怎么能算生物信息呢。所以這里就推薦了一本生物學(xué)的書籍。相信很多人應(yīng)該和筆者是一樣的,無論是在學(xué)習(xí)當(dāng)中還是在實(shí)驗(yàn)過程中(不錯(cuò),筆者在整個(gè)求學(xué)生涯的大部分時(shí)間都是一個(gè)濕實(shí)驗(yàn)人員),常常處于一種似懂非懂的情形。雖然是生物學(xué)出身,但是對(duì)于很多信息的了解也都是支離破碎的,特別是讀了研究生和博士之后,感覺知識(shí)體系愈加的破碎,因此想要尋找一本書可以將整個(gè)系統(tǒng)建立起來。幸運(yùn)的是,這本書就來到了筆者眼前。筆者在讀完這本書之后的確能夠?qū)⒅皩W(xué)習(xí)到的許多知識(shí)點(diǎn)串聯(lián)起來,構(gòu)建完整的知識(shí)體系。
二?慣例小結(jié)
雖然,讀文獻(xiàn)做實(shí)驗(yàn)也能夠獲得許多知識(shí),但是這些知識(shí)都非常的零散。而一本書實(shí)際上是將一個(gè)方向的知識(shí)進(jìn)行整合以方便大眾學(xué)習(xí),這種方式可以快速將我們已有的零散知識(shí)進(jìn)行整理,或許能夠在較短時(shí)間內(nèi)完成一個(gè)明顯的提升(因人而異)。筆者在上面所提到的書籍都是在生信開發(fā)過程中給了筆者非常多的助益,即使在筆者自身也覺得其中許多知識(shí)并未完全的消化的情況下。不過,這不是也正說明這些書的價(jià)值嗎?
本公眾號(hào)開發(fā)的相關(guān)軟件,Multi-omics Hammer軟件和Multi-omics Visual軟件歡迎大家使用。文末是本公眾號(hào)在其他平臺(tái)的賬戶,也歡迎大家關(guān)注并多提意見。
簡書:WJ的生信小院
公眾號(hào):生信小院
博客園:生信小院
最后,也歡迎各位大佬能夠在本平臺(tái)上:1傳播和講解自己發(fā)表的論文;2:發(fā)表對(duì)某一科研領(lǐng)域的看法;3:想要達(dá)成的合作或者相應(yīng)的招聘信息;4:展示自己以尋找博后工作或者博士就讀的機(jī)會(huì);5:博導(dǎo)提供博后工作或者博士攻讀機(jī)會(huì),都可以后臺(tái)給筆者留言。希望本平臺(tái)在進(jìn)行生信知識(shí)分享的同時(shí),能夠成為生信分析者的交流平臺(tái),能夠?qū)崿F(xiàn)相應(yīng)的利益互補(bǔ)和雙贏(不一定能實(shí)現(xiàn),但是夢(mèng)想總得是有的吧)。
另外,怎么說呢,投幣也可,不強(qiáng)求,但奢求。


