華為程序員總結(jié):C/C++的陷阱與套路,當(dāng)年就是折在這些地兒…
本文結(jié)合作者的工作經(jīng)驗和學(xué)習(xí)心得,對C++語言的一些高級特性,做了簡單介紹;對一些常見的誤解,做了解釋澄清;對比較容易犯錯的地方,做了歸納總結(jié);希望借此能增進大家對C++語言了解,減少編程出錯,提升工作效率。
一、導(dǎo)語
C++是一門被廣泛使用的系統(tǒng)級編程語言,更是高性能后端標(biāo)準(zhǔn)開發(fā)語言;C++雖功能強大,靈活巧妙,但卻屬于易學(xué)難精的專家型語言,不僅新手難以駕馭,就是老司機也容易掉進各種陷阱。
本文結(jié)合作者的工作經(jīng)驗和學(xué)習(xí)心得,對C++語言的一些高級特性,做了簡單介紹;對一些常見的誤解,做了解釋澄清;對比較容易犯錯的地方,做了歸納總結(jié);希望借此能增進大家對C++語言了解,減少編程出錯,提升工作效率。

二、陷阱
我的程序里用了全局變量,為何進程退出會莫名其妙的core掉?
Rule:C++在不同模塊(源文件)里定義的全局變量,不保證構(gòu)造順序;但保證在同一模塊(源文件)里定義的全局變量,按定義的先后順序構(gòu)造,按定義的相反次序析構(gòu)。
我們程序在a.cpp里定義了依次全局變量X和Y;
按照規(guī)則:X先構(gòu)造,Y后構(gòu)造;進程停止執(zhí)行的時候,Y先析構(gòu),X后析構(gòu);但如果X的析構(gòu)依賴于Y,那么core的事情就有可能發(fā)生。
結(jié)論:如果全局變量有依賴關(guān)系,那么就把它們放在同一個源文件定義,且按正確的順序定義,確保依賴關(guān)系正確,而不是定義在不同源文件;對于系統(tǒng)中的單件,單件依賴也要注意這個問題。
std::sort()的比較函數(shù)有很強的約束,不能亂來
相信工作5年以上至少50%的C/C++程序員都被它坑過,我已經(jīng)聽到過了無數(shù)個悲傷的故事,《圣斗士星矢》,《仙劍》,還有別人家的項目《天天愛消除》,都有人掉坑,程序運行幾天莫名奇妙的Crash掉,一臉懵逼。
如果要用,要自己提供比較函數(shù)或者函數(shù)對象,一定搞清楚什么叫“嚴(yán)格弱排序”,一定要滿足以下3個特性:
非自反性
非對稱性
傳遞性
盡量對索引或者指針sort,而不是針對對象本身,因為如果對象比較大,交換(復(fù)制)對象比交換指針或索引更耗費。
注意操作符短路
考慮游戲玩家回血回藍(魔法)刷新給客戶端的邏輯。玩家每3秒回一點血,玩家每5秒回一點藍,回藍回血共用一個協(xié)議通知客戶端,也就是說只要有回血或者回藍就要把新的血量和魔法值通知客戶端。
玩家的心跳函數(shù)heartbeat()在主邏輯線程被循環(huán)調(diào)用

如果GenHP回血了,就返回true,否則false;不一定每次調(diào)用GenHP都會回血,取決于是否達到3秒間隔。
如果GenMP回藍了,就返回true,否則false;不一定每次調(diào)用GenMP都會回血,取決于是否達到5秒間隔。
實際運行發(fā)現(xiàn)回血回藍邏輯不對,Word麻,原來是操作符短路了,如果GenHP()返回true了,那GenMP()就不會被調(diào)用,就有可能失去回藍的機會。你需要修改程序如下:

邏輯與(&&)跟邏輯或(||)有同樣的問題, if (a && b) 如果a的表達式求值為false,b表達式也不會被計算。
有時候,我們會寫出 if (ptr != nullptr && ptr->Do())這樣的代碼,這正是利用了操作符短路的語法特征。
別讓循環(huán)停不下來

程序跑到這,WTF?根本停不下來???問題很簡單,unsigned永遠>=0,是不是心中一萬只馬奔騰?
解決這個問題很簡單,但是有時候這一類的錯誤卻沒這么明顯,你需要罩子放亮點。
內(nèi)存拷貝小心內(nèi)存越界
memcpy,memset有很強的限制,僅能用于POD結(jié)構(gòu),不能作用于stl容器或者帶有虛函數(shù)的類。
帶虛函數(shù)的類對象會有一個虛函數(shù)表的指針,memcpy將破壞該指針指向。
對非POD執(zhí)行memset/memcpy,免費送你四個字:自求多福
注意內(nèi)存重疊
內(nèi)存拷貝的時候,如果src和dst有重疊,需要用memmov替代memcpy。
理解user stack空間很有限
不能在棧上定義過大的臨時對象。一般而言,用戶棧只有幾兆(典型大小是4M,8M),所以棧上創(chuàng)建的對象不能太大。
用sprintf格式化字符串的時候,類型和符號要嚴(yán)格匹配
因為sprintf的函數(shù)實現(xiàn)里是按格式化串從棧上取參數(shù),任何不一致,都有可能引起不可預(yù)知的錯誤; /usr/include/inttypes.h里定義了跨平臺的格式化符號,比如PRId64用于格式化int64_t
用c標(biāo)準(zhǔn)庫的安全版本(帶n標(biāo)識)替換非安全版本
比如用strncpy替代strcpy,用snprintf替代sprintf,用strncat代替strcat,用strncmp代替strcmp,memcpy(dst, src, n)要確保[dst,dst+n]和[src, src+n]都有有效的虛擬內(nèi)存地址空間。多線程環(huán)境下,要用系統(tǒng)調(diào)用或者庫函數(shù)的安全版本代替非安全版本(_r版本),謹(jǐn)記strtok,gmtime等標(biāo)準(zhǔn)c函數(shù)都不是線程安全的。
STL容器的遍歷刪除要小心迭代器失效
vector,list,map,set等各有不同的寫法:

有時候遍歷刪除的邏輯不是這么明顯,可能循環(huán)里調(diào)了另一個函數(shù),而該函數(shù)在某種特定的情況下才會刪除當(dāng)前元素,這樣的話,就是很長一段時間,程序都運行得好好的,而當(dāng)你正跟別人談笑風(fēng)生的時候,忽然crash,這就尷尬了。
圣斗士星矢項目曾經(jīng)遭遇過這個問題,基本規(guī)律是一個禮拜game server crash一次,折磨團隊將近一個月。
比較low的處理方式可以把待刪元素放到另一個容器WaitEraseContainer里保存下來,再走一趟單獨的循環(huán),刪除待刪元素。
當(dāng)然,我們推薦在遍歷的同時刪除,因為這樣效率更高,也顯得行家里手。
三、性能
空間換取時間
通過空間換取時間是提高性能的慣用法,bitmap,int map[]這些慣用法要了然于胸。
減少拷貝 & COW
了解Copy On Write。
只要可能就應(yīng)該減少拷貝,比如通過共享,比如通過引用指針的形式傳遞參數(shù)和返回值。
延遲計算和預(yù)計算
比如游戲服務(wù)器端玩家的戰(zhàn)力,由屬性a,b決定,也就是說屬性a,b任何一個變化,都需要重算戰(zhàn)力;但如果ModifyPropertyA(),ModifyPropertyB()之后,都重算戰(zhàn)力卻并非真正必要,因為修改屬性A之后有可能馬上修改B,兩次重算戰(zhàn)力,顯然第一次重算的結(jié)果會很快被第二次的重算覆蓋。
而且很多情況下,我們可能需要在心跳里,把最新的戰(zhàn)力值推送給客戶端,這樣的話,ModifyPropertyA(),ModifyPropertyB()里,我們其實只需要把戰(zhàn)力置臟,延遲計算,這樣就能避免不必要的計算。
在GetFightValue()里判斷FightValueDirtyFlag,如果臟,則重算,清臟標(biāo)記;如果不臟,直接返回之前計算的結(jié)果。
預(yù)計算的思想類似。
分散計算
分散計算是把任務(wù)分散,打碎,避免一次大計算量,卡住程序。
哈希
減少字符串比較,構(gòu)建hash,可能會多費一點存儲空間,但收益可觀,信我。
日志節(jié)制
日志的開銷不容忽視,要分級,可以把日志作為debug手段,但要release干凈。
編譯器為什么不給局部變量和成員變量做默認初始化
因為效率,C++被設(shè)計為系統(tǒng)級的編程語言,效率是優(yōu)先考慮的方向,c++秉持的一個設(shè)計哲學(xué)是“不為不必要的操作付出任何額外的代價”。所以它有別于java,不給成員變量和局部變量做默認初始化,如果需要賦初值,那就由程序員自己去保證。
結(jié)論:從安全的角度出發(fā),不應(yīng)使用未初始化的變量,定義變量的時候賦初值是一個好的習(xí)慣,很多錯誤皆因未正確初始化而起,C++11支持成員變量定義的時候直接初始化,成員變量盡量在成員初始化列表里初始化,且要按定義的順序初始化。
理解函數(shù)調(diào)用的性能開銷(棧幀建立和銷毀,參數(shù)傳遞,控制轉(zhuǎn)移),性能敏感函數(shù)考慮inline
X86_64體系結(jié)構(gòu)因為通用寄存器數(shù)目增加到16個,所以64位系統(tǒng)下參數(shù)數(shù)目不多的函數(shù)調(diào)用,將會由寄存器傳遞代替壓棧方式傳遞參數(shù),但棧幀建立、撤銷和控制轉(zhuǎn)移依然會對性能有所影響。
遞歸的優(yōu)點、缺點
雖然遞歸函數(shù)能簡化程序編寫,但也常常帶來運行速度變慢的問題,所以需要預(yù)估好遞歸深度,優(yōu)先考慮非遞歸實現(xiàn)版本。
遞歸函數(shù)要有退出條件且不能遞歸過深,不然有爆棧危險。
四、數(shù)據(jù)結(jié)構(gòu)和容器
了解std::vector的方方面面和底層實現(xiàn)
vector是動態(tài)擴容的,2的次方往上翻,為了確保數(shù)據(jù)保存在連續(xù)空間,每次擴充,會將原member悉數(shù)拷貝到新的內(nèi)存塊; 不要保存vector內(nèi)對象的指針,擴容會導(dǎo)致其失效 ;可以通過保存其下標(biāo)index替代。
運行過程中需要動態(tài)增刪的vector,不宜存放大的對象本身 ,因為擴容會導(dǎo)致所有成員拷貝構(gòu)造,消耗較大,可以通過保存對象指針替代。
resize()是重置大小;reserve()是預(yù)留空間,并未改變size(),可避免多次擴容; clear()并不會導(dǎo)致空間收縮 ,如果需要釋放空間,可以跟空的vector交換,std::vector .swap(v),c++11里shrink_to_fit()也能收縮內(nèi)存。
理解at()和operator[]的區(qū)別 :at()會做下標(biāo)越界檢查,operator[]提供數(shù)組索引級的訪問,在release版本下不會檢查下標(biāo),VC會在Debug版本會檢查;c++標(biāo)準(zhǔn)規(guī)定:operator[]不提供下標(biāo)安全性檢查。
C++標(biāo)準(zhǔn)規(guī)定了std::vector的底層用數(shù)組實現(xiàn),認清這一點并利用這一點。
常用數(shù)據(jù)結(jié)構(gòu)
數(shù)組:內(nèi)存連續(xù),隨機訪問,性能高,局部性好,不支持動態(tài)擴展,最常用。
鏈表:動態(tài)伸縮,脫離插入極快,特別是帶前后驅(qū)指針,內(nèi)存通常不連續(xù)(當(dāng)然可以通過從固定內(nèi)存池分配規(guī)避),不支持隨機訪問。
查找:3種:bst,hashtable,基于有序數(shù)組的bsearch。二叉搜索樹(RBTree),這個從begin到end有序,最壞查找速度logN,壞處內(nèi)存不連續(xù),節(jié)點有額外空間浪費;hashtable,好的hash函數(shù)不好選,搜索最壞退化成鏈表,難以估計捅數(shù)量,開大了浪費內(nèi)存,擴容會卡一下,無序;基于有序數(shù)組的bsearch,局部性好,insert/delete慢。

五、最佳實踐
對于在啟動時加載好,運行中不變化的查詢結(jié)構(gòu),可以考慮用sorted array替代map,hash表等
因為有序數(shù)組支持二分查找,效率跟map差不多。對于只需要在程序啟動的時候構(gòu)建(排序)一次的查詢結(jié)構(gòu),有序數(shù)組相比map和hash可能有更好的內(nèi)存命中性(局部命中性)。
運行過程中,穩(wěn)定的查詢結(jié)構(gòu)(比如配置表,需要根據(jù)id查找配置表項,運行過程中不增刪),有序數(shù)組是個不錯的選擇;如果不穩(wěn)定,則有序數(shù)組的插入刪除效率比map,hashtable差,所以選用有序數(shù)組需要注意適用場合。
std::map or std::unorder_map?
想清楚他們的利弊,map是用紅黑樹做的,unorder_map底層是hash表做的,hash表相對于紅黑樹有更高的查找性能。hash表的效率取決于hash算法和沖突解決方法(一般是拉鏈法,hash桶),以及數(shù)據(jù)分布,如果負載因子高,就會降低命中率,為了提高命中率,就需要擴容,重新hash,而重新hash是很慢的,相當(dāng)于卡一下。
而紅黑樹有更好的平均復(fù)雜度,所以如果數(shù)據(jù)量不是特別大,map是勝任的。
積極的使用const
理解const不僅僅是一種語法層面的保護機制,也會影響程序的編譯和運行。
const常量會被編碼到機器指令。
理解四種轉(zhuǎn)型的含義和區(qū)別
避免用錯,盡量少用向下轉(zhuǎn)型(可以通過設(shè)計加以改進)
static_cast, dynamic_cast,const_cast,reinterpret_cast,傻傻分不清?
C++磚家說:一句話,盡量少用轉(zhuǎn)型,強制類型轉(zhuǎn)換是C Style,如果你的C++代碼需要類型強轉(zhuǎn),你需要去考慮是否設(shè)計有問題。
理解字節(jié)對齊
字節(jié)對齊能讓存儲器訪問速度更快。
字節(jié)對齊跟cpu架構(gòu)相關(guān),有些cpu訪問特定類型的數(shù)據(jù)必須在一定地址對齊的儲存器位置,否則會觸發(fā)異常。
字節(jié)對齊的另一個影響是調(diào)整結(jié)構(gòu)體成員變量的定義順序,有可能減少結(jié)構(gòu)體大小,這在某些情況下,能節(jié)省內(nèi)存。
牢記3 rules和5 rules,當(dāng)然C++11又多了&&的copy ctor和op=版本
只在需要接管的時候才自定義operator=和copy constructor,如果編譯器提供的默認版本工作的很好,不要去自找麻煩,自定義的版本勿忘拷貝每一個成分,如果要接管就要處理好。
組合優(yōu)先于繼承,繼承是一種最強的類間關(guān)系
典型的適配器模式有類適配器和對象適配器,一般而言,建議用對象適配的方式,而非用基于繼承的類適配方式。
減少依賴,注意隔離
最大限度的減少文件間的依賴關(guān)系,用前向聲明拆解相互依賴。
了解pimpl技術(shù)。
頭文件要自給自足,不要圖省事all.h,不要包含不必要的頭文件,也不要把該包含的頭文件推給user去包含,一句話,頭文件包含要不多不少剛剛好。
嚴(yán)格配對
打開的句柄要關(guān)閉,加鎖/解鎖,new/delete,new[]/delete[],malloc/free要配對,可以使用RAII技術(shù)防止資源泄露,編寫符合規(guī)范的代碼
Valgrind對程序的內(nèi)存使用方式有期望,需要干凈的釋放,所以規(guī)范編程才能寫出valgrind干凈的代碼,不然再好的工具碰到不按規(guī)劃寫的代碼也是武功盡廢啊。
理解多繼承潛在的問題,慎用多繼承
多繼承會存在菱形繼承的問題,多個基類有相同成員變量會有問題,需要謹(jǐn)慎對待。
有多態(tài)用法抽象基類的析構(gòu)函數(shù)要加virtual關(guān)鍵字
主要是為了基類的析構(gòu)函數(shù)能得到正確的調(diào)用。
virtual dtor跟普通虛函數(shù)一樣,基類指針指向子類對象的時候,delete ptr,根據(jù)虛函數(shù)特征,如果析構(gòu)函數(shù)是普通函數(shù),那么就調(diào)用ptr顯式(基類)類型的析構(gòu)函數(shù);如果析構(gòu)函數(shù)是virtual,則會調(diào)用子類的析構(gòu)函數(shù),然后再調(diào)用基類析構(gòu)函數(shù)。
避免在構(gòu)造函數(shù)和析構(gòu)函數(shù)里調(diào)用虛函數(shù)
構(gòu)造函數(shù)里,對象并沒有完全構(gòu)建好,此時調(diào)用虛函數(shù)不一定能正確綁定,析構(gòu)亦如此。
從輸入流獲取數(shù)據(jù),要做好數(shù)據(jù)不夠的處理,要加try catch;沒有被吞咽的exception,會被傳播
從網(wǎng)絡(luò)數(shù)據(jù)流讀取數(shù)據(jù),從數(shù)據(jù)庫恢復(fù)數(shù)據(jù)都需要注意這個問題。
協(xié)議盡量不要傳float,如果傳float要了解NaN的概念,要做好檢查,避免惡意傳播
可以考慮用整數(shù)替代浮點,比如萬分之五(5%%),就保存5。
定義宏要遵循常規(guī)
要對每個變量加括弧,有時候需要加do {} while(0)或者{},以便能將一條宏當(dāng)成一個語句。要理解宏在預(yù)處理階段被替換,不用的時候要#undef,要防止污染別人的代碼。
了解智能指針和指針的誤用
理解基于引用計數(shù)法的智能指針實現(xiàn)方式,了解所有權(quán)轉(zhuǎn)移的概念,理解shared_ptr和unique_ptr的區(qū)別和適用場景
考慮用std::shared_ptr管理動態(tài)分配的對象。
指針能帶來彈性,但不要誤用,它的彈性指一方面它能在運行時改變指向,可以用來做多態(tài),另一方面對于不能固定大小的數(shù)組可以動態(tài)伸縮,但很多時候,我們對固定大小的array,也在init里new/malloc出來,其實沒必要,而且會多占用sizeof(void*)字節(jié),而且增加一層間接訪問。
size_t到底是個什么?我該用有符號還是無符號整數(shù)?
size_t類型是被設(shè)計來保存系統(tǒng)存儲器上能保存的對象的最大個數(shù)。
32位系統(tǒng),一個對象最小的單位是一個字節(jié),那2的32次方內(nèi)存,最多能保存的對象數(shù)目就是4G/1字節(jié),正好一個unsigned int能保存下來(typedef unsigned int size_t)。
同樣,64位系統(tǒng),unsigned long是8字節(jié),所以size_t就是unsigned long的類型別名。
對于像索引,位置這樣的變量,是用有符號還是無符號呢?像money這樣的屬性呢?
一句話:要講道理,用最自然,最順理成章的類型。比如索引不可能為負用size_t,賬戶可能欠錢,則money用int。比如:

標(biāo)準(zhǔn)庫給出了最好的示范,因為如果是有符號的話,你需要這樣判斷
if (index < 0 || index >= max_num) throw out_of_bound();
而如果是無符號整數(shù),你只需要判斷 if (index >= max_num),你認可嗎?
整型一般用int,long就很好,用short,char需要很謹(jǐn)慎,要防止溢出
整型包括int,short,long,long long和char,沒錯,char也是整型,float是實型。
絕大多數(shù)情況下,用int,long就很好,long一般等于機器字長,能直接放到寄存器,硬件處理起來速度也通常更快。
很多時候,我們希望用short,char達到減少結(jié)構(gòu)體大小的目的。但是由于字節(jié)對齊的原因,可能并不能真正減少大小,而且1,2個字節(jié)的整型位數(shù)太少,一不小心就溢出了,需要特別注意。
所以,除非在db、網(wǎng)絡(luò)這些對存儲大小非常敏感的場合,我們才需要考慮是否以short,char替代int,long。其他情況下,就相當(dāng)于為省電而不開樓道的燈,省不了多少錢卻冒著摔斷腿的危險。
局部變量更沒有必要用(unsigned) short,char等,棧是自動伸縮的,它既不節(jié)省空間,還危險,還慢。
六、擴展
了解c++高階特性
模板和泛型編程,union,bitfield,指向成員的指針,placement new,顯式析構(gòu),異常機制,nested class,local class,namespace,多繼承、虛繼承,volatile,extern "C"等
有些高級特性只有在特定情況下才會被用到,但技多不壓身,平時還是需要積累和了解,這樣在需求出現(xiàn)時,才能從自己的知識庫里拿出工具來對付它。
了解C++新標(biāo)準(zhǔn)
關(guān)注新技術(shù),c++11/14/17、lambda,右值引用,move語義,多線程庫等
c++98/03標(biāo)準(zhǔn)到c++11標(biāo)準(zhǔn)的推出歷經(jīng)13年,13年來程序設(shè)計語言的思想得到了很大的發(fā)展,c++11新標(biāo)準(zhǔn)吸收了很多其他語言的新特性,雖然c++11新標(biāo)準(zhǔn)主要是靠引入新的庫來支持新特征,核心語言的變化較少,但新標(biāo)準(zhǔn)還是引入了move語義等核心語法層面的修改,每個CPPer都應(yīng)該了解新標(biāo)準(zhǔn)。
OOD設(shè)計原則并不是胡扯
設(shè)計模式六大原則(1):單一職責(zé)原則
設(shè)計模式六大原則(2):里氏替換原則
設(shè)計模式六大原則(3):依賴倒置原則
設(shè)計模式六大原則(4):接口隔離原則
設(shè)計模式六大原則(5):迪米特法則
設(shè)計模式六大原則(6):開閉原則

熟悉常用設(shè)計模式,活學(xué)活用,不生搬硬套
神化設(shè)計模式和反設(shè)計模式,都不是科學(xué)的態(tài)度,設(shè)計模式是軟件設(shè)計的經(jīng)驗總結(jié),有一定的價值;GOF書上對每一個設(shè)計模式,都用專門的段落講它的應(yīng)用場景和適用性,限制和缺陷,在正確評估得失的情況下,是鼓勵使用的,但顯然,你首先需要準(zhǔn)確get到她。
以上為本次全部分享,希望對大家有幫助!避免常見陷阱與套路,提高編碼效率。
另外如果你想更好的提升你的編程能力,學(xué)好C語言C++編程!彎道超車,快人一步!
分享(源碼、項目實戰(zhàn)視頻、項目筆記,基礎(chǔ)入門教程)
歡迎轉(zhuǎn)行和學(xué)習(xí)編程的伙伴,利用更多的資料學(xué)習(xí)成長比自己琢磨更快哦!

另外,UP在主頁上傳了一些學(xué)習(xí)C/C++編程的視頻教程,有興趣或者正在學(xué)習(xí)的小伙伴一定要去看一看哦!會對你有幫助的~
編程學(xué)習(xí)書籍分享:

編程學(xué)習(xí)視頻分享:
