都說(shuō) HashMap 是線程不安全的,到底體現(xiàn)在哪兒?
?

前言:我們都知道HashMap是線程不安全的,在多線程環(huán)境中不建議使用,但是其線程不安全主要體現(xiàn)在什么地方呢,本文將對(duì)該問(wèn)題進(jìn)行解密。
1.jdk1.7中的HashMap
在jdk1.8中對(duì)HashMap做了很多優(yōu)化,這里先分析在jdk1.7中的問(wèn)題,相信大家都知道在jdk1.7多線程環(huán)境下HashMap容易出現(xiàn)死循環(huán),這里我們先用代碼來(lái)模擬出現(xiàn)死循環(huán)的情況:
public?class?HashMapTest?{
????public?static?void?main(String[]?args)?{
????????HashMapThread?thread0?=?new?HashMapThread();
????????HashMapThread?thread1?=?new?HashMapThread();
????????HashMapThread?thread2?=?new?HashMapThread();
????????HashMapThread?thread3?=?new?HashMapThread();
????????HashMapThread?thread4?=?new?HashMapThread();
????????thread0.start();
????????thread1.start();
????????thread2.start();
????????thread3.start();
????????thread4.start();
????}
}
class?HashMapThread?extends?Thread?{
????private?static?AtomicInteger?ai?=?new?AtomicInteger();
????private?static?Map<Integer,?Integer>?map?=?new?HashMap<>();
????@Override
????public?void?run()?{
????????while?(ai.get()?<?1000000)?{
????????????map.put(ai.get(),?ai.get());
????????????ai.incrementAndGet();
????????}
????}
}
上述代碼比較簡(jiǎn)單,就是開(kāi)多個(gè)線程不斷進(jìn)行put操作,并且HashMap與AtomicInteger都是全局共享的。在多運(yùn)行幾次該代碼后,出現(xiàn)如下死循環(huán)情形:

其中有幾次還會(huì)出現(xiàn)數(shù)組越界的情況:這里我們著重分析為什么會(huì)出現(xiàn)死循環(huán)的情況,通過(guò)jps和jstack命名查看死循環(huán)情況,結(jié)果如下:從堆棧信息中可以看到出現(xiàn)死循環(huán)的位置,通過(guò)該信息可明確知道死循環(huán)發(fā)生在HashMap的擴(kuò)容函數(shù)中,根源在transfer函數(shù)中,jdk1.7中HashMap的transfer函數(shù)如下:
void?transfer(Entry[]?newTable,?boolean?rehash)?{
????????int?newCapacity?=?newTable.length;
????????for?(Entry<K,V>?e?:?table)?{
????????????while(null?!=?e)?{
????????????????Entry<K,V>?next?=?e.next;
????????????????if?(rehash)?{
????????????????????e.hash?=?null?==?e.key???0?:?hash(e.key);
????????????????}
????????????????int?i?=?indexFor(e.hash,?newCapacity);
????????????????e.next?=?newTable[i];
????????????????newTable[i]?=?e;
????????????????e?=?next;
????????????}
????????}
????}
總結(jié)下該函數(shù)的主要作用:
在對(duì)table進(jìn)行擴(kuò)容到newTable后,需要將原來(lái)數(shù)據(jù)轉(zhuǎn)移到newTable中,注意10-12行代碼,這里可以看出在轉(zhuǎn)移元素的過(guò)程中,使用的是頭插法,也就是鏈表的順序會(huì)翻轉(zhuǎn),這里也是形成死循環(huán)的關(guān)鍵點(diǎn)。下面進(jìn)行詳細(xì)分析。
1.1 擴(kuò)容造成死循環(huán)分析過(guò)程
前提條件:
這里假設(shè)
hash算法為簡(jiǎn)單的用key mod鏈表的大小。
最開(kāi)始hash表size=2,key=3,7,5,則都在table[1]中。
然后進(jìn)行resize,使size變成4。
未resize前的數(shù)據(jù)結(jié)構(gòu)如下:

如果在單線程環(huán)境下,最后的結(jié)果如下:這里的轉(zhuǎn)移過(guò)程,不再進(jìn)行詳述,只要理解transfer函數(shù)在做什么,其轉(zhuǎn)移過(guò)程以及如何對(duì)鏈表進(jìn)行反轉(zhuǎn)應(yīng)該不難。
然后在多線程環(huán)境下,假設(shè)有兩個(gè)線程A和B都在進(jìn)行put操作。線程A在執(zhí)行到transfer函數(shù)中第11行代碼處掛起,因?yàn)樵摵瘮?shù)在這里分析的地位非常重要,因此再次貼出來(lái)。

此時(shí)線程A中運(yùn)行結(jié)果如下:線程A掛起后,此時(shí)線程B正常執(zhí)行,并完成resize操作,結(jié)果如下:這里需要特別注意的點(diǎn):由于線程B已經(jīng)執(zhí)行完畢,根據(jù)Java內(nèi)存模型,現(xiàn)在newTable和table中的Entry都是主存中最新值:7.next=3,3.next=null。
此時(shí)切換到線程A上,在線程A掛起時(shí)內(nèi)存中值如下:e=3,next=7,newTable[3]=null,代碼執(zhí)行過(guò)程如下:
newTable[3]=e?---->?newTable[3]=3
e=next?---->?e=7
此時(shí)結(jié)果如下:

繼續(xù)循環(huán):
e=7
next=e.next?---->?next=3【從主存中取值】
e.next=newTable[3]?---->?e.next=3【從主存中取值】
newTable[3]=e?---->?newTable[3]=7
e=next?---->?e=3
結(jié)果如下:

再次進(jìn)行循環(huán):
e=3
next=e.next?---->?next=null
e.next=newTable[3]?----> e.next=7 即:3.next=7
newTable[3]=e?---->?newTable[3]=3
e=next?---->?e=null
注意此次循環(huán):e.next=7,而在上次循環(huán)中7.next=3,出現(xiàn)環(huán)形鏈表,并且此時(shí)e=null循環(huán)結(jié)束。
結(jié)果如下:

在后續(xù)操作中只要涉及輪詢hashmap的數(shù)據(jù)結(jié)構(gòu),就會(huì)在這里發(fā)生死循環(huán),造成悲劇。
1.2 擴(kuò)容造成數(shù)據(jù)丟失分析過(guò)程
遵照上述分析過(guò)程,初始時(shí):
線程A和線程B進(jìn)行put操作,同樣線程A掛起:

此時(shí)線程A的運(yùn)行結(jié)果如下:此時(shí)線程B已獲得CPU時(shí)間片,并完成resize操作:同樣注意由于線程B執(zhí)行完成,newTable和table都為最新值:5.next=null。
此時(shí)切換到線程A,在線程A掛起時(shí):e=7,next=5,newTable[3]=null。
執(zhí)行newtable[i]=e,就將7放在了table[3]的位置,此時(shí)next=5。接著進(jìn)行下一次循環(huán):
e=5
next=e.next?---->?next=null,從主存中取值
e.next=newTable[1]?---->?e.next=5,從主存中取值
newTable[1]=e?---->?newTable[1]=5
e=next?---->?e=null
將5放置在table[1]位置,此時(shí)e=null循環(huán)結(jié)束,3元素丟失,并形成環(huán)形鏈表。并在后續(xù)操作hashmap時(shí)造成死循環(huán)。

2.jdk1.8中HashMap
在jdk1.8中對(duì)HashMap進(jìn)行了優(yōu)化,在發(fā)生hash碰撞,不再采用頭插法方式,而是直接插入鏈表尾部,因此不會(huì)出現(xiàn)環(huán)形鏈表的情況,但是在多線程的情況下仍然不安全,這里我們看jdk1.8中HashMap的put操作源碼:
這是jdk1.8中HashMap中put操作的主函數(shù), 注意第6行代碼,如果沒(méi)有hash碰撞則會(huì)直接插入元素。如果線程A和線程B同時(shí)進(jìn)行put操作,剛好這兩條不同的數(shù)據(jù)hash值一樣,并且該位置數(shù)據(jù)為null,所以這線程A、B都會(huì)進(jìn)入第6行代碼中。
假設(shè)一種情況,線程A進(jìn)入后還未進(jìn)行數(shù)據(jù)插入時(shí)掛起,而線程B正常執(zhí)行,從而正常插入數(shù)據(jù),然后線程A獲取CPU時(shí)間片,此時(shí)線程A不用再進(jìn)行hash判斷了,問(wèn)題出現(xiàn):線程A會(huì)把線程B插入的數(shù)據(jù)給覆蓋,發(fā)生線程不安全。
這里只是簡(jiǎn)要分析下jdk1.8中HashMap出現(xiàn)的線程不安全問(wèn)題的體現(xiàn),后續(xù)將會(huì)對(duì)java的集合框架進(jìn)行總結(jié),到時(shí)再進(jìn)行具體分析。
總結(jié)
首先HashMap是線程不安全的,其主要體現(xiàn):
在jdk1.7中,在多線程環(huán)境下,擴(kuò)容時(shí)會(huì)造成環(huán)形鏈或數(shù)據(jù)丟失。
在jdk1.8中,在多線程環(huán)境下,會(huì)發(fā)生數(shù)據(jù)覆蓋的情況。