SQL中in與exist的區(qū)別
exist
exists對(duì)外表用loop逐條查詢,每次查詢都會(huì)查看exists的條件語(yǔ)句,當(dāng) exists里的條件語(yǔ)句能夠返回記錄行時(shí)(無(wú)論記錄行是的多少,只要能返回),條件就為真,返回當(dāng)前l(fā)oop到的這條記錄,反之如果exists里的條 件語(yǔ)句不能返回記錄行,則當(dāng)前l(fā)oop到的這條記錄被丟棄,exists的條件就像一個(gè)bool條件,當(dāng)能返回結(jié)果集則為true,不能返回結(jié)果集則為 false
in
in查詢相當(dāng)于多個(gè)or條件的疊加,這個(gè)比較好理解,比如下面的查詢
select * from user where userId in (1, 2, 3);
等效于
select * from user where userId = 1 or userId = 2 or userId = 3;
總的來(lái)說(shuō),in查詢就是先將子查詢條件的記錄全都查出來(lái),假設(shè)結(jié)果集為B,共有m條記錄,然后在將子查詢條件的結(jié)果集分解成m個(gè),再進(jìn)行m次查詢
in 和 exist 區(qū)別
select * from A where id in(select id from B)
以上查詢使用了in語(yǔ)句,in()只執(zhí)行一次,它查出B表中的所有id字段并緩存起來(lái).之后,檢查A表的id是否與B表中的id相等,如果相等則將A表的記錄加入結(jié)果集中,直到遍歷完A表的所有記錄.
它的查詢過(guò)程類似于以下過(guò)程
List resultSet=[]; Array A=(select * from A); Array B=(select id from B);for(int i=0;i<A.length;i++) { ? ?for(int j=0;j<B.length;j++) { ? ? ? ?if(A[i].id==B[j].id) { ? ? ? ? ? ?resultSet.add(A[i]); ? ? ? ? ? ?break; ? ? ? ?} ? ?} }return resultSet; ? ? ? ? ? ? ? ?
可以看出,當(dāng)B表數(shù)據(jù)量較大時(shí)不適合使用in(),因?yàn)樗鼤?huì)B表數(shù)據(jù)全部遍歷一次.
如:A表有10000條記錄,B表有1000000條記錄,那么最多有可能遍歷100001000000次,效率很差.
再如:A表有10000條記錄,B表有100條記錄,那么最多有可能遍歷10000100次,遍歷次數(shù)大大減少,效率大大提升.
結(jié)論:in()適合B表數(shù)據(jù)量<A表的情況
?
select a.* from A a where exists(select 1 from B b where a.id=b.id)
以上查詢使用了exists語(yǔ)句,exists()會(huì)執(zhí)行A.length次,它并不緩存exists()結(jié)果集,因?yàn)閑xists()結(jié)果集的內(nèi)容并不重要,重要的是結(jié)果集中是否有記錄,如果有則返回true,沒(méi)有則返回false.
它的查詢過(guò)程類似于以下過(guò)程
List resultSet=[]; Array A=(select * from A)for(int i=0;i<A.length;i++) { ? ?if(exists(A[i].id) { //執(zhí)行select 1 from B b where b.id=a.id是否有記錄返回 ? ? ? ?resultSet.add(A[i]); ? ?} }return resultSet;
當(dāng)B表比A表數(shù)據(jù)量大時(shí)適合使用exists(),因?yàn)樗鼪](méi)有那么遍歷操作,只需要再執(zhí)行一次查詢就行.
如:A表有10000條記錄,B表有1000000條記錄,那么exists()會(huì)執(zhí)行10000次去判斷A表中的id是否與B表中的id相等.
如:A表有10000條記錄,B表有100000000條記錄,那么exists()還是執(zhí)行10000次,因?yàn)樗粓?zhí)行A.length次,可見(jiàn)B表數(shù)據(jù)越多,越適合exists()發(fā)揮效果.
再如:A表有10000條記錄,B表有100條記錄,那么exists()還是執(zhí)行10000次,還不如使用in()遍歷10000*100次。
因?yàn)?strong>in()是在內(nèi)存里遍歷比較,而exists()需要查詢數(shù)據(jù)庫(kù),我們都知道查詢數(shù)據(jù)庫(kù)所消耗的性能更高,而內(nèi)存比較更快.
?
結(jié)論:exists()適合B表數(shù)據(jù)量>A表的情況
當(dāng)A表與B表數(shù)據(jù)量相同時(shí),in與exists效率差不多,可任選一個(gè)使用.
鏈接:https://www.dianjilingqu.com/637509.html