符合這個姑娘條件的深圳男生到底有多少?
01
昨天看了條微博,是一個博主給她的朋友找合適的對象,問題是:
一位女孩子拜托我問一下:在深圳,28到38歲,正當工作收入40w或以上,相貌中等即可,身高不低于178cm,身體健康,干凈衛(wèi)生不打呼嚕,性格精神正常,無不良嗜好,作息規(guī)律,學歷大于等于本科的未婚男性數(shù)量有多少?

當時有一位挺大的數(shù)據(jù)博主,給出了他的答案:

這里面每一個數(shù)據(jù)都基本是真實的,所以他最后得出結論,全深圳,符合這樣條件的男生只有28人。
而且這還沒考慮“身體健康”、“性格精神正?!?、“干凈衛(wèi)生不打呼?!边@三項無法量化的條件。
這和我們的日常生活經(jīng)驗相悖,畢竟在上海,這樣的男生我認識的就有不下20個,偌大的深圳不可能只有30個以內(nèi)。
為什么?
因為他的這個算法是有問題的。
02
首先科普一個高中就學過的簡單概念,叫做“條件概率”,指的是事件A在另外一個事件B已經(jīng)發(fā)生條件下的發(fā)生概率。
比如說,全中國男人的平均身高是167cm,這沒問題,但如果統(tǒng)計全中國18-28歲男人的身高,就顯然不是167cm了。
事實上,根據(jù)之前柳葉刀的數(shù)據(jù),中國現(xiàn)在19歲男青年的平均身高高達175cm,在全世界排在第65位,在東亞排第一。

也就是說,當我們把統(tǒng)計范圍限定在18-28歲這個年齡段時,就不能用“全中國的平均身高”或者“全深圳的平均身高”來計算概率了。因為這件事里互不關聯(lián)的幾個條件因素會互相影響,并不能簡單疊加。
這應該是顯而易見的一個事實。
那么搞清了這個事實,再來看那位博主的結論:

會發(fā)現(xiàn)他就犯了這個問題。
比如167cm,是全中國男性的平均身高。但如果把條件限制在“深圳”和“28-38歲”,很顯然不是這個數(shù)據(jù)。
正如上面所說,隨著經(jīng)濟發(fā)展和營養(yǎng)水平越來越好,中國人的身高一代比一代高,同時大城市居民普遍比農(nóng)村居民的身高更高。
2019年廣東全省的《國民體質監(jiān)測報告》顯示,廣東全省男青年,在28-38歲之間的平均身高在169.4-170.9之間。

所以我也不知道那博主“深圳男人平均身高167cm是怎么來的。”
再比如“本科”、“身高”、“年齡”、“深圳”都會影響收入,事實上收入比較低的大齡外地男性,根本不會繼續(xù)在深圳待下去,所以這里絕對不能用1%去計算。
還有吸煙率,深圳男性的吸煙率只有30%,遠低于全國平均的52.9%,按照我們男性吸煙率年年遞減的狀態(tài)來看,如果限制在“28-38歲”可能30%都不到。
再者,“深圳”是一座快速擴張的城市,它的常住人口,在最近20年翻了快一倍。

會到深圳來打拼的多半是年輕人,所以年齡相對來說會更小,也不能簡單用正態(tài)分布去計算。
因為他的算法出了問題,所以最后才會得出一個比較極端的結論——深圳符合條件的男青年只有三十多人。
因為算法有問題,所以接下來一系列狂歡嘲諷的評論,諸如“夢里啥都有”,都站不住腳了。
03

本來文章到這里就應該結束了,但既然都寫到這了,查了這么多數(shù)據(jù)了,不如我們按照他的估算方法,把正確的數(shù)據(jù)填進去算算看。
因為有不少數(shù)據(jù)是缺失的,所以也只能是估算,會有誤差。
先從第一條開始,人口。
深圳2019年末統(tǒng)計的常駐人口是1343.88萬人,這1343.88萬人口的平均年齡為32.5歲,是中國所有一線城市中平均年齡最年輕的。

這是官方數(shù)據(jù),統(tǒng)計口徑是不算上關外大量的流動人口。
如果算上深圳數(shù)量龐大的流動人口,那根據(jù)根據(jù)《中國移動的基于移動大數(shù)據(jù)的深圳市人口統(tǒng)計研究報告》,剔除掉一人多卡的情況后得出結論:
2017年9-11月,深圳人口穩(wěn)定在2200萬左右:

現(xiàn)在只會更多。
當然,為了后續(xù)統(tǒng)計方便,我們這里采用官方數(shù)據(jù)的1343萬人,其中男性占54%,也就是726萬人。
再考慮第二條,年齡。
根據(jù)南方日報給的一組數(shù)據(jù),非深戶人口平均年齡33.9歲,其中19-35歲年輕人占比52.56%。

可以大致估算出28-38歲的非深戶青年人,占全部非深戶人口的25%左右。
再加上深圳有戶口的常駐人口較少,且全深圳人口平均年齡為32.5歲,還小于非深戶人口,所以這里就直接用非深戶人口的數(shù)據(jù)來代替全部人口數(shù)據(jù)了。
也就是說,全深圳,至少有181萬名28-38歲的適齡青年。
接下來是第三個條件,未婚。
這一條我沒找到合適的數(shù)據(jù),按照那位博主的方式等比例推算,得出未婚男青年為66萬人。
第四個條件,身高。
根據(jù)《2019年廣東省國民體質監(jiān)測公報》,可以得到整個廣東省,28-38歲男青年的平均身高,在1.7米左右。

再根據(jù)全國數(shù)據(jù)可知,我國城鎮(zhèn)人口平均身高,比鄉(xiāng)村人口要高2公分左右,所以這里估算深圳市28-38歲男青年平均身高為172cm。
又因為居民身高是符合正態(tài)分布的,這里因為沒有更多數(shù)據(jù),一般我們統(tǒng)計身高的時候,取標準差為6cm。
那我們可以查表得出,深圳男青年平均身高小于178cm的概率,為84%左右,也就是大概有16%的人高于178cm。

也就是深圳大概有10.5萬,年齡在28-38歲的男青年,身高在178cm以上。
第五個條件,學歷。
這里有一份南方財經(jīng)全媒體集團做的深圳市學歷統(tǒng)計,其中顯示2015年,深圳大專以上的學歷人才又258萬人,就已經(jīng)占所有人口的22.67%。
之后深圳又通過各種措施引進高學歷人才,所以講道理五年以后深圳高學歷人才會比當時比例更高。

注意,這還是針對所有年齡段的數(shù)據(jù)。事實上我國高等教育毛入學率一年比一年高,本科生、研究生一年比一年多,所以如果把數(shù)據(jù)聚焦在28-38這個年齡段,本科率一定會比總本科率高得多。


篇幅有限(懶得算了),那個博主這里取的數(shù)值是50%,我們保守一點,算40%。
那就是:
深圳大概有4.2萬,年齡在28-38歲,身高在178cm以上,且擁有本科學歷的男青年。
第六個條件,收入。
稅前稅后40萬收入差得很多,但約定俗成如果不提稅后,說的就是稅前。
稅前年薪40萬+放在全國鳳毛麟角,但是當我們限定了上面一系列條件之后,在深圳絕對不止1%。
只是限定這么多條件后,想找到相對靠譜的數(shù)據(jù)已經(jīng)是不可能了,我們只能靠估算。
稅前40萬年收入,大概是互聯(lián)網(wǎng)大廠資深一點的技術工作者或者市場經(jīng)理、運營經(jīng)理?;蛘呦袢A為、OPPO、VIVO這種科技公司稍微資深一點的同事。
去招聘網(wǎng)站上看一看,會發(fā)現(xiàn)對于這些大廠來說,并不太高。

這里還有一份這些大廠大概的收入情況表,基本到了騰訊8級左右就能拿到稅前40萬的年薪——說實在的,這并不難。

為了能搶到人才,國內(nèi)這些大廠給的錢不會相差太大,而小廠為了搶到人,有時候會給更多的錢,而深圳這樣的大廠總部又特別多。
同時,根據(jù)深圳市人力資源和社會保障局出臺的《人力資源市場工資指導價位》

全行業(yè)大學本科高位值在51000元每月,專科在48000元每月值。

這里的“高位值”,值的是前10%的工資水平。
扣除掉性別、年齡等因素后,我覺得這里取10%是比較合理的。
那深圳大概有4200名,年齡在28-38歲,身高在178cm以上,擁有本科學歷且年收入在40萬以上的男青年。
最后一個條件,吸煙率。
這個深圳有自己的統(tǒng)計數(shù)據(jù)。
2014年,深圳男性的吸煙率為34.3%,而在2019年的報告中,深圳市政府表示深圳人吸煙率一年比一年低,所以有理由相信,現(xiàn)在深圳男性吸煙率已經(jīng)不到34.3%。
同時,有調(diào)查表明,年輕人抽煙比例更低。

也有調(diào)查表明,學歷越高的群體,吸煙率越低:

所以在深圳,28-38歲擁有本科學歷的男青年里,抽煙比例應該遠低于全年齡段的男性。
我們保守點,取25%的人吸煙。
也就是說。
在深圳,大概有3150名,年齡在28-38歲,身高在178cm以上,擁有本科學歷且年收入在40萬以上且不抽煙的男青年。
剩下作息規(guī)律、無不良愛好這種,實在是沒辦法統(tǒng)計,就到這吧。
到這步,那位博主得出的結論是141人,而我得出的是3150人。
雖然同樣不多,但看起來至少上四位數(shù)了,如果每天認識一個,可以連續(xù)8年不重樣的...也不錯了...
只是這樣的一批人,到底為什么會單身,以及會不會為了你結束單身...
就又是另一個故事了。
04
雖然那位博主主業(yè)就是統(tǒng)計學,同時還在自己微博里賣有關統(tǒng)計學的課程:

但從上面的分析過程可以看出,他在估算中犯了許多低級錯誤。包括把各種概率簡單相乘,甚至中間很多數(shù)據(jù)都是錯的。
我相信一位統(tǒng)計學博主,不會意識不到這點。我只能理解為,他寫那么一段話,就是為了吐槽那個征友女孩子的要求不切實際,都是空想。
這正好符合現(xiàn)在網(wǎng)上主流的刻板印象:女生對男生有各種不切實際的幻想。
同時,也確實有很多網(wǎng)友,現(xiàn)在在拿這張圖證明這一點。
諸如說女人就是想坐享其成啦。

還有這種直接拿著28當結論,然后說這種話的啦。

或者其他說得更難聽的我就不截圖了。
我覺得其實也沒必要這樣,因為你也不知道人姑娘到底什么條件。
比如姑娘可能1米7,那想認識178以上的男性無可厚非。姑娘可能年收入50萬,那想男朋友不要比自己差太多,也完全可以理解。
總之,大家還是少點惡意,多講事實吧。
最后,分享一段@汪有同學的話:

有時候意思是一樣的意思。換一種說法,就是完全兩樣感受。
我覺得說得挺有道理。
與你們共勉。