Stata編程小筆記4——分組求和
2022-04-21 09:03 作者:deepwaterqh | 我要投稿
緒言:
(1)分組求和最常用的命令是 bys 和 egen / gen 結(jié)合,其中bys是bysort的縮寫,能實現(xiàn)“排序+分組”的雙重功能。如果單純寫by,stata會要求你先對數(shù)據(jù)排序——sort。注意bys 和 egen 、?gen 結(jié)合效果不同。
(2)分組求和還有一個常用命令,叫collapse,但注意這個命令會改變原始數(shù)據(jù)的結(jié)構(gòu)。

首先是bys和egen:將組內(nèi)某變量的所有值一次性相加(缺失值視為0)。
上述例子是按照foreign這個變量來分組,然后加總每組內(nèi)price變量的值,并將加總的值保存在TotalPrice變量中。對于bys這行命令,有時候我們會看到下面這種寫法:
bys后面的變量多了個括號,這是什么意思呢?實際上,這相當(dāng)于如下命令:
換言之,make這個變量在分組求和過程中不起作用,而僅在dataset展示數(shù)據(jù)的時候起作用(分組列示)。

其次是bys和gen:將組內(nèi)某變量的值逐步累加(缺失值視為0)。

最后是collapse:這個命令和前面兩個命令的最大區(qū)別在于,運行之后原始數(shù)據(jù)不見了,取而代之的是求和的結(jié)果。比如:
結(jié)果數(shù)據(jù):

標(biāo)簽: