R -- dplyr, tidyverse, 初級數(shù)據(jù)分析快速入門 (2)

一、對行列的修改

(二)、對整體的修改與調(diào)整
1.調(diào)整數(shù)據(jù)
·分組group_by
group_by(Species)
summarise(PL_mean=mean(Petal.Length),SW_mean=mean(Sepal.Width)
mutate(PL_mean=mean(Petal.Length),SW_mean=mean(Sepal.Width)
ungroup()
·排序arrange
arrange(Sepal.Length, desc(Sepal.Width)
·去重distinct 保留每個類第一次出現(xiàn)的數(shù)值
distint(Species,.keep_all=TRUE)
·字段拆分與合并
按照分隔符拆分;將分段的字符串合并到一個字符串中,合并各段字符串中間會有一個間隔。
join:將多個表進(jìn)行連接操作
bind:按行/列合并數(shù)據(jù)集的函數(shù)
2.變量的轉(zhuǎn)化
(1)將連續(xù)變量轉(zhuǎn)化為分組變量
mutate(grade=case_when(
??subID>=4000~”forth”,
??subID>=3000~”third”,
??subID>=2000~”second”,
??subID>=1000~”first”
))
(2)將含有相同元素的變量統(tǒng)一轉(zhuǎn)化名稱
mutate(status=case_when(
??subID==”1”~”active”,
??subID==”0”~”inactive”,
??subID==”8”~”unknow”,
))
標(biāo)簽: