生信数据处理好帮手:dplyr助你一臂之力!
点击蓝字 关注我们
library(dplyr)
starwars
class(starwars)
colnames(starwars)
dim(starwars)
# 筛选出height为150的行
filter(starwars, height == 150)
# 筛选出sex为female的行
filter(starwars, sex == 'female')
# 筛选出skin_color为light并且height等于150的行
filter(starwars, skin_color == 'light' & height == 150)
# 筛选出skin_color为light或者height等于150的行
filter(starwars, skin_color == 'light' | height == 150)
# 升序排列
arrange(starwars, height)
# 降序排列
arrange(starwars, -height)
# 降序排列,使用desc()函数
arrange(starwars, desc(height))
# 添加两列:ht_m将身高数据除以100,color列连接skin_color和eye_color两列
mutate(starwars, ht_m = height/100, color = paste(skin_color, eye_color, sep = "_"))
# 计算新列ht_m和color,并返回仅包含新列的对象
transmute(starwars, ht_m = height/100, color = paste(skin_color, eye_color, sep = "_"))
汇总数据:summarise()
# 返回数据中height的均值
summarise(na.omit(starwars), mean(height))
# 返回数据中height的标准差
summarise(na.omit(starwars), sd(height))
# 返回数据中height的最大值和最小值
summarise(na.omit(starwars), max(height), min(height))
# 返回starwars数据框的行数
summarise(starwars, n())
# 返回sex去重后的个数
summarise(starwars, n_distinct(sex))
# 返回height的第一个值
summarise(starwars, first(height))
# 返回height的最后一个值
summarise(starwars, last(height))

小花有话说



长按识别二维码关注我们哟
(点击阅读原文跳转)
点一下阅读原文了解更多资讯