三分钟带你学会序列插值——优雅的imputeTS方法


1.library(imputeTS)
2.# 创建一个带有缺失值的短时间序列示例
3.x <- ts(c(1, 2, 3, 4, 5, 6, 7, 8, NA, NA, 11, 12))
1.# 使用na.mean插补缺失值
2.na.mean(x)
3.[1] 1.0 2.0 3.0 4.0 5.0 6.0 7.0 8.0 5.9 5.9 11.0 12.0
1.# 使用na.mean插补缺失值,选项为median
2.na.mean(x, option="median")
3.[1] 1.0 2.0 3.0 4.0 5.0 6.0 7.0 8.0 5.5 5.5 11.0 12.0

1.# 使用na.interpolation插补缺失值
2.na.interpolation(x)
3.[1] 1 2 3 4 5 6 7 8 9 10 11 12
1.# 使用na.kalman插补缺失值
2.#(tsAirgap是imputeTS包提供的示例时间序列)
3.data("tsAirgap")
4.imp <- na.kalman(tsAirgap)
5.# 可视化代码
6.ggplot_na_imputations(tsAirgap, imp, tsAirgapComplete)

ggplot_na_distribution(可视化缺失值分布):
1.# 示例代码 'ggplot_na_distribution'
2.#(tsAirgap是imputeTS包提供的示例时间序列)
3.# 可视化此时间序列中的缺失值
4.ggplot_na_distribution(tsAirgap)

ggplot_na_distribution2(可视化缺失值分布的条形图):
1.#(tsHeating是imputeTS包提供的示例时间序列)
2.# 可视化此时间序列中的缺失值
3. ggplot_na_distribution2(tsHeating,number_intervals = 20)

ggplot_na_gapsize(可视化不同NA间隙的频率):
1.#(tsNH4是imputeTS包提供的示例时间序列)
2.# 可视化前NAs大小 / 连续的NA
3.ggplot_na_gapsize(tsNH4)

分布的摘要统计信息
statsNA
函数在 imputeTS 包中提供了关于单变量时间序列中缺失值分布的摘要统计信息。以下是它提供的信息的解释:statsNA
函数的示例代码,请跟着小果一起练习哦:1.# 示例代码 'statsNA'
2.#(tsNH4 是 imputeTS 包提供的示例时间序列)
3.# 打印关于缺失数据的统计信息
4.statsNA(tsNH4)
往期推荐