R腳本-基于R對csv分布數(shù)據(jù)進行去冗余篩選
2023-06-12 16:27 作者:一枚鄉(xiāng)野村姑 | 我要投稿
R腳本-基于R對csv分布數(shù)據(jù)進行去冗余篩選

# 導入必要的包(如果未安裝第一次使用需要安裝以下腳本)
library(dplyr)
library(geosphere)
# 讀取數(shù)據(jù)
data <- read.csv("points.csv")
# 計算每個點與其他點之間的距離
dist_mat <- distm(data[, c("lon", "lat")])
# 將距離小于5km的點標記為需要保留的
keep <- rep(TRUE, nrow(data))
for (i in 1:(nrow(data)-1)) {
for (j in (i+1):nrow(data)) {
if (dist_mat[i, j] < 5000) {
keep[j] <- FALSE
}
}
}
# 篩選并保存數(shù)據(jù)
result <- data[keep, ]
write.csv(result, "filtered_points.csv", row.names = FALSE)
腳本說明:其中,假設(shè)原始數(shù)據(jù)的文件名為points.csv,包含兩列數(shù)據(jù)lon和lat表示經(jīng)度和緯度。在腳本中,首先讀取數(shù)據(jù),然后計算每個點與其他點之間的距離。接著,將距離小于5km的點標記為需要保留的,并最終篩選出需要保留的點并保存為filtered_points.csv文件。
本文使用 文章同步助手 同步
標簽: