給數(shù)據(jù)集拍個(gè)X片看看——R語言xray包介紹
---
title: "給數(shù)據(jù)集拍個(gè)X片看看——R語言xray包"
author: "wuliubingbing"
date: "2023-08-19"
output: html_document
---
```{r setup, include=FALSE}
knitr::opts_chunk$set(echo = TRUE)
library(xray)
```
把本文全部復(fù)制粘貼到Rmarkdown中編譯
# xray包
R 包,用于在數(shù)據(jù)集上顯示 X射線視覺。此包允許您分析數(shù)據(jù)集的變量,以評(píng)估數(shù)據(jù)的形狀。當(dāng)您擁有用于建模的數(shù)據(jù)時(shí),將此視為第一步,您可以使用此包來分析所有變量,并檢查是否有任何值得轉(zhuǎn)換甚至完全避免該變量的奇怪之處。
#異常檢測(cè)
xray::anomalies
分析所有列的異常情況,無論它們是 NA、零、無限等,如果檢測(cè)到至少 80% 的行具有這些異常的變量,則會(huì)向您發(fā)出警告。當(dāng)所有行具有相同的值時(shí),它還會(huì)警告您。
```{r}
head(mtcars,10) %>% knitr::kable()
```
```{r}
anomalies(mtcars, anomaly_threshold=0.5)
```
#分布
xray::distributions嘗試分析變量的分布,以便了解每個(gè)變量的統(tǒng)計(jì)結(jié)構(gòu)。它還返回?cái)?shù)值變量的百分位數(shù)表作為結(jié)果,該表可以通知您數(shù)據(jù)的形狀。
```{r}
distributions(mtcars)
```
# 時(shí)間序列
xray::timebased還會(huì)調(diào)查您的分布,但會(huì)顯示隨時(shí)間的變化,因此,如果分布隨時(shí)間發(fā)生任何變化(例如,變量停止或開始收集),您可以輕松地將其可視化。
```{r}
head(longley,10) %>% knitr::kable()
```
```{r}
data(longley)
longley$Year=as.Date(paste0(longley$Year,'-01-01'))
timebased(longley, 'Year')
```