๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
๐Ÿ’š ๊ฐœ๋ฐœ/R

[R Programming] ๊ฒฐ์ธก์น˜(NA) ์ง€์šฐ๊ธฐ in R

by devshin.kr 2022. 5. 16.
728x90
๋ฐ˜์‘ํ˜•
ํ•ด๋‹น ๊ธ€์€ 2018๋…„ 12์›” 10์ผ์— ์ž‘์„ฑ๋˜์—ˆ์Šต๋‹ˆ๋‹ค.

 

๋‚˜๋Š” MacBook์„ ์‚ฌ์šฉํ•˜๊ธฐ ๋•Œ๋ฌธ์— ์—‘์…€(.xlsx) ํŒŒ์ผ์„ csv ํŒŒ์ผ๋กœ ๋ณ€ํ™˜ํ•  ๋•Œ๋งˆ๋‹ค ๊ฐ’์ด ๊นจ์ง„๋‹ค. ์–ด๋–ป๊ฒŒ ํ•ด์•ผ ์•ˆ ๊นจ์ง€๊ฒŒ ๋งŒ๋“ค ์ˆ˜ ์žˆ์„๊นŒ๋ฅผ ๊ณ ๋ฏผํ•˜๋˜ ๋์— ๊ฒฐ๊ตญ ์ฐพ์€ ๊ฒฐ๋ก ์€ R Studio์—์„œ ํŒŒ์ผ์„ ๋ถˆ๋Ÿฌ ์˜ฌ ๋•Œ ์ฒ˜์Œ๋ถ€ํ„ฐ ์—‘์…€์„ ๋ถˆ๋Ÿฌ ์˜ค๋Š” ๊ฒƒ.

cafe <- read_xlsx("./cafe.xlsx")

ํ•˜์ง€๋งŒ ์ด๋ ‡๊ฒŒ ํ•˜๋ฉด ์•„๋ž˜์˜ ์˜ˆ์‹œ์™€ ๊ฐ™์ด csv ํŒŒ์ผ์„ ๋ถˆ๋Ÿฌ ์˜ฌ ๋•Œ์ฒ˜๋Ÿผ ์ฒ˜์Œ์— ๊ฒฐ์ธก์น˜๋ฅผ ์ œ๊ฑฐํ•  ์ˆ˜ ์—†๋‹ค. csvํŒŒ์ผ์„ ์ฝ์–ด ์˜ฌ ๋•Œ ์ฒ˜์Œ๋ถ€ํ„ฐ ๊ฒฐ์ธก์น˜๋ฅผ ์ œ๊ฑฐํ•˜๊ณ  ์‹ถ๋‹ค๋ฉด ์•„๋ž˜์™€ ๊ฐ™์ด ํ•˜๋ฉด ๋œ๋‹ค. ๋˜๋Š” ํ…Œ์ด๋ธ”์€ ๊ทธ๋Œ€๋กœ ๋‘๊ณ  ๊ฒฐ์ธก์น˜๋ฅผ ์ œ๊ฑฐํ•œ ํ‰๊ท ๋งŒ ๊ตฌํ•˜๊ณ  ์‹ถ๋‹ค๋ฉด

cafe <- read.csv(“./cafe.cav”)

meanValue <- mean(cafe$price, na.rm = T) ํ•˜๋ฉด ๋œ๋‹ค.

 

 

cafe <- read.csv("./cafe.csv", header = T, na.rm = T)

   ๋ฌผ๋ก  Mac์—์„œ๋„ read.csv()ํ•จ์ˆ˜๋ฅผ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋‹ค. ๋”ฐ๋ผ์„œ cafe.csv ํŒŒ์ผ์ด ๊นจ์ง€์ง€ ์•Š์€ ์ •์ƒ์ ์ธ ํŒŒ์ผ์ด๋ผ๋ฉด ์œ„์˜ ์ฝ”๋“œ๋„ ๋งฅ์—์„œ ๋Œ์•„ ๊ฐ„๋‹ค.

   ํ•˜์ง€๋งŒ .xslx ํŒŒ์ผ์„ .csvํŒŒ์ผ๋กœ ๋ณ€ํ™˜ํ•˜๋Š” ๊ณผ์ •์—์„œ ํŒŒ์ผ์ด ๊นจ์ง€๊ธฐ ๋•Œ๋ฌธ์— ํŒŒ์ผ์„ readํ•  ๋•Œ๋ถ€ํ„ฐ .xlsxํ•จ์ˆ˜๋ฅผ ์‚ฌ์šฉํ•ด์•ผ๋งŒ ํ•œ๋‹ค๋ฉด, ์•„๋ž˜์˜ ๊ฒฐ์ธก์น˜ ์ œ๊ฑฐ ๋ฐฉ๋ฒ•์„ ๊ถŒํ•œ๋‹ค.

โ€‹

โ€‹

์˜ˆ์‹œ

   ์˜ˆ์‹œ๋กœ cafe.xlsx ํŒŒ์ผ์˜ ์ปฌ๋Ÿผ ์ค‘ ํ•˜๋‚˜๊ฐ€ price๋ผ๊ณ  ํ•˜์ž. ๊ทธ๋ฆฌ๊ณ  price์˜ ํ‰๊ท  ๊ฐ’์„ ๊ตฌํ•˜๊ณ ์ž ํ•œ๋‹ค. price์˜ ๊ฐ’ ์ค‘ ํ•˜๋‚˜๊ฐ€ NA๋กœ Not Answer, ์ฆ‰ ์‘๋‹ต์ž๊ฐ€ ๋‹ตํ•˜์ง€ ์•Š์€ ๊ฐ’์ด๋‹ค. ํ•ด๋‹น ๊ฐ’์ด ์žˆ๋‹ค๋ฉด price์˜ ํ‰๊ท  ๊ฐ’์€ NA๋กœ ๋‚˜ํƒ€๋‚œ๋‹ค. ๋”ฐ๋ผ์„œ NA๋ฅผ ์ œ๊ฑฐํ•˜์ž.

cafe <- read_xlsx("./cafe.xlsx")
is.na(cafe) # cafe ํ…Œ์ด๋ธ”์—์„œ ๊ฒฐ์ธก์น˜๊ฐ€ ์žˆ๋Š”์ง€ ํ™•์ธํ•˜๋Š” ํ•จ์ˆ˜. ๊ฒฐ์ธก์น˜๊ฐ€ ์žˆ๋Š” ์œ„์น˜์—์„œ TRUE๋กœ ๋‚˜ํƒ€๋‚œ๋‹ค.
cafe <- na
omit(cafe) # ์ด ํ•จ์ˆ˜๋กœ ๊ฒฐ์ธก์น˜๋ฅผ ์ œ๊ฑฐ!

mean(cafe$price)

   mean(cafe$price) ์˜ ๊ฒฐ๊ณผ๋Š” NA๋กœ ๋‚˜ํƒ€๋‚  ๊ฒƒ์ด๋‹ค.

โ€‹

๊ฒฐ์ธก์น˜ ์—†์• ๊ธฐ

cafe <- read_xlsx("./cafe.xlsx")

 na.omit()ํ•จ์ˆ˜๋กœ ๊ฒฐ์ธก์น˜๋ฅผ ์ œ๊ฑฐํ–ˆ๋‹ค. ์ด์ œ mean()ํ•จ์ˆ˜๋ฅผ ์‚ฌ์šฉํ•  ๋•Œ, NA๊ฐ€ ์•„๋‹Œ, ์›ํ•˜๋Š” ํ‰๊ท  ๊ฐ’์ด ๋‚˜์˜ฌ ๊ฒƒ์ด๋‹ค.

 

 

 

Mac์—์„œ csv ํŒŒ์ผ์„ ๋ถˆ๋Ÿฌ์˜ฌ ๋•Œ ๊นจ์ง€๋Š” ํ˜„์ƒ ํ•ด๊ฒฐํ•˜๊ธฐ ๋งํฌ

2022.05.16 - [๐Ÿ’š ๊ฐœ๋ฐœ/R] - [R Programming] ์—‘์…€ ํŒŒ์ผ์„ ์ฝ์ž in R

 

[R Programming] ์—‘์…€ ํŒŒ์ผ์„ ์ฝ์ž in R

ํ•ด๋‹น ๊ธ€์€ 2018๋…„ 12์›” 11์ผ์— ์ž‘์„ฑ๋˜์—ˆ์Šต๋‹ˆ๋‹ค.  ๋‚˜๋Š” MacBook Pro๋ฅผ ์‚ฌ์šฉํ•œ๋‹ค. RStudio์—์„œ csvํŒŒ์ผ์„ ์ฝ์–ด ์™€์•ผ ํ•˜๋Š”๋ฐ csvํŒŒ์ผ์ด ๊นจ์ง€๋Š” ๊ฒฝ์šฐ๊ฐ€ ์žˆ๋‹ค. ๋‚ด ์ƒ๊ฐ์— ์ฒ˜์Œ๋ถ€ํ„ฐ csvํŒŒ์ผ์ธ ๊ฒฝ์šฐ๋Š” ์ƒ๊ด€์ด ์—†๋Š”

devshin93.tistory.com

 

๋ฐ˜์‘ํ˜•

'๐Ÿ’š ๊ฐœ๋ฐœ > R' ์นดํ…Œ๊ณ ๋ฆฌ์˜ ๋‹ค๋ฅธ ๊ธ€

[R Programming] ๋งฅ๋ถ์—์„œ ์—‘์…€ ํŒŒ์ผ์„ ์ฝ์ž in R  (0) 2022.05.16

๋Œ“๊ธ€