ํด๋น ๊ธ์ 2018๋ 12์ 10์ผ์ ์์ฑ๋์์ต๋๋ค.
๋๋ MacBook์ ์ฌ์ฉํ๊ธฐ ๋๋ฌธ์ ์์ (.xlsx) ํ์ผ์ csv ํ์ผ๋ก ๋ณํํ ๋๋ง๋ค ๊ฐ์ด ๊นจ์ง๋ค. ์ด๋ป๊ฒ ํด์ผ ์ ๊นจ์ง๊ฒ ๋ง๋ค ์ ์์๊น๋ฅผ ๊ณ ๋ฏผํ๋ ๋์ ๊ฒฐ๊ตญ ์ฐพ์ ๊ฒฐ๋ก ์ R Studio์์ ํ์ผ์ ๋ถ๋ฌ ์ฌ ๋ ์ฒ์๋ถํฐ ์์ ์ ๋ถ๋ฌ ์ค๋ ๊ฒ.
cafe <- read_xlsx("./cafe.xlsx")
ํ์ง๋ง ์ด๋ ๊ฒ ํ๋ฉด ์๋์ ์์์ ๊ฐ์ด csv ํ์ผ์ ๋ถ๋ฌ ์ฌ ๋์ฒ๋ผ ์ฒ์์ ๊ฒฐ์ธก์น๋ฅผ ์ ๊ฑฐํ ์ ์๋ค. csvํ์ผ์ ์ฝ์ด ์ฌ ๋ ์ฒ์๋ถํฐ ๊ฒฐ์ธก์น๋ฅผ ์ ๊ฑฐํ๊ณ ์ถ๋ค๋ฉด ์๋์ ๊ฐ์ด ํ๋ฉด ๋๋ค. ๋๋ ํ ์ด๋ธ์ ๊ทธ๋๋ก ๋๊ณ ๊ฒฐ์ธก์น๋ฅผ ์ ๊ฑฐํ ํ๊ท ๋ง ๊ตฌํ๊ณ ์ถ๋ค๋ฉด
cafe <- read.csv(“./cafe.cav”)
meanValue <- mean(cafe$price, na.rm = T) ํ๋ฉด ๋๋ค.
cafe <- read.csv("./cafe.csv", header = T, na.rm = T)
๋ฌผ๋ก Mac์์๋ read.csv()ํจ์๋ฅผ ์ฌ์ฉํ ์ ์๋ค. ๋ฐ๋ผ์ cafe.csv ํ์ผ์ด ๊นจ์ง์ง ์์ ์ ์์ ์ธ ํ์ผ์ด๋ผ๋ฉด ์์ ์ฝ๋๋ ๋งฅ์์ ๋์ ๊ฐ๋ค.
ํ์ง๋ง .xslx ํ์ผ์ .csvํ์ผ๋ก ๋ณํํ๋ ๊ณผ์ ์์ ํ์ผ์ด ๊นจ์ง๊ธฐ ๋๋ฌธ์ ํ์ผ์ readํ ๋๋ถํฐ .xlsxํจ์๋ฅผ ์ฌ์ฉํด์ผ๋ง ํ๋ค๋ฉด, ์๋์ ๊ฒฐ์ธก์น ์ ๊ฑฐ ๋ฐฉ๋ฒ์ ๊ถํ๋ค.
โ
โ
์์
์์๋ก cafe.xlsx ํ์ผ์ ์ปฌ๋ผ ์ค ํ๋๊ฐ price๋ผ๊ณ ํ์. ๊ทธ๋ฆฌ๊ณ price์ ํ๊ท ๊ฐ์ ๊ตฌํ๊ณ ์ ํ๋ค. price์ ๊ฐ ์ค ํ๋๊ฐ NA๋ก Not Answer, ์ฆ ์๋ต์๊ฐ ๋ตํ์ง ์์ ๊ฐ์ด๋ค. ํด๋น ๊ฐ์ด ์๋ค๋ฉด price์ ํ๊ท ๊ฐ์ NA๋ก ๋ํ๋๋ค. ๋ฐ๋ผ์ NA๋ฅผ ์ ๊ฑฐํ์.
cafe <- read_xlsx("./cafe.xlsx")
is.na(cafe) # cafe ํ
์ด๋ธ์์ ๊ฒฐ์ธก์น๊ฐ ์๋์ง ํ์ธํ๋ ํจ์. ๊ฒฐ์ธก์น๊ฐ ์๋ ์์น์์ TRUE๋ก ๋ํ๋๋ค.
cafe <- na
omit(cafe) # ์ด ํจ์๋ก ๊ฒฐ์ธก์น๋ฅผ ์ ๊ฑฐ!
mean(cafe$price)
mean(cafe$price) ์ ๊ฒฐ๊ณผ๋ NA๋ก ๋ํ๋ ๊ฒ์ด๋ค.
โ
๊ฒฐ์ธก์น ์์ ๊ธฐ
cafe <- read_xlsx("./cafe.xlsx")
na.omit()ํจ์๋ก ๊ฒฐ์ธก์น๋ฅผ ์ ๊ฑฐํ๋ค. ์ด์ mean()ํจ์๋ฅผ ์ฌ์ฉํ ๋, NA๊ฐ ์๋, ์ํ๋ ํ๊ท ๊ฐ์ด ๋์ฌ ๊ฒ์ด๋ค.
Mac์์ csv ํ์ผ์ ๋ถ๋ฌ์ฌ ๋ ๊นจ์ง๋ ํ์ ํด๊ฒฐํ๊ธฐ ๋งํฌ
2022.05.16 - [๐ ๊ฐ๋ฐ/R] - [R Programming] ์์ ํ์ผ์ ์ฝ์ in R
'๐ ๊ฐ๋ฐ > R' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[R Programming] ๋งฅ๋ถ์์ ์์ ํ์ผ์ ์ฝ์ in R (1) | 2022.05.16 |
---|
๋๊ธ