빅데이터 기초과정에서 R을 배우는 문과생입니다.
과제로 한 컴퓨터 부품 판매 사이트의 데이터를 다루는 것을 하고 있는데요.
> str(customerall)
'data.frame': 4500 obs. of 11 variables:
$ regcust : Factor w/ 4500 levels "aarxcntv","aasiueyx",..: 1 2 3 4 5 6 7 8 9 10 ...
$ frequency: int 13 17 6 16 4 19 20 14 13 12 ...
$ sales : int 64083 119498 34974 108474 20007 154353 114934 66965 145667 62457 ...
$ age : int 28 16 23 11 11 28 11 39 11 11 ...
$ sex : Factor w/ 2 levels "F","M": 2 2 2 2 2 2 2 2 1 2 ...
$ type : Factor w/ 2 levels "Basic","Premium": 1 1 1 1 1 2 1 1 2 1 ...
$ regyear : int 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 ...
$ regmon : int 6 5 6 5 6 5 6 6 5 5 ...
$ ageGroup : Factor w/ 3 levels "Adult","Young",..: 2 3 2 3 3 2 3 1 3 3 ...
$ status : int 1 1 1 1 1 1 1 1 1 1 ...
$ lifeValue: int 0 0 0 0 0 0 0 0 0 0 ...
위와 같은 구조로 이루어져있습니다.
각 column의 의미는 위에서부터 차례로
암호화된 고객 ID
구매 횟수
매출
나이
성별
유/무료 고객 구분
가입년도
가입월
나이대
활동여부
생애가치(경영학 용어)
입니다.
받은 문제 중 하나는 sales항목이 NA값을 가진 고객의 status를 0으로 변환하라는 것인데요
저는
csutomerall 데이터프레임의 sales 변수에서 결측치를 보이는 고객의 statue를 0으로, 그렇지 않은 고객은 1로 바꿔라
라고 하고 싶어서
customerall$status<-ifelse(customerall$sales=='NA',"0","1")
라고 입력을 하였습니다.
그런데 그 후
summary(customerall) 을 하여 데이터를 확인해보니
status 항목이 integer에서 charactor로 변환이 되어버린 것을 확인할 수 있었습니다.
우측 상단의 environment에서 해당 변수 customerall을 클릭해 데이터를 열어보니
sales항목이 N/A인 항목들의 status가 0이 아닌 N/A로 변환이 되어있구요..
어떻게 하면 sales항목이 NA값을 가진 고객의 status를 0으로 바꿀 수 있을까요??