본문 바로가기

SMALL

naive bayes1

데이터마이닝 R - Naive bayes classification 실습 1. spam data를 이용하여 분류 모델을 만들고 결과 해석(비복원추출방법 사용) spam의 data를 사용하려면 library "kernlab" 을 install 해줘야한다. (명심!) spam dataset은 총 4601개의 이메일에서 등장하는 단어의 종류와 관련된 58개의 변수로 구성이 되어있다. 여기서 마지막 type은 스팸인지 아닌지를 구별하는 변수로 이 변수를 통하여 분류 모델을 구성할 것이다. library "klaR"을 사용하기 위해 먼저 install 해주고, 비복원추출로 분석하며 데이터의 70%를 train data로, 나머지를 test data로 사용한다. 4601개의 데이터이기 때문에 3220개의 데이터를 train 데이터로 지정해주었다. model1이라는 변수에 학습된 Naïv.. 2020. 5. 18.

이전 1 다음

티스토리툴바