컴퓨터/이론 및 tools 사용

데이터마이닝 weka - IBK (KNN K-Nearest Neighbor)

review777777 2016. 11. 4. 03:02
반응형

데이터 마이닝 기법 해보기

확장자 .arff로 바꿔야 weka에서 사용 가능함

(http://slavnik.fe.uni-lj.si/markot/csv2arff/csv2arff.php 사이트에서 변환)

데이터는 http://learnersdesk.weebly.com/weka-tutorials.html

http://storm.cis.fordham.edu/~gweiss/data-mining/datasets.html 다운.

 

 

IBK(KNN K-Nearest Neighbor)

근접 이웃의 비효율성을 없애려고 제안된 기법

K 근접 이웃은 가장 근접한 K개의 데이터로 클래스를 분류

과거 데이터 인스턴스를 사용하여 새 데이터 인스턴스의 결과물을 예측할 수 있는 데이터 마이닝 기술이다.

bmwreponses(수입/첫번째구매/마지막구매/반응) 를 이용해서 예측해봤다.

classify에서 lazy -< IBK를 이용하면 된다.

 

 

88.7667% 정확도를 기록

 

한다.

Confusion Matrix에 보면 76의 거짓 긍정과 261의 거짓부정이 있다.

반응형