ml.yah.ac/
opentutorials.org/course/4548/28945
군집화란, 비슷한 것들을 찾아서 그룹을 만드는 것이다.
분류와 비슷해보이지만 비교하자면,
어떤 대상들을 구분해서 그룹을 만드는 것이 군집화라면,
분류는 어떤 대상이 어떤 그룹에 속하는지를 판단하는 것이라고 할 수 있다.
연관 규칙 학습이란, 서로 연관된 특징을 찾아내는 것이다.
쇼핑 추천, 음악 추천, 영화 추천, ... 등
추천이 이름 뒤에 붙은 것들은 거의 다 연관규칙을 이용한 것이라고 보면 된다.
잘 생각해보면 연관규칙은 서로 관련이 있는 특성(열)을 찾아주는 머신러닝의 기법이라는 것을 알 수 있다.
- 관측치(행)를 그룹핑 해주는 것
군집화
- 특성(열)을 그룹핑 해주는 것
연관규칙
비지도 학습과 지도 학습의 차이점을 비교해보자.
비지도 학습은 탐험적이다.
탐험이 미지의 세계를 파악하는 것이듯,
데이터들의 성격을 파악하는 것이 목적이다.
독립변수와 종속변수의 구분이 중요하지 않다. 데이터만 있으면 된다.
지도 학습은 역사적이다.
과거의 원인과 결과를 바탕으로 결과를 모르는 원인이 발생했을 때
그것은 어떤 결과를 초래할 것인가를 추측하는 것이 목적이다.
그래서 원인인 독립변수와 결과인 종속변수가 꼭 필요하다.