머신러닝의 기법은 다양하지만 크게 세가지로 나누게 된다면 지도학습, 비지도학습, 강화학습이다.
지도학습(supervised learning)
지도학습이란 기계에 무언가를 가르친다는 의미이다. 예를 들어 문제와 답을 학습시켜서 비슷한 문제가 나오면 풀수있게 하는것이 지도학습이다. "문제집으로 학생을 가르치듯이 지도하는것"이 지도학습이라고 생각하면된다.
위의 표를보면 온도에 따라서 판매량이 변화되는 것을 볼수있다.
"그러면 1.9일의 온도에 따라 판매량을 추측할수있지 않을까?" 라는 생각을 가질수있다.
결국 지도학습은 과거의 데이터를 학습해서 결과를 예측하는데 주로 사용되는 것을 볼수있다.
지도학습에는 독립변수(원인)과 종속변수(결과)를 통해서 모델을 만들고 모델을 통해 문제를 해결하고 있다.
지도학습을 잘하기 위해서는 충분히 많은 데이터(독립변수, 종속변수)가 필요한것을 볼수있다.
결국 머신러닝(지도학습)을 통해 일반인들도 미래에 대한 예측과 예측에 가능한 공식을 만들수 있기 때문에 과거에는 소수의 천재들이 만든 공식을 사용하는 사용자였으면 지금은 공식을 만드는 생산자가 될수있다.
회귀(Regression)
예측하고 싶은 종속변수(결과)가 "숫자"일때 회귀라는 머신러닝의 방법을 사용한다.
위의 온도와 판매량에서 판매량이 숫자이기 때문에 회귀 방법이다.
앞으로 문제가 생겼을때 예측하고 싶은 결과가 숫자이면 회귀방법을 사용해서 문제를 해결하면된다.
분류(classfication)
종속변수(추측하고 싶은결과)가 "이름 혹은 문자"일때는 분류를 사용한다.
데이터에 독립변수와 종속변수가 있으면 지도학습 방법을 고려하고 종속변수가 숫자이면 회귀 문자이면 분류를 사용하면된다.
비지도학습(unsupervised learning)
군집화(clustering)
군집화 vs 분류
군집화는 비슷한것들끼리 모아서 적당한 그룹을 만드는것이다. 분류는 그룹을 만들고 난 후에 각각의 것들을 적당한 그룹에 위치하게 하는것이다. 군집화와 분류는 그룹화한다는것은 공통점이지만 물건들을 모으고 그룹화 또는 그룹을 만들고 물건을 넣느냐에 따라 차이점을 둔다.
군집화의 예)
택배 배송시스템을 만드는데 이용자가 전국에 1000만명이된다. 내가 만들수 있는 택배 본부는 100개밖에 안된다.
이용자의 배달주소 정보가 있는 표만 보고서는 100개의 본부를 어느곳에 설치해야될지 어렵기 때문에 100개의 본부로 1000만명의 이용자를 커버하는 방법에 군집화를 이용한다.
군집화를 통해 비슷한 정보를 가지고 있는것끼리 그룹핑할수있다.
즉, 군집화는 비슷한 행(관측치)끼리 "그룹핑"하는것이다.
https://opentutorials.org/course/4548/28934
https://opentutorials.org/course/4548/28938
https://opentutorials.org/course/4548/28942
https://opentutorials.org/course/4548/28945
'Machine Learning' 카테고리의 다른 글
[ML] Pre3. 머신러닝을 배우기 전 필요한 지식 (0) | 2021.07.26 |
---|---|
[ML] Pre2. 모델(Model) (0) | 2021.02.10 |
Pre 1.머신러닝이란? (0) | 2021.02.09 |
0. 머신러닝 공부하기 앞서... (1) | 2021.02.09 |
댓글