본문으로 바로가기

학습 목표 

- Ruled based learning

- Decision Tree

- Linear Regression

 

위의 3가지는 요새는 잘쓰이지는 않지만 한계를 알아보기 위해 파악해본다.

 

Ruled based learning

Perfect world 라는 System이 있다고 가정해보자.

Sky, Temp , Humid , Wind , Water , Forecast 의 정보에 따라 Enjoy Sport을 할것인지 말것인지를 결정을 하려고 한다.

 

Perfect system은 아래의 특징을 따른다.

 

- 관측 에러는 없다.

- 일관적이지 않은 관측이 없다.

  (완벽히 관측되고 완벽히 일관적이다. 비가오면 계속 비가오는것이지 도중에 해가 뜨지 않는다.)

- 정보(Sky, Temp , Humid , Wind , Water , Forecast )가 모두 주어지면 이 System의 의사결정을 설명할수 있다.

 

어떠한 Factor가 Enjoy Sport를 하는데 가장 큰 영향을 주는지 찾아보자.

 

<용어 정리>

Instance X : 하나의 Sample을 의미.

위의 표에따르면 < Sunny , Warm , Normal , Strong , Warm ,Same > 이다. ( 첫번째줄)

Label : 판단의 결과. Enjoy sport의 Yes / No

Training Datset : 여러개의 Instance X를 모아둔것.

Hypotheses (H): 가설을 세워 Y를 추론. 여러개의 H가 가능하다. 

Target Function (C) : 우리가 알지못하고 데이터를 통해 추론해야할 Funciton.

 

Graphical Representation of Function Approximation

 

xi : Input vector

x1은 h1 / h2 / h3 각각 가설에 따르면 항상 Enjoy sport 이다.

- 예를 들어 h1의 가설은 Sunny , Warm 만 충족하면 Enjoy sport 인데 , x1은 h1의 기준을 만족한다.

x2는 h3 가설에 따라 판별해보면 No Enjoy sport 이다. (h3의  Strong 기준이 맞지 않기 때문)

 

h1은 조건을 만족시키는데 덜까다롭지만 h3는 조금 더 까다롭다. 즉 h1은 general 한 hypotheses이고

h3는 specific한 hypothese 이다.