Support Vector Machine (SVM)

working now

Support vector Machine이 뭘까?


☾ Table of contents

☺︎ A definition of Support Vector Machine (SVM)

☺︎ SVM vs one-class SVM

☻ Reference

☺︎ A definition of Support Vector Machine (SVM)

차원축소라는 것은 무엇일까?

SVM

분류(classification), 회귀(regression), 특이점 판별(outliers detection) 에 쓰이는 지도 학습 머신 러닝 방법 중 하나이다 [1].

  • SVC : Classification
  • SVR : Regression
  • OneclassSVM : outlier detection에 사용

최적의 분리초평면 (hyperplane) 찾아서 분류 및 회귀를 수행함 SVM은 훈련시간이 상대적으로 느리지만, 정확성이 뛰어나며 다른 방법보다 과대적합의 가능성이 낮은 모델 임

해당거리 (maximum margin)의 중간 지점인 hyperplane으로 각 그룹을 구분 짓는 방법 SVC는 데이터가 선형인 경우, 잘 작동하지만 비선형인 경우 잘 작동하지 않음 결론적으로 마진 거리를 멀게하는 것이

Elements of SVM

  • 결정경계 (decision boundary) : 데이터 분류의 기준이 되는 경계면
  • 초평면 (hyperplane) : 데이터를 분리하기 위해서 2개를 분리하는 결정영역이 있어야하고, 이 결정영역을 결정짓기위해서 초평면 선택이 필요함.
  • 마진 (margin): 결정경계에서 서포트벡터까지 거리임. 최적의 결정경계는 마진을 최대화 함.
  • 서포트 벡터 (support vector) : 훈련데이터 중에서 결정 경계와 가장 가까이에 있는 데이터들의 집합
  • 슬랙 변수 (slack variables) : 완벽한 분리가 불가능할때 선형적으로 분류를 위해 허용된 오차를 위한 변수; 소프트 마진 SVM (Soft margin SVM)에서 사용함

서포트 벡터 머신 종류

  • 하드 마진 : 마진의 안쪽과 바깥쪽에 절대로 잘못 분류된 오 분류를 허용하지 않는 SVM; 노이즈로 인하여 최적의 결정경계를 잘못 구할 수도 있고, 못 찾을경우도 발생 할 수 있다.
  • 소프트 마진 : 마진의 안쪽이나 바깥쪽에 절대로 잘못 분류된 오 분류를 허용하는 SVM; 하드 마진 SVM은 적용하기 어려우므로 어느 정도의 오류를 허용하는 소프트 마진 SVM을 주로 이용함

SVR : SVM을 회귀에 적용하는 방법으로, SVC와 목표를 반대로 함. 마진 내부에 데이터가 최대한 많이 들어가도록 학습함 마진의 폭은 epsilon통해서 조절

☺︎ SVM vs One-class SVM

☻ Reference

  • [1] https://wooono.tistory.com/111
  • [2] eigenvalue + eigenvector + covariance https://blog.naver.com/angryking/221206754322

Thanks for reading. Hope to see you again :o)

Written on December 31, 2023