svm 예제 r

클래스가 선형 경계로 분리가능한 경우 최대 마진 분류기를 사용하여 분류 경계를 찾을 수 있습니다. 분리된 데이터의 예를 시각화하기 위해 40개의 무작위 관측을 생성하고 두 클래스에 할당합니다. 육안 검사를 통해 두 클래스를 분할하는 무한한 많은 줄이 존재한다는 것을 알 수 있습니다. 이제 데이터의 데이터 프레임을 만들어 y를 요인 변수로 전환합니다. 그런 다음 y를 응답 변수 및 기타 변수를 예측 변수로 사용하여 이 데이터 프레임에서 svm을 호출합니다. 데이터 프레임은 x1 및 x2라는 2개의 열로 행렬 x의 압축을 풀것입니다. SVM에 커널이 선형이고, 조정 매개 변수 비용이 10이고 배율이 false임을 알려줍니다. 이 예제에서는 변수를 표준화하지 않도록 요청합니다. 현재 교육 데이터는 x 및 y입니다.

이전 예제에 대해 이미 생성된 경우 x 및 y입니다. 따라서이 새 데이터를 첨부 할 수 있도록 제거해 보겠습니다. 이전 섹션의 선형 SVM도 마찬가지입니다. 이제 SVM의 비선형 버전으로 이동해 보겠습니다. 결정 경계가 비선형인 2차원의 표준 예가 있는 통계 학습의 교과서 요소의 예를 살펴보겠습니다. 커널 지원 벡터 머신을 사용하여 해당 경계를 학습합니다. 지원 벡터 머신(SVM)은 분리 하이퍼플레인에 의해 공식적으로 정의된 차별적 분류자입니다. 즉, 레이블이 지정된 학습 데이터(감독 학습)가 주어지면 알고리즘은 새로운 예제를 분류하는 최적의 하이퍼플레인을 출력합니다. 위의 예에서는 공간을 더 높은 차원으로 영리하게 매핑하여 비선형 데이터를 분류하는 방법을 찾았습니다. 그러나 이 변환을 계산하면 계산 비용이 많이 들 수 있습니다. 데이터 집합의 모든 벡터에 대해 이 작업을 수행하는 것은 많은 작업이 될 수 있으므로 더 저렴한 솔루션을 찾을 수 있다면 좋을 것입니다.

SVM은 강력한 기술이며 배포를 알 수 없는 데이터(데이터의 비규칙성이라고도 함)에 특히 유용합니다. 여기서 고려된 예제는 두 개의 기능으로만 구성되므로 여기에 있는 R에 의해 장착된 SVM을 선형 SVM이라고도 합니다. SVM은 다양한 종류의 데이터를 처리하기 위한 커널로 구동되며 모델 튜닝 중에 커널도 설정할 수 있습니다. 이러한 예로는 가우시안 및 방사형이 있습니다.

Next Post:
Previous Post: