-
[4장]ISL with R : QDA(이차판별분석)기초지식/ISL with R(통계학) 2023. 7. 20. 06:28반응형
선형판별분석(LDA: Linear Discriminant Analysis)과 이차판별분석(QDA: Quadratic Discriminant Analysis)
LDA는 먼저 클래스 간의 분포가 정규분포를 따르며, 각 클래스가 다른 평균 동일한 분산을 가질 때 독립변수(x)를 여러 클래스(k 개의 클래스) 중 어디에 속하는지를 판별하는 방식이었다. 여기에서 각 클래스의 분산이 다를 수도 있다는 가정을 추가한 것이 QDA이다.
QDA의 판별함수 도출(p>1인 경우)
QDA의 판별함수를 계산할 때는 LDA의 판별함수 계산과정에서 "각 클래스별 다른 공분산 행렬"이라는 가정만 추가해 주면 된다.([4장]ISL with R : LDA(선형판별분석) 참조 )
QDA도 LDA와 마찬가지로 아래와 같은 베이즈 정리에서 시작한다.
우리가 구하고자 하는 값은 "확률변수 X가 x 일 때, k라는 클래스에 속하는 확률"인 아래 식 2와 같은 사후확률이다.
베이즈 정리를 통해서 식 2를 "k 라는 클래스가 나올 확률 * k 클래스일 때 확률변수 X가 x일 확률(사전확률) / x 가 특정 클래스에 속할 모든 확률"로 바꿔 쓸 수 있다. 이때 k 클래스일 때 확률변수 X가 x일 확률인 사전확률은 아래 식 3과 같다.
데이터의 분포는 정규분포를 따르고 각 클래스의 평균과 공분산 행렬이 다르다는 가정을 통해 사전확률을 아래와 같이 정의할 수 있다. 아래 식 4에서도 알 수 있듯이 LDA와 다른 점은 단순히 공분산 행렬에 클래스별 구분이 들어갔다는 점이다.
식 4를 바탕으로 아래와 같은 사후확률을 구할 수 있다.
식 5의 사후확률을 정리하면 판별함수(델타_k) 를 도출할 수 있다. LDA와 다른 점은 클래스별 공분산 행렬이 같다는 가정하에 상수로 처리되던 부분이 가정이 달라지면서 더 이상 상수가 아니게 된다는 점이다.
반응형'기초지식 > ISL with R(통계학)' 카테고리의 다른 글
[4장]ISL with R : 로지스틱회귀 LDA QDA 실습 in R(재무지표를 통한 상승주 분류) (0) 2024.03.14 [4장]ISL with R : LDA(선형판별분석) (0) 2023.07.08 [4장]ISL with R : 로지스틱 회귀(회귀계수의 계산2: 최적해 도출) (1) 2023.04.09 [4장]ISL with R : 로지스틱 회귀(회귀계수의 계산1: 우도함수와 경사하강법) (0) 2023.04.05 [4장]ISL with R : 로지스틱 회귀(로지스틱 함수) (0) 2023.04.04