머신러닝, 딥러닝 개념(10)
-
지도 학습(7) : 나이브 베이즈
이번 포스팅은 다음 교재의 내용을 참고해서 작성했다.https://web.stanford.edu/~jurafsky/slp3/4.pdf① 베이즈 정리(Bayes' Theorem)조건부확률(Conditional Probability) 두 사건 $A$, $B$가 있다고 하자. 사건 $A$가 일어났다는 조건 하에 사건 $B$가 일어날 확률을 '사건 $B$에 대한 사건 $A$의 조건부확률'이라 하며, 기호로는 $P(B|A)$와 같이 표시한다. $P(B|A)$를 구하는 공식은 다음과 같다.$$P(B|A) = \frac{P(B \cap A)}{P(A)}$$ 베이즈 정리(Bayes' Theorem) $P(B|A)$를 다음과 같이 쓸 수도 있다.$$P(B|A) = \frac{P(A|B)P(B)}{P(A)}$$이 공식 자..
2025.03.18 -
지도 학습(6+) : 서포트 벡터 머신 심화
이 포스팅에서는 Support Vector Machine에서 쓰이는 수학 개념 위주로 다룬다. 서포트 머신 벡터에 대한 기본 개념은 다음 포스팅을 참고하기 바람.https://one-plus-one-is-two.tistory.com/17 지도 학습(6) : 서포트 벡터 머신① 서포트 벡터 머신(Support Vector Machine, SVM) 개요두 개의 클래스가 존재하는 데이터셋이 다음과 같이 분포되어 있다고 하자. 위 그림에서 두 클래스를 구분짓는 직선을 하나 그어보라고 하면 그one-plus-one-is-two.tistory.com 이번 포스팅은 다음 교재의 내용을 참고하여 작성하였다.https://see.stanford.edu/materials/aimlcs229/cs229-notes3.pdf 포..
2025.03.15 -
지도 학습(6) : 서포트 벡터 머신
① 서포트 벡터 머신(Support Vector Machine, SVM) 개요두 개의 클래스가 존재하는 데이터셋이 다음과 같이 분포되어 있다고 하자. 위 그림에서 두 클래스를 구분짓는 직선을 하나 그어보라고 하면 그을 수 있을까? 당연히 그을 수 있다! 왼쪽 아래에는 파란 점만 몰려 있고 오른쪽 위에는 빨간 점만 몰려 있으니 이들을 구분하는 선을 긋는 것은 식은 죽 먹기다. 그래서 다음과 같이 두 클래스를 구분 짓는 직선을 그어보았다.직선을 기준으로 아래에는 파란 점들만, 위에는 빨간 점들만 있기 때문에 클래스별로 구분이 잘 되었다. 그런데 이때 어떤 클래스에 속하는지 모르는 미지의 데이터 2개가 들어왔다고 해보자. 미지의 데이터는 점 (2, 5)에 하나, 점 (5, 6)에 하나 들어와 있다. 그래프에..
2025.03.14 -
지도 학습(5) : k-최근접 이웃
이번 포스팅은 다음 교재의 내용을 참고해서 작성했다.https://sebastianraschka.com/pdf/lecture-notes/stat479fs18/02_knn_notes.pdf ① k-최근접 이웃(k-Nearest Neighbor, kNN) 개요 k-최근접 이웃(이후부터는 kNN이라고 씀)의 개념은 간단하다. 위 그림에서 몇 가지 데이터가 주어져 있고, 각 데이터는 class A 또는 class B로 분류되어 있다. 이때, 미지의 데이터가 들어왔을 때 이 데이터가 어느 클래스에 속하는지를 어떻게 판단할까? kNN에서는 미지의 데이터와 거리가 가장 가까운 k개의 데이터를 뽑아내고, 뽑아낸 데이터들 중 가장 많은 데이터가 속하는 클래스로 미지의 데이터를 분류한다. 예를 들어, 위 그림에서 k=3이..
2025.03.10 -
지도 학습(4) : 로지스틱 회귀
내가 포스팅을 5일 정도 쉬었는데... 사실 그동안 논건 아니고 포스팅을 뭘 써야할 지 고민을 많이 했다. 뭘 써야할지 고민해야 될 정도로 머신러닝은 양이 방대한데 또 나는 4학년이니까 이거 개념 정리 하는거 말고도 졸업 프로젝트도 해야 되고, 공인 영어 성적이나 자격증도 따야되고, 공모전도 나가보고... 학부 연구생이나 인턴도 해야될 것 같은데 신경써야 할 일들이 너무 많은 것 같아서 힘들다. 이번 포스팅은 다음 교재의 내용을 참고해서 작성했다.https://web.stanford.edu/~jurafsky/slp3/5.pdf ① 로지스틱 회귀(Logistic Regression)로지스틱 회귀는 이름은 회귀지만 사실 분류 목적으로 쓰이는 알고리즘이다. 어떤 결과가 발생할 확률을 예측함으로써 이진 분류 작..
2025.03.10 -
지도 학습(3) : 다항 회귀, 릿지 회귀, 라쏘 회귀, 엘라스틱 넷
① 다항 회귀(Polynomial Regression)다항 회귀는 주어진 데이터를 다음과 같이 다항함수 꼴로 적합시키는 회귀이다.이번 내용은 앞에서 포스팅한 다중 선형 회귀에 대해 알고 있어야 이해하기가 쉽다. 따라서 아직 해당 내용을 읽지 않았다면 읽고 오는 것을 권장한다.https://one-plus-one-is-two.tistory.com/12 지도 학습(2) : 다중 선형 회귀② 다중 선형 회귀(Multiple Linear Regression)이번에 다룰 선형 회귀는 가중치가 2개 이상인 다중 선형 회귀이다. 다중 선형 회귀의 수식을 쓰면 다음과 같다. 여러 개의 입력값 $x$가 들어오고, 그 개one-plus-one-is-two.tistory.com 다항 회귀도 다중 선형 회귀와 비슷하게 다음..
2025.03.05