머신러닝, 딥러닝 개념(10)
-
성능 지표(1) : 회귀 성능 지표 Ⅰ
머신러닝 라이브러리인 사이킷런(scikit-learn)의 공식 문서에는 다양한 머신러닝 지식들이 아주 잘 설명되어 있다. 성능 지표에 대한 설명도 다음 링크에 들어가보면 매우 잘 되어 있다.https://scikit-learn.org/stable/modules/model_evaluation.html# 3.4. Metrics and scoring: quantifying the quality of predictionsWhich scoring function should I use?: Before we take a closer look into the details of the many scores and evaluation metrics, we want to give some guidance, inspire..
2025.03.04 -
지도 학습(2) : 다중 선형 회귀
② 다중 선형 회귀(Multiple Linear Regression)이번에 다룰 선형 회귀는 가중치가 2개 이상인 다중 선형 회귀이다. 다중 선형 회귀의 수식을 쓰면 다음과 같다. 여러 개의 입력값 $x$가 들어오고, 그 개수만큼 가중치 $W$가 붙는 방식이다.위 수식을 벡터를 사용하여 표현하면 다음과 같다. $\rm w$ 벡터에 전치(Transpose) 기호인 T가 붙은 것 빼고는 단일 선형 회귀와 수식이 유사하다.전치를 하는 이유는 행렬을 배웠으면 알 것인데, 행렬의 곱셈은 ($l \times m$ 행렬)×($m \times n$ 행렬) 형태로만 가능하기 때문이다. 이때 결과는 $l \times n$ 행렬이 된다. 위에 주어진 두 벡터는 행렬 관점에서 보자면 $n \times 1$ 행렬인데 $(n ..
2025.03.01 -
지도 학습(1) : 단순 선형 회귀
이번에는 머신러닝의 선사시대 역할을 맡고 있는 선형 회귀에 대해 포스팅해보려고 한다. 선형 회귀는 개론에서도 약간 다룬 바 있지만 여기서는 수식과 코드를 동반하여 더 심화적인 내용까지 다룬다.① 단순 선형 회귀(Simple Linear Regression)선형 회귀(Linear Regression)에서 독립 변수는 하나 또는 그 이상이 될 수 있으나, 그 중에서 독립 변수가 하나인 경우만을 특별히 '단순 선형 회귀'라고 부른다. 독립 변수가 두 개 이상인 선형 회귀는 다중 선형 회귀(Multiple Linear Regression)라고 한다. 혹시 개론을 안 읽고 여기로 왔다면 개론을 먼저 읽고 오길 바란다. 선형 회귀에 대한 가장 기본적인 설명은 여기서 다 했다.https://one-plus-one-..
2025.02.27 -
머신러닝 개론 : 머신러닝 알고리즘, 손실 함수, 최적화
① 머신러닝 알고리즘지도 학습(Supervised Learning) : 라벨(정답)이 있는 데이터를 입력으로 받아 학습하는 알고리즘. 대표적으로 회귀와 분류가 있다.비지도 학습(Unsupervised Learning) : 라벨이 없는 데이터를 입력으로 받아 그 패턴을 학습하는 알고리즘. 대표적으로 클러스터링이 있다.회귀(Regression) : 지도 학습의 일종으로, 하나의 종속변수와 하나 이상의 독립변수 사이의 관계를 추정하는 작업분류(Classification) : 지도 학습의 일종으로, 데이터를 사전에 정의된 클래스 혹은 항목에 할당하는 작업클러스터링(Clustering) : 비지도 학습의 일종으로, 유사성이 높은 데이터들을 같은 그룹으로 묶는 작업이다.머신러닝 알고리즘 중 가장 기본적이고 쉬운 것..
2025.02.26