개요
- Tom M. Mitchell (CMU) 정의
- “A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E.”
- 즉, 특정 작업 T에 대해 경험 E를 통해 성능 P가 향상되는 과정
- 명시적인 규칙을 프로그래밍하지 않고, 데이터로부터 패턴을 스스로 학습하는 방법
- AI ⊃ ML ⊃ 딥러닝 포함 관계
학습 종류
지도 학습 (Supervised Learning)
- 입력(X)과 정답 레이블(Y)이 쌍으로 주어진 데이터를 사용해 학습
- 모델은 X → Y 매핑 함수를 학습
- 종류
- 분류 (Classification): 범주형 출력 예측
- 예: 스팸 메일 판별, 이미지 분류, 질병 진단
- 알고리즘: Logistic Regression, SVM, Decision Tree, Random Forest
- 회귀 (Regression): 연속형 수치 출력 예측
- 예: 주가 예측, 집값 예측
- 알고리즘: Linear Regression, Ridge, Lasso
비지도 학습 (Unsupervised Learning)
- 정답 레이블 없이 입력 데이터만으로 숨겨진 구조·패턴을 발견
- 종류
- 군집화 (Clustering): 유사한 데이터를 그룹화
- 예: 고객 세분화, 문서 분류
- 알고리즘: K-Means, DBSCAN, Hierarchical Clustering
- 차원 축소 (Dimensionality Reduction): 고차원 데이터를 저차원으로 압축
- 예: 데이터 시각화, 노이즈 제거
- 알고리즘: PCA, t-SNE, Autoencoder
반지도 학습 (Semi-supervised Learning)
- 레이블이 있는 소수의 데이터와 레이블 없는 다수의 데이터를 함께 사용
- 레이블링 비용이 높을 때 유용 (의료 이미지, 법률 문서 등)
- 예: 이미지 레이블의 10%만 사용해 분류 모델 학습
강화 학습 (Reinforcement Learning)
- 에이전트(Agent)가 환경(Environment)과 상호작용하며 보상(Reward)을 최대화하는 정책(Policy)을 학습
- 핵심 요소
- 에이전트, 환경, 상태(State), 행동(Action), 보상(Reward)
- 예: AlphaGo, 로보틱스, 게임 AI, RLHF (LLM 정렬)
주요 개념
과적합과 과소적합 (Overfitting / Underfitting)
- 과적합: 훈련 데이터에는 잘 맞지만 새로운 데이터에 일반화 실패
- 대처: 정규화(Regularization), Dropout, 데이터 증강, 조기 종료(Early Stopping)
- 과소적합: 모델이 너무 단순하여 훈련 데이터조차 제대로 학습 못함
- 대처: 모델 복잡도 증가, 더 많은 특성(Feature) 사용
교차 검증 (Cross Validation)
- 데이터를 여러 폴드(Fold)로 나눠 모델의 일반화 성능을 평가
- K-Fold: 데이터를 K개로 분할 후 K번 학습·평가를 반복
- 목적: 테스트 데이터 누출(Data Leakage)을 방지하고 신뢰 있는 성능 추정
하이퍼파라미터 튜닝 (Hyperparameter Tuning)
- 학습률(Learning Rate), 배치 크기, 트리 깊이 등 학습 전에 설정하는 파라미터 최적화
- 방법: Grid Search, Random Search, Bayesian Optimization
특성 공학 (Feature Engineering)
- 원시 데이터에서 모델 학습에 유용한 특성(Feature)을 추출·변환·생성
- 도메인 지식이 중요하며 모델 성능에 큰 영향
평가 지표
| 태스크 |
지표 |
| 분류 |
Accuracy, Precision, Recall, F1-Score, AUC-ROC |
| 회귀 |
MSE, RMSE, MAE, R² |
| 군집화 |
Silhouette Score, Davies-Bouldin Index |
주요 알고리즘 비교
| 알고리즘 |
유형 |
특징 |
| Linear Regression |
지도 (회귀) |
단순, 해석 용이 |
| Logistic Regression |
지도 (분류) |
이진 분류 확률 출력 |
| Decision Tree |
지도 |
해석 용이, 과적합 취약 |
| Random Forest |
지도 |
앙상블, 높은 정확도 |
| SVM |
지도 |
고차원 효과적, 커널 트릭 |
| K-Means |
비지도 (군집) |
단순, K 사전 지정 필요 |
| XGBoost |
지도 |
그래디언트 부스팅, 고성능 |
관련 포스트