Supervised Learning

지도 학습 (영어: Supervised Learning)은 훈련 데이터(Training Data)로부터 하나의 함수를 유추해내기 위한 기계 학습(Machine Learning)의 한 방법이다. 훈련 데이터는 일반적으로 입력 객체에 대한 속성을 벡터 형태로 포함하고 있으며 각각의 벡터에 대해 원하는 결과가 무엇인지 표시되어 있다. 이렇게 유추된 함수 중 연속적인 값을 출력하는 것을 회귀분석(Regression)이라 하고 주어진 입력 벡터가 어떤 종류의 값인지 표식하는 것을 분류(Classification)라 한다. 지도 학습기(Supervised Learner)가 하는 작업은 훈련 데이터로부터 주어진 데이터에 대해 예측하고자 하는 값을 올바로 추측해내는 것이다. 이 목표를 달성하기 위해서는 학습기가 "알맞은" 방법을 통하여 기존의 훈련 데이터로부터 나타나지 않던 상황까지도 일반화하여 처리할 수 있어야 한다. 사람과 동물에 대응하는 심리학으로는 개념 학습(Concept Learning)을 예로 들 수 있다.

즉, 주어진 정답이 있을때 사용할 수 있다. 이런 문제들은 많은데, Regression 이나 Classification 등이 있다.

Problem

Supervised learning은 문제의 타입 (problem type)에 따라 크게 두가지로 분류될 수 있다.

Regression problem: 먼저 Regression problem이란 기대되는 목적값이 continuous 한 연속성을 가지고 있을 때, Regression problem 이라고 한다. 즉 평수에 의한 아파트 값은 Regression problem이다, 22평일 때 가격이 1억, 23평일 때 1.2억,24평일 때 1.4억과 같이 Feature x_i에 대해서 Targeted value y_i가 기대 되는 경우 Regression problem이라고 한다.

Classification problem: Classification problem은 목적값이 continuous한 연속성이 없이 몇가지 값으로 끊어지는 경우이다. 예를 들어 “나이가 20대이고, 종양의 크기가 2cm이면 음성암”,”나이가 50대이고 종양의 크기가 3cm 이면 양성암” 과 같이 나이,종양과 같은 Feature에 대해서 기대되는 target value가 양성/음성과 같이 연속성이 없이 몇 개의 분류로 딱 떨어지는 경우를 Classification problem이라고 한다.

Favorite site

Wikipedia (en) 지도학습에 대한 설명
삼성소프트웨어멤버십 PLAYGROUND :: 7기 신촌 박진상: 기계학습 #1 - 지도학습
[추천] Self-Supervised Representation Learning ¹ - 자가 학습 학습은 레이블이없는 데이터를 더 잘 활용하는 동시에 감독 학습 방식으로 학습 할 수있는 큰 기회를 제공합니다. 이 게시물은 이미지, 비디오 및 제어 문제에 대한 자율 학습 작업에 대한 많은 흥미로운 아이디어를 다룹니다.

References

Self-Supervised_Representation_Learning.pdf ↩

Supervised Learning

Problem

See also

Favorite site

References