변수는 원인이 되는 X변수(독립변수) , 결과가 되는 Y변수(종속변수) 로 나눌 수 있다.
예측은 수치 예측과 범주 예측으로 나눌 수 있는데, 수치 예측은 Y변수가 연속형이고, 범주 예측은 Y변수가 범주형이다.
* 연속형 데이터 : 데이터 자체가 숫자로 표현됨 ex. 가격, 길이
범주형 데이터 : 원칙적으로 데이터를 숫자로 표현할 수 없음 ex. 제품불량여부
수치 예측 (Regression)
- 결과가 수치인 값을 예측하는 것이다.
- 수치예측 예로는 중고차 가격 예측 등이 있다.
범주 예측 (분류, Classification)
- 결과가 어느 분류에 포함되는지를 예측하는 것이다.
- 범주 예측 예로는 불량 예측, 고객 이탈 여부 예측, 스팸 여부 예 등이 있다.
출처
- 김성범 [교수 / 산업경영공학부]