[데이터 분석] 지도학습의 분석 절차
지도학습의 분석 절차 1. 분석의 목적을 기반한 데이터 수집 - 요인(설명변수=x), 결과(종속변수=y) - Feature Selection : 설명변수 선택, y에 어떠한 변수들이 영향을 많이 미칠지 고민하는 과정 (Y ~ x1, x2, x3 ....) 2. 알고리즘 선택 - 회귀(연속형 데이터) or 분류(펙터형 데이터) => 데이터의 특성, 목적에 따라 선택 3. 알고리즘 적용 - 선택된 설명변수들(x)과 종속변수(y) 간 패턴 발견이 목적 - 결과(종속변수=y)가 있는 전체 100% 데이터를, 70%의 학습 데이터(training data), 30%의 검증 데이터(test data)로 랜덤 추출 (보통 70:30 비율로 분리) 4. 학습 데이터 기반 모델 생성 - 70%의 학습 데이터(traini..
Data/Analysis
2019. 1. 15. 17:00