scaling1 2-4. 데이터 전처리 - 데이터 분할 및 스케일링 1. 데이터 분할 데이터는 보통 train : val : test = 6 : 2 : 2 로 분할해 사용하는데, 데이터의 양을 고려해 조정하기도 한다. train : 학습을 위한 데이터셋 val : 학습한 모델의 검증하는 셋으로, val 데이터셋으로 평가한 결과를 통해 모델링의 하이퍼파라미터를 조정한다.(학습에 포함된다고 생각) test : test from sklearn.datasets import load_iris iris_load = load_iris() iris = pd.DataFrame(iris_load.data, columns = iris_load.feature_names) iris['Class'] = load_iris().target iris['Class'] = iris['Class'].map.. 2024. 2. 14. 이전 1 다음