Sklearn(사이키런), 이상치처리
저번에는 "python으로 구현" 하지만 상당히 어려워 python machine Learning Library를 사용하는데 그중 대표가 Sklearn(사이키런) -Sklearn(사이키런)은 간단한 문제는 가능하나 복잡하거나 deep learning은 python코드로 사용 -python과 sklearn을 이용해 온도에 따른 ozone량 예측을 해보았으나 2가지 차 발견 -machine learning에서 학습이 잘되기 위해서는 data전처리가 필수!! 1.결측치 : nan 2.이상치(outlier) : data의 일반적인 값보다 상대적으로 큰 data = 전체 data 패턴에서 동떨어져있는 관측치 - 이런 이상치는 "평균"에 영향을 많이 끼치기 때문에 반드시 처리해야한다 - 독립변수 이상치 : 지대점,..
2021.08.31