목록전체 글 (142)
컴공댕이 공부일지
보호되어 있는 글입니다.

참고 교재 - (위키북스) 파이썬 머신러닝 완벽 가이드 개정 2판 01. 차원 축소 (Dimension Reduction) 개요 많은 피처로 구성된 다차원 데이터 세트의 차원을 축소해, 새로운 차원의 데이터 세트를 생성하는 것 변수의 개수 = 차원의 개수 n개의 독립 변수들이 하나의 공간에 표현되려면, 공간이 n차원이여야 한다. 즉, 차원이 증가할수록 데이터 표현 공간이 복잡해진다. 그래서, 모델링이 어려워지기 때문에 기존 변수를 조합하는 차원 축소 기법을 사용하는 것이다. ㅡ 차원이 증가할수록, 데이터 포인트 간 거리가 멀어져, 희소한(드문드문한) 구조를 가지게 된다. 피처가 많을 경우, 개별 피처 간 상관관계가 높을 가능성도 크고, 적은 차원에서 학습된 모델보다 예측 신뢰도가 떨어진다. 특히, 선형 ..

참고 교재 - (위키북스) 파이썬 머신러닝 완벽 가이드 개정 2판 01. 자전거 대여 수요 예측 - 함수 정리 .subpots() : 여러 개의 그래프를 한 번에 표현 barplot() : 막대그래프 형태로 시각화 hist() : 빈도를 시각적 막대그래프로 표현하는 히스토그램을 그려주는 함수 tight_layout() : 요소 간격을 조종해 레이어를 최적화 - RMSLE MSE (오차의 제곱 평균) RMSE (mse에 루트) RMSLS (rmse에 로그 추가) 모두 값이 0에 가까울수록 좋은 성능. 그러나, 스코어링을 할 땐, neg 활용 log1p() 함수( log(x+1) )를 활용해 로그 변환해 오버/언더플로 오류를 해결한다. expm1() 함수로 원래 스케일로 다시 돌릴 수 있다. 특징 - 로그값..
보호되어 있는 글입니다.
보호되어 있는 글입니다.