정규화 (Normalization)
Feature의 스케일이 심하게 차이 나는 경우에 수행
→ 정규화 방법
- MIN-MAX 정규화
- ( X - MIN ) / ( MAX - MIN )
- Z-Score 정규화
- ( X - X.Mean() ) / X.표준편차
pd.crosstab()
python pandas 에서 데이터 재구조화에 여러 함수가 있음
- pivot(), pivot_table()
- stack(), unstack()
- melt()
- wide_to_long()
- crosstab()
→ 두개 이상의 factor로 빈도표를 만들때 가장 간편하게 쓸 수 있는 방법
전처리에 필요한 간편한 함수들을 계속해서 써먹고 있다. 다 기억할 수는 없지만 필요할때 검색해서 바로바로 쓸 수 있을 정도로 익숙해 지는게 좋겠다.
EDA를 기반으로 종합적인 정리가 한번 필요할 것 같다.
Uploaded by Notion2Tistory v1.1.0