티스토리 뷰

쓰기/TIL

2021/01/11

데이터켓 2021. 1. 11. 21:39

정규화 (Normalization)

Feature의 스케일이 심하게 차이 나는 경우에 수행

→ 정규화 방법

  1. MIN-MAX 정규화
    • ( X - MIN ) / ( MAX - MIN )
  1. Z-Score 정규화
    • ( X - X.Mean() ) / X.표준편차

pd.crosstab()

python pandas 에서 데이터 재구조화에 여러 함수가 있음

  • pivot(), pivot_table()
  • stack(), unstack()
  • melt()
  • wide_to_long()
  • crosstab()

    → 두개 이상의 factor로 빈도표를 만들때 가장 간편하게 쓸 수 있는 방법

전처리에 필요한 간편한 함수들을 계속해서 써먹고 있다. 다 기억할 수는 없지만 필요할때 검색해서 바로바로 쓸 수 있을 정도로 익숙해 지는게 좋겠다.

EDA를 기반으로 종합적인 정리가 한번 필요할 것 같다.

'쓰기 > TIL' 카테고리의 다른 글

2021/01/15 Clustering, pandas tips  (0) 2021.01.15
2021/01/14 eigenvector, PCA, One-hot-encoding  (0) 2021.01.15
2021/01/13 Linear algebra  (0) 2021.01.14
2021/01/06  (0) 2021.01.06
댓글
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2025/04   »
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30
글 보관함