
데이터를 읽어 왔을 때, 날짜, 시간 정보가 str형태로, object인 경우가 많은데, pandas의 to_datetime 메소드로 형태를 바꿔줄 수 있다. return은 pandas datetime64 type이 된다. 아래와 같이 date가 object일 때. # format을 지정해 줄 수 있다. df['year'] = pd.to_datetime(df['date'], format='%Y%m%d %H:%M:%S') # datetime64 type의 dt.method에 handling 하기 좋은 도구가 많다. # 아래는 year를 4자리 숫자로 반환 df['year'] = pd.to_datetime(df['date'], format='%Y%m%d %H:%M:%S').dt.year 참고

np.array를 빠르게 pandas DataFrame으로 pd.DataFrame(df_after, columns=df_pre.columns,index=list(df_pre.index.values)) # 빠르게 설정, np.array 같은 데이터를 넣고, # 컬럼을 이전에 사용하던거 그대로 다시 넣고, 인덱스 설정해서 동일하게 만들어줌 sklearn 같은 패키지들이 함수가, np.arrayf를 반환할 때가 많기 때문에, 빠르게 데이터를 다시 pandas DataFrame 에 넣어주기 편한 방법 pd.Series() 로 형태 맞춰주기 df['data'] = pd.Series(np.array) df['data1'] = original 이미 만들어져 있는 DataFrame에 컬럼으로 넣고 싶을 때, data ..