정리 노트

10일 차 (2020/07/17) 본문

[TIL]국민대X프로그래머스 여름방학 인공지능 과정

10일 차 (2020/07/17)

꿈만 꾸는 학부생 2022. 7. 17. 16:39
728x90

오늘은 pandas에서 두 dataframe을 하나로 합치는 merge와 NaN 값을 처리하는 방법에 대해 배웠습니다.

두 dataframe을 merge

https://pandas.pydata.org/docs/reference/api/pandas.merge.html?highlight=merge#pandas.merge 

 

pandas.merge — pandas 1.4.3 documentation

Merge DataFrame or named Series objects with a database-style join. A named Series object is treated as a DataFrame with a single named column. The join is done on columns or indexes. If joining columns on columns, the DataFrame indexes will be ignored. Ot

pandas.pydata.org

SQL에서 JOIN 하듯이 pandas에서는 두 dataframe을 join 시켜주는 merge 함수를 제공하고 있습니다.

joined_df = pd.merge(dataframe1, dataframe2, on='column name')

on 인자를 여러 컬럼들을 묶은 리스트 형태로 줘서 join column을 여러 개 설정할 수 있습니다.

pandas에서 NaN 처리하기

https://dsbook.tistory.com/21

 

파이썬 Pandas NaN 데이터 처리하기

import pandas as pd train_data = pd.read_csv('./train.csv') train_data.head() NaN (Not a Number) 데이터 In computing, NaN, standing for Not a Number, is a member of a numeric data type that ca..

dsbook.tistory.com

dropna로 NaN 데이터를 삭제

dropna를 사용하면 NaN 데이터를 가지고 있는 row 또는 column을 삭제할 수 있습니다.

dataframe.dropna(inplace=True)    # row 삭제
# 또는
filtered = dataframe.dropna(axis=1)    # col 삭제

fillna로 NaN 데이터를 다른 데이터로 대체

fillna를 쓰면 NaN을 다른 데이터로 대체할 수 있습니다.

dataframe.column1.fillna('new data', inplace=True)
# 또는
completed = dataframe.column1.fillna('new data')
728x90

'[TIL]국민대X프로그래머스 여름방학 인공지능 과정' 카테고리의 다른 글

14일 차(2022/07/21)  (0) 2022.07.21
11일 차(2022/07/18)  (0) 2022.07.18
9일 차(2022/07/14)  (0) 2022.07.15
8일 차(2022/07/13)  (0) 2022.07.14
7일 차(2022/07/12)  (0) 2022.07.12