일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
Tags
- gan
- GIT
- 재귀
- python3
- machine learning
- PANDAS
- 프로그래머스
- Heap
- SQL
- kmu
- 정렬
- 머신 러닝
- OS
- LSTM
- 회귀
- Regression
- 운영체제
- programmers
- 스택
- 파이썬
- C++
- googleapiclient
- db
- 데이터베이스
- Seq2Seq
- Stack
- 국민대학교
- 국민대
- Python
- instaloader
Archives
- Today
- Total
정리 노트
10일 차 (2020/07/17) 본문
728x90
오늘은 pandas에서 두 dataframe을 하나로 합치는 merge와 NaN 값을 처리하는 방법에 대해 배웠습니다.
두 dataframe을 merge
https://pandas.pydata.org/docs/reference/api/pandas.merge.html?highlight=merge#pandas.merge
SQL에서 JOIN 하듯이 pandas에서는 두 dataframe을 join 시켜주는 merge 함수를 제공하고 있습니다.
joined_df = pd.merge(dataframe1, dataframe2, on='column name')
on 인자를 여러 컬럼들을 묶은 리스트 형태로 줘서 join column을 여러 개 설정할 수 있습니다.
pandas에서 NaN 처리하기
dropna로 NaN 데이터를 삭제
dropna를 사용하면 NaN 데이터를 가지고 있는 row 또는 column을 삭제할 수 있습니다.
dataframe.dropna(inplace=True) # row 삭제
# 또는
filtered = dataframe.dropna(axis=1) # col 삭제
fillna로 NaN 데이터를 다른 데이터로 대체
fillna를 쓰면 NaN을 다른 데이터로 대체할 수 있습니다.
dataframe.column1.fillna('new data', inplace=True)
# 또는
completed = dataframe.column1.fillna('new data')
728x90
'[TIL]국민대X프로그래머스 여름방학 인공지능 과정' 카테고리의 다른 글
14일 차(2022/07/21) (0) | 2022.07.21 |
---|---|
11일 차(2022/07/18) (0) | 2022.07.18 |
9일 차(2022/07/14) (0) | 2022.07.15 |
8일 차(2022/07/13) (0) | 2022.07.14 |
7일 차(2022/07/12) (0) | 2022.07.12 |