일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 데이터베이스
- 재귀
- Seq2Seq
- 국민대학교
- googleapiclient
- kmu
- python3
- 머신 러닝
- C++
- OS
- Heap
- Regression
- GIT
- programmers
- PANDAS
- 운영체제
- Stack
- db
- 프로그래머스
- 정렬
- gan
- Python
- LSTM
- machine learning
- 국민대
- 스택
- SQL
- 파이썬
- instaloader
- 회귀
- Today
- Total
정리 노트
10일 차 (2020/07/17) 본문
오늘은 pandas에서 두 dataframe을 하나로 합치는 merge와 NaN 값을 처리하는 방법에 대해 배웠습니다.
두 dataframe을 merge
https://pandas.pydata.org/docs/reference/api/pandas.merge.html?highlight=merge#pandas.merge
pandas.merge — pandas 1.4.3 documentation
Merge DataFrame or named Series objects with a database-style join. A named Series object is treated as a DataFrame with a single named column. The join is done on columns or indexes. If joining columns on columns, the DataFrame indexes will be ignored. Ot
pandas.pydata.org
SQL에서 JOIN 하듯이 pandas에서는 두 dataframe을 join 시켜주는 merge 함수를 제공하고 있습니다.
joined_df = pd.merge(dataframe1, dataframe2, on='column name')
on 인자를 여러 컬럼들을 묶은 리스트 형태로 줘서 join column을 여러 개 설정할 수 있습니다.
pandas에서 NaN 처리하기
파이썬 Pandas NaN 데이터 처리하기
import pandas as pd train_data = pd.read_csv('./train.csv') train_data.head() NaN (Not a Number) 데이터 In computing, NaN, standing for Not a Number, is a member of a numeric data type that ca..
dsbook.tistory.com
dropna로 NaN 데이터를 삭제
dropna를 사용하면 NaN 데이터를 가지고 있는 row 또는 column을 삭제할 수 있습니다.
dataframe.dropna(inplace=True) # row 삭제
# 또는
filtered = dataframe.dropna(axis=1) # col 삭제
fillna로 NaN 데이터를 다른 데이터로 대체
fillna를 쓰면 NaN을 다른 데이터로 대체할 수 있습니다.
dataframe.column1.fillna('new data', inplace=True)
# 또는
completed = dataframe.column1.fillna('new data')
'[TIL]국민대X프로그래머스 여름방학 인공지능 과정' 카테고리의 다른 글
14일 차(2022/07/21) (0) | 2022.07.21 |
---|---|
11일 차(2022/07/18) (0) | 2022.07.18 |
9일 차(2022/07/14) (0) | 2022.07.15 |
8일 차(2022/07/13) (0) | 2022.07.14 |
7일 차(2022/07/12) (0) | 2022.07.12 |