일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- LSTM
- SQL
- GIT
- PANDAS
- Seq2Seq
- 국민대
- instaloader
- programmers
- 국민대학교
- 재귀
- 파이썬
- Stack
- Regression
- machine learning
- 머신 러닝
- gan
- 스택
- 정렬
- 데이터베이스
- OS
- Python
- db
- kmu
- googleapiclient
- 회귀
- Heap
- 프로그래머스
- python3
- 운영체제
- C++
- Today
- Total
목록PANDAS (3)
정리 노트
오늘은 pandas에서 두 dataframe을 하나로 합치는 merge와 NaN 값을 처리하는 방법에 대해 배웠습니다. 두 dataframe을 merge https://pandas.pydata.org/docs/reference/api/pandas.merge.html?highlight=merge#pandas.merge pandas.merge — pandas 1.4.3 documentation Merge DataFrame or named Series objects with a database-style join. A named Series object is treated as a DataFrame with a single named column. The join is done on columns or ind..
오늘은 3일 간 강의 들은 것을 바탕으로 미션을 수행하는 날이었습니다. Kaggle에 있는 netflix 데이터를 이용해 2가지 Mission을 해결해야 했습니다. 2번째 Mission이 좀 힘들었습니다. 'country' column 중에서 단일 국가와 아닌 것을 구별하는 방법이 쉽지가 않았습니다. country 중에는 NaN도 있었기 때문에 이 경우에 대한 처리도 생각해야 했습니다. 저는 단일 국가이면 True, 아니면 False를 담는 Series를 만드는 과정을 먼저 거쳤고, 이 Series를 통해 netflix 정보를 가지고 있는 dataframe을 filtering 했습니다. 그리고 groupby와 통계 함수를 거치면 Series를 반환한다는 것과 Series를 파이썬의 딕셔너리처럼 활용할 수..
오늘은 다른 모듈 pandas에 대해 배웠습니다. numpy 모듈은 학과 시간에 살짝 다뤘던 경험이 있었지만 pandas 모듈은 처음 사용해본 것이기 때문에 배웠던 내용들의 거의 모든 것이 신기했습니다. pandas로 데이터 다루기 1차원 데이터 - Series Series는 1차원의 labled array입니다. 처음 이 정의를 접했을 때 '이게 리스트와 dict를 합친 건가?' 생각이 들었습니다. Series는 기존 파이썬의 리스트와 dict를 가지고 생성할 수 있습니다. >>> import pandas as pd >>> s = pd.Series([1, 4, 9, 16, 25, 36]) >>> s 0 1 1 4 2 9 3 16 4 25 5 36 dtype: int64 >>> t = pd.Series(..