일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
Tags
- programmers
- C++
- OS
- machine learning
- 머신 러닝
- Python
- Stack
- 스택
- googleapiclient
- python3
- 데이터베이스
- 국민대학교
- SQL
- 정렬
- db
- Seq2Seq
- 재귀
- GIT
- 국민대
- Regression
- 프로그래머스
- LSTM
- 회귀
- kmu
- gan
- instaloader
- 운영체제
- PANDAS
- Heap
- 파이썬
Archives
- Today
- Total
정리 노트
4일 차(2022/07/07) 본문
728x90
오늘은 3일 간 강의 들은 것을 바탕으로 미션을 수행하는 날이었습니다.
Kaggle에 있는 netflix 데이터를 이용해 2가지 Mission을 해결해야 했습니다.
2번째 Mission이 좀 힘들었습니다. 'country' column 중에서 단일 국가와 아닌 것을 구별하는 방법이 쉽지가 않았습니다. country 중에는 NaN도 있었기 때문에 이 경우에 대한 처리도 생각해야 했습니다.
저는 단일 국가이면 True, 아니면 False를 담는 Series를 만드는 과정을 먼저 거쳤고, 이 Series를 통해 netflix 정보를 가지고 있는 dataframe을 filtering 했습니다.
그리고 groupby와 통계 함수를 거치면 Series를 반환한다는 것과 Series를 파이썬의 딕셔너리처럼 활용할 수 있다는 점을 이용해 최댓값을 가진 나라의 이름을 for문을 통해 찾았습니다.
# 가장 많이 올린 단일 국가 찾기
nfx_by_solo_cuntry = filtered_netflix["show_id"].groupby(by=filtered_netflix["country"])
product_cnt_series = nfx_by_solo_cuntry.count()
most_cnt = max(product_cnt_series)
for key, val in product_cnt_series.items():
if val == most_cnt:
print(key)
728x90
'[TIL]국민대X프로그래머스 여름방학 인공지능 과정' 카테고리의 다른 글
6일 차(2022/07/11) (0) | 2022.07.12 |
---|---|
5일 차(2022/07/08) (0) | 2022.07.08 |
3일차(2022/07/06) (0) | 2022.07.06 |
2일차(2022/07/05) (0) | 2022.07.05 |
1일차(2022/07/04) (0) | 2022.07.05 |