Notice
Recent Posts
Recent Comments
Link
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | |
| 7 | 8 | 9 | 10 | 11 | 12 | 13 |
| 14 | 15 | 16 | 17 | 18 | 19 | 20 |
| 21 | 22 | 23 | 24 | 25 | 26 | 27 |
| 28 | 29 | 30 | 31 |
Tags
- 스택
- 운영체제
- OS
- Regression
- 회귀
- C++
- 국민대학교
- Stack
- python3
- 데이터베이스
- LSTM
- instaloader
- machine learning
- programmers
- 정렬
- 국민대
- Seq2Seq
- Python
- db
- gan
- 프로그래머스
- 파이썬
- 머신 러닝
- SQL
- kmu
- googleapiclient
- Heap
- GIT
- 재귀
- PANDAS
Archives
- Today
- Total
정리 노트
4일 차(2022/07/07) 본문
728x90
오늘은 3일 간 강의 들은 것을 바탕으로 미션을 수행하는 날이었습니다.
Kaggle에 있는 netflix 데이터를 이용해 2가지 Mission을 해결해야 했습니다.
2번째 Mission이 좀 힘들었습니다. 'country' column 중에서 단일 국가와 아닌 것을 구별하는 방법이 쉽지가 않았습니다. country 중에는 NaN도 있었기 때문에 이 경우에 대한 처리도 생각해야 했습니다.
저는 단일 국가이면 True, 아니면 False를 담는 Series를 만드는 과정을 먼저 거쳤고, 이 Series를 통해 netflix 정보를 가지고 있는 dataframe을 filtering 했습니다.
그리고 groupby와 통계 함수를 거치면 Series를 반환한다는 것과 Series를 파이썬의 딕셔너리처럼 활용할 수 있다는 점을 이용해 최댓값을 가진 나라의 이름을 for문을 통해 찾았습니다.
# 가장 많이 올린 단일 국가 찾기
nfx_by_solo_cuntry = filtered_netflix["show_id"].groupby(by=filtered_netflix["country"])
product_cnt_series = nfx_by_solo_cuntry.count()
most_cnt = max(product_cnt_series)
for key, val in product_cnt_series.items():
if val == most_cnt:
print(key)728x90
'[TIL]국민대X프로그래머스 여름방학 인공지능 과정' 카테고리의 다른 글
| 6일 차(2022/07/11) (0) | 2022.07.12 |
|---|---|
| 5일 차(2022/07/08) (0) | 2022.07.08 |
| 3일차(2022/07/06) (0) | 2022.07.06 |
| 2일차(2022/07/05) (0) | 2022.07.05 |
| 1일차(2022/07/04) (0) | 2022.07.05 |