일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- Seq2Seq
- instaloader
- 머신 러닝
- programmers
- googleapiclient
- Regression
- 회귀
- machine learning
- Heap
- OS
- 프로그래머스
- C++
- gan
- Python
- 데이터베이스
- python3
- 파이썬
- LSTM
- 운영체제
- 스택
- SQL
- GIT
- PANDAS
- 재귀
- 정렬
- kmu
- 국민대
- Stack
- db
- 국민대학교
- Today
- Total
목록K-POP 아이돌 SNS 분석 (8)
정리 노트
본 포스트는 아래 2가지에 대한 결과물을 공유하는 포스트입니다. 소통 지수 계산식 수정 수집한 데이터에 대한 시각화 계산식 수정 원래 인스타그램에서 소통 수치 계산 식에서는 좋아요 수, 댓글 수, 미디어 수를 그대로 사용하고 각 수치마다 가중치를 곱해서 계산했습니다. 하지만 미디어 수가 댓글 수와 좋아요 수에 비해 너무나도 작은 수치라 제대로 반영되지 않는다는 문제점을 발견했습니다. 따라서 좋아요 수와 댓글 수에 상용로그를 적용해서 크기를 대폭 줄였습니다. 이로 인해 가중치 곱 없이 각자의 수치를 더하기만 하는 식으로 교체할 수 있었습니다. (인스타그램 포스트 소통 지수) = (미디어 수) + log(댓글 수) + log(좋아요 수) 시각화 결과 결과부터 얘기하자면 여자친구(GFRIEND)의 소통 지수가..
이번 포스트에서는 인스타그램, 유튜브 데이터 수집 결과를 공유하기 위한 포스트입니다. 인스타그램 데이터 수집 import instaloader import pandas as pd from tqdm import tqdm loader = instaloader.Instaloader() loader.login(user='사용자이름', passwd='사용자비밀번호') user_name = gfriendofficial # user_name = "wm_ohmygirl" posts = instaloader.Profile.from_username(loader.context, user_name).get_posts() data_dict = {"date": [], "media_count": [], "like_count": [..
사전 조사의 과정을 거치면서 아래 2가지에 대해 생각해야 한다고 느꼈습니다. 활성화 지수 계산식 수정 주제 구체화 이번 포스트에서 이 점들에 대해 생각하고 정리해 보겠습니다. 주제 구체화 2024.01.29 - [K-POP 아이돌 SNS 분석] - 주제 선정과 그 이유 포스트에서 주제를 'K-POP 아이돌 SNS 활성화 분석'으로 정했었습니다. 지금 생각해 보면 범위가 넓습니다. 어떤 아이돌을 대상으로 하는지 아니면 여러 아이돌을 대상으로 하는지 범위를 정해야 했습니다. 그래서 저는 두 아이돌 그룹을 골라 이들의 SNS를 비교 분석하기로 결정했습니다. 선택한 아이돌 그룹은 '여자친구(GFRIEND)'와 '오마이걸(OH MY GIRL)'입니다. 이 두 그룹을 선택한 이유는 다음과 같습니다. 제가 여자친구 ..
2024.02.05 - [K-POP 아이돌 SNS 분석] - 사전 조사 글에서 준비하기로 한 것들 중 googleapiclient를 사용해 유튜브 데이터에 접근하기 위한 준비 과정에 대해 작성합니다. API Key 얻기 Google Cloud Platform에 로그인해서 프로젝트(ex. YoutubeCrawling)를 먼저 생성합니다. 그 후, 위의 API를 검색해 '사용'을 클릭합니다. 다음에는 프로젝트의 '사용자 인증 정보' 탭으로 가서 API 키를 받습니다. 패키지 설치 파이썬 언어를 통해 유튜브 데이터에 접근하기 위해서는 아래 3가지의 패키지를 설치해야 합니다. google-api-python-client (version: 2.118.0) google-auth-oauthlib (version 1...
2024.02.05 - [K-POP 아이돌 SNS 분석] - 사전 조사 글에서 준비하기로 한 것들 중 tweepy를 사용하기 위한 준비 과정에 대해 작성합니다. tweepy 패키지를 사용하기 위해서는 X 계정을 만들고, developers 계정으로도 추가해야 합니다. Developers 계정으로 추가할 때 tier를 선택하게 되는데 Free 티어로는 제가 원하는 API에 요청할 수 없다고 합니다. 제가 잘 못 이해한 것일 수도 있지만 해본 바로는, v2 API로는 트윗을 올리는 것만이 가능했고, v1.1은 premium을 사용할 것을 제안하며 결국은 v2를 사용하라는 암묵적인 압박이 들어옵니다. 따라서 가볍게 하려는 프로젝트에서 X를 사용하기에는 적절하지 않다고 판단했습니다. 앞으로 프로젝트에서는 인스타..
2024.02.05 - [K-POP 아이돌 SNS 분석] - 사전 조사 글에서 준비하기로 한 것들 중 instaloader를 사용하기 위한 준비 과정에 대해 작성합니다. 패키지 설치 저는 일단 PyCharm으로 진행할 예정이라 PyCharm을 기준으로 설명합니다. PyCharm을 사용할 때는 직접 'instaloader' 검색해서 설치할 수 있습니다. 일단, 가장 최신 버전의 것을 설치했습니다. 만약 colaboratory 환경 같은 곳에서 사용한다면 아래 명령어를 사용해 설치할 수 있습니다. !pip install instaloader 패키지 둘러보기 패키지에 대한 자세한 설명들은 아래 공식 사이트에서 확인하시길 바랍니다. 이 포스트에서는 극히 일부만 살펴봅니다. Python Module instalo..
저번 포스트를 작성하고 7일이 지났는데 그동안 계속 조사한 것은 아니고, 학회 강의에서 주어진 과제를 수행하는데 생각보다 오래 걸려서 이 사이드 프로젝트를 위해 조사할 시간이 부족했습니다... 이전 글에서 아래의 3가지에 대해 조사해야 할 것 같다고 판단했습니다. 아이돌은 지금 어떤 SNS를 사용하고 있는지 조사(인스타그램? 팬카페? 트위터? 아님 다른 어딘가?) (아이돌 제외) 요즘 사람들은 어떤 SNS를 사용하는지 조사 각 SNS 별로 최소한의 회원 가입 또는 구독 등으로 어떤 데이터를 어디까지 얻어낼 수 있는지 조사 이번 포스트에서는 이들에 대한 조사 내용을 정리합니다. 요즘 사람들이 사용하는 SNS 한국갤럽조사연구소에서 작성한 갤럽리포트가 있습니다. 한국갤럽조사연구소 〈마켓70 2023〉은 70가..
평소에 K-POP을 자주 들었고, 주변에 K-POP을 좋아하는 사람이 많다 보니 자연스레 K-POP을 주제로 데이터 분석을 할 수 있는 게 있을까라는 생각을 하게 됐습니다. 저와 비슷한 생각으로 해본 사람들을 찾기 위해 인터넷을 돌아다니다 이러한 사이트를 발견했습니다. K-Pop Radar 케이팝 레이더 오늘의 케이팝 현황, 팬덤 데이터 관측기. 아티스트별 유튜브, 트위터 등 온라인 팬덤 지표 제공. www.kpop-radar.com 케이팝 레이더는 쉽게 말해 여러 플랫폼의 팬 또는 구독자 수의 증감률이나 총 수 등을 기준으로 순위를 매기고 있습니다. 그리고 자체적인 연말 결산도 제공하고 있습니다. 특히 X(트위터), 인스타그램은 팔로워 수에 초점을 맞춰서 데이터 보드를 제공하고 있습니다. 저는 팔로워 ..