정리 노트

데이터 시각화 본문

K-POP 아이돌 SNS 분석

데이터 시각화

꿈만 꾸는 학부생 2024. 2. 27. 22:41
728x90

본 포스트는 아래 2가지에 대한 결과물을 공유하는 포스트입니다.

  • 소통 지수 계산식 수정
  • 수집한 데이터에 대한 시각화

계산식 수정

원래 인스타그램에서 소통 수치 계산 식에서는 좋아요 수, 댓글 수, 미디어 수를 그대로 사용하고 각 수치마다 가중치를 곱해서 계산했습니다.

하지만 미디어 수가 댓글 수와 좋아요 수에 비해 너무나도 작은 수치라 제대로 반영되지 않는다는 문제점을 발견했습니다. 따라서 좋아요 수와 댓글 수에 상용로그를 적용해서 크기를 대폭 줄였습니다. 이로 인해 가중치 곱 없이 각자의 수치를 더하기만 하는 식으로 교체할 수 있었습니다.

(인스타그램 포스트 소통 지수) = (미디어 수) + log(댓글 수) + log(좋아요 수)

시각화 결과

두 그룹의 소통 지수 비교

결과부터 얘기하자면 여자친구(GFRIEND)의 소통 지수가 오마이걸의 소통 지수보다 높은 상황에서 여자친구 그룹은 해체를 하게 됐습니다. 이로 인해 해체와 소통 지수와의 상관은 없다고 판단했습니다.

여자친구(GFRIEND) 시각화

월 별로 좋아요 수와 댓글 수의 평균을 계산해서 시간에 따른 변화를 확인한 결과가 위의 두 그림과 같습니다.

두 수치 모두 시간이 지날수록 상승하는 형태를 나타내고 있습니다. 그리고 가장 최근의 포스트에서 좋아요 수와 댓글 수가 가장 많았음을 확인할 수 있었습니다. 이 날은 여자친구가 해체했을 때로 해체의 아쉬움이 그대로 드러난 수치라 볼 수 있습니다.

오마이걸 시각화

월 별로 좋아요 수와 댓글 수의 평균을 계산해서 시간에 따른 변화를 확인한 결과가 위의 두 그림과 같습니다.

두 수치 모두 시간이 지날수록 하강하는 형태를 나타내고 있습니다.

결국은.. 프로젝트 종료

원래 이 프로젝트는 여자친구(GFRIEND)의 인스타그램 소통 지수가 오마이걸 그룹보다 낮을 것이라는 가정 하에 진행했던 프로젝트였습니다. 하지만 이번 시각화를 통해 완벽히 틀렸음을 확인하게 됐습니다.

이 이상 이 프로젝트에 시간을 투자하는 것은 시간 낭비라고 판단해 중단하기로 결정했습니다.

이 프로젝트를 진행하면서 아래의 것들을 깨달았습니다.

  • 미리 가정하고 진행하지 말 것: 가정이 틀렸을 때 하고 싶은 의지가 확 떨어짐
  • 타임라인(마감 일)을 정할 것: 혼자 하는 프로젝트라 필요 없다고 판단했지만, 마감 일이 정해져 있지 않으니 진행 속도가 늦어짐

이 프로젝트를 진행한 과정을 담은 카테고리를 비공개로 전환할까 생각했습니다. 하지만 누구나 이 과정을 보고 이보다 더 나은 과정을 계획하고 실행할 수 있기를 바라며 그대로 공개하기로 결정했습니다.

728x90

'K-POP 아이돌 SNS 분석' 카테고리의 다른 글

데이터 얻기  (1) 2024.02.25
구체화 과정  (2) 2024.02.17
googleapiclient로 Youtube 데이터 가져오기  (2) 2024.02.15
사전 과정 - tweepy 살펴보기  (0) 2024.02.10
사전 과정 - instaloader 둘러보기  (0) 2024.02.10