TASK/Daily

코드스테이츠 PMB 14기 - 데이터로 돌아보는 너튜브 W6W4 유튜브

윤성현, 2022. 10. 4. 14:25

"눈에 보이게"

 

난 노트 정리를 잘 못하는 편이다. 고등학생 시절, 공부 잘하던 친구들을 따라 하기 위해 "법과 정치" 과목을 노트 필기한 적이 있다. 3색 볼펜과 형광펜 등을 활용하여 한껏 예쁘게 꾸미고 정리했다.

 

대학생 시절 노트정리

 

그 나잇대 남자애가 이쁘게 꾸며봐야 얼마나 이쁘겠냐 하겠지만 당시의 내 눈으로 보았을 땐 "이 정도면 나쁘지 않아"라는 말이 나왔던 것 같다. 다만 정리 이후 다시 보지 않은 것이 문제이지만

 

슬픈 과거를 뒤로 하고 이제 와서 노트 정리의 패착을 분석을 해보자면 이렇다.

 

1. 다시 볼 것을 고려하지 않은 채 작성

2. 무엇이 중요한지 모른 채 작성

3. 그냥 노트 정리는 나랑 안 맞아.

 

가장 합리적인 3번을 제외하고 상위 두 가지의 이유는 오늘 이야기할 데이터의 시각화에 있어 매우 중요한 요소들이다. 데이터를 시각화한다는 것은 무엇일까? 혹시 인포그래픽을 아는가? 비주얼라이제이션의 대명사인 인포그래픽은 다양한 데이터를 눈에 보기 쉽게 정리해놓은 일종의 디지털 일러스트라고 할 수 있다.


 

상기 인포그래픽은 통계청 자료이다.

 

21년의 인천광역시 청년들과 관련된 다양한 사항들을 정리하였다. 어떤 것이 있는지를 보는 것보다는 해당 자료들이 보는 이의 시야에 잘 들어오고 자료가 정확하게 이해되는지를 보아야 한다.

 

특징은 데이터를 일러스트를 활용하여 보기 좋게 편집하였을 뿐 아니라 다양한 그래프 형태를 활용하였다는 것이다.

 

이와 같이 인포그래픽은 다양한 요소들을 활용하여 데이터를 보다 직관적으로 바라볼 수 있도록 하고 이해가 수월하도록 작성되었다. 해당 자료가 이해가 안 되거나 시각적으로 눈에 잘 안 들어온다고 생각하는 사람은 없으리라 생각한다.

 

PM은 남이 보는 문서를 작성해야 한다.

 

프로덕트 매니저는 커뮤니케이션을 잘해야 한다. 제품팀 내의 구성원뿐만 아니라 다양한 직무의 이해관계자들과 이야기하고 설득해야 한다. 경영진을 비롯한 마케팅, 경영지원, 법무, 기타 등등 다양한 직군들의 관계자들이 포진되어 있고 제품 관리자는 그들과 의견을 맞추고 함께 나아가기 위해 노력해야 한다.

 

데이터 시각화 자료 또한 그 일환 중 하나라고 생각한다. 제품 관리자의 가장 중요한 스킬 중 하나인 데이터 분석 및 데이터 기반 의사결정이 보다 원활하게 진행되기 위해서는 데이터 시각화가 반드시 필요하다.

 

왜? 시각화된 데이터 자료를 공유하며 그들과 의견을 나누고 개선점을 도출해야 하기 때문이다. 데이터는 곧 설득이다.

 

데이터 시각화를 못하느니 안 만드는 게 낫다.

 

설명을 좀 하자면 위에서 말한 못한 데이터 시각화란 잘못된 데이터 시각화를 의미한다. 다시 말해 올바르지 못한 인사이트가 도출될 위험이 있는 자료를 의미한다. 데이터를 시각화한다는 것은 명확한 범위와 범주, 기간을 설정해야 한다는 것을 의미한다. 그렇지 않은 요소가 들어간다면 자칫 오판할 가능성이 생겨버린다. 이는 심각한 피해로 이어질 수 있다.

 

오늘은 활용 가능한 데이터를 가져와 가설을 세워보고 실제와 비교하는 과제를 작성해볼까 한다.


1. 가설 세워보기

 

사진=유튜브

오늘의 제품은 유튜브이다. 세계 최대 비디오 플랫폼 유튜브는 2005년 2월 14일 처음 론칭되었으며 현재는 C2B2G를 넘나들며 전 세계인들의 사랑을 받는 동영상 플랫폼의 대명사라고 할 수 있다.

 

가설 이유
만 20 ~ 29가 유튜브 이용율이
가장 높을 것이다.
유튜브에서 주로 보이는 컨텐츠가 20대를 겨냥한 컨텐츠인점, 스마트폰을 많이 사용하는 연령대이기 때문이다.
벗방 방송에 대한 부정적 의견은
남성 대비 여성이 높을 것이다.
벗방 방송의 주요 BJ들이 여성이기 때문이다.
소득이 높을수록 유튜브 시청
시간은 줄어들 것이다.
소득이 높을수록 근로시간도 비례하여 높아져 유튜브 시청시간이 줄어들기 때문이다.

 

2. 실제 데이터와 비교하기

 

1. 만 20 ~ 29가 유튜브 이용률이 가장 높을 것이다.

 

 

위 데이터는 특정 집단의 구분 없이 1000명을 대상으로 유튜브 사용시간에 대하여 조사한 그래프이다. 1번 10분 이하가 713명으로 압도적이 것을 알 수 있다. 다만 연령대 별 유튜브 사용시간에 대한 데이터는 해당 자료에서 산출하는 것이 다소 어려웠다. 조사에 참여한 연령대 별 사용자수는 알 수 있었으나 연령대별 사용시간에 대한 데이터는 별도로 기재되어 있지 않다. 따라서 보충자료를 통하여 해당 가설을 검정해보는 과정을 진행해보았다.

 

사진=와이즈앱

 

앱 조사업체 와이즈 앱에 따르면 국내 유튜브 앱 사용자는 4천41만 명이며 총 사용시간은 12억 3천549만 시간으로 집계되었다. 이중 세대별 1인당 평균 사용시간은 10대가 2천8백12분으로 가장 높았으며(가설 실패) 20대의 경우 평균 2천4백91분으로 집계되었다.

 

유튜브 세대별 사용자 분포는 50대 이상이 28.7%로 가장 많았으며 20대의 경우 17.2%로 집계되었다.

세대별 총 사용시간의 경우에도 50대 이상이 25.4%로 가장 많았으며 20대는 23.3%로 나타났다.

 

2. 벗방 방송에 대한 부정적 의견은 남성 대비 여성이 높을 것이다.

 

 

위와 동일하게 별도의 군집 구분 없이 총 사용자 1000명을 대상으로 벗방 편법 방송에 대한 유저들의 의견을 막대그래프로 나타내었다. 사실상 벗방과 다를 것 없다는 의견과 벗방보다 더 나쁘다는 의견이 주료를 이루었다. 다만 상기와 동일한 이유로 성별 기준 의견에 대한 시각화 데이터는 산정이 다소 어려운 관계로 한국 언론진흥재단이 해당 데이터를 통하여 산출한 시각화 데이터를 참고하겠다.

 

 

벗방과 다를 바 없다, 벗방보다 더 나쁘다 등 부정적 의견에 대한 비율에 한정하여 여성이 51.2%로 남성보다 높은 수치를 기록하였다.(가설 성공) 추가로 연령 기준으로 보았을 때 60대가 54.8%로 가장 높은 부정 의견 비율로 집계되었다.

 

3. 소득이 높을수록 유튜브 시청시간은 줄어들 것이다.

 

 

자료에 따르면 300만 원 이상의 소득분포가 198명으로 가장 많은 수를 차지하였으며 뒤를 이어 200만 원 이상 300만 원 미만이 많은 것으로 집계되었다.


회고: 뇌피셜은 생각보다 엇나가는 경우가 많다.

 

오늘 과제는 사실 엑셀을 활용하여 간단하게 마무리하였다. 다만 느낀 점은 좀 많았은데 우선 뇌피셜은 정말 못써먹겠다는 것이다. 난 당연히 유튜브 시청시간이 20대가 압도적일 줄 알았다. 우리가 보통 유튜브를 들어가면 나오는 콘텐츠들이 20대 겨냥 콘텐츠가 많은 거 같아 그리 생각하였는데 이제 보니 알고리즘이었나 보다. 즉 50대의 유튜브는 전혀 다른 영상들이 가득할 것이라는 생각이다.

 

두 번째는 데이터를 가공하기 전에 그래프를 읽는 법부터 배워야 한다는 사실을 깨달았다. X축과 Y축뿐만 아니라 기간이 올바르게 설정되어있는지, 추이를 비교할 만큼의 유의미한지.. 정말 기본을 알아야 데이터를 다루고 읽을 수 있다는 사실을 깨달았다. 나는 기본이 안되어있다.