회사에서 '데이터 분석가'라는 직책을 달고 일해온지도 이제 1년 반이 되어간다. 1년이 넘는 기간동안 평균적으로 2주에 하나씩 크고 작은 프로젝트에 참여하며 분석 레포트를 작성하고 시각화 대시보드를 제작해왔는데, 돌이켜서 생각해보면 '코호트 분석'을 사용했던 프로젝트가 가장 많았던 것 같다. 코호트 분석이 주 목적이 아니더라도 분석 레포트의 신뢰도를 높이고, 더 적확한 인사이트를 도출하기 위해서 보조 수단으로 코호트 분석을 진행했던 적도 많았다.
“ 코호트 분석 (Cohort Analysis) ” 란?
'코호트(Cohort)'는 정의된 기간 내에 공통적인 특성이나 경험을 공유하는 개인의 그룹이다. '코호트 분석(Cohort Analysis)'은 코호트별로 분석하는 기법으로, 사용자 그룹이 시간이 지남에 따라 어떻게 행동하는지 이해하기 위해 데이터 분석에 사용되는 기술이라고 할 수 있다.
코호트 분석은 회사가 다양한 고객 그룹이 서비스의 변화에 어떻게 대응하는지 이해하고, 사용자 경험을 개선하는 데 도움을 주며 코호트 분석을 통해 나온 인사이트는 마케팅, 제품 개발, 사용자 연구에 일반적으로 사용된다. 어떤 코호트로 사용자를 분류해야 더 나은 인사이트를 찾을 수 있는지는 회사마다 다르다. 보통 여러 기준의 세그먼트에 따라 나누어 분석한 뒤, 그 중 회사에 가장 적합한 세그먼트를 채택하고 이후에는 그 세그먼트별 분석을 위주로 본다. 물론 신규 서비스가 시작되거나 새로운 프로젝트를 진행할 때마다 적합한 세그먼트를 새롭게 구해야 하기도 한다.
우리 회사같은 경우는 고객 대상으로 팝업창을 띄워 설문조사를 진행한 적이 있는데, 그 설문조사 결과에 따라 세그먼트를 나누어 코호트 분석을 주기적으로 진행하고 있다. 이뿐만 아니라 'A 서비스를 이용하는 사용자', 'A 서비스를 이용하지 않는 사용자'로 나누어 제작된 대시보드가 따로 있고, 가입 이후 기간별로 서비스 이용횟수에 따라 세그먼트를 나누어 충성고객을 정의내린 프로젝트를 진행한 적도 있었다.
코호트 분석 예시
캐글의 Supermarket Sales 데이터를 이용해 간단한 코호트 분석을 해보았다.
해당 데이터는 Supermarket의 판매 품목과 판매액을 나타내고 있는 데이터로, 1000개의 row와 17개의 column로 이루어져 있다.
사용자를 세그먼트별로 나누지 않고 분석했을 때, 즉 코호트 분석을 사용하지 않았을 때는 주요 지표들이 다음과 같았다.
이를 기억해 두고, 코호트 분석을 사용했을 때는 지표들이 어떻게 변하는지 보자.
세그먼트별로 나누어 분석할 때는 해당 세그먼트별로 데이터의 수량이 비슷한지 살펴보는 과정이 선행되어야 한다. 만약 데이터 양을 맞추지 않고 세그먼트를 비교하면, 데이터 양이 적은 세그먼트는 분석 결과에 미치는 영향이 미미할 것이다. 이는 분석 결과를 왜곡시킬 수 있고, 실제로는 중요한 세그먼트에서 발생하는 문제를 감지하지 못할 수도 있다. 또한, 통계적 추론은 샘플 크기가 충분히 큰 경우에만 신뢰성 있는 결과를 제공하기 때문에, 데이터 양이 적은 세그먼트의 경우 통계적으로 유의미한 결과를 얻기 어렵다.
Supermarket의 지점(A, B, C)별로 나누어 코호트 분석을 진행해보면 여러 지표들이 차이가 나는 것을 발견할 수 있다. 가장 많이 판매되는 상품도 다르고, 지점 유저당 평균 수익도 다르며, 월별 판매비율도 차이가 난다. 만약 이러한 코호트 분석을 거치지 않고 마케팅 전략이나 신규 서비스를 기획한다면 특정 지점에서는 성공적이었어도 다른 지점에서는 큰 성과를 거두지 못할 수도 있다.
다른 기준의 세그먼트별로 나누어 분석해보기
하나의 세그먼트별 분석만 진행하는 게 아니라, 이처럼 차이가 날 것으로 예상되는 여러 세그먼트별로 분석을 각각 진행해보며 우리 회사에 가장 적합한 세그먼트 기준은 무엇인지 판단하는 과정이 필요하다. 또는, 두 개의 세그먼트 기준을 연합해서 활용할 수도 있다. 예를 들면 처음에 썼던 세그먼트 기준인 '지점'과 '성별'을 결합시켜 'C지점의 여성 고객'은 어떤 식으로 행동하는지를 분석해볼 수도 있다. 이렇게 디테일하게 파고들수록 어떤 세그먼트의 고객이 충성고객인지를 파악할 수 있게 되고 고객별 맞춤전략을 수립하는 데 도움을 얻을 수 있다.
'데이터' 카테고리의 다른 글
GPT와 BERT, 두 모델의 공통점과 차이점에 대하여... (0) | 2023.05.19 |
---|---|
GPT, 그게 도대체 뭔데? (0) | 2023.05.04 |
'이탈 위험도' 들어본 적 있나요? (0) | 2023.04.21 |
데이터 정제, 기본적이지만 필수적인 과정 (0) | 2023.04.07 |
우리 회사는 '검색' 기능을 제대로 활용하고 있을까? (0) | 2023.03.10 |