데이터 18

AB테스트는 이유 있는 제품을 만든다.

아직 2개월 반이 남긴 했지만, 올해는 저에게 정말 다사다난한 한 해였습니다. 다양한 스쿼드에서 전담 데이터분석가로 일했고, 여러 직무의 동료들과 협업했으며, 분석 업무 외에도 경험해보지 못했던 많은 업무들을 맡았어요. 그러다가 3분기에 들어서서는 아예 1개의 스쿼드만 맡도록 바뀌었어요. 고객이 좋아할만한 템플릿을 추천해주는 추천스쿼드 담당 DA가 된거죠. 스쿼드 내에는 추천모델을 개발하는 개발자님들이 계셨고, 그분들이 개발하신 추천모델이 고객이 실제로 좋아하는지 체크할 필요가 있었습니다. 그러기 위해서 스쿼드에서 선택한 방법은 'AB테스트'였습니다. 데이터직군이라면(데이터직군 외에도) 누구나 AB테스트에 관심이 많을 거라 생각해요. 그래서 저는 오늘 저희 팀이 진행해 온, 또 앞으로도 진행할 'AB테..

데이터 2024.10.03

PM을 위한 데이터 리터러시(프로덕트 데이터 분석) 강의를 완강하며…

📝 강의를 듣게 된 계기 일을 잘하고 싶었다. 나를 비롯한 직장인이라면 누구나 직장을 다니는 동안 계속해서 하는 고민일테지만, 정말로 일을 잘하고 싶었다. 현재 맡은 업무를 잘 해내서 더 비중 있고 회사에서 중요하게 생각하는 프로젝트를 맡고 싶었고, 그런 프로젝트를 맡은 경험을 하나둘 쌓아나가면서 내 커리어를 발전시켜나가고 싶었다. 학생 때 제일 좋아하던 과목이 수학이었는데, 수학은 답이 명확히 정해져 있기 때문이었다. 하지만 “일을 잘한다”는 명제에는 답이 명확히 정해져 있지 않았고, 그랬기에 더욱 어려웠다. 나는 최선을 다했는데 이게 다른 팀원에게도, 고객에게도, 궁극적으로 회사 서비스 차원에서도 최선이 맞을까? 업무를 수행하는 데에 있어서 더 나은 방법은 없었을까? 등의 고민을 계속했지만 답이 나오..

데이터 2023.07.14

GPT와 BERT, 두 모델의 공통점과 차이점에 대하여...

자연어처리(NLP)를 찍먹해본 경험이 있다면 GPT와 BERT, 이 2개의 모델은 한 번쯤은 들어봤으리라 생각한다. GPT(Generative Pre-trained Transformer)와 BERT(Bidirectional Encoder Representations from Transformers)은 자연어처리에 사용되는 대표 모델이다. 나 또한 자연어처리에 관심이 있는 사람으로써, 이 2개의 모델을 들어보고 활용한 서비스도 여럿 봐왔다. *요새 이슈인 챗GPT도 대표적으로 GPT 모델을 활용하여 만들어진 AI이다. 하지만 이 2개의 모델 차이가 뭐냐라는 질문에는 대답하지 못할만큼 얕은 지식의 소유자였다. 그렇기 때문에 이번에 2가지 모델의 차이점을 알아보고 정리해보았다. 모델 구조 GPT는 트랜스포머 ..

데이터 2023.05.19

GPT, 그게 도대체 뭔데?

요새 챗GPT가 이슈이다. 아니, ‘아직까지 이슈이다라는 말이 정확하겠다. 핫토픽으로 등장한지 꽤 되었는데도 아직도 뜨거운 감자로 IT 관련 뉴스기사 랭킹을 독차지하고 있으니 말이다. IT 관련 업종이 아닌 내 친구들도 모두 챗GPT에 대해 알고 있고, 대다수가 한 번 이상 써봤을 정도니 말 다했다. 나도 업무에서 막히는 부분이 나올 때마다 이제는 구글링을 하는 게 아니라 챗GPT한테 물어보는 경우가 더 많아졌다. 하루에도 몇 번씩 챗GPT에 접속하고 질문을 던지다보니 궁금증이 생겼다. 왜 "챗-GPT"일까? '챗'은 서로 채팅(Chat)하며 사용자의 궁금증을 해결하는 방식이니까 이해가 되는데, 'GPT'는 왜 붙어진 이름일까? 챗GPT 이후 등장한 비슷한 형식의 AI인 트루스GPT, 오토GPT도 앞의 ..

데이터 2023.05.04

'이탈 위험도' 들어본 적 있나요?

서론 회사에서 데이터 분석가로 일하고 있다면, 아니 분석가가 아니더라도 데이터를 다루는 일을 하고 있다면 ‘이탈’이라는 단어는 숱하게 많이 들어보았을 것이다. 이탈은 일반적으로 고객이 제공하는 제품이나 서비스를 더 이상 이용하지 않거나 구독을 취소하는 것을 의미한다. 이탈이 발생하면 회사는 수익을 상실하게 되고, 이탈의 수가 클수록 수익 상실률은 커지기 때문에 이탈은 고객 충성도와 회사 수익성에 직접적인 영향을 미치는 중요한 문제이다. 이러한 이유로 어느 정도 데이터를 중요시하는 회사라면 회사 내부적으로 이탈률ㅡ이탈을 측정하는 대표 지표ㅡ을 측정하는 대시보드를 별도로 관리하고 있는 게 일반적이다. 이탈률 ‘이탈률’은 특정 기간 동안 고객 중에서 이탈한 고객의 수를 전체 고객 수로 나눈 비율을 뜻한다. 이..

데이터 2023.04.21

데이터 정제, 기본적이지만 필수적인 과정

최근에 일주일이 넘는 시간을 투자했던 프로젝트를 아예 처음부터 다시 시작해야 했던 일이 있었다. 프로젝트의 기획 방향이 달라졌다거나 데이터가 잘못되었던 문제는 아니었다. 데이터를 분석할 때 가장 먼저 해야하는 “데이터 정제”에서 내가 꼼꼼하게 살펴보지 못한 탓이었다. 프로젝트 중간진행을 팀 리더한테 공유하는 과정에서 특정 논지의 결과가 이상하다는 피드백을 받았고, (결과가 이상하다는 논거는 리더의 직관에 의한 피드백이었는데ㅡ 문제를 해결하고나서 보니 리더의 직관이 맞았다. 역시 한 도메인에서 쌓은 연차는 무시 못한다…) 피드백받은 내용을 다시 정리해보던 중 나의 분석 첫 단추인 ‘데이터 정제’ 단계에서부터 꼬였다는 걸 알게 된 것이다. *다행히도 프로젝트는 예상 기한보다 시간 소요가 많아지긴 했지만 무사..

데이터 2023.04.07

우리 회사는 '검색' 기능을 제대로 활용하고 있을까?

글을 시작하면서... 당신의 회사가 어떤 서비스를 운영하고 있든지 ‘검색’ 기능은 높은 확률로 서비스 내에 자리잡고 있을 것이다. Google이나 Bing과 같은 검색엔진을 운영하고 있는 회사는 물론이고, 하물며 의류 쇼핑몰을 운영한다 하더라도 검색바는 메인페이지의 상단 UI에 배치되어 있을 만큼 ‘검색’ 기능은 대다수의 서비스에서 중요 기능으로 자리 잡고 있다. 그렇다면 우리의 회사는, 우리의 서비스는 그 중요한 ‘검색’ 기능을 제대로 사용하고 있을까? 유저는 우리의 검색 기능을 통해서 원하는 결과를 얻고 있을까? 고객 니즈를 충족시키고 있을까? 이 글이 이러한 질문에 답하는데 도움을 줄 수 있길 바란다. 데이터 수집 회사 서비스의 검색 기능의 성과를 분석하는 프로젝트를 진행하기에 앞서, 선행되어야 할..

데이터 2023.03.10

코호트 분석(Cohort Analysis)을 해야하는 이유

회사에서 '데이터 분석가'라는 직책을 달고 일해온지도 이제 1년 반이 되어간다. 1년이 넘는 기간동안 평균적으로 2주에 하나씩 크고 작은 프로젝트에 참여하며 분석 레포트를 작성하고 시각화 대시보드를 제작해왔는데, 돌이켜서 생각해보면 '코호트 분석'을 사용했던 프로젝트가 가장 많았던 것 같다. 코호트 분석이 주 목적이 아니더라도 분석 레포트의 신뢰도를 높이고, 더 적확한 인사이트를 도출하기 위해서 보조 수단으로 코호트 분석을 진행했던 적도 많았다. “ 코호트 분석 (Cohort Analysis) ” 란? '코호트(Cohort)'는 정의된 기간 내에 공통적인 특성이나 경험을 공유하는 개인의 그룹이다. '코호트 분석(Cohort Analysis)'은 코호트별로 분석하는 기법으로, 사용자 그룹이 시간이 지남에..

데이터 2023.02.25