Marketing/Insight

[crm/마케팅분석] 구매연관성 분석 어떻게 활용할까?

_tami_ 2024. 3. 14. 22:41

이번 글에서는 다양한 crm 마케팅 분석법 중 "데이터 마이닝(알고리즘)"을 이용한 구매연관성 분석에 대해 이야기해 보겠습니다. 

데이터 마이닝이란?
결과를 예측하기 위해 대량의 데이터 세트에서 이상점과 패턴 및 상관관계를 찾아내는 프로세스..인데요. 마케터 입장에서 설명해보자면 고객이 남긴 대량의 행동데이터, 구매데이터에서 공통점/상관관계를 파악하는 과정입니다.

예를 들어, 2~3가지 변수라면 RFM 분석과 같이 마케터가 기준을 두고 고객의 그룹핑할 수 있으나 구매이력, 찜, 장바구니 담기 등 여러 변수로 고객을 그룹핑하려면? 마케터가 명확한 기준을 두기 어렵습니다. 경우의 수가 굉장히 많아지기 때문입니다. 그래서 이걸 똑똑한 AI한테 맡기는 겁니다. 네가 알아서 패턴 찾고, 상관관계 파악해서 나한테 알려줘! 하는 거죠.  

데이터 마이닝에는 여러 알고리즘이 있는데요. 그 중 CRM에서 활용할만한 건 클러스터링 알고리즘(고객 관심사 분석)과 이번 글에서 설명할 연관 규칙 알고리즘 정도가 될 것 같습니다. 

 

[글 구성]
1. 구매연관성 분석이란?
2. 구매연관성 활용 사례
3. 구매연관성 지표(지지도, 신뢰도, 향상도) 
4. 마케팅 활용 방안(CRM, 퍼포먼스 연계) 

 

1. 구매연관성 분석이란? 

고객이 남긴 데이터(예:구매, 장바구니)로 고객이 어떤 상품을 함께 구매하는지 위에서 설명한 알고리즘을 활용해 파악합니다. 대표적 사례로 월마트가 있습니다. 월마트는 영수증 데이터 분석을 통해 기저귀 심부름을 나온 남편이 맥주를 함께 산다는 사실을 발견했습니다. 이를 통해 기저귀 진열대 옆에 맥주를 진열했고 (정확한 수치는 찾을 수 없었으나)두 제품 모두 추가 매출이 발생되었다고 합니다.  

 

2. 구매연관성 활용사례

월마트는 오프라인의 사례이고 온라인 플랫폼에서는 CRM 마케팅 그리고 "상품 추천"으로도 활용됩니다.  

아래 배달의민족, cj온스타일 예시와 같이 어떤 상품을 장바구니에 담았을 때 함께 구매하면 좋을 상품을 추천해 줍니다.  

 

cj온스타일 앱의 사례를 보면 장바구니에 담은 상품에 따라 추천상품도 달라지는 것을 볼 수 있습니다. 

 

 

 

3. 구매연관성 지표(지지도, 신뢰도, 향상도) 

그럼 한가지 질문을 던져보겠습니다. 

월마트 사례에서 기저귀+맥주를 함께 사는 것을 발견하고 상품 진열을 바꾼 것을 말씀드렸습니다.

 

그런데 전체 구매 건 수에서 기저귀/맥주 구매 건 수 비중이 낮다면 어떨까요? 

마트를 방문하는 고객 중에 기저귀를 하는 아이를 둔 가정이 많지 않을 수도 있지 않을까요? 요즘같이 1인 가구가 늘어나는 상황에서 충분히 이런 의문을 가질 수 있다고 생각합니다. 

 

상품 진열을 바꾸거나 상품 추천을 위한 결정을 하기 위해서는 "A상품+B상품 구매연관성이 높으니까"라고 단순히 접근해선 안된다고 생각합니다. 

 

그래서 구매연관성 분석을 할 때 3가지 지표로 연관성이 높고 낮음을 판단합니다.  

 

각 지표에 대해 아래 표와 같이 A1~A5 고객의 마트 구매내역을 가정하고 설명하겠습니다. 

 

 

1)지지도(Support)

전체 거래 중 구매가 일어난 상품 비중을 의미합니다. 

밀키트+사과를 구매한 것을 분석한다고 할 때, 이에 대한 지지도는 40%입니다. 

 

각 지표별로 계산식이 있는데...넣으면 오히려 복잡해질 것 같아 제외하겠습니다. 

 

 

지지도에서 추가로 확인해야 할 사항이 있습니다.

분석 결과에 3가지 종류의 지지도가 나오기 때문입니다. 

 

밀키트+사과 구매에 대한 지지도를 파악한다는 가정으로 설명하겠습니다. 

 

-antecedent support: 선행절에 대한 지지도. 전체 구매 중 "밀키트"를 포함해서 구매하는 비중 

-consequent support: 후행절에 대한 지지도. 전체 구매 중 "사과"를 포함해서 구매하는 비중 

-support: "밀키트"와 "사과"를 동시에 구매하는 비중 

 

쉽게 설명해서  antecedent support와 consequent support는 "단품 구매"에 대한 지지도, support는 동시 구매에 대한 지지도로 보면 됩니다. 

 

이를 통해서 우리는 이 상품이 전체 구매에서 높은 비중을 차지하는 지를 알 수 있습니다. 

 

단순하게 예를 들어보겠습니다.

"밀키트+사과" 지지도 50%, "두부+사과" 지지도는 35%. 이 2가지 조건만 두었을 때 "밀키트+사과" 조합으로 추천해야겠다는 판단을 할 수 있습니다. 그런데 전체 구매 비중에서 "밀키트"가 20%, "두부"가 50%라면 어떨까요? 오히려 "두부+사과"를 추천하는 게 효과적일 수 있습니다. 해석할 때 이런 요소들을 함께 고려하여 결정을 내려야 합니다. 그만큼 해석하는 사람의 의중이 중요합니다. 또한 여러가지 사항들을 고려해야 하기에 분석하는 과정보다 해석하는 과정이 제일 어렵다고 생각합니다. 

 

그렇다면 위의 지지도는 "구매 순서"가 반영된 걸까요? 

그렇지 않습니다. 선행절, 후행절에 대한 지지도일 뿐, 구매하는 순서가 반영된 것은 아닙니다. 

**참고**
구매순서에 대한 이야기가 나왔으니 잠깐 다른 이야기를 해보겠습니다. 
분석 알고리즘은 연관분석과 순차패턴분석이 있습니다.
연관분석에는 고객id, 상품 카테고리, 구매건 수 데이터를 주로 활용한다면,
순차패턴분석은 여기에 구매시간이 추가됩니다. 

순차패턴분석은 결과 지표에 supportAB, confidenceAB와 같이 각 지표에 순서가 추가되어 나옵니다. 

 

 

2)Confidence(신뢰도)

A상품만 구매한 고객 중 A상품과 B상품을 함께 구매한 고객 비중을 의미합니다. 

여기서 유의해야 할 것은 "기준"을 어느 상품에 두냐에 따라 수치가 달라진다는 것입니다. 

(순서가 아닌 기준입니다. 헷갈리면 안 됩니다.)

 

예를 들어,  

밀키트 구매고객 중 밀키트와 사과를 함께 구매할 확률은 50%지만

반대로 사과 구매고객 중 사과와 밀키트를 함께 구매할 확률은 약 66%가 됩니다. 

 

신뢰도로 밀키트를 구매한 고객이 사과도 구매할 가능성이 높은 지 판단할 수 있습니다. 

 

 

 

3)Lift(향상도)

이건 내용이 복잡할 수 있어서 예시 상황으로 설명하겠습니다. 

밀키트를 산 고객에게 사과를 추천하려 합니다. 추천하려는 "사과"가 구매자에게 어필이 될까요? 

그걸 수치로 확인해 보기 위한 지표라 보시면 될 것 같습니다. 

 

1) 밀키트 구매고객 중 "밀키트+사과" 구매고객 비중 2/4 (50%)

2) 전체 구매고객 중 "사과" 구매고객 비중 3/5 (60%)

1)에 2)를 나눕니다. 

 

최종 결과는 30%

 

밀키트를 사지 않고 사과만 사는 사람이 이미 전체 구매의 60%로 높기 때문에 밀키트를 산 사람에게 "사과"를 추천했을 때 어필되지 않을 가능성이 높습니다. (이미 사과를 구매했을 가능성이 높은거죠.) 

 

 

 

이렇게 3개 주요 지표로 최종 추천 여부를 판단하게 됩니다. 

다만 더 정확한 판단을 위해 leverage, conviction 지표를 추가로 확인하기도 하는데요. 

관련해서는 설명이 잘되어있는 다른 블로그 링크로 대신하겠습니다. 

 

**링크: https://zephyrus1111.tistory.com/119

 

8. 연관 규칙 분석(Association Rule Analysis) with Python

이번 포스팅에서는 데이터 간의 관계를 탐색하기 위한 방법으로 마케팅 분야에서 많이 활용되고 있는 연관 규칙 분석(마케팅에서는 장바구니 분석이라고도 한다) 대해서 알아보고자 한다. 여기

zephyrus1111.tistory.com

 

위에서도 언급했듯 같은 결괏값을 두고 어떻게 해석하느냐에 따라 결론에 큰 영향을 미친다고 생각합니다.  

그래서 해석하는 사람이 명확한 기준과 근거를 가지고 해석하는 것이 무엇보다 중요하다고 생각합니다.  

 

4. 마케팅 활용 방안(CRM, 퍼포먼스 연계) 

위에서 사례로 든 상품 추천은 직접 로직을 짤수도 있지만 아마 대부분 솔루션을 사용하고 있을 거라 생각합니다. 

구매연관성 분석은 상품 추천 로직 외에 크로스셀링/업셀링으로 객단가를 높이는 목적으로 활용해 볼 수 있습니다. 

 

아래 몇 가지 간단한 상황을 예시로 두는 것으로 이 글을 마무리하겠습니다. 

 

1) 유입 고객 Lock-in 전략 

(상황 01)
신규 구매자도 늘리고, 첫구매자 재구매율도 높일 수 있는 방법이 있을까? 
이때 구매연관성 분석을 유용하게 활용해 볼 수 있습니다. 

1)고객 첫구매 데이터를 분석 및 선호 카테고리/브랜드 파악
2)첫구매 선호 카테고리/브랜드 퍼포먼스 소재 반영 and 첫구매 웰컴딜 상품 활용  "퍼포먼스&프로모션"
3)첫구매자 대상 첫구매 상품과 구매연관도가 높은 상품 소구하여 CRM 메세지 발송  "CRM"
(상황 02)
월별 첫구매 고객 LTV를 확인했을 때 여름 시즌 첫구매자 LTV가 상대적으로 낮은 것을 확인
카테고리별로 쪼개보니 저가 여름 샌들 구매고객 재구매율이 다른 카테고리 대비 현저히 낮은 편이라면? 

1)여름 샌들과 함께 구매하는 상품 / 여름 샌들과 비슷한 액세서리 구매고객 구매연관성 높은 상품 확인 
2)해당 상품 할인 상품 지정 > CRM 메시지 발송하여 유입 및 구매 유도  "CRM&프로모션"

 

2) 크로스셀링/업셀링 캠페인으로 객단가 높이기  

(상황 03)
고객 클러스터링 분석을 통해 관심사별로 고객을 그룹핑했을 때 20~30만 원대 운동화 위주 구매하는 그룹을 발견했다. 운동화 구매주기는 2~3개월. 다른 상품 구매를 유도하여 더 자주 구매하도록 유도하고 싶을 때 


1)운동화 구매연관성 높은 상품 소구한 CRM 액션  "CRM"
2)①번 구매전환 고객에게 고가 상품 소구하여 2차로 CRM 액션  "CRM"

 

긴 글 읽어주셔서 감사합니다.

내용에 오류가 있거나 궁금한 부분은 언제든 댓글로 남겨주세요.

좋은 피드백에 대한 댓글은 언제나 환영입니다 :)