온라인 쇼핑몰 RFM(Recency, Frequency, Monetary)모형 기반 군집분석에 따른 연관성 규칙(Association Rule) 전략 연구

온라인 쇼핑몰 고객을 RFM 기반 군집분석으로 ‘우수고객’, ‘잠재고객’ 등으로 나눈 뒤, 각 그룹별로 연관규칙 분석을 적용하여 그룹 맞춤형 상품 추천 전략을 제시하는 2단계 분석 방법론을 다룬다.


논문 요약

  • 논문 제목: 온라인 쇼핑몰 RFM 모형 기반 군집분석에 따른 연관성 규칙(Association Rule) 전략 연구
  • 저자: 정미정
  • 게재 학술지: 동국대학교 일반대학원 (석사학위논문)
  • 발행 연도: 2021
  • 핵심 요약: 온라인 쇼핑몰의 고객 구매 데이터를 활용하여, 먼저 RFM(최근성, 빈도, 금액) 지표 기반의 K-평균 군집분석으로 고객을 ‘우수고객’, ‘잠재고객’ 등 여러 세그먼트로 분류했다. 이후, 각 세그먼트별로 독립적인 연관규칙 분석(장바구니 분석)을 수행하여, 그룹별로 함께 구매되는 상품 조합 패턴을 발견하고 이를 바탕으로 차별화된 교차 판매 전략을 제안했다.

연구 배경

“모든 고객에게 똑같은 상품을 추천하는 것은 더 이상 통하지 않는다. 그렇다면, VIP 고객에게는 무엇을, 잠재 고객에게는 무엇을 추천해야 할까?” 이 연구는 이 질문에 대한 데이터 기반의 해답을 찾기 위해, 고객 세분화와 상품 추천이라는 두 가지 강력한 분석 기법을 결합한다.

온라인 쇼핑몰의 치열한 경쟁 속에서, 고객에게 개인화된 경험을 제공하는 것은 생존과 성장의 필수 조건이 되었다. 이를 위해 많은 기업들이 두 가지 핵심적인 데이터 분석 기법을 활용해왔다.

  1. 고객 세분화 (Customer Segmentation): 전체 고객을 비슷한 특성을 가진 그룹으로 나누는 기법이다. 특히 RFM(Recency, Frequency, Monetary) 분석은 고객의 최근성, 구매 빈도, 구매 금액을 기준으로 우량 고객과 이탈 위험 고객 등을 식별하는 데 널리 사용된다. 이는 ‘누구에게(Who)’ 마케팅할 것인가의 문제를 해결한다.
  2. 연관규칙 분석 (Association Rule Mining): 일명 장바구니 분석으로, 고객들이 어떤 상품들을 함께 구매하는지 그 연관성을 분석하는 기법이다. “기저귀를 구매한 고객은 맥주도 함께 구매한다”는 고전적인 예시처럼, 상품 간의 숨겨진 관계를 발견하여 교차 판매나 상품 추천에 활용한다. 이는 ‘무엇을(What)’ 마케팅할 것인가의 문제를 해결한다.

하지만 이 두 기법은 종종 독립적으로 사용되어 시너지를 내지 못했다. 모든 고객을 대상으로 한 연관규칙 분석은 “평균적인” 구매 패턴만을 보여줄 뿐, 고객 그룹별로 미묘하게 다른 구매 패턴을 포착하지 못하는 한계가 있었다. 본 연구는 바로 이 지점에서 출발하여, 고객 세분화와 연관규칙 분석을 순차적으로 결합하는 새로운 하이브리드 방법론을 제안한다.


해결하려는 문제

‘모든 고객’을 위한 획일적인 상품 추천의 한계를 넘어, ‘특정 고객 그룹’의 고유한 구매 패턴을 발견하고, 이를 바탕으로 세그먼트별로 차별화된 초개인화 추천 전략을 수립한다.

기존의 연관규칙 분석은 쇼핑몰 전체의 거래 데이터를 대상으로 수행되었다. 이 경우, “빵을 산 사람은 우유도 산다”와 같은 매우 일반적이고 상식적인 규칙이 발견될 가능성이 높다. 하지만 이러한 추천은 고객에게 큰 가치를 주지 못한다.

진정한 개인화 추천은 고객의 유형을 고려해야 한다. 예를 들어,

  • 우수고객(VIP): ‘고급 와인’과 ‘수입 치즈’를 함께 구매하는 패턴을 보일 수 있다.
  • 신규고객(New Customer): ‘생수’와 ‘라면’ 같은 생필품을 함께 구매하는 패턴을 보일 수 있다.
  • 이탈위험고객(At-risk Customer): 특정 카테고리의 상품을 더 이상 구매하지 않는 패턴을 보일 수 있다.

이 연구가 해결하고자 하는 핵심 문제는 바로 이러한 **’고객 그룹별 구매 패턴의 이질성’**을 분석하는 것이다. 먼저 고객을 RFM 기반으로 의미 있는 그룹으로 나눈 뒤, 각 그룹의 ‘장바구니’를 개별적으로 분석하여 그룹의 특성에 맞는 상품 연관 규칙을 발견하는 것을 목표로 한다. 이를 통해 “VIP 고객에게는 고급 와인과 수입 치즈를 함께 추천”하고, “신규 고객에게는 생수와 라면을 함께 추천”하는 등, 훨씬 더 정교하고 효과적인 맞춤형 마케팅 전략을 수립하고자 한다.


연구 모형

1단계에서 RFM 점수를 기반으로 K-평균 군집분석을 수행하여 고객 세그먼트를 도출하고, 2단계에서 각 세그먼트별 거래 데이터에 연관규칙 분석을 적용하여 그룹별로 특화된 상품 연관 규칙을 발견한다.

본 연구는 고객 세분화와 상품 추천 전략을 결합하기 위해, 다음과 같은 명확한 **2단계 분석 파이프라인(2-Stage Analysis Pipeline)**을 설계했다.

  • 1단계: 고객 세분화 (Customer Segmentation)
    1. 전체 고객의 거래 데이터로부터 각 고객의 RFM(최근성, 빈도, 금액) 점수를 계산한다.
    2. 산출된 RFM 점수를 입력 변수로 사용하여 **K-평균 군집분석(K-Means Clustering)**을 수행한다.
    3. 고객들을 ‘우수고객(High RFM)’, ‘잠재고객(Medium RFM)’, ‘일반고객(Low RFM)’, ‘이탈위험고객’ 등과 같이 의미 있는 세그먼트로 분류한다.
  • 2단계: 세그먼트별 연관규칙 분석 (Segment-specific Association Rule Mining)
    1. 1단계에서 분류된 각 고객 세그먼트별로 거래 데이터를 필터링한다. (예: ‘우수고객’ 그룹에 속한 고객들의 거래 내역만 추출)
    2. 각 세그먼트의 거래 데이터에 대해 Apriori 또는 FP-Growth와 같은 연관규칙 분석 알고리즘을 각각 적용한다.
    3. 각 세그먼트별로 지지도(Support), 신뢰도(Confidence), 향상도(Lift)가 높은 상품 연관 규칙을 도출한다.
  • 전략 제안: 각 세그먼트별로 도출된 고유한 연관 규칙을 바탕으로, 차별화된 교차 판매, 상품 추천, 프로모션 등 구체적인 e-CRM 전략을 제안한다.

데이터 설명

특정 온라인 쇼핑몰의 고객 구매 이력 데이터를 활용했으며, 고객별 RFM 산출 및 장바구니 분석이 가능한 거래 기록 형태의 오프체인(Off-chain) 데이터이다.

  • 출처: 논문에 구체적인 출처는 명시되지 않았으나, 국내 특정 온라인 쇼핑몰의 내부 거래 데이터베이스에서 추출한 데이터를 활용한 것으로 보인다. 이는 전형적인 오프체인(Off-chain) 데이터이다.
  • 수집 방법: 기업 내부의 데이터웨어하우스(DW)에서 특정 기간의 고객 정보와 주문 내역을 추출하여, 고객 ID를 기준으로 분석용 데이터셋을 구축했을 것이다.
  • 데이터 변수 설명: 본 연구는 두 단계의 분석을 위해, 고객 단위와 거래 단위의 데이터가 모두 필요하다.
    • 고객 단위 파생 데이터 (군집분석용):
      • Recency: 각 고객의 마지막 구매일로부터 기준일까지의 경과 시간.
      • Frequency: 각 고객의 총 구매 횟수.
      • Monetary: 각 고객의 총 구매 금액.
    • 거래 단위 데이터 (연관규칙 분석용):
      • TransactionID: 각 거래(주문)의 고유 식별자.
      • ProductID: 해당 거래에 포함된 각 상품의 고유 식별자.
      • 분석을 위해, 각 TransactionID에 어떤 ProductID들이 포함되어 있는지를 나타내는 ‘장바구니(Market Basket)’ 형태의 데이터로 변환된다.

데이터 분석

고객을 RFM 기반 군집으로 나눈 뒤, 각 군집의 구매 데이터를 개별적으로 분석한 결과, ‘우수고객’ 그룹과 ‘일반고객’ 그룹에서 나타나는 상품 간의 연관 규칙이 뚜렷한 차이를 보임을 확인했다.

본 연구의 데이터 분석은 설계된 2단계 파이프라인에 따라 체계적으로 진행되었다.

1단계 분석에서는 모든 고객의 RFM 점수를 계산하고, 이를 기반으로 K-평균 군집분석을 수행하여 고객을 여러 개의 세그먼트로 나누었다. 그 결과, 예를 들어 ‘최근에 자주, 많이 구매한 VIP 그룹’, ‘과거에는 많이 샀지만 최근 구매가 뜸한 이탈 위험 VIP 그룹’, ‘구매력은 낮지만 꾸준히 방문하는 충성도 높은 일반 고객 그룹’ 등과 같이, 각기 다른 특성을 가진 고객 군집들을 식별할 수 있었다.

2단계 분석이 이 연구의 핵심이다. 1단계에서 분류된 각 그룹별로 거래 데이터를 따로 모아 연관규칙 분석을 수행했다. 그 결과, 각 그룹별로 매우 다른 구매 패턴(연관 규칙)이 나타났다.

  • **’VIP 그룹’**에서는 {고급 유기농 식재료} → {수입 와인}과 같은 규칙이 높은 신뢰도로 발견되었다.
  • **’일반 고객 그룹’**에서는 {라면} → {계란} 또는 {우유} → {시리얼}과 같은 일상적인 생필품 조합 규칙이 주로 발견되었다.

이러한 분석 결과는 고객 세그먼트에 따라 추천해야 할 상품 조합이 완전히 달라져야 함을 명확하게 보여준다.


핵심 결과

고객 세그먼트별로 주로 함께 구매하는 상품의 조합이 다르다는 것을 데이터로 증명했으며, 이는 고객 유형에 따라 교차 판매 및 상품 추천 전략이 반드시 차별화되어야 함을 의미한다.

본 연구의 가장 중요한 결과는 **’세분화 후 연관규칙 분석(Segment-then-Association Rule Mining)’**이라는 하이브리드 방법론의 실질적인 유효성을 입증했다는 점이다.

전체 고객을 대상으로 한 연관규칙 분석에서는 발견하기 어려웠던, 각 고객 그룹의 고유한 소비 맥락과 라이프스타일이 반영된 구매 패턴을 성공적으로 찾아냈다. ‘우수고객’은 왜 우수고객인지, 그들이 주로 어떤 상품 조합을 통해 높은 지출을 하는지를 구체적인 데이터 기반의 규칙으로 설명할 수 있게 된 것이다.

이는 마케터가 더 이상 막연한 추측이 아닌, 데이터에 기반하여 “VIP 고객 그룹에게는 유기농 식재료를 구매했을 때, 다음 단계로 와인 할인 쿠폰을 제공하자” 와 같은 매우 구체적이고 정교한 액션 플랜을 수립할 수 있게 되었음을 의미한다.


시사점

고객 세분화는 그 자체로 끝나는 것이 아니라, 각 세그먼트의 고유한 행동 패턴을 심층적으로 분석하고 그에 맞는 개인화 전략을 실행하기 위한 ‘출발점’이다.

이 연구는 데이터 기반 CRM 전략을 수립하는 데 있어 다음과 같은 중요한 시사점을 제공한다.

첫째, 분석의 깊이가 전략의 깊이를 결정한다. 단순히 고객을 몇 개의 그룹으로 나누는 것에서 멈추지 않고, 각 그룹의 내부를 더 깊이 들여다보는 노력이 필요하다. 이 연구는 ‘연관규칙 분석’이라는 구체적인 심층 분석 도구를 제시함으로써, 세분화 이후 무엇을 해야 할지에 대한 명확한 방향을 보여준다.

둘째, 정교한 개인화는 ‘고객 이해’와 ‘상품 이해’의 결합에서 나온다. 군집분석을 통해 ‘고객(Who)’을 이해하고, 연관규칙 분석을 통해 ‘상품(What)’ 간의 관계를 이해하며, 이 둘을 결합했을 때 비로소 ‘어떤 고객에게 어떤 상품을 추천할 것인가’라는 개인화의 핵심 질문에 답할 수 있다.


인사이트

모두를 위한 추천은 아무를 위한 추천도 아니다. ‘그들’만을 위한 추천을 하라.

이 논문은 개인화 마케팅의 정수를 보여준다. 진정한 개인화는 고객을 ‘평균’으로 보지 않고, 고유한 욕망과 패턴을 가진 ‘부족(Tribe)’으로 인식하는 것에서 시작한다. 그리고 각 부족에게 그들만의 언어와 방식으로 말을 거는 것, 즉 ‘그들만을 위한’ 맞춤형 제안을 하는 것이 성공의 핵심이다.

  • 페르소나 예시: “DeFi 수확 최적화 농부, 파머 핀(Farmer Finn)”
    • 특징: 핀은 DeFi에서 이자 농사를 지을 때, 단순히 APY만 보지 않는다. 그는 **리스크 관리를 위해 여러 프로토콜을 ‘조합’**하여 사용한다. 예를 들어, 그는 안정적인 수익을 위해 커브(Curve)에 스테이블코인을 예치하고, 거기서 받은 LP 토큰을 컨벡스(Convex)에 넣어 수익을 부스팅하며, 동시에 변동성 자산은 에이브(Aave)에 예치하여 담보 비율을 관리한다. 그의 행동은 특정 목적(위험 관리 및 수익 극대화)을 위해 프로토콜들을 조합하는 뚜렷한 패턴을 보인다.
    • 데이터 기반 행동: Curve, Convex, Aave 등 특정 프로토콜 조합을 반복적으로, 그리고 함께 사용하는 트랜잭션 패턴.
  • 실질적인 마케팅 액션 제안:
    1. 세그먼트별 ‘DeFi 레시피’ 발견: 1단계(군집분석)로 ‘파머 핀’과 같이 정교한 전략을 사용하는 ‘수확 최적화 농부’ 세그먼트를 식별한다. 그 다음, 2단계(연관규칙 분석)를 통해 이 그룹이 가장 자주 사용하는 DeFi 프로토콜 조합, 즉 이들만의 ‘DeFi 레시피’ ({Curve, Convex, Aave})를 발견한다.
    2. ‘레시피’ 기반의 다음 단계 추천: 이 세그먼트에 속한 사용자가 Curve와 Aave를 사용하는 것이 감지되면, 연관규칙 분석 결과를 바탕으로 “당신의 포트폴리오에 Convex를 추가하여 수익률을 20% 더 높여보세요!”와 같이, 그들의 ‘레시피’에 기반한 가장 논리적인 다음 단계를 선제적으로 추천한다.
    3. 원클릭 ‘레시피’ 실행 기능 제공: 이 ‘수확 최적화 농부’ 세그먼트를 위해, 발견된 인기 ‘DeFi 레시피'(예: Curve+Convex+Aave 전략)를 한 번의 클릭으로 실행할 수 있는 통합 관리 dApp(Aggregator)이나 ‘전략 볼트(Strategy Vault)’ 기능을 제공한다. 이는 이들의 복잡한 작업을 단순화하여 강력한 락인(Lock-in) 효과를 창출하고, 수수료 수익을 증대시킬 수 있다.