고객의 온라인 행동 변수를 접목한 RFM 분석 방법론 리뷰

전통적인 RFM(최근성, 빈도, 금액) 분석에 고객의 온라인 행동 데이터(페이지뷰, 체류 시간 등)를 결합하여, 더욱 정교하고 설명력 높은 고객 세분화 모델을 제안한다.


논문 요약

  • 논문 제목: 고객의 온라인 행동 변수를 접목한 RFM 분석 방법론
  • 저자: 김현지
  • 게재 학술지: 국민대학교 대학원 (석사학위논문)
  • 발행 연도: 2024
  • 핵심 요약: 구매 이력 데이터에만 의존하는 전통적인 RFM 모델의 한계를 지적하고, 고객의 웹사이트 내 비구매 행동(방문 빈도, 페이지뷰, 체류 시간 등) 변수를 추가하여 확장된 RFM 모델을 구축했다. K-평균 군집분석을 통해 이 확장 모델이 기존 모델보다 고객의 잠재적 가치와 이탈 징후를 더 정확하게 식별하고, 더 풍부한 고객 세그먼트를 도출함을 보였다.

연구 배경

고객이 남긴 ‘구매 기록’은 빙산의 일각에 불과하다. 이 연구는 물밑에 잠긴 거대한 ‘행동 기록’을 분석하여 고객을 더 깊이 이해하고자 하며, 이를 위해 CRM의 고전적인 분석 기법인 RFM을 현대적으로 재해석한다.

**고객 관계 관리(CRM)**의 가장 기본적이면서도 중요한 첫 단계는 고객 세분화(Customer Segmentation), 즉 전체 고객을 의미 있는 소그룹으로 나누는 것이다. 이를 위한 가장 고전적이고 강력한 분석 기법이 바로 RFM 분석이다. RFM은 세 가지 핵심 지표를 바탕으로 고객을 평가한다.

  • Recency (최근성): 고객이 얼마나 최근에 구매했는가?
  • Frequency (빈도): 고객이 얼마나 자주 구매했는가?
  • Monetary (금액): 고객이 얼마나 많은 돈을 썼는가?

이 세 가지 지표를 조합하면 ‘최근에, 자주, 많은 돈을 쓴’ VIP 고객부터 ‘오래전에, 한 번, 소액을 구매한’ 이탈 고객까지 손쉽게 식별할 수 있다.

하지만 RFM 분석은 태생적으로 구매(Transaction) 데이터에만 의존한다는 명확한 한계를 가진다. 이커머스 환경에서는 고객이 구매하지 않더라도 수많은 의미 있는 활동을 남긴다. 예를 들어, 매일 웹사이트에 방문하여 신상품을 둘러보고, 장바구니에 상품을 담아두는 고객은 당장 구매를 하지 않더라도 매우 높은 잠재 가치를 지닌다. 그러나 전통적인 RFM 모델은 이 고객의 구매 빈도(F)와 금액(M)이 ‘0’이므로 가치를 낮게 평가할 수밖에 없다.

본 연구는 이러한 한계를 극복하기 위해, RFM 모델에 고객의 온라인 행동 변수(Online Behavior Variables), 즉 비구매 활동 데이터를 통합하는 새로운 방법론을 제안한다.


해결하려는 문제

구매 데이터에만 의존하는 전통적인 RFM 모델의 한계를 극복하고, 고객의 비구매 온라인 행동 데이터를 통합하여 잠재적 가치를 보다 정확하게 평가하고 예측한다.

전통적인 RFM 모델은 다음과 같은 질문에 답하기 어렵다.

  • 구매액은 적지만, 우리 브랜드에 매우 높은 관심을 보이는 ‘충성도 높은 잠재 고객’은 누구인가?
  • 과거에는 VIP 고객이었지만, 최근 구매는 없으나 웹사이트 방문은 잦은 고객은 ‘이탈 위험 고객’인가, 아니면 ‘재구매 탐색 고객’인가?
  • 아직 구매 경험이 없는 신규 방문자의 잠재 가치는 어떻게 평가할 수 있는가?

이처럼 구매 기록만으로는 고객의 현재 상태와 미래 가능성을 온전히 파악할 수 없다. 특히, 구매 주기가 긴 상품(가구, 가전 등)이나, 충분한 탐색 후에 구매가 일어나는 전문 분야의 경우, 비구매 활동 데이터의 중요성은 더욱 커진다.

본 연구의 핵심 목표는 고객의 ‘관심’과 ‘관여도’를 측정할 수 있는 온라인 행동 변수를 RFM 모델에 통합하는 것이다. 이를 통해, 구매 이력이 부족하거나 없는 고객의 잠재력을 평가하고, 기존 고객의 미묘한 행동 변화를 감지하여 보다 정교하고 현실적인 고객 세분화를 달성하고자 한다.


연구 모형

전통적인 RFM 변수에 온라인 행동 변수(방문 빈도, 페이지뷰, 체류 시간 등)를 추가하여 확장된 특징 벡터를 생성하고, 이를 K-평균 군집분석에 적용하여 고객을 세분화한다.

본 연구는 기존 RFM 모델을 확장하는 방식으로 설계되었다. 그 과정은 다음과 같다.

  1. 특징 공학 (Feature Engineering):
    • 구매 행동 데이터 추출: 고객별 거래 데이터에서 전통적인 RFM(Recency, Frequency, Monetary) 값을 계산한다.
    • 온라인 행동 데이터 추출: 웹 로그 데이터에서 고객별 방문 빈도, 총 페이지뷰, 평균 세션 체류 시간, 장바구니 추가 횟수 등 비구매 행동 변수들을 추출한다.
    • 확장된 특징 벡터 생성: 1단계와 2단계에서 추출한 변수들을 결합하여 각 고객을 설명하는 ‘확장된 RFM(Enhanced RFM)’ 특징 벡터를 생성한다.
  2. 군집 분석 (Clustering):
    • 생성된 확장 RFM 특징 벡터를 K-평균(K-Means) 군집분석 알고리즘의 입력값으로 사용한다.
    • K-평균 알고리즘은 고객들을 유사한 특징(구매 패턴 + 온라인 행동 패턴)을 가진 그룹으로 자동 분류한다.
  3. 모델 비교 및 평가:
    • 전통적인 RFM 변수만을 사용한 군집분석 결과와, 확장된 RFM 변수를 사용한 군집분석 결과를 비교한다.
    • 각 세그먼트의 특징, 프로필, 구매 전환율 등을 분석하여 확장된 모델이 얼마나 더 설명력 높고 유용한 세그먼트를 생성하는지를 평가한다.

데이터 설명

특정 이커머스 사이트의 고객 거래 데이터와 웹 로그 데이터를 통합하여 사용했으며, 이는 구매 이력과 비구매 행동을 모두 포함하는 오프체인(Off-chain) 데이터이다.

  • 출처: 논문에 구체적인 기업명이나 데이터 출처는 명시되지 않았으나, 국내 특정 이커머스 기업과의 협력을 통해 확보한 데이터를 사용한 것으로 추정된다. 데이터의 성격은 기업 내부 시스템에서 관리되는 오프체인(Off-chain) 데이터이다.
  • 수집 방법: 기업 내부의 주문 관리 시스템(OMS)에서 구매 데이터를, 웹 로그 분석 시스템(예: Google Analytics)에서 행동 데이터를 각각 추출한 뒤, 고객 ID를 기준으로 두 데이터를 통합했을 것으로 보인다.
  • 데이터 변수 설명: 본 연구의 핵심은 변수의 ‘확장’에 있으며, 변수들은 다음과 같은 두 그룹으로 구조화할 수 있다.
    • 전통 RFM 변수 그룹 (구매 행동):
      • Recency: 마지막 구매일로부터 경과된 시간
      • Frequency: 총 구매 횟수
      • Monetary: 총 구매 금액
    • 추가된 온라인 행동 변수 그룹 (비구매 행동):
      • 방문/체류 관련:
        • Visit Frequency: 총 방문 횟수 (세션 수)
        • Session Duration: 세션 당 평균 체류 시간
      • 탐색 관련:
        • Page Views (PV): 총 조회한 페이지 수
        • Viewed Products Count: 조회한 상품의 유니크한 개수
      • 관여 관련:
        • Add-to-Cart Count: 장바구니에 상품을 추가한 횟수
        • Wishlist Interaction: 위시리스트(찜하기) 관련 활동 횟수

데이터 분석

기존 RFM 변수 그룹과 온라인 행동 변수가 추가된 확장 RFM 변수 그룹 각각에 K-평균 군집분석을 적용하고, 각 군집의 특성 및 구매 전환율 등을 비교하여 모델의 설명력과 유효성을 검증했다.

본 연구의 데이터 분석은 두 가지 다른 모델의 결과를 비교하는 방식으로 이루어졌다.

  • 모델 A (전통 RFM): 오직 Recency, Frequency, Monetary 세 가지 변수만을 사용하여 K-평균 군집분석을 수행했다.
  • 모델 B (확장 RFM): Recency, Frequency, Monetary에 더해 Visit Frequency, Page Views 등 다양한 온라인 행동 변수들을 포함하여 K-평균 군집분석을 수행했다.

두 모델의 분석 결과를 비교한 결과, 모델 B(확장 RFM)가 고객의 특성을 훨씬 더 풍부하고 명확하게 설명하는 것으로 나타났다. 예를 들어, 모델 A에서는 단순히 ‘저가치 고객’으로 묶였던 그룹이, 모델 B에서는 온라인 행동 변수에 따라 **’단순 방문 후 이탈 고객’**과 **’구매는 안 하지만 관심은 많은 잠재 고객’**으로 명확하게 분리되었다. 후자 그룹은 비록 당장의 구매액은 낮지만, 향후 우량 고객으로 전환될 가능성이 높은 매우 중요한 타겟 집단이다. 이처럼 확장된 모델은 기존 모델이 놓치고 있던 유의미한 고객 세그먼트를 발견하고, 그들의 잠재 가치를 평가하는 데 훨씬 더 효과적임을 입증했다.


핵심 결과

온라인 행동 변수를 추가한 RFM 모델은 기존 RFM 모델에 비해 고객 그룹을 더 명확하게 구분했으며, 특히 ‘잠재 우량 고객’이나 ‘관심 이탈 고객’ 등 새로운 유형의 고객 세그먼트를 발견하는 데 효과적이었다.

본 연구의 핵심 결과는 **’RFM 모델의 성공적인 확장’**이다. 구매 이력 데이터에 온라인 행동 데이터를 결합함으로써, 고객 세분화의 질과 설명력이 크게 향상되었다. 기존 RFM 모델이 고객을 ‘과거의 구매 실적’을 기준으로 평가했다면, 확장된 RFM 모델은 **’현재의 관심도와 미래의 구매 가능성’**까지 고려하여 고객을 평가할 수 있게 되었다.

특히, 다음과 같은 새로운 유형의 고객 세그먼트를 식별할 수 있었다는 점이 중요한 성과이다.

  • 잠재적 충성 고객: 현재 구매 실적(F, M)은 낮지만, 방문 빈도와 페이지뷰 등 온라인 활동성이 매우 높은 그룹. 이들은 약간의 프로모션이나 개인화된 추천만으로도 우량 고객으로 전환될 가능성이 높다.
  • 관심 이탈 위험 고객: 과거 구매 실적(F, M)은 높았지만, 최근 방문 빈도나 체류 시간 등 온라인 활동성이 급격히 감소한 그룹. 이들은 구매 중단에 이어 관심까지 끊어지기 직전의 상태로, 시급한 이탈 방지 조치가 필요한 대상이다.

이처럼 확장된 RFM 모델은 기업이 고객을 더 깊이 이해하고, 더 정교한 타겟 마케팅을 실행할 수 있는 강력한 분석적 토대를 제공한다.


시사점

고객의 ‘구매’ 행동뿐만 아니라, 구매로 이어지지 않은 ‘탐색’과 ‘관심’의 과정 또한 고객 가치를 평가하고 미래 행동을 예측하는 데 매우 중요한 데이터이다.

이 연구는 고객 데이터 분석을 수행하는 실무자들에게 다음과 같은 명확한 시사점을 제공한다.

첫째, 데이터의 범위를 확장해야 한다. 기업은 더 이상 구매 데이터에만 만족해서는 안 된다. 고객이 웹사이트나 앱에서 남기는 모든 ‘디지털 발자국’, 즉 클릭, 스크롤, 페이지뷰, 검색, 체류 시간 등의 데이터를 적극적으로 수집하고 통합하여 분석에 활용해야 한다. 이러한 비구매 데이터는 고객의 숨겨진 의도와 니즈를 파악할 수 있는 보고(寶庫)이다.

둘째, 고객의 가치를 다각적으로 평가해야 한다. 단순히 돈을 많이 쓰는 고객만이 우량 고객은 아니다. 우리 브랜드에 높은 관심을 보이고, 커뮤니티에 자주 참여하며, 긍정적인 리뷰를 남기는 고객 또한 매우 높은 가치를 지닌다. 이 연구는 이러한 ‘관여도(Engagement)’를 측정할 수 있는 변수들을 활용하여, 고객 가치 평가 모델을 더욱 정교하게 만들어야 함을 보여준다.


인사이트

고객의 ‘지갑’만 보지 말고, 고객의 ‘발자취’를 따라가라.

이 논문은 고객을 이해하는 ‘해상도’를 높이는 방법을 제시한다. 구매라는 저해상도 이미지만으로 고객을 판단하는 시대는 지났다. 고객이 남긴 모든 행동 데이터를 활용하여 초고해상도 이미지로 고객을 바라볼 때, 비로소 보이지 않던 기회들이 보이기 시작한다.

  • 고객 페르소나 예시: “정보 탐색가, 알파(Alpha)”
    • 특징: 알파는 다양한 DeFi 프로토콜에 대해 깊이 있게 조사하지만, 실제 투자는 매우 신중하게 결정한다. 그는 여러 프로토콜의 문서(docs)를 읽고, 디스코드에서 활발히 질문하며, 다른 고래 투자자들의 트랜잭션을 Etherscan에서 자주 조회한다. 그의 실제 USDC 거래(Monetary)는 많지 않지만, 그의 온체인 ‘탐색’과 ‘학습’ 활동은 누구보다 활발하다.
    • 데이터 기반 행동: 낮은 Monetary, 하지만 높은 Approve 트랜잭션 수, 다양한 dApp과의 view 함수 호출 횟수, 거버넌스 포럼 및 디스코드 활동량.
  • 실질적인 마케팅 액션 제안:
    1. 탐색 행동 기반 리타겟팅: ‘알파’와 같이 approve 트랜잭션은 많지만 실제 swap이나 stake 트랜잭션은 적은 지갑 그룹을 ‘잠재 VIP’로 식별한다. 이들에게는 “더 궁금한 점이 있으신가요? 저희 개발자와의 AMA 세션에 참여해 보세요”와 같이, 이들의 정보 탐색 니즈를 충족시키는 방향으로 리타겟팅하여 신뢰를 구축한다.
    2. 관여도(Engagement) 기반 잠재고객 점수화: 총 거래량을 넘어, ‘다른 지갑의 활동 조회 횟수(Etherscan)’, ‘거버넌스 포럼 방문 빈도’, ‘다양한 dApp과의 view 함수 호출’ 등을 점수화하여 ‘Web3 관여도(Engagement) 점수’를 만든다. 이 점수가 높지만 실제 거래가 없는 고객을 ‘전환 직전 고객’으로 분류하고 특별 관리한다.
    3. 장벽 제거 캠페인: 이 ‘정보 탐색가’ 그룹이 가장 많이 조회했지만 결국 거래하지 않은 프로토콜이나 함수를 분석한다. 해당 프로세스에 높은 가스비나 복잡한 UI 등 명백한 장벽이 있다면, 이를 개선하거나 “첫 거래 가스비 지원” 캠페인을 통해 첫 거래의 심리적, 비용적 장벽을 낮춰준다.