CRM 분석을 위한 고객 세분화에 관한 연구 리뷰

데이터마이닝의 군집분석 기법을 활용하여 고객을 실질적인 가치와 행동 특성에 따라 그룹화하는 방법론을 제시하고, 이를 통해 CRM 전략의 기반을 마련하는 과정을 분석한다.

논문 요약

  • 논문 제목: CRM 분석을 위한 고객 세분화에 관한 연구
  • 저자: 송관배, 양광모, 강경식
  • 게재 학술지: 한국지능정보시스템학회
  • 발행 연도: 2007
  • 핵심 요약: 데이터마이닝의 군집분석 기법을 적용하여 고객을 동질적인 특성을 가진 여러 그룹으로 객관적으로 세분화하고, 각 세그먼트의 프로파일을 정의하여 차별화된 CRM 전략 수립의 토대를 마련하는 방법론을 제시했다.

연구 배경

2000년대 중반, 기업들은 방대한 고객 데이터를 축적하기 시작했지만, 이를 어떻게 활용하여 실질적인 비즈니스 가치를 창출할지에 대한 고민이 깊어졌다. 모든 고객에게 동일한 메시지를 전달하는 매스 마케팅의 한계가 명확해지면서, 고객 개개인의 특성에 맞는 개인화된 접근법의 필요성이 대두되었다. 이러한 배경에서 **CRM(Customer Relationship Management)**과 데이터마이닝(Data Mining) 기술이 주목받기 시작했다. 특히 데이터마이닝의 핵심 기법 중 하나인 **군집분석(Clustering Analysis)**은 별도의 정답 없이 데이터 자체의 유사성을 기반으로 고객 그룹을 찾아내는 강력한 도구였다. 이 연구는 이러한 기술을 활용하여, 감이나 경험이 아닌 데이터에 기반한 객관적인 **고객 세분화(Customer Segmentation)**를 수행하고, 이를 통해 마케팅 효율성을 극대화하고자 하는 시대적 요구를 반영한다.


해결하려는 문제

전체 고객을 하나의 집단으로 보고 획일적인 마케팅을 적용하는 비효율성을 극복하고, 데이터에 기반하여 고객을 의미 있는 소규모 그룹으로 나누고자 했다.

기업이 마주한 근본적인 문제는 ‘모든 고객은 다르다’는 사실을 알면서도, 이들을 효과적으로 구분할 방법이 없다는 것이었다. 연령이나 성별 같은 단순한 인구통계학적 구분만으로는 고객의 실제 구매 행동이나 니즈를 파악하기에 턱없이 부족했다. 예를 들어, 같은 30대 남성이라도 한 명은 최신 전자기기에 열광하는 얼리어답터일 수 있고, 다른 한 명은 주말 캠핑을 즐기는 아웃도어 애호가일 수 있다. 이 연구는 이처럼 비효율적인 ‘원 사이즈 핏츠 올(One-size-fits-all)’ 접근법에서 벗어나, 실제 고객의 행동 데이터를 분석하여 숨겨진 패턴을 찾아내고, 동질적인 특성을 가진 의미 있는 고객 그룹(세그먼트)을 발견하는 것을 핵심 문제로 삼았다.


연구 모형

고객의 구매 관련 데이터(RFM)와 인구통계학적 데이터를 주요 변수로 사용하여, 군집분석 알고리즘(K-평균 등)으로 고객 세그먼트를 생성하고 각 그룹의 특성을 정의하는 분석 프레임워크를 적용했다.

이 연구에서 제시한 고객 세분화 모델은 데이터마이닝의 전형적인 분석 프레임워크를 따른다.

  1. 변수 선택(Variable Selection): 고객을 효과적으로 구분할 수 있는 핵심 지표를 선택한다. 이 연구에서는 고객 가치 평가의 고전적인 모델인 RFM(Recency, Frequency, Monetary) 변수를 핵심으로 사용했다.
  2. 데이터 전처리(Data Preprocessing): 선택된 변수들의 단위나 범위가 다르므로, 이를 동일한 스케일로 표준화(Standardization)하거나 정규화(Normalization)하여 분석의 왜곡을 방지한다.
  3. 군집분석 실행(Clustering Execution): K-평균(K-Means)과 같은 군집분석 알고리즘을 적용하여, 데이터 공간에서 서로 가까운 고객들을 하나의 군집(Cluster)으로 묶는다. 이 과정에서 최적의 군집 개수(K)를 결정하는 것이 중요하다.
  4. 세그먼트 프로파일링(Segment Profiling): 형성된 각 군집이 어떤 특성을 가지는지 분석한다. 각 군집의 RFM 평균값과 인구통계학적 특성을 비교하여 ‘충성 우량 고객’, ‘이탈 위험 고객’ 등과 같이 각 세그먼트의 정체성을 명확히 정의하고 이름을 부여한다.

데이터 설명

특정 산업(예: 유통업)의 고객 구매 이력과 신상 정보를 포함하는 데이터를 분석에 사용했다.

  • 출처: 논문에 구체적인 기업이나 데이터셋 출처는 명시되지 않음. 일반적으로 CRM 분석 연구에서 활용되는 익명화된 유통업체 또는 금융사의 고객 데이터를 사용했을 것으로 추정된다.
  • 온체인 여부: 온체인 데이터가 아닌, 기업의 내부 데이터베이스 시스템에 저장된 오프체인(Off-chain) 데이터이다.
  • 수집 방법: 논문에 구체적인 수집 방법은 명시되지 않았으나, 통상적으로 기업의 판매 시점 정보 관리 시스템(POS), 웹사이트 회원가입 정보, 고객센터 로그 등에서 수년간 축적된 데이터를 추출하여 활용한다.
  • 데이터 변수 설명: 이 연구는 CRM을 위한 고객 세분화의 표준적인 변수 구조를 사용하며, 다음과 같이 논리적으로 그룹화할 수 있다.
    • 고객 가치 변수 (Customer Value Metrics): 고객의 현재 및 미래 가치를 직접적으로 나타내는 지표.
      • Recency (R): 얼마나 최근에 구매했는가?
      • Frequency (F): 얼마나 자주 구매했는가?
      • Monetary (M): 얼마나 많은 돈을 썼는가?
    • 고객 행동 변수 (Customer Behavior Metrics): 고객의 구매 습관이나 선호도를 보여주는 지표.
      • 주요 구매 상품군: 고객이 주로 구매하는 상품의 카테고리.
      • 방문 주기: 평균적으로 얼마 만에 한 번씩 방문하는가.
      • 평균 구매액 (Average Ticket Size): 한 번 구매할 때 평균적으로 얼마를 지출하는가.
    • 고객 인구통계 변수 (Demographic Metrics): 고객의 기본적인 신상 정보.
      • 연령대, 성별, 거주 지역 등.

데이터 분석

선정된 고객 변수들을 기반으로 K-평균 군집분석(K-Means Clustering)을 수행하여, 통계적으로 유의미하면서도 마케팅적으로 해석 가능한 고객 그룹들을 도출했다.

데이터 분석의 핵심은 K-평균 군집분석이다. 먼저, 분석가는 사전에 군집의 개수(K)를 정해야 한다. 그 후 알고리즘은 무작위로 K개의 중심점(Centroid)을 선택하고, 모든 고객 데이터를 각자 가장 가까운 중심점에 할당하여 K개의 초기 군집을 형성한다. 다음으로, 각 군집의 평균값을 계산하여 새로운 중심점으로 업데이트한다. 이 과정을 중심점의 위치가 더 이상 변하지 않을 때까지 반복한다. 최종적으로 형성된 군집들이 통계적으로 유의미하게 다른 특성을 보이는지(예: ANOVA 분석)를 검증하고, 각 군집의 변수별 평균값을 비교하여 ‘어떤 고객들이 모여있는 그룹인가’를 해석하는 프로파일링(Profiling) 작업을 수행했다.


핵심 결과

군집분석을 통해 전체 고객을 ‘충성 우량 고객’, ‘이탈 가능 고객’, ‘신규 고객’ 등과 같이 명확한 특성을 가진 여러 개의 세그먼트로 성공적으로 분류했다.

이 연구는 데이터마이닝 기법을 통해 막연했던 전체 고객 집단을 구체적이고 실행 가능한(Actionable) 세그먼트로 나누는 것이 가능함을 실증적으로 보여주었다. 예를 들어, 다음과 같은 특성을 가진 세그먼트들을 발견할 수 있었다.

  • 충성 우량 고객: 구매 빈도(F)와 총 구매액(M)이 모두 높고, 최근 구매일(R)도 가까운 그룹. 기업의 핵심 수익원이다.
  • 이탈 가능 우량 고객: 과거 구매액(M)은 높았으나, 최근 구매일(R)이 멀어지고 있는 그룹. 적극적인 관리가 필요한 집단이다.
  • 성장 가능 신규 고객: 최근 구매일(R)은 가깝지만, 아직 구매 빈도(F)나 구매액(M)은 낮은 그룹. 잠재력이 높은 집단이다. 이러한 분류는 각 그룹의 특성에 맞는 차별화된 마케팅 전략을 수립할 수 있는 객관적인 근거를 제공했다.

시사점

고객 세분화는 일회성 분석이 아니라, 비즈니스 전략과 긴밀하게 연결되어 지속적으로 실행되어야 하는 CRM의 핵심 프로세스이다.

이 연구는 고객 세분화가 단순히 데이터를 분석하여 보고서를 만드는 기술적인 활동에 그쳐서는 안 된다는 점을 강조한다. 성공적인 세분화는 CRM 전략의 출발점이다. 각 세그먼트의 특성과 니즈에 맞춰 각기 다른 상품을 제안하고, 다른 채널로 소통하며, 다른 메시지를 전달해야 한다. 또한, 고객의 행동은 계속해서 변하므로, 세분화는 한 번으로 끝나는 것이 아니라 주기적으로 수행되어 고객의 이동(예: 신규 고객에서 충성 고객으로, 또는 충성 고객에서 이탈 고객으로)을 추적하고 그에 맞춰 전략을 수정하는 동적인 프로세스가 되어야 한다는 실무적 시사점을 제공한다.


인사이트

고객을 ‘아는 것’에서 ‘분류하는 것’으로, 마케팅의 첫 단추를 채워라. 이 논문의 핵심 가치는 모든 정교한 마케팅의 시작은 ‘제대로 된 분류’에서 비롯된다는 기본 원칙을 명확히 보여준다는 데 있다. 기술적 분석 결과를 마케터가 즉시 사용할 수 있는 페르소나와 액션으로 바꾸면 다음과 같다.

  • 고객 페르소나 예시: ‘알뜰한 계획 구매족’
    • 30대 후반, 자녀가 있는 여성 고객. 구매 빈도는 월 1~2회로 높지 않지만, 한 번 방문 시 대량으로 구매하여 평균 구매액이 높다. 주로 주말 오전에 방문하며, 할인 쿠폰이나 프로모션에 민감하게 반응하는 패턴을 보인다. 이 고객은 충동구매를 하지 않으며, ‘이번 주말 특별 할인 품목’이나 ‘자녀를 위한 간식 모음전’ 같은 정보에 높은 반응을 보인다.
  • 실질적인 마케팅 액션 아이디어
    1. 타겟 프로모션 발송: ‘알뜰한 계획 구매족’ 세그먼트에게는 매주 목요일 저녁, 주말 할인 상품 정보를 담은 맞춤형 카카오톡 알림톡이나 문자 메시지를 발송한다.
    2. 연관 구매 유도(Cross-selling): 이들이 자주 구매하는 상품(예: 기저귀)과 함께 구매하면 좋은 상품(예: 물티슈, 분유)을 묶어 추가 할인 혜택을 제공하는 ‘장바구니 추천’ 기능을 앱에 구현한다.
    3. 세그먼트 기반 성과 측정: 전체 매출이 아닌, ‘알뜰한 계획 구매족’ 세그먼트의 월간 구매액과 방문 횟수가 어떻게 변하는지를 추적하여, 이들을 타겟으로 한 마케팅 캠페인의 실질적인 효과를 측정한다.