카드산업에서 휴면 고객 예측 리뷰

신용카드 고객의 월별 사용 금액 및 이용 업종 등 거래 이력을 시계열 데이터로 보고, 순환신경망(LSTM) 모델을 통해 미래에 거래가 중단될 ‘휴면 고객’을 예측하는 방법론을 제시한다.


논문 요약

  • 논문 제목: 카드산업에서 휴면 고객 예측
  • 저자: 이재은 외
  • 게재 학술지: 서비스사이언스학회지
  • 발행 연도: 2019
  • 핵심 요약: 국내 카드사의 실제 고객 거래 데이터를 활용하여, 일정 기간 거래가 없는 ‘휴면’ 상태로 전환될 고객을 예측하는 모델을 개발했다. 특히, 고객의 월별 카드 사용액, 사용 업종 등의 시계열 데이터를 순환신경망(RNN)의 일종인 LSTM(Long Short-Term Memory) 모델에 학습시켜, 고객의 동적인 소비 패턴 변화를 포착하고 미래의 휴면 가능성을 예측하는 방법론의 유효성을 검증했다.

연구 배경

고객의 이탈은 어느 날 갑자기 일어나지 않는다. 카드 명세서에 찍히는 숫자의 미묘한 변화 속에 그 신호가 숨어있다. 이 연구는 딥러닝이라는 첨단 청진기를 사용해 고객의 소비 심박수 변화를 감지하고, 관계가 끊어지기 전에 이상 징후를 발견하고자 한다.

신용카드 산업은 매우 경쟁이 치열한 시장이다. 새로운 고객을 유치하는 것도 중요하지만, 기존 고객이 카드를 계속 사용하게 만드는, 즉 **고객 유지(Customer Retention)**가 수익성의 핵심이다. 이 과정에서 기업이 가장 경계해야 할 것은 바로 **’휴면 고객(Dormant Customer)’**의 발생이다. 휴면 고객은 카드를 해지하지는 않았지만, 더 이상 사용하지 않아 사실상 이탈한 것과 마찬가지인 고객을 의미한다.

문제는, 어떤 고객이 언제 휴면 상태로 전환될지 예측하기가 매우 어렵다는 점이다. 기존의 분석은 주로 특정 시점의 고객 정보(총 사용액, 가입 기간 등)를 보는 정적인(Static) 분석에 머물러 있었다. 하지만 고객의 소비 행동은 시간에 따라 변화하는 동적인(Dynamic) 과정이다. 예를 들어, 지난달까지 매월 100만 원씩 쓰던 고객의 이번 달 카드 사용액이 10만 원으로 급감했다면, 이는 매우 강력한 위험 신호일 수 있다.

이러한 **시간의 흐름에 따른 패턴(시계열)**을 분석하기 위해, 본 연구는 딥러닝 기술, 그중에서도 순차적인 데이터 처리에 특화된 **순환신경망(Recurrent Neural Network, RNN)**과 그 발전된 형태인 LSTM(Long Short-Term Memory) 모델을 도입한다. LSTM은 과거의 중요한 소비 패턴을 ‘기억’하고, 이를 바탕으로 미래의 행동(휴면 전환 여부)을 예측하는 데 매우 효과적인 도구이다.


해결하려는 문제

고객이 카드 해지라는 명시적인 행동을 하기 전에, 거래 데이터의 미묘한 패턴 변화를 감지하여 거래가 중단될 ‘휴면 전환’ 가능성을 선제적으로 예측하고, 이를 방지하기 위한 마케팅 대상을 정밀하게 선별한다.

카드사의 CRM 담당자는 다음과 같은 문제에 직면한다. 수백만 명의 고객 중, 다음 분기에 휴면으로 전환될 가능성이 가장 높은 고객은 누구인가? 이 질문에 정확하게 답할 수 있다면, 한정된 마케팅 예산(예: 캐시백, 포인트 제공, 할인 쿠폰)을 가장 필요한 고객에게 집중하여 이탈을 효과적으로 방지하고 ROI를 극대화할 수 있다.

기존의 방식으로는 ‘지난 6개월간 사용 실적이 없는 고객’처럼 이미 휴면 상태가 된 후에야 사후적으로 파악할 수 있었다. 하지만 이때는 이미 고객의 마음이 떠난 뒤라, 어떤 마케팅 활동도 효과를 보기 어렵다.

이 연구가 해결하고자 하는 핵심 문제는, 이러한 사후적 대응을 선제적 예방으로 전환하는 것이다. 고객의 월별 카드 사용 내역이라는 시계열 데이터를 분석하여, 소비 패턴에 나타나는 미묘한 ‘이상 징후’를 조기에 감지하고, 이를 통해 “이 고객은 지금은 활성 상태이지만, 3개월 뒤 휴면 고객이 될 확률이 80%입니다” 와 같이 미래의 위험을 예측하는 지능형 시스템을 구축하는 것을 목표로 한다.


연구 모형

고객의 월별 카드 이용 내역(총 사용액, 업종별 사용액 등)을 다변량 시계열 데이터로 구성하고, 이를 LSTM 모델에 학습시켜 향후 특정 기간 내 휴면 상태로 전환될 확률을 예측하는 시계열 분류 모델을 구축한다.

본 연구는 고객의 휴면 전환을 예측하기 위해, 다음과 같은 딥러닝 기반의 시계열 이진 분류(Time-series Binary Classification) 모델링 절차를 따랐다.

  1. 시계열 데이터 구성:
    • 각 고객별로 과거 특정 기간(예: 12개월) 동안의 월별 카드 이용 데이터를 시간순으로 정렬하여 시퀀스를 생성한다.
    • 각 월별 데이터는 총 사용 금액, 요식업종 사용 금액, 쇼핑업종 사용 금액, 교통업종 사용 금액 등 여러 변수로 구성된 다변량(Multivariate) 데이터이다.
  2. 데이터 전처리 및 시퀀스 생성:
    • 생성된 다변량 시계열 데이터를 LSTM 모델이 학습할 수 있는 형태의 숫자 벡터 시퀀스로 변환한다.
    • “과거 12개월간의 월별 소비 패턴 시퀀스(X)”를 입력으로 사용하여, “향후 3개월 내에 휴면으로 전환될지 여부(Y)”를 예측하도록 데이터셋을 구성한다.
  3. LSTM 모델 학습:
    • 설계된 LSTM 모델에 준비된 시퀀스 데이터를 입력하여 학습시킨다. 모델은 각 고객의 과거 소비 패턴의 흐름으로부터, 미래에 휴면으로 전환될 가능성을 나타내는 고유의 패턴을 학습한다.
  4. 모델 성능 평가:
    • 학습된 모델을 테스트 데이터에 적용하여, 실제 휴면 고객을 얼마나 정확하게 예측하는지 정확도(Accuracy), 정밀도(Precision), 재현율(Recall) 등의 지표로 평가한다.

데이터 설명

국내 특정 카드사의 실제 고객 거래 데이터를 활용했으며, 고객별 월간 사용액, 이용 업종 등 시간의 흐름에 따른 소비 패턴을 포함하는 오프체인(Off-chain) 데이터이다.

  • 출처: 논문에 구체적인 카드사명은 명시되지 않았으나, 국내 특정 신용카드사의 실제 거래 데이터베이스에서 추출된 데이터를 활용한 것으로 보인다. 이는 전형적인 오프체인(Off-chain) 데이터이다.
  • 수집 방법: 기업 내부의 데이터웨어하우스(DW)에서 고객 ID를 기준으로 특정 기간 동안의 월별 카드 승인 내역을 집계하여 시계열 데이터셋을 구축했을 것이다.
  • 데이터 변수 설명: 본 연구의 데이터는 각 고객의 소비 이력을 시간의 흐름에 따라 나타내는 다변량 시계열 데이터이다.
    • 고객 프로필 정보: CustomerID, 성별, 연령 등.
    • 월별 거래 시계열 데이터 (핵심 입력 변수): 각 고객에 대해, 시간순으로 정렬된 월별 소비 기록의 시퀀스.
      • 월별 총 이용 금액 및 건수
      • 월별 할부 이용 금액 및 건수
      • 업종별 이용 금액/건수: 요식, 유통(쇼핑), 교통, 의료, 레저 등 세분화된 업종별 소비 패턴. (고객의 라이프스타일 변화를 감지하는 데 중요한 변수)
    • 타겟(종속) 변수:
      • 휴면_전환_여부: 특정 미래 기간(예: 3개월 또는 6개월) 동안 카드 거래가 전혀 없을 경우 ‘1’(휴면 전환), 한 번이라도 있을 경우 ‘0’(활성 유지)으로 정의된 이진 값.

데이터 분석

고객의 과거 12개월간의 월별 거래 데이터를 시퀀스로 만들어 LSTM 모델에 학습시킨 결과, 모델은 고객의 소비 규모 감소나 특정 업종에서의 사용 중단과 같은 패턴을 학습하여 미래의 휴면 가능성을 성공적으로 예측했다.

본 연구의 데이터 분석은 고객의 소비 이력이라는 시계열 데이터 속에 미래의 휴면 가능성을 예측할 수 있는 유의미한 패턴이 있는지를 LSTM 딥러닝 모델을 통해 검증하는 과정이다.

연구진은 각 고객의 과거 12개월치 월별 소비 데이터를 하나의 시퀀스로 구성하여 LSTM 모델의 입력으로 사용했다. 이 과정에서 LSTM 모델은 다음과 같은 복잡하고 동적인 패턴을 학습했다.

  • 추세 패턴: 최근 몇 달간 카드 사용액이 지속적으로 감소하는 추세를 보이는 고객은 휴면 가능성이 높다.
  • 계절성/주기성 패턴: 특정 고객이 매년 연말에는 소비가 많았으나, 올해 연말에는 소비가 급감하는 등 기존의 주기성에서 벗어나는 패턴은 위험 신호이다.
  • 업종 패턴 변화: 과거에는 쇼핑, 레저 등 다양한 업종에서 카드를 사용하던 고객이, 최근에는 교통비와 같은 필수적인 업종에서만 카드를 사용하는 경우, 해당 카드가 ‘주력 카드’에서 ‘보조 카드’로 밀려났음을 시사하며, 이는 휴면의 강력한 전조가 될 수 있다.

이렇게 학습된 LSTM 모델은, 정적인 정보만 사용하는 기존의 통계 모델에 비해 더 높은 정확도로 미래의 휴면 고객을 예측하는 성능을 보였다.


핵심 결과

딥러닝 기반의 LSTM 모델은 고객의 동적인 소비 패턴 변화를 효과적으로 포착하여, 정적인 변수만 사용하는 전통적인 모델에 비해 더 높은 정확도로 미래의 휴면 고객을 예측할 수 있음을 입증했다.

이 연구의 핵심 결과는, 신용카드 고객의 휴면(이탈)이 고객의 과거 소비 ‘시퀀스’에 의해 예측 가능하다는 것을 실제 데이터를 통해 증명했다는 점이다. 고객의 행동은 고정되어 있지 않으며, 시간의 흐름에 따른 변화의 ‘궤적’ 속에 미래에 대한 단서가 담겨 있다.

LSTM 모델은 이러한 궤적을 효과적으로 학습하는 능력 덕분에, 단순히 지난달 사용액만을 보는 것이 아니라 지난 1년간의 소비 흐름 전체를 종합적으로 판단하여 미래를 예측할 수 있었다. 예를 들어, 지난달 사용액이 동일한 두 고객이 있더라도, 한 명은 꾸준히 비슷한 금액을 써왔고 다른 한 명은 지속적으로 사용액이 감소해왔다면, LSTM 모델은 후자의 고객을 훨씬 더 높은 휴면 위험군으로 정확하게 예측해낼 수 있다.

이 결과는 고객의 동적인 행동 데이터를 분석하는 데 있어, LSTM과 같은 시계열 딥러닝 모델이 매우 강력하고 효과적인 도구임을 명확히 보여준다.


시사점

고객의 거래 데이터는 단순한 과거 기록이 아니라, 미래 행동의 단서를 담고 있는 ‘시계열 신호’이며, LSTM과 같은 딥러닝 모델은 이 신호를 해석하여 선제적인 고객 관계 관리를 가능하게 하는 핵심 기술이다.

이 연구는 카드사를 비롯한 금융 및 유통 기업의 CRM 전략에 다음과 같은 중요한 시사점을 제공한다.

첫째, 고객 데이터 분석의 관점을 ‘시점’에서 ‘기간’으로 전환해야 한다. 월말 실적이나 분기별 보고서처럼 특정 시점의 스냅샷 데이터만 보는 것에서 벗어나, 각 고객의 과거부터 현재까지 이어지는 데이터의 ‘흐름’을 분석해야 한다. 이 흐름 속에 고객의 만족도 변화, 충성도 하락, 이탈 의도 등 중요한 정보가 담겨 있다.

둘째, 선제적 마케팅(Proactive Marketing)의 정교화가 가능하다. LSTM 기반의 휴면 예측 모델을 통해 ‘다음 달 휴면 전환 확률 상위 10% 고객 리스트’를 매일 자동으로 생성할 수 있다. 마케팅팀은 이 리스트를 바탕으로, 고객이 완전히 마음을 돌리기 전에 가장 효과적인 타이밍에 맞춤형 리텐션 캠페인(예: 타겟 쿠폰, 캐시백 이벤트)을 실행하여 이탈률을 최소화할 수 있다.


인사이트

고객의 ‘오늘’이 아닌, 고객의 ‘어제와 오늘’을 함께 보아야 ‘내일’이 보인다.

이 논문은 데이터 속에 숨겨진 ‘시간의 힘’을 어떻게 활용할 것인가에 대한 명확한 해답을 준다. 고객의 현재 상태는 과거 행동들의 누적된 결과물이며, 미래 행동은 현재 상태의 연장선상에 있다. 딥러닝 시계열 모델은 바로 이 과거-현재-미래를 잇는 복잡한 패턴의 방정식을 데이터로부터 풀어내는 열쇠이다.

  • 페르소나 예시: “잠재적 이탈 위험이 있는 DeFi 고래, 월리(Whaley)”
    • 특징: 월리는 지난 6개월간 유니스왑에서 매월 평균 10만 USDC 이상을 거래해 온 VIP 사용자였다. 하지만 지난달 그의 거래량은 1만 USDC로 급감했고, 이번 달에는 아직 한 건의 거래도 없다. 그의 거래량 시계열 데이터는 뚜렷한 하향 추세를 보이고 있으며, 이는 그가 유니스왑을 떠나 다른 DEX로 이동했거나, 아예 DeFi 활동을 중단할 수 있다는 강력한 ‘휴면/이탈’ 신호이다.
    • 데이터 기반 행동: 과거 6개월간 높고 안정적인 월별 거래량을 보이다가, 최근 2개월간 거래량이 급격히 감소하는 시계열 패턴.
  • 실질적인 마케팅 액션 제안:
    1. 시계열 기반 이상 징후 탐지 시스템 구축: 이 논문의 LSTM 모델을 활용하여, 각 주요 사용자의 온체인 활동(거래량, 빈도, 사용하는 dApp 종류 등) 시계열을 실시간으로 모니터링한다. ‘월리’와 같이, 과거 평균 대비 활동량이 급격히 감소하는 ‘하향 추세’ 이상 패턴이 감지되면 자동으로 ‘휴면 위험’ 알림을 발생시키는 시스템을 구축한다.
    2. 개인화된 리액티베이션(Re-activation) 캠페인: ‘휴면 위험’ 알림이 발생한 지갑을 대상으로, “월리님, 유니스왑 V4의 새로운 기능(Hooks)을 VIP 고객님께 가장 먼저 체험할 기회를 드립니다!” 또는 “VIP 고객님을 위해 다음 5회 스왑 거래의 수수료를 50% 할인해 드립니다”와 같이, 그들의 과거 기여도(높은 거래량)를 인정하고 새로운 가치를 제안하는 맞춤형 리텐션 캠페인을 실행한다.
    3. 경쟁 프로토콜 분석 및 대응 전략 수립: ‘월리’의 지갑 활동을 추가로 분석하여, 그가 최근 어떤 새로운 경쟁 DEX에서 활동을 시작했는지 파악한다. 만약 경쟁 프로토콜이 더 낮은 수수료나 새로운 기능으로 그를 유인했다면, 이를 파악하여 자사 프로토콜의 약점을 보완하고 경쟁력 있는 대응 전략(예: 수수료 인하, 유사 기능 도입)을 수립한다.