머신러닝 기법을 활용한 이동통신사업자의 5G 요금제 잠재고객 이탈요인에 관한 연구 리뷰

이동통신사의 4G 고객 데이터를 머신러닝으로 분석하여, 5G 요금제로 전환할 가능성이 높은 잠재 고객 그룹을 식별하고, ‘단말기 교체 주기’와 같은 핵심 전환 유도 요인을 밝혀낸다.


논문 요약

  • 논문 제목: 머신러닝 기법을 활용한 이동통신사업자의 5G 요금제 잠재고객 이탈요인에 관한 연구
  • 저자: 왕반
  • 게재 학술지: 한양대학교 대학원 (석사학위논문)
  • 발행 연도: 2023
  • 핵심 요약: 4G 요금제 고객 중 5G 요금제로 전환할 가능성이 높은 잠재고객 그룹을 식별하기 위해, 고객의 가입 정보, 요금 수준, 데이터 사용량, 단말기 정보 등을 변수로 사용하여 로지스틱 회귀, 의사결정나무 등 다양한 머신러닝 분류 모델을 구축하고 성능을 비교했다. 분석 결과, ‘단말기 교체 주기’와 ‘기존 데이터 사용량’ 등이 5G 전환의 주요 예측 변수임을 식별하고, 이를 바탕으로 효과적인 업셀링(Up-selling) 전략의 방향을 제시했다.

연구 배경

포화 상태에 이른 이동통신 시장에서 기업의 성장은 신규 가입자 유치만큼이나, 기존 고객을 더 높은 가치의 서비스로 전환시키는 능력에 달려있다. 이 연구는 ‘누가 우리의 다음 VIP 고객이 될 것인가’라는 질문에 데이터 기반의 해답을 찾고자 한다.

이동통신 시장은 대부분의 잠재 고객이 이미 서비스를 이용하고 있는 대표적인 성숙 시장이다. 이러한 환경에서 통신사들의 핵심적인 성장 전략 중 하나는 기존 4G(LTE) 고객들을 더 높은 요금과 새로운 가치를 제공하는 5G 서비스로 전환시키는 **업셀링(Up-selling)**이다.

하지만 모든 4G 고객에게 5G 전환을 유도하는 마케팅은 비효율적이다. 어떤 고객은 5G에 전혀 관심이 없을 수도 있고, 어떤 고객은 이미 전환을 마음먹었을 수도 있다. 따라서 한정된 마케팅 자원을 가장 효과적으로 사용하기 위해서는 5G로 전환할 가능성이 가장 높은 잠재 고객 그룹을 미리 식별하는 것이 매우 중요하다.

이러한 고객 행동 예측(Customer Behavior Prediction) 문제에 머신러닝 기술이 효과적으로 활용될 수 있다. 고객의 과거 행동 데이터(요금제, 데이터 사용량 등)와 프로필 데이터(가입 기간, 사용 단말기 등)를 분석하여, 미래에 특정 행동(5G로의 전환)을 할 확률을 예측하는 것이다. 본 연구에서는 이 문제를 지도학습(Supervised Learning) 기반의 이진 분류(Binary Classification) 문제로 정의한다. 즉, 고객을 ‘5G로 전환할 그룹’과 ‘전환하지 않을 그룹’으로 나누는 모델을 구축하고, 그 모델을 통해 어떤 요인이 전환에 중요한 영향을 미치는지 분석한다.


해결하려는 문제

모든 4G 고객에게 5G 전환 프로모션을 진행하는 비효율을 줄이고, 전환 가능성이 가장 높은 잠재 고객 그룹을 데이터 기반으로 선별하여 마케팅 자원을 집중한다.

이동통신사의 마케팅팀은 다음과 같은 구체적인 문제에 직면한다. “수백만 명의 4G 고객 중, 다음 달 5G로 전환할 가능성이 가장 높은 상위 10%는 누구인가?” 이 질문에 정확하게 답할 수 있다면, 마케팅 캠페인의 ROI(투자 대비 수익)를 극대화할 수 있다. 예를 들어, 5G 전환 가능성이 낮은 고객에게는 불필요한 마케팅 비용을 지출하지 않고, 전환 가능성이 높은 고객에게만 집중적으로 할인 혜택이나 단말기 보조금과 같은 프로모션을 제공할 수 있다.

이 연구가 해결하고자 하는 핵심 문제는 바로 이 **’타겟 고객 선별의 비효율성’**이다. 마케터의 직관이나 ‘모든 고객에게 동일하게’라는 식의 접근법을 넘어, 데이터 분석을 통해 5G 전환 가능성을 과학적으로 예측하고, 이를 바탕으로 한정된 마케팅 자원을 가장 효과적으로 배분하는 방법론을 찾는 것을 목표로 한다. 나아가, 어떤 요인들이 고객의 전환 결정에 큰 영향을 미치는지 파악하여, 더 설득력 있는 마케팅 메시지와 전략을 개발하고자 한다.


연구 모형

이동통신 고객의 가입 정보, 요금제, 데이터 사용량, 단말기 정보 등을 독립변수로, 5G 요금제 전환 여부를 종속변수로 하는 이진 분류 모델을 구축하고, 여러 머신러닝 알고리즘의 성능을 비교 평가한다.

본 연구는 5G 전환 잠재고객을 식별하기 위해 다음과 같은 표준적인 지도학습 분류 모델링 절차를 따랐다.

  1. 데이터 준비 및 정의:
    • 특정 기간 동안의 4G 고객 데이터를 수집한다.
    • 해당 기간 내에 5G 요금제로 전환한 고객은 ‘1’(전환 그룹), 전환하지 않은 고객은 ‘0’(미전환 그룹)으로 라벨링한다. 이것이 모델이 맞춰야 할 정답, 즉 종속 변수가 된다.
    • 고객의 전환 이전 시점의 모든 특성(가입 기간, 데이터 사용량, 단말기 정보 등)을 독립 변수로 정의한다.
  2. 머신러닝 모델 학습:
    • 준비된 데이터를 사용하여 여러 종류의 이진 분류 모델을 학습시킨다.
      • 로지스틱 회귀: 전통적인 통계 모델로, 각 변수의 영향력을 해석하는 데 용이하다.
      • 의사결정나무: ‘IF-THEN’ 규칙 형태로 결과를 보여주어 이해하기 쉽다.
      • 랜덤포레스트, XGBoost: 여러 개의 트리를 결합한 앙상블 모델로, 일반적으로 더 높은 예측 정확도를 보인다.
  3. 모델 성능 비교 및 최적 모델 선정:
    • 학습에 사용되지 않은 테스트 데이터를 사용하여 각 모델의 성능을 평가한다. 정확도(Accuracy), 정밀도(Precision), 재현율(Recall), F1-Score, AUC 등 다양한 지표를 통해 어떤 모델이 5G 전환 고객을 가장 잘 예측하는지 비교하고 최적 모델을 선정한다.
  4. 주요 이탈(전환) 요인 분석:
    • 선정된 최적 모델(예: 랜덤포레스트)의 **변수 중요도(Feature Importance)**를 분석하여, 어떤 변수가 5G 전환 예측에 가장 큰 영향을 미쳤는지 파악한다.

데이터 설명

국내 특정 이동통신사의 고객 데이터를 활용했으며, 고객의 기본 계약 정보, 4G 요금제 및 데이터 사용 패턴, 단말기 정보 등을 포함하는 오프체인(Off-chain) 데이터이다.

  • 출처: 논문에 구체적인 기업명은 명시되지 않았으나, 국내 주요 이동통신사(SKT, KT, LGU+ 등) 중 한 곳의 내부 CRM 및 빌링(Billing) 시스템에서 추출된 데이터를 활용한 것으로 보인다. 이는 오프체인(Off-chain) 데이터이다.
  • 수집 방법: 기업 내부의 데이터웨어하우스(DW)에서 특정 기간을 기준으로 데이터를 추출하여 분석용 데이터셋을 구축했을 것이다.
  • 데이터 변수 설명: 본 연구는 고객의 5G 전환 가능성을 예측하기 위해 다음과 같은 다양한 변수들을 활용했다.
    • 종속 변수 (Target Variable):
      • 5G_전환_여부: 특정 관찰 기간 내에 4G에서 5G 요금제로 변경했는지 여부 (1: 전환, 0: 미전환).
    • 독립 변수 (Input Features):
      • 고객 프로필 정보: 가입_기간, 성별, 연령대.
      • 기존(4G) 요금제 및 이용 패턴: 현재_4G_요금제_가격, 월평균_데이터_사용량, 월평균_음성통화량, 월평균_부가서비스_이용료.
      • 결합 관계 정보: 가족_결합_할인_여부, 인터넷/TV_결합_여부.
      • 단말기 정보: 단말기_사용_기간, 현재_단말기_스펙(5G 지원 여부). (5G 전환의 물리적 필요조건을 나타내는 매우 중요한 변수).
      • 고객 서비스 이력: 고객센터_상담_횟수, 멤버십_포인트_사용량.

데이터 분석

여러 머신러닝 분류 알고리즘을 비교 평가한 결과, 앙상블 모델인 랜덤포레스트가 가장 높은 예측 성능을 보였으며, 변수 중요도 분석을 통해 ‘단말기 사용 기간’이 5G 전환의 가장 강력한 예측 변수임을 발견했다.

본 연구의 데이터 분석은 여러 머신러닝 모델의 성능을 객관적으로 비교하고, 최적 모델을 통해 핵심적인 비즈니스 인사이트를 도출하는 과정으로 이루어졌다.

분석 결과, 로지스틱 회귀나 단일 의사결정나무와 같은 단순한 모델에 비해, 여러 개의 트리를 결합하여 복잡한 패턴을 학습하는 랜덤포레스트와 같은 앙상블 모델이 5G 전환 고객을 예측하는 데 있어 가장 높은 정확도와 F1 점수를 기록했다. 이는 고객의 전환 결정이 단일 요인이 아닌, 여러 요인들의 복합적인 상호작용에 의해 이루어짐을 시사한다.

최적 모델로 선정된 랜덤포레스트의 **변수 중요도(Feature Importance)**를 분석한 결과, **’단말기 사용 기간’**이 5G 전환 여부를 예측하는 데 가장 압도적으로 중요한 변수로 나타났다. 즉, 고객이 현재 사용 중인 4G 단말기가 오래될수록, 가까운 미래에 5G 단말기로 교체하면서 5G 요금제로 전환할 확률이 급격히 높아진다는 것이다. 그 뒤를 이어 ‘월평균 데이터 사용량’, ‘결합 할인 여부’ 등이 중요한 변수로 나타났다.


핵심 결과

머신러닝 모델은 고객의 5G 전환 가능성을 높은 정확도로 예측했으며, 특히 ‘단말기 교체 주기’, ‘기존 데이터 사용량’, ‘가족 결합 할인 여부’가 고객의 전환 결정을 이끄는 핵심 요인임이 밝혀졌다.

이 연구의 핵심 결과는 데이터 분석을 통해 5G 요금제로의 고객 전환을 유도하는 핵심 동력을 명확히 식별했다는 점이다. 분석 결과는 다음과 같은 구체적인 고객의 모습을 보여준다.

  1. 필요의 순간 (Trigger Event): 낡은 4G 폰을 새 폰으로 바꿀 시점이 된 고객 (높은 ‘단말기 사용 기간’).
  2. 내재적 니즈 (Needs): 기존 4G 환경에서 데이터를 많이 사용하여 더 빠르고 많은 데이터에 대한 갈증이 있는 고객 (높은 ‘데이터 사용량’).
  3. 전환 장벽 (Switching Barrier): 가족 결합, 인터넷 결합 등으로 이미 통신사에 깊이 묶여 있어, 타사로 이동하기보다는 기존 통신사 내에서 업그레이드할 가능성이 높은 고객 (높은 ‘결합 할인’).

머신러닝 모델은 바로 이러한 세 가지 특성을 동시에 가진 고객이 5G로 전환할 확률이 매우 높다는 것을 학습했다. 이는 통신사가 마케팅 자원을 누구에게, 그리고 ‘언제’ 집중해야 하는지에 대한 명확한 지침을 제공한다.


시사점

신규 서비스로의 고객 전환을 유도하기 위해서는, 고객의 서비스 이용 패턴뿐만 아니라 ‘단말기 교체’와 같은 외부적인 ‘트리거 이벤트(Trigger Event)’를 파악하고, 그 순간을 포착하여 마케팅 활동을 집중하는 것이 매우 효과적이다.

이 연구는 서비스 업그레이드나 교차 판매를 목표로 하는 기업들에게 다음과 같은 중요한 실무적 시사점을 제공한다.

첫째, 고객의 ‘결정적 순간(Moment of Truth)’을 데이터로 포착해야 한다. 이 연구에서 ‘단말기 교체 시점’이 바로 그 결정적 순간이다. 고객이 어떤 행동을 하게 되는 데에는 그 행동을 촉발하는 특정 계기, 즉 ‘트리거 이벤트’가 존재한다. 기업은 자사 데이터와 외부 데이터를 결합하여 이러한 트리거 이벤트를 정의하고, 이를 예측하거나 감지하는 시스템을 구축해야 한다.

둘째, 타이밍이 전부다. 아무리 좋은 제안이라도 타이밍이 맞지 않으면 효과가 없다. 5G 전환 의사가 전혀 없는 고객에게 계속해서 프로모션 메시지를 보내는 것은 스팸일 뿐이다. 이 연구는 머신러닝 예측 모델을 통해 마케팅 활동의 타이밍을 최적화하고, 고객의 피로도는 줄이면서 전환율은 높이는 ‘스마트한 마케팅’의 가능성을 보여준다.


인사이트

고객의 ‘필요’가 ‘행동’으로 바뀌는 순간을 포착하라.

이 논문의 핵심은 ‘잠재고객’을 ‘실제 고객’으로 전환시키는 ‘마법의 순간’을 데이터로 찾아내는 방법을 제시했다는 점이다. 모든 고객은 어떤 서비스나 상품에 대한 막연한 필요나 관심을 가지고 있다. 성공적인 마케팅은 이 잠재된 필요가 특정 계기(트리거)를 만나 실제 행동으로 폭발하는 바로 그 순간에, 가장 매력적인 제안을 건네는 것이다.

  • 페르소나 예시: “잠재적 디파이 투자자, 예금주 에밀리”
    • 특징: 에밀리는 코인베이스나 업비트 같은 중앙화 거래소(CEX)에서 USDC를 구매하여, 자신의 개인 메타마스크 지갑으로 옮겨두었다. 하지만 그녀는 아직 유니스왑이나 에이브 같은 DeFi 프로토콜과 상호작용한 적은 없다. 그녀는 Web3 생태계에 발을 들였지만, 아직 적극적인 행동에 나서지 않은 **’전환 직전의 잠재고객’**이다. 그녀의 지갑에 잠자고 있는 USDC는 아직 사용되지 않은 거대한 잠재력이다.
    • 데이터 기반 행동: CEX로부터 대량의 USDC 첫 출금. 이후 DeFi 트랜잭션 없이 보유만 하고 있는 상태.
  • 실질적인 마케팅 액션 제안:
    1. 전환 시그널(Trigger) 감지: ‘에밀리’와 같이, CEX에서 USDC를 대량으로 출금한 후 일정 기간 동안 아무런 DeFi 활동이 없는 지갑 그룹을 ‘DeFi 잠재 고객’으로 식별한다. 특히, 이들이 Etherscan에서 특정 DeFi 프로토콜의 컨트랙트를 조회하거나, Zapper/Debank 같은 포트폴리오 트래커에 지갑을 연결하는 행동은 5G 전환 직전의 ‘단말기 정보 탐색’과 같은 강력한 **’전환 시그널’**이다.
    2. 첫 DeFi 경험 유도 (Onboarding Campaign): 이 잠재 고객 그룹에게 “당신의 지갑에 잠자고 있는 USDC, 연 5% 이자로 깨워보세요!”와 같이, Aave나 Compound와 같은 시장에서 검증된 신뢰도 높은 프로토콜에 예치하는 첫 번째 DeFi 경험을 적극적으로 유도한다. **’첫 예치 시 가스비 지원’**과 같은 프로모션은 전환의 장벽을 크게 낮출 수 있다.
    3. 교육 콘텐츠를 통한 신뢰 형성: 이들은 아직 DeFi 생태계가 낯설고 두려울 수 있다. 이들에게 “USDC로 할 수 있는 5가지 디파이 활동”이나 “초보자를 위한 가장 안전한 이자 농사 가이드”와 같은 쉽고 유용한 교육 콘텐츠를 제공하여, 미지의 세계에 대한 두려움을 없애고 자신감을 심어주어 실제 행동으로 전환되도록 돕는다.