NFT 게임 ‘Planet IX’의 온체인 데이터를 K-평균 클러스터링으로 분석하여, 플레이어들을 ‘고래’, ‘일반 유저’ 등 뚜렷한 행동 패턴을 가진 그룹으로 성공적으로 분류한 구체적인 사례 연구이다.
논문 요약
- 논문 제목: Clustering and analysis of user behaviour in blockchain: A case study of Planet IX
- 저자: Dorottya Zelenyanszki, Zhe Hou, Kamanashis Biswas, Vallipuram Muthukkumarasamy
- 게재 학술지: arXiv
- 발행 연도: 2025
- 핵심 요약: 블록체인 상의 사용자 행동 데이터는 풍부한 정보를 담고 있지만, 익명성으로 인해 그 특성을 파악하기 어렵다. 본 연구는 폴리곤(Polygon) 네트워크 기반의 NFT 게임 ‘Planet IX’의 온체인 거래 데이터를 수집하고, 이를 바탕으로 행동 기반 변수들을 추출했다. K-평균(K-Means) 군집 분석을 적용하여 전체 플레이어를 ‘고래(Whales)’, ‘일반 플레이어(Regular Players)’, ‘초보자(Newbies)’ 등과 같이 의미 있는 세그먼트(Segment)로 분류하고 각 그룹의 행동적 특성을 명확히 규명했다.
연구 배경
Web3 애플리케이션에서 발생하는 방대한 온체인 데이터는, 전통적인 데이터 분석 기법인 ‘고객 세분화(Customer Segmentation)’를 적용하여 익명의 지갑 주소 너머의 사용자 페르소나를 발견할 수 있는 새로운 기회의 장을 열었다.
Web2 시대의 기업들은 사용자의 클릭 데이터, 구매 이력 등을 분석하여 고객을 그룹화하고 맞춤형 마케팅을 수행해왔다. Web3 시대가 도래하면서, 모든 사용자 활동이 투명한 분산원장(블록체인)에 기록되기 시작했다. 이는 기업이 사용자를 이해할 수 있는 데이터의 패러다임이 근본적으로 바뀌었음을 의미한다. 특히 **GameFi(게임파이)**와 같이 수많은 사용자가 활발하게 상호작용하는 분야에서는 방대한 양의 **온체인 행동 데이터(On-chain Behavioral Data)**가 생성된다.
이 논문의 핵심 키워드인 **사용자 행동 군집분석(User Behavior Clustering)**은 바로 이러한 데이터를 활용하여 유사한 행동 패턴을 보이는 사용자들을 자동으로 그룹화하는 과정을 말한다. 이는 수많은 익명의 지갑 주소들을 ‘고액 자산가’, ‘적극적 참여자’, ‘간헐적 방문자’ 등과 같이 의미 있는 페르소나로 재해석하는 과정이다. 이 연구는 특정 DApp(‘Planet IX’)의 실제 데이터를 바탕으로 이러한 군집 분석을 성공적으로 수행한 구체적인 사례를 보여줌으로써, Web3 데이터 분석의 실질적인 가능성을 탐구한다.
해결하려는 문제
수많은 익명의 지갑 주소로 이루어진 블록체인 게임 사용자 기반을, 어떻게 하면 데이터 기반의 방법론을 통해 의미 있는 그룹으로 분류하고, 각 그룹의 특성을 파악하여 게임 운영 및 마케팅에 활용할 수 있는가에 대한 실증적 해법을 제시한다.
블록체인 게임 ‘Planet IX’의 운영팀 입장에서, 사용자들은 그저 식별 불가능한 지갑 주소의 나열로 보일 뿐이다. 누가 핵심 플레이어인지, 누가 곧 이탈할 가능성이 높은지, 어떤 그룹이 게임 내 경제에 가장 큰 영향을 미치는지 파악하기 어렵다. 이 논문이 해결하려는 문제는 바로 이 ‘익명성 뒤의 사용자 이해’ 문제이다. 즉, “원시적인 온체인 거래 기록(raw on-chain transaction logs)을 어떻게 가공하고 분석해야만, 비즈니스적으로 가치 있는 고객 세그먼트(customer segments)를 도출할 수 있는가?”라는 구체적인 질문에 답하고자 한다. 이를 통해 데이터에 기반한 게임 운영, 맞춤형 이벤트 기획, 건전한 경제 생태계 설계 등 실질적인 의사결정을 돕는 것을 목표로 한다.
연구 모형
온체인 데이터 수집, 행동 변수 추출(피처 엔지니어링), K-평균 군집 분석 적용, 그리고 군집별 특성 분석이라는 명확한 4단계의 데이터 분석 파이프라인을 연구 모형으로 채택했다.
이 연구는 이론 제안이 아닌, 실제 데이터를 다루는 구체적인 분석 파이프라인을 연구 모형으로 제시하고 수행했다.
- 데이터 수집 (Data Collection): 폴리곤 블록체인에서 ‘Planet IX’ 게임과 관련된 스마트 컨트랙트의 모든 트랜잭션 데이터를 수집한다.
- 피처 엔지니어링 (Feature Engineering): 수집된 원시 데이터로부터 각 사용자의 행동을 나타낼 수 있는 정량적인 변수(피처)를 생성한다. 예를 들어, 총 거래 횟수, 사용한 총 가스비, 보유한 NFT의 수, 총 지출액 등을 각 사용자별로 계산한다.
- 군집 분석 모델링 (Clustering Modeling): 각 사용자를 표현하는 피처 벡터들을 입력으로 하여 K-평균(K-Means) 클러스터링 알고리즘을 적용한다. K-평균 알고리즘은 전체 사용자를 미리 정해진 K개의 그룹으로 나누되, 각 그룹 내 사용자들의 행동 패턴(피처)은 서로 유사하고 다른 그룹과는 상이하도록 최적의 경계를 찾아낸다.
- 결과 분석 및 해석 (Result Analysis & Interpretation): 모델링을 통해 도출된 각 사용자 그룹(클러스터)이 어떤 특징을 갖는지 분석한다. 각 클러스터에 속한 사용자들의 평균적인 변수 값을 비교하여 ‘고래’, ‘일반 유저’ 등과 같이 직관적으로 이해할 수 있는 이름과 페르소나를 부여한다.
데이터 설명
NFT 게임 ‘Planet IX’가 운영되는 폴리곤(Polygon) 블록체인에서, 게임 스마트 컨트랙트와 상호작용한 사용자들의 모든 온체인 거래 기록을 분석 데이터로 활용했다.
- 출처: NFT 게임 ‘Planet IX’의 폴리곤 메인넷 온체인 데이터.
- 수집 방법: 논문에 구체적인 수집 도구는 명시되지 않았으나, 일반적으로 Polygonscan API를 직접 호출하거나 The Graph와 같은 블록체인 인덱싱 프로토콜, 또는 Nansen, Dune Analytics 같은 데이터 분석 플랫폼을 통해 특정 스마트 컨트랙트와 관련된 모든 트랜잭션 이력을 수집하는 방법을 활용했을 것으로 추정된다. 사용된 데이터는 전부 온체인 데이터이다.
- 데이터 변수 설명: 이 연구는 사용자의 게임 내 행동과 재무적 활동을 포착하기 위해 다음과 같이 논리적으로 구조화된 변수들을 생성하여 분석에 사용했다.
- 활동성 지표 (Activity Metrics): 사용자의 게임 참여 빈도와 꾸준함을 나타내는 변수.
Transaction Count
: 총 트랜잭션 발생 횟수.Active Days
: 활동 일수.Contract Interaction Frequency
: 특정 게임 컨트랙트와의 상호작용 빈도.
- 재무적 지표 (Financial Metrics): 사용자의 자본 투입 규모와 경제적 영향력을 나타내는 변수.
Total Gas Fees Paid
: 지불한 총 가스비(네트워크 수수료).Total IXT Spent
: 게임 내 네이티브 토큰(IXT) 총 소비량.Total MATIC Spent
: 폴리곤 네이티브 토큰(MATIC) 총 소비량.
- 자산 보유 지표 (Asset Holding Metrics): 사용자의 게임 내 자산 축적 정도를 나타내는 변수.
Number of NFTs Owned
: 보유한 총 NFT(게임 내 토지인 PIX 등)의 수량.Value of NFT Portfolio
: 보유한 NFT 포트폴리오의 현재 가치 (추정치).Asset Diversity
: 보유한 NFT 종류의 다양성.
- 활동성 지표 (Activity Metrics): 사용자의 게임 참여 빈도와 꾸준함을 나타내는 변수.
데이터 분석
사용자별로 계량화된 행동 변수들을 기반으로 K-평균 알고리즘을 적용하여, 수학적으로 서로 다른 특성을 가진 사용자 집단을 객관적으로 분리하고 각 집단의 특성을 명확히 규명했다.
이 연구의 데이터 분석은 K-평균(K-Means) 군집 분석을 핵심으로 한다. 먼저, 앞서 생성한 여러 행동 변수(피처)들을 표준화(Standardization)하여 각 변수가 동일한 스케일을 갖도록 조정했다. 그 후, 분석의 핵심 단계인 K-평균 알고리즘을 적용했다. 이 알고리즘은 먼저 K개의 임의의 중심점을 설정한 뒤, 모든 사용자(데이터 포인트)를 가장 가까운 중심점에 할당하고, 다시 각 그룹의 새로운 중심점을 계산하는 과정을 더 이상 중심점이 변하지 않을 때까지 반복한다.
연구팀은 ‘엘보우 방법(Elbow Method)’과 같은 통계적 기법을 사용하여 최적의 군집 수(K)를 결정했다. 그 결과, 사용자들을 가장 잘 설명하는 K개의 그룹이 도출되었다. 분석의 마지막 단계는 **프로파일링(Profiling)**이다. 각 그룹에 속한 사용자들의 평균적인 변수 값을 비교 분석했다. 예를 들어, 한 그룹이 다른 그룹에 비해 ‘총 지출액’과 ‘보유 NFT 수’가 월등히 높다면, 이 그룹을 ‘고래(Whales)’로 명명하는 식이다. 이 과정을 통해 추상적인 데이터 클러스터에 구체적인 비즈니스 의미와 페르소나를 부여했다.
핵심 결과
온체인 거래 데이터에 K-평균 군집 분석을 적용하는 것만으로도, 블록체인 게임 플레이어들을 ‘고래’, ‘일반 플레이어’, ‘초보자’와 같이 뚜렷하게 구별되는, 의미 있는 그룹들로 성공적으로 분류할 수 있음을 실증적으로 증명했다.
이 연구의 가장 중요한 결과는 Web3 사용자 행동 분석의 실효성 입증에 있다. 이론이나 가능성에 머무르지 않고, 실제 DApp의 온체인 데이터를 활용하여 통계적으로 유의미하고 비즈니스적으로 유용한 고객 세그먼트를 성공적으로 도출해냈다. 특히, 소수의 ‘고래’ 그룹이 게임 내 경제 활동의 대부분을 차지하는 반면, 대다수의 ‘초보자’ 그룹은 활동성이 낮다는 사실 등을 정량적으로 보여주었다. 이는 Web3 애플리케이션 역시 Web2 서비스와 마찬가지로 소수의 핵심 유저가 생태계를 이끌어가는 보편적인 패턴을 따른다는 점을 확인시켜 준다. 결국, 이 연구는 온체인 데이터가 더 이상 추상적인 기록이 아니라, 고객을 이해하고 비즈니스 전략을 수립하는 데 직접적으로 활용될 수 있는 구체적인 자산임을 명확히 보여준 사례이다.
시사점
모든 Web3 프로젝트는 자사의 온체인 데이터를 분석하여 고객을 깊이 있게 이해하고, 데이터에 기반한 정교한 운영 및 마케팅 전략을 수립할 수 있으며, 이는 더 이상 선택이 아닌 필수적인 역량이다.
이 논문은 모든 Web3 DApp 및 게임 개발사에게 중요한 실무적 시사점을 제공한다. 첫째, 더 이상 감이나 커뮤니티 여론에만 의존하여 의사결정을 할 필요가 없다. 자사의 스마트 컨트랙트와 상호작용한 모든 거래 기록은 고객의 행동과 동기를 파악할 수 있는 가장 정확하고 편향 없는 데이터 소스이다. 둘째, 고객 세분화는 Web3 환경에서도 매우 효과적이다. 식별된 각 사용자 그룹(고래, 일반 유저 등)의 특성에 맞춰 차별화된 콘텐츠, 이벤트, 보상 시스템을 제공함으로써 사용자 만족도와 리텐션(retention)을 극대화할 수 있다. 이 연구는 사실상 모든 Web3 프로젝트가 ‘온체인 데이터 분석팀’ 또는 그에 준하는 역량을 내재화해야 할 필요성을 역설하고 있다.
인사이트
지갑은 단지 지갑이 아니다, 고객의 페르소나다: 온체인 데이터 클러스터링으로 숨겨진 고객 유형을 정의하라.
이 논문이 보여준 기술적 분석의 핵심 가치는, 익명의 지갑 주소에 불과했던 사용자들을 살아있는 고객 페르소나로 전환시켜 마케터가 즉시 활용할 수 있는 구체적인 인사이트를 제공한다는 점이다.
- 고객 페르소나 예시: “랜드 배런 웨일 (The Land Baron Whale)”
- 온체인 특성: K-평균 클러스터링 결과,
총 지출액
과보유 NFT 수
변수에서 다른 그룹 대비 압도적으로 높은 수치를 보이는 그룹에 속한다. 특히 게임 내 핵심 자산인 ‘토지(PIX)’ NFT를 대량으로, 그리고 다양한 종류로 보유하고 있으며, 새로운 NFT가 출시될 때마다 가장 먼저 대량 구매하는 패턴을 보인다. - 해석: 이 사용자는 단순히 돈만 많은 투자자가 아니라, 게임 세계의 ‘부동산 재벌’이자 핵심적인 ‘마켓 메이커’이다. 이들의 자산 매각이나 구매 결정은 게임 내 경제에 직접적인 영향을 미친다.
- 온체인 특성: K-평균 클러스터링 결과,
- 마케팅 액션 제안:
- VIP 전담 채널 운영: 이 페르소나 그룹만을 위한 비공개 디스코드 채널이나 텔레그램 그룹을 개설하여, 전담 직원이 직접 소통하며 특별한 대우를 제공하고 이탈을 방지한다.
- 신규 자산 우선 접근권(Whitelist) 제공: 새로운 토지나 아이템 NFT를 민팅(minting)할 때, 이들에게 가장 먼저, 그리고 가장 유리한 조건으로 구매할 수 있는 우선권을 부여하여 충성도를 높이고 지속적인 투자를 유도한다.
- 게임 경제 자문 위원회 초대: 이들을 ‘자문 위원회’로 초대하여, 향후 게임의 인플레이션 정책이나 새로운 경제 시스템 도입 시 의견을 구한다. 이는 이들에게 강력한 소속감을 부여하는 동시에, 게임 운영의 리스크를 줄이는 효과가 있다.
- 고객 페르소나 예시: “DeFi 네이티브 USDC 파워 유저”
- 이름: ‘CryptoLeo’ (지갑 주소 0xAbC…)
- 특징: 이 사용자는 수백 건의 USDC 트랜잭션 기록을 가지고 있으며, 평균 거래액이 매우 높다. 주로 Aave, Compound와 같은 대형 DeFi 프로토콜과 상호작용하며, 스테이킹 및 유동성 공급 활동이 빈번하다. 가스비 변동에 민감하며, 최적의 수익률을 찾아 여러 프로토콜을 이동하는 경향이 있다. 그는 단순한 송금자가 아니라, USDC를 핵심 자산으로 활용하는 적극적인 ‘수익 농부(Yield Farmer)’이다.
- 마케팅 액션 아이템:
- 프로토콜 맞춤형 리포트 제공: ‘CryptoLeo’와 같은 파워 유저 세그먼트에게는 그들이 주로 사용하는 DeFi 프로토콜(Aave 등)과 연계된 신규 상품이나 이자율 변동에 대한 심층 분석 리포트를 정기적으로 제공한다.
- 가스비 최적화 알림 서비스: 이 세그먼트가 가스비에 민감하다는 점에 착안하여, 네트워크 가스비가 낮은 시간대를 예측하여 알려주는 텔레그램 봇이나 이메일 알림 서비스를 제공하여 고객의 거래 비용 절감을 돕는다.
- VIP 전용 거버넌스 포럼: 이들의 전문성을 인정하고 존중하는 의미에서, 새로운 금융 상품 출시에 앞서 이들 VIP 세그먼트만을 대상으로 하는 비공개 포럼을 열어 피드백을 받고, 이를 실제 프로덕트에 반영한다.