Abnormal Trading Detection in the NFT Market 리뷰

NFT 시장의 거래 데이터를 분석하여, 비지도 학습(Unsupervised Clustering)을 통해 가격을 왜곡하는 워시 트레이딩(자전 거래)과 같은 이상 거래를 효과적으로 자동 탐지하는 방법론을 제안한다.


논문 요약

  • 논문 제목: Abnormal Trading Detection in the NFT Market
  • 저자: Mingxiao Song, Yunsong Liu, Agam Shah, Sudheer Chava
  • 게재 학술지: arXiv
  • 발행 연도: 2023
  • 핵심 요약: NFT 거래 데이터를 그래프 네트워크로 구성하고, 거래 패턴과 가격 변동성 등 다양한 특징(Feature)을 추출했다. 여기에 K-Means와 같은 비지도 클러스터링을 적용하여, 정상 거래와는 뚜렷이 구분되는 이상 거래 그룹을 성공적으로 식별해냈다.

연구 배경

이 연구는 NFT 시장의 폭발적 성장 이면에 숨겨진 시장 교란 행위, 특히 워시 트레이딩의 심각성을 인지하고, 이를 기술적으로 해결하려는 시도에서 출발한다.

NFT(대체 불가능 토큰) 시장은 디지털 자산의 소유권을 증명하는 새로운 방식으로 각광받으며 급격히 성장했다. 하지만 이러한 성장과 함께 **워시 트레이딩(Wash Trading)**과 같은 비정상적인 거래 활동 역시 급증했다. 워시 트레이딩이란 판매자와 구매자가 공모하거나, 한 사람이 여러 지갑을 이용해 서로 거래를 주고받으며 거래량이나 가격을 인위적으로 부풀리는 행위를 말한다. 이는 특정 NFT가 매우 인기 있는 것처럼 보이게 만들어 다른 투자자들의 비합리적인 투자를 유도하는 심각한 시장 교란 행위이다.

이러한 행위를 수동으로 적발하는 것은 거의 불가능에 가깝다. 이 문제를 해결하기 위해, 본 연구는 머신러닝 기반의 이상 탐지(Anomaly Detection) 기술에 주목한다. 특히, 악의적인 사용자들이 자신의 거래에 ‘이것은 이상 거래’라고 표시하지 않기 때문에, 정답이 없는 데이터에서 패턴을 스스로 찾아내는 비지도 학습(Unsupervised Clustering) 방법론이 필수적이다. 이 연구는 바로 이 기술을 활용하여 NFT 시장의 건전성을 확보하는 것을 목표로 한다.


해결하려는 문제

NFT 시장의 투명성을 저해하고 가격을 왜곡하는 워시 트레이딩과 같은 이상 거래를 자동으로 식별한다.

NFT 시장의 가장 큰 문제 중 하나는 정보의 비대칭성과 시장 조작에 대한 취약성이다. 수많은 지갑 주소 사이에서 하루에도 수백만 건의 거래가 발생하는데, 이 중 어떤 것이 진정한 수요에 의한 거래이고 어떤 것이 가격 조작을 위한 허위 거래인지 구분하기란 매우 어렵다. 특히, 한 개인이 다수의 지갑을 생성하여 복잡한 패턴으로 자산을 이동시키면, 그 흔적을 쫓는 것은 더욱 힘들다. 본 연구가 해결하고자 하는 문제는 바로 이 지점에 있다. 대규모의 온체인 트랜잭션 데이터 속에서 숨겨진 이상 거래의 패턴을 자동으로, 그리고 확장 가능한 방식으로 탐지하는 시스템을 구축하는 것이다.


연구 모형

NFT 거래 데이터를 거래 그래프로 변환하고, 각 지갑(노드)의 특징을 추출하여 비지도 학습으로 이상 거래 그룹을 군집화한다.

본 연구는 이상 거래를 탐지하기 위해 체계적인 데이터 분석 모델을 설계했다.

  1. 거래 그래프 구축 (Graph Construction): 모든 NFT 거래 데이터를 ‘그래프’ 형태로 재구성한다. 이 그래프에서 각 **지갑 주소는 노드(Node)**가 되고, 두 지갑 간의 **NFT 거래는 엣지(Edge)**가 된다.
  2. 특징 공학 (Feature Engineering): 구축된 그래프와 거래 데이터로부터 각 지갑의 행동 패턴을 나타내는 정량적인 특징(Feature)들을 추출한다. 예를 들어, 특정 지갑이 얼마나 많은 다른 지갑과 거래했는지(Degree), 거래 빈도는 어떤지, 거래 가격의 변동성은 얼마나 큰지 등을 계산한다.
  3. 비지도 클러스터링 (Unsupervised Clustering): 추출된 특징들을 기반으로 K-Means 클러스터링 알고리즘을 적용한다. 이 알고리즘은 유사한 특징을 가진 지갑(또는 거래)들을 동일한 그룹(클러스터)으로 묶어준다.
  4. 이상 그룹 식별 (Anomaly Identification): 클러스터링 결과, 대부분의 정상적인 거래들은 하나 또는 몇 개의 거대한 클러스터를 형성하는 경향이 있다. 반면, 워시 트레이딩과 같은 이상 거래는 그 패턴이 독특하고 수가 적기 때문에, 아주 작고 고립된 클러스터를 형성할 가능성이 높다. 연구진은 이렇게 분리된 소규모 클러스터의 특성을 분석하여 최종적으로 이상 거래 그룹으로 판단한다.

데이터 설명

이더리움 블록체인에서 발생한 NFT 거래 데이터를 활용하며, 이는 공개된 온체인 데이터이다.

  • 출처: 이더리움(Ethereum) 블록체인. 데이터는 모두 공개적으로 검증 가능한 온체인(On-chain) 데이터이다. 논문에서 특정 데이터 소스를 명시하지는 않았지만, 일반적으로 OpenSea, LooksRare와 같은 주요 NFT 마켓플레이스의 API를 활용하거나, Dune Analytics, Google BigQuery의 공개 이더리움 데이터셋과 같은 인덱싱 서비스를 통해 데이터를 수집했을 것으로 추정된다.
  • 수집 방법: 특정 기간 동안의 NFT 컬렉션 컨트랙트 주소와 관련된 모든 Transfer 이벤트를 수집하여 거래 원장을 구성하는 방식이다.
  • 데이터 변수 설명: 이상 거래의 특징을 다각도로 포착하기 위해 다음과 같이 논리적인 그룹으로 변수를 구조화했다.
    • 그래프 기반 특징 (Graph-based Features): 지갑의 네트워크 내 위치와 관계를 설명한다.
      • In/Out-Degree: 특정 지갑으로 들어오거나 나간 거래의 수.
      • Clustering Coefficient: 특정 지갑의 거래 상대방들이 서로 얼마나 거래하는지 나타내는 지표. (워시 트레이딩 시 높게 나타남)
      • Centrality: 지갑이 전체 거래 네트워크에서 얼마나 중심적인 역할을 하는지.
    • 거래 패턴 특징 (Transactional Pattern Features): 지갑의 활동 양상을 설명한다.
      • Transaction Frequency: 단위 시간당 거래 빈도.
      • Transaction Volume: 총 거래 금액.
      • Time Interval between Transactions: 연속된 거래 사이의 시간 간격.
    • 가격 및 수익 특징 (Price & Profit Features): 거래의 재무적 결과를 설명한다.
      • Price Volatility: 해당 NFT 컬렉션의 가격 변동성.
      • Realized PnL: 거래를 통해 발생한 실제 손익. (워시 트레이딩 시 0에 가깝게 나타남)

데이터 분석

K-Means 클러스터링을 적용하여 거래 데이터를 여러 그룹으로 분할한 뒤, 각 클러스터의 특성을 분석하여 이상 거래로 의심되는 클러스터를 특정한다.

본 연구의 분석은 비지도 학습의 핵심 원리를 따른다. 먼저, 앞서 추출한 여러 특징(그래프, 거래 패턴, 가격 등)을 기반으로 각 거래(또는 지갑)를 다차원 공간상의 한 점으로 표현한다. 그 후, K-Means 알고리즘이 이 점들을 가장 가까운 ‘중심점(Centroid)’에 할당하며 K개의 그룹으로 나눈다.

분석의 핵심은 이렇게 형성된 클러스터들을 ‘해석’하는 단계에 있다. 대다수의 정상적인 거래는 평균적인 거래 패턴을 공유하므로, 크고 밀도가 높은 클러스터를 형성한다. 반면, 워시 트레이딩은 ▲매우 짧은 시간 안에 ▲자신 또는 소수의 지갑과 반복적으로 ▲수익이 거의 0에 가깝게 거래하는 등 극단적인 특징을 보인다. 따라서 이러한 거래들은 다른 정상 거래들과는 멀리 떨어진, 작고 독특한 클러스터를 형성하게 된다. 연구진은 각 클러스터의 평균 거래액, 평균 손익, 거래 상대방의 수 등 통계량을 비교하여 이러한 ‘이상 클러스터’를 최종적으로 식별해냈다.


핵심 결과

제안된 비지도 학습 모델은 실제 NFT 데이터에서 워시 트레이딩 패턴을 효과적으로 식별했으며, 특히 거래 그래프 특징이 이상 거래 탐지에 매우 유용한 것으로 나타났다.

분석 결과는 매우 성공적이었다. 제안된 모델은 실제 NFT 거래 데이터 속에서 워시 트레이딩의 전형적인 특징을 가진 클러스터들을 명확하게 분리해냈다. 예를 들어, 특정 클러스터에 속한 거래들은 거의 모든 거래가 단 두 개의 지갑 사이에서만 발생하거나, 3~4개의 지갑이 서로 돌아가며 거래하는 ‘순환 거래(Cyclic Trading)’ 패턴을 뚜렷하게 보였다.

특히 주목할 만한 점은, 단순히 거래액이나 빈도 같은 개별 지표만으로는 찾아내기 어려운 이상 패턴을 **그래프 기반 특징(Graph-based Features)**이 효과적으로 포착했다는 것이다. ‘나의 거래 상대방들이 서로 얼마나 아는 사이인가’를 나타내는 클러스터링 계수(Clustering Coefficient)와 같은 지표는, 고립된 소규모 집단 내에서만 거래가 일어나는 워시 트레이딩을 탐지하는 데 결정적인 역할을 했다. 이는 이상 거래 탐지에 있어 개별 거래 내역뿐만 아니라 거래 간의 ‘관계’를 분석하는 것이 매우 중요함을 시사한다.


시사점

AI 기반의 자동화된 이상 탐지 시스템은 NFT 시장의 건전성을 확보하고 투자자 신뢰를 높이는 데 필수적인 기술이다.

본 연구의 결과는 NFT 생태계의 모든 참여자에게 중요한 실무적 시사점을 제공한다.

  • NFT 마켓플레이스: OpenSea와 같은 플랫폼은 이러한 이상 탐지 시스템을 자체적으로 도입하여, 워시 트레이딩이 의심되는 컬렉션이나 사용자에게 경고 표시를 하거나 거래를 제한함으로써 플랫폼의 신뢰도를 높일 수 있다.
  • 투자자: 투자자들은 이러한 분석 결과를 참고하여 특정 NFT 프로젝트의 거래량이 인위적으로 부풀려진 것은 아닌지 판단하고, 더 현명한 투자 결정을 내릴 수 있다.
  • 규제 기관: 시장 모니터링 및 규제를 담당하는 기관은 이러한 기술을 활용하여 대규모 시장 교란 행위를 조기에 감지하고 대응할 수 있다.

결론적으로, AI 기반의 자동화된 이상 탐지 기술은 투명하고 공정한 시장 환경을 조성함으로써, 새로운 디지털 자산 시장이 장기적으로 성장하기 위한 핵심적인 인프라 기술이 될 것이다.


인사이트

모든 거래는 흔적을 남기고, 데이터는 그 속에서 거짓말을 찾아낸다.

이 논문은 범죄 수사관처럼 데이터 속에 숨겨진 비정상적인 ‘흔적’을 찾아내는 기술을 다룬다. AI 빅데이터 마케터의 관점에서 이 방법론을 응용하면, 악성 유저를 걸러내고 진성 고객에게 집중하는 효율적인 CRM 전략을 수립할 수 있다.

  • 고객 페르소나 예시 (CRM 관점): “에어드랍 전문 헌터, 최씨”
    • 행동 특성: 이 논리가 찾아낸 ‘워시 트레이더’와 유사하게, ‘최씨’는 수십, 수백 개의 지갑을 이용해 특정 dApp의 에어드랍 기준을 충족시키기 위한 최소한의 활동만을 수행한다. 이들의 거래 그래프는 여러 개의 지갑이 단 하나의 중앙 지갑 또는 dApp과 상호작용하는 별(Star) 모양의 패턴을 보인다. 평균 거래액은 극히 낮고, 특정 캠페인 기간에만 활동량이 급증했다가 사라진다.
    • 탐지 이유: 이들의 행동은 ‘진정한 서비스 사용’이라는 정상적인 패턴과 거리가 멀기 때문에, 비지도 클러스터링을 통해 ‘비정상 사용자’ 그룹으로 쉽게 분리될 수 있다.
  • 실질적인 마케팅 액션 제안
    1. 시빌(Sybil) 공격 방지 및 마케팅 효율화: 신규 사용자를 대상으로 하는 리워드 캠페인이나 에어드랍 진행 시, ‘최씨’ 페르소나에 해당하는 클러스터에 속한 지갑들을 보상 대상에서 제외한다. 이를 통해 마케팅 예산이 실제 잠재 고객에게만 집중되도록 하여 비용 낭비를 막는다.
    2. 커뮤니티 거버넌스 보호: 이들이 다수의 지갑을 이용해 특정 안건에 대한 투표권을 행사하려 할 때, 해당 클러스터의 비정상적인 투표 활동을 감지하고 그 영향력을 제한하거나, 커뮤니티에 해당 사실을 공표하여 건전한 의사결정을 보호한다.
    3. 진성 고객 식별: 반대로, 이 비정상 클러스터를 제외한 나머지 ‘정상 클러스터’ 내에서 활동이 활발한 사용자들을 ‘진성 고객’으로 정의하고, 이들에게만 특별한 혜택이나 VIP 서비스를 제공하는 CRM 전략을 펼칠 수 있다.