MANA, ENJ 등 주요 NFT 관련 코인의 가격이 이더리움과 같은 주요 암호화폐와 어떤 관계를 맺고 움직이는지 분석하고, 머신러닝을 통해 단기 가격을 예측하는 모델을 개발한다.
논문 요약
- 논문 제목: NFT 코인과 암호화폐: 가격 역학과 예측
- 저자: 김선웅
- 게재 학술지: 한국산학기술학회논문지
- 발행 연도: 2023
- 핵심 요약: 대표적인 NFT 관련 코인(MANA, ENJ, AXS, SAND)의 가격이 비트코인, 이더리움 등 주요 암호화폐의 가격과 어떤 인과 관계를 갖는지 그랜저 인과성 검정을 통해 분석했다. 또한, 과거 가격 데이터를 특징으로 사용하여 다양한 머신러닝 회귀 모델로 1일 후의 가격을 예측하는 실험을 수행했으며, 그 결과 랜덤포레스트 모델이 가장 우수한 예측 성능을 보임을 확인했다.
연구 배경
NFT의 인기는 관련 프로젝트의 ‘코인’에 대한 관심으로 이어졌다. 하지만 이 새로운 자산의 가격은 무엇에 의해 움직이는가? 이 연구는 데이터 분석을 통해 NFT 코인 시장의 보이지 않는 역학 관계와 예측 가능성을 탐색한다.
2021년 NFT 시장이 폭발적으로 성장하면서, 단순히 NFT 작품 자체뿐만 아니라 관련 생태계를 구성하는 ‘NFT 코인’ 또한 중요한 투자 자산으로 부상했다. 여기서 NFT 코인이란, 다음과 같은 유형의 토큰을 의미한다.
- 메타버스 플랫폼 토큰: 디센트럴랜드(MANA), 더샌드박스(SAND)와 같이, 가상 공간의 토지(LAND) NFT를 거래하거나 생태계에 참여하는 데 사용되는 화폐.
- 블록체인 게임 토큰: 엑시 인피니티(AXS), 엔진코인(ENJ)과 같이, 게임 내 아이템 NFT를 구매하거나 거버넌스에 참여하는 데 사용되는 토큰.
이러한 새로운 유형의 자산이 등장하면서, 투자자들은 중요한 질문에 직면했다. “이 NFT 코인들의 가격은 과연 무엇에 의해 결정되는가?” 즉, 개별 프로젝트의 성공 여부에 따라 독립적으로 움직이는가, 아니면 비트코인이나 이더리움과 같은 전체 암호화폐 시장의 흐름에 연동되어 움직이는가? 이 질문에 대한 답은 NFT 코인의 투자 매력도와 리스크를 평가하는 데 매우 중요하다.
이러한 배경 하에, 본 연구는 두 가지 핵심적인 분석을 수행한다.
- 시계열 인과관계 분석: **그랜저 인과관계 검정(Granger Causality Test)**이라는 통계적 기법을 사용하여, 이더리움과 같은 주요 암호화폐의 과거 가격 움직임이 NFT 코인의 미래 가격 움직임을 예측하는 데 도움이 되는지를 분석한다.
- 머신러닝 가격 예측: 과거 가격 데이터를 특징(Feature)으로 사용하여, **랜덤포레스트(Random Forest)**와 같은 머신러닝 회귀 모델이 NFT 코인의 단기 가격을 얼마나 정확하게 예측할 수 있는지 실험한다.
해결하려는 문제
변동성이 큰 NFT 관련 코인 시장의 가격 움직임을 이해하기 위해, 해당 코인이 다른 주요 암호화폐와 독립적으로 움직이는지, 혹은 연동되어 움직이는지 분석하고, 나아가 머신러닝을 통해 가격 예측 가능성을 타진한다.
NFT 코인 시장은 매우 높은 변동성과 불확실성을 특징으로 한다. 투자자들은 이 새로운 자산에 투자할 때, 합리적인 의사결정을 내리기 위한 정보가 절대적으로 부족하다.
이 연구가 해결하고자 하는 문제는 바로 이 **’정보의 비대칭성과 불확실성’**이다. 구체적으로 다음과 같은 질문에 대한 데이터 기반의 답을 찾고자 한다.
- NFT 코인은 이더리움이나 비트코인과 같은 시장의 ‘대장주’들과 함께 움직이는가, 아니면 별개의 움직임을 보이는가? (포트폴리오 분산 효과 분석)
- 주요 암호화폐의 가격 변동은 NFT 코인 가격 변동의 ‘선행 지표’가 될 수 있는가?
- 과거 가격 데이터를 기반으로, 머신러닝 모델은 내일의 NFT 코인 가격을 어느 정도의 정확도로 예측할 수 있는가?
이러한 분석을 통해, 투자자들에게는 더 나은 투자 전략 수립의 근거를, 시장 분석가에게는 NFT 코인 시장의 동인을 이해하는 새로운 관점을 제공하는 것을 목표로 한다.
연구 모형
주요 NFT 코인과 암호화폐의 일별 가격 데이터에 대해 그랜저 인과관계 검정을 실시하여 상호 영향력을 분석하고, 과거 가격 데이터를 특징으로 하는 머신러닝 회귀 모델을 구축하여 1일 후의 가격을 예측한다.
본 연구는 NFT 코인의 가격 역학을 분석하기 위해, 다음과 같은 2단계의 연구 모형을 설계했다.
- 1단계: 관계 분석 (Relationship Analysis)
- 연구 대상 코인(MANA, ENJ, AXS, SAND)과 주요 암호화폐(BTC, ETH)의 일별 종가 데이터를 수집한다.
- 각 시계열 데이터가 안정적인지(Stationary) 단위근 검정(Unit Root Test)을 통해 확인하고, 불안정할 경우 차분(Differencing)을 통해 안정화시킨다.
- 안정화된 시계열 데이터 쌍(예: ETH 가격 변동률과 MANA 가격 변동률)에 대해 그랜저 인과관계 검정을 실시하여, 한쪽의 과거 데이터가 다른 쪽의 현재 데이터를 설명(예측)하는 데 통계적으로 유의미한 정보량을 가지는지 분석한다.
- 2단계: 가격 예측 모델링 (Price Prediction Modeling)
- 특정 NFT 코인의 1일 후 가격을 예측하기 위한 특징(Feature) 데이터셋을 구축한다. 특징은 해당 코인의 과거 가격 정보(예: 1일 전 종가, 5일 이동평균선 등)와,
1단계
분석 결과 유의미한 관계가 있는 것으로 나타난 다른 암호화폐(예: ETH)의 과거 가격 정보를 포함한다. - 이 데이터를 사용하여 랜덤포레스트, 선형 회귀 등 다양한 머신러닝 회귀 모델을 학습시킨다.
- 학습된 모델의 예측 성능을 RMSE(평균 제곱근 오차)와 같은 지표로 평가하여, 어떤 모델이 가장 정확한 예측을 하는지 비교한다.
- 특정 NFT 코인의 1일 후 가격을 예측하기 위한 특징(Feature) 데이터셋을 구축한다. 특징은 해당 코인의 과거 가격 정보(예: 1일 전 종가, 5일 이동평균선 등)와,
데이터 설명
CoinMarketCap에서 수집한 주요 NFT 관련 코인(MANA, ENJ 등)과 대표 암호화폐(BTC, ETH)의 일별 가격 시계열 데이터를 활용했으며, 이는 거래소 가격을 집계한 오프체인(Off-chain) 데이터이다.
- 출처: 본 연구는 암호화폐 시세 정보 사이트인 CoinMarketCap에서 데이터를 수집했다. 이는 실제 블록체인 원장 데이터가 아닌, 여러 거래소의 가격을 종합한 오프체인(Off-chain) 시장 데이터이다.
- 수집 방법: 연구진은 CoinMarketCap 웹사이트나 API를 통해, 특정 기간(2021년 1월 ~ 2022년 12월) 동안의 일별 시세 데이터를 수집했다.
- 데이터 변수 설명: 본 연구의 데이터는 각 암호화폐의 일별 가격 시계열로 구성된다.
- 분석 대상 시계열 데이터:
- NFT 관련 코인:
MANA (디센트럴랜드)
,ENJ (엔진코인)
,AXS (엑시 인피니티)
,SAND (더샌드박스)
의 일별 가격. - 주요 암호화폐:
BTC (비트코인)
,ETH (이더리움)
의 일별 가격.
- NFT 관련 코인:
- 예측 모델의 변수:
- 종속 변수 (Target): 특정 NFT 코인의 1일 후 종가(Close Price).
- 독립 변수 (Features): 예측 대상 코인의 과거 가격 정보 (
1일 전 종가
,1일 전 시가/고가/저가
,거래량
) 및 다른 주요 암호화폐의 과거 가격 정보 (1일 전 BTC 종가
,1일 전 ETH 종가
).
- 분석 대상 시계열 데이터:
데이터 분석
그랜저 인과관계 분석 결과, 이더리움(ETH) 가격 변동이 NFT 코인 가격에 유의미한 예측력을 가지는 것으로 나타났으며, 이를 반영한 랜덤포레스트 예측 모델이 다른 모델 대비 가장 낮은 예측 오차를 기록했다.
본 연구의 데이터 분석은 관계 분석과 예측 성능 비교의 두 가지 핵심적인 부분으로 이루어졌다.
관계 분석에서는 그랜저 인과관계 검정을 통해, 여러 시계열 데이터 간의 상호 영향력을 평가했다. 분석 결과, 대부분의 경우 이더리움(ETH) 가격의 과거 변동이 NFT 코인 4종(MANA, ENJ, AXS, SAND)의 현재 가격 변동을 예측하는 데 통계적으로 유의미한 정보를 제공하는 것으로 나타났다. 이는 NFT 생태계가 대부분 이더리움 플랫폼 위에서 구축되기 때문에, 기축 통화와 같은 역할을 하는 ETH의 가격 움직임이 생태계 내 다른 토큰들의 가격에 선행하여 영향을 미친다는 것을 시사한다. 반면, 비트코인(BTC)의 영향력은 상대적으로 제한적이었다.
예측 모델링 분석에서는 이렇게 확인된 관계를 바탕으로, NFT 코인의 과거 가격뿐만 아니라 ETH의 과거 가격까지 포함하여 특징을 구성하고, 이를 여러 머신러닝 모델에 학습시켰다. 각 모델의 예측 오차(RMSE)를 비교한 결과, 수많은 결정 트리를 앙상블한 랜덤포레스트(Random Forest) 회귀 모델이 가장 낮은 오차를 기록하며 최고의 예측 성능을 보였다.
핵심 결과
NFT 관련 코인의 가격은 독립적으로 움직이지 않고, 이더리움 등 주요 암호화폐 시장의 움직임에 유의미한 영향을 받으며, 이러한 관계를 변수로 활용한 랜덤포레스트 모델은 단기 가격 예측에 효과적임을 확인했다.
이 연구의 핵심 결과는 두 가지로 요약할 수 있다.
첫째, NFT 코인 시장은 독립된 섬이 아니다. NFT 코인의 가격은 개별 프로젝트의 성과뿐만 아니라, 이더리움으로 대표되는 거시적인 암호화폐 시장의 흐름과 매우 밀접하게 연관되어 있다. 따라서 NFT 코인에 투자하는 것은 이더리움 생태계 전체에 투자하는 것과 유사한 시스템적 리스크를 안고 있음을 데이터로 증명했다.
둘째, NFT 코인 가격은 어느 정도 예측 가능하다. 시장이 매우 변동성이 크고 비이성적으로 보일 때도 있지만, 과거 가격 데이터 속에는 미래를 예측할 수 있는 통계적 패턴이 존재한다. 특히, 랜덤포레스트와 같은 강력한 머신러닝 모델은 이러한 복잡한 패턴을 학습하여, 단기적인 가격 움직임을 통계적으로 유의미한 수준에서 예측할 수 있음을 보여주었다.
시사점
NFT 관련 자산에 투자할 때는 개별 프로젝트의 호재뿐만 아니라, 이더리움 등 거시적인 암호화폐 시장 전체의 동향을 반드시 함께 고려해야 하며, 머신러닝 기반의 예측 모델은 이러한 복잡한 시장에서 리스크를 관리하는 보조 도구로 활용될 수 있다.
이 연구는 NFT 및 Web3 자산 투자자들에게 다음과 같은 실질적인 시사점을 제공한다.
첫째, 포트폴리오 구성 시 상관관계를 고려해야 한다. NFT 코인들은 이더리움과 높은 동조화 경향을 보이므로, 이더리움과 NFT 코인들을 함께 보유하는 것은 효과적인 분산 투자가 아닐 수 있다. 진정한 리스크 분산을 위해서는, 암호화폐 시장 전체와 상관관계가 낮은 다른 종류의 자산(예: 실물 자산, 채권)을 포트폴리오에 편입하는 것을 고려해야 한다.
둘째, 데이터 기반의 정량적 투자가 가능하다. 감이나 소문에 의존하는 투자 방식을 넘어, 이 연구에서 제시한 것과 같은 머신러닝 모델을 보조적인 의사결정 도구로 활용할 수 있다. 예를 들어, 모델이 예측한 가격보다 현재 시장 가격이 비정상적으로 높다면 ‘과열’ 신호로 해석하고, 반대의 경우 ‘저평가’ 신호로 해석하여 투자 타이밍을 잡는 데 참고할 수 있다.
인사이트
모든 토큰은 홀로 존재하지 않고, 보이지 않는 거미줄로 연결되어 있다.
이 논문은 개별 상품이나 고객을 넘어, 그들이 속한 ‘생태계’ 전체의 역학 관계를 이해하는 것의 중요성을 보여준다. 특정 토큰의 가치는 그 자체만으로 결정되지 않는다. 그것이 어떤 블록체인 위에서 작동하는지, 어떤 다른 토큰들과 상호작용하는지, 그리고 전체 시장의 분위기는 어떤지에 따라 그 가치가 결정된다. 성공적인 마케팅은 바로 이 보이지 않는 ‘관계의 거미줄’을 데이터로 읽어내는 것에서 시작된다.
- 페르소나 예시: “DeFi 퀀트 트레이더, 알고리드믹 앨리스(Algorithmic Alice)”
- 특징: 앨리스는 감정에 기반한 투자를 배제하고, 오직 데이터와 알고리즘으로만 거래한다. 그녀는 이 논문의 방법론을 활용하여, 수백 개의 알트코인과 주요 자산(BTC, ETH, USDC) 간의 인과관계 및 상관관계 네트워크를 구축한다. 그녀의 모델이 ‘ETH 가격 변동이 특정 DeFi 토큰 A의 가격 변동을 3시간 선행한다’는 통계적 관계를 발견하면, 그녀는 이더리움 가격이 움직이는 순간, 토큰 A에 대한 롱/숏 포지션을 자동으로 실행하는 통계적 차익거래(Statistical Arbitrage) 봇을 운영하여 수익을 창출한다.
- 데이터 기반 행동: 데이터 제공 API(CoinMarketCap, Kaiko 등)를 통해 대량의 시세 데이터를 수집. Python, R 등을 활용하여 통계 분석 및 백테스팅을 수행. 자동화된 거래 봇을 운영.
- 실질적인 마케팅 액션 제안 (Web3 데이터 분석 플랫폼 관점):
- 시장 데이터 분석 API 제공: ‘앨리스’와 같은 퀀트 투자자들을 위해, 단순히 가격 데이터만 제공하는 것을 넘어, 이 논문에서 수행한 그랜저 인과관계 분석이나 상관관계 분석 결과를 실시간으로 계산하여 제공하는 고급 데이터 API 서비스를 개발하고 유료로 제공한다.
- 데이터 기반 투자 전략 콘텐츠 발행: “지난 한 주간, ETH 가격과 가장 높은 동조화(상관관계)를 보인 토큰 TOP 5” 또는 “시장이 하락할 때 오히려 가격이 상승하는 디커플링(De-coupling) 경향을 보인 토큰 분석”과 같이, 데이터 분석에 기반한 깊이 있는 투자 리포트를 정기적으로 발행하여, 전문 투자자 커뮤니티 내에서 플랫폼의 전문성과 인지도를 높인다.
- 포트폴리오 리스크 관리 툴: 사용자가 자신의 포트폴리오(보유 토큰 목록)를 입력하면, 각 토큰 간의 상관관계 행렬을 계산하여 보여주고, “현재 포트폴리오의 90%가 이더리움 가격 변동에 매우 민감합니다. 리스크 분산을 위해 이더리움과 상관관계가 낮은 XXX 토큰을 일부 편입하는 것을 고려해보세요”와 같이, 데이터 기반의 포트폴리오 리스크 관리 솔루션을 제공한다.