왜 온체인 데이터 분석에 Snowflake인가?
블록체인 기술의 핵심 가치 중 하나는 데이터의 투명성이다. 모든 거래 내역이 온체인(On-chain)에 기록되지만, 이 데이터를 실제 분석에 활용하는 것은 전혀 다른 차원의 문제로 다가올 수 있다.
로우 데이터(Raw Data) 분석의 한계와 정제된 데이터 플랫폼의 필요성
온체인 데이터는 그 자체로 ‘로우 데이터(Raw Data)’의 집합체다. 이 데이터는 암호화되어 있고, 비정형적이며, 방대한 볼륨을 가지고 있다. 개인이 직접 블록체인 노드를 운영하며 이 데이터를 추출, 변환, 적재(ETL)하고 인덱싱하는 것은 막대한 엔지니어링 비용과 시간을 소모하게 만든다.
이러한 문제를 해결하기 위해, 데이터를 분석하기 쉬운 형태로 가공하여 판매하거나 제공하는 전문 데이터 플랫폼이 있다. 해당 플랫폼들은 복잡한 원시 데이터를 구조화하고, 지갑 주소 등에 ‘라벨링(Labeling)’을 더해 사용자가 SQL 등을 통해 손쉽게 원하는 정보에 접근할 수 있도록 지원한다. 전 세계 데이터의 90% 이상이 비정형 상태로 사일로에 갇혀있다는 점을 감안할 때 , 이러한 데이터 큐레이션(Data Curation)은 분석의 첫걸이 될 수 있을것이다.
온체인 데이터 플랫폼 비교: Dune vs. Flipside (Filsedo)
온체인 분석 플랫폼에는 여러 플레이어가 있지만, 그중 Dune Analytics와 Flipside Crypto는 SQL 기반 분석의 양대 축으로 자리 잡았다.
| 항목 | Dune Analytics | Flipside Crypto |
|---|---|---|
| 핵심 강점 | 커뮤니티 기반 대시보드 | 데이터의 깊이 및 라벨링(Labeling) |
| 사용자 참여도 | 매우 활발 (대시보드 생성·공유 생태계) | 연구 중심 사용자층 위주 |
| 데이터 접근성 | SQL 쿼리 + 중간 테이블로 접근 용이 | 로우 레벨 데이터로 접근 난이도 높음 |
| 데이터 구조 | 가공된 데이터 (중간 테이블 제공) | 원시적이고 세밀한 블록체인 데이터 |
| 특징 기능 | 대시보드 공유, 커뮤니티 협업 | 주소 라벨링(CEX, DEX, NFT 등) |
| 적합 용도 | 트렌드 분석, 인사이트 시각화 | 심층 리서치, 학술 연구 |
| 사용 난이도 | 비교적 쉬움 | 상대적으로 높음 |
| 대표 활용 사례 | 온체인 트렌드 모니터링 | 블록체인 논문·리서치 데이터 분석 |
Flipside의 진화: Snowflake와의 통합
논문 분석용으로 Flipside를 활용하려 했는데, 최근 Flipside가 자체 웹 SQL 환경을 폐지하고 Snowflake 기반 데이터 제공 방식으로 전환한 것을 확인했다. 과거에는 Flipside 웹사이트에서 직접 SQL을 실행했지만, 이제는 Snowflake Marketplace를 통해 온체인 전체 데이터베이스를 데이터 셰어(Data Share) 형태로 제공한다. 즉, 사용자는 Flipside의 웹 환경이 아니라 자신의 Snowflake 계정 안에서 직접 데이터를 조회할 수 있다. 이는 Web3 데이터를 엔터프라이즈급으로 통합 분석하려는 흐름에 부합하는 전략적 전환으로 볼 수 있다.
Snowflake 활용 가이드 (도입 중심)
Flipside가 Snowflake를 핵심 인프라로 선택했다는 것은, 이제 온체인 데이터 분석가들에게도 Snowflake 활용 능력이 중요해졌다는 신호로 볼 수 있을것이다.
Snowflake란 무엇인가? (특징)
먼저 Snowflake를 알아본다면, 해당 플랫폼은 전통적인 데이터베이스나 데이터 웨어하우스와는 근본적으로 다른 아키텍처를 가진 ‘데이터 클라우드(Data Cloud)’ 플랫폼으로 아래와 같은 특징을 알 수 있다.
- 스토리지와 컴퓨팅의 완벽한 분리: Snowflake의 핵심 아키텍처는 데이터를 저장하는 ‘스토리지’와 쿼리를 실행하는 ‘컴퓨팅(가상 웨어하우스)’을 분리한 것으로 사용자는 데이터 로딩, 정교한 분석 등 각기 다른 워크로드에 대해 독립적인 컴퓨팅 자원을 할당하고, 사용한 만큼만 초 단위로 비용을 지불할 수 있다.
- 클라우드 종속성 없음(Cloud Agnostic): Snowflake는 AWS, Azure, GCP 등 주요 클라우드 위에서 동일한 사용자 경험을 제공한다.
- 데이터 공유(Secure Data Sharing): Snowflake의 가장 강력한 기능입니다. 데이터를 물리적으로 복제하거나 이동(ETL)할 필요 없이, 다른 Snowflake 계정에 실시간으로 데이터 접근 권한을 부여할 수 있다. Flipside가 데이터를 제공하는 방식이 바로 이것!
- 데이터 마켓플레이스: 이 ‘데이터 공유’ 기능을 기반으로, 수많은 서드파티 데이터 제공자가 자사의 데이터를 상품으로 올려놓은 곳이 바로 Snowflake Marketplace다. 온체인 데이터(Amberdata , Flipside )뿐만 아니라, 날씨, 금융, 마케팅, 지리 정보 등 다양한 오프체인 데이터를 이곳에서 찾아 즉시 결합할 수 있다.
30일 무료 체험 (Free Trial)
Snowflake는 엔터프라이즈 서비스이지만, 개인 연구자나 개발자가 기능을 테스트하기에 충분한 무료 체험판을 제공한다. 이점이 가장 마음에 드는 부분으로 해당 내용 덕분에 다양한 실험을 해볼 수 있었다.

- 간: 30일
- 금액: 400달러 상당 크레딧
- 사용처: 웨어하우스(컴퓨팅) 및 스토리지 비용
- 만료: 기간 종료 또는 크레딧 소진 시 → 유료 전환 필요
- 이 정도 크레딧이면 온체인 데이터 쿼리, Python 연동, 기본 분석 실험에는 충분하다.
Snowflake Marketplace에서 데이터 연결하기 (리전 문제 포함)

계정 생성 완료 후 데이터를 사용하기 위해서는 MARKET PLACE에서 데이터를 연결해야한다. 이동 경로는 Work with data – Marketplace으로 접근 가능하며 이 곳에서 키워드 검색을 통해 원하는 데이터를 연결할 수 있다. Flipside Crypto의 데이터분석을 위해 접근했으니 검색 후 원하는 데이터를 찾아서 Get버튼으로 활성화 시키면 된다. 하지만…

Snowflake 계정을 생성하고 데이터를 연결하는 과정은 간단하지만, 매우 중요한 ‘함정’이 하나 있다. 바로 ‘리전(Region)‘이다. Snowflake 계정은 생성 시 특정 클라우드(AWS, Azure, GCP)의 특정 리전(예: AWS의 US East (N. Virginia))을 선택해야 하며, 한번 생성된 계정의 리전은 변경할 수 없다.

데이터 마켓플레이스에서 데이터를 ‘공유’받을 때, 가장 효율적이고 문제없는 방법은 데이터 제공자(Provider)와 동일한 리전에 계정을 생성하는 것이다. 만약 다른 리전에 계정을 생성하면 데이터 접근이 불가능하거나 복잡한 추가 설정(데이터 복제)이 필요할 수 있다.

Manage – Admin – Accounts에서 접근해서 지역 및 정보를 변경한 계정을 새로 만들 수 있으나 이 방법으로는 400크리딧은 옮길 수 없다.. snowflake의 warehouse를 사용하기에 비용 발생이되니 계정을 다시 만들기로 결심한다! ㅜㅜ 꼭 사용전에 원하는 데이터의 지역 및 환경 스펙 확인해보자!
- (필수 추천) Flipside 데이터 셰어를 원활하게 이용하기 위한 계정 생성 조건은 다음과 같으며 해당 내용은 PC버전 기준 페이지 우측에서 확인할 수 있다.
- Flipside에서 제공하는 ETH 데이터셋
- Cloud Provider: AWS
- Region: US East (N. Virginia) (리전 ID:
us-east-1)
- Flipside에서 제공하는 ETH 데이터셋
힘을내어 다시 회원가입하여 데이터 접근에 성공하였다.


데이터 연결 완료되었다면 샘플쿼리 돌려서 접속 가능한지 확인해본다. 샘플쿼리 제공하고 있으니 해당 쿼리를 그대로 실행해도 문제 없다. 실행은 우측상단 버튼을 사용하거나 Ctrl+Enter 단축키로 실행해볼 수 있다.

결론
Flipside 데이터를 Snowflake로 접근해본 결과, 데이터 확보 과정이 매우 편리했고, 다양한 데이터 조합을 통해 더 강력한 분석 환경을 경험할 수 있었다. 다만 리전이 계정 단위로 고정되어 있다는 점은 아쉬웠지만, 30일간 400달러 무료 크레딧은 그 이상의 가치가 있었다.
다음 포스팅에서는 API를 통해 데이터를 직접 연결하고 가져오는 방법을 다룰 예정이다