Superset 소개 및 설치
Superset 개요
Airbnb에서 시작된 오픈소스 프로젝트
Superset은 Airbnb에서 시작된 오픈소스 데이터 시각화 및 대시보드 도구입니다. Apache Airflow의 개발자인 Maxim이 함께 만든 프로젝트이며, 현재 Airbnb의 전사 대시보드로 사용되고 있습니다.
- GitHub Repository
- Dropbox에서도 데이터 탐색 대시보드로 사용
- Maxim이 창업한 회사에서 상용 서비스 제공 (Preset에서 무료 계정 생성 가능)
Superset이란?
Superset은 강력한 데이터 시각화 및 대시보드 기능을 제공하는 오픈소스 솔루션입니다. 주요 특징은 다음과 같습니다.
- 다양한 형태의 데이터 시각화 및 직관적인 UI 제공
- 대시보드 공유 및 협업 기능 지원
- 엔터프라이즈 수준의 보안 및 권한 제어 제공
- SQLAlchemy 기반으로 다양한 데이터베이스 연동 지원
- Druid.io와 연동하여 실시간 데이터 시각화 가능
- API 및 플러그인 아키텍처를 통한 확장성
Superset의 기본구조
- Backend: Flask 기반
- Frontend: React.js 기반
- Metadata DB: 기본적으로 SQLite 사용 (MySQL, PostgreSQL 등으로 변경 가능)
- 캐싱: Redis 사용
- DB 연동: SQLAlchemy를 통해 다양한 관계형 데이터베이스와 연결
Superset의 주요 용어
- Database: 관계형 데이터베이스 (예: Redshift, MySQL, PostgreSQL 등)
- Dataset: 데이터베이스의 특정 테이블
- Dashboard: 여러 개의 차트(Chart)로 구성된 데이터 시각화 화면
- Chart: 개별적인 데이터 시각화 요소 (예: Bar Chart, Line Chart 등)
Preset.io 서비스 사용해서 Superset설치하기
- 무료 Starter 플랜이 있지만 회사 이메일이 필요함
- Superset 오픈소스를 기반으로 한 서비스지만 일부 변경된 버전 사용
- 오픈소스 버전과 큰 차이는 없음
(1). 회원가입 및 플랜 선택
- Preset.io 방문 후 Sign up for free 클릭
- 회사 이메일 입력 후 회원가입 진행
- Free Starter 플랜 선택 후 WORKSPACE 생성
(2). 데이터베이스 연결
- Superset에서 Databases → +DATABASE 클릭
- Amazon Redshift 검색 후 선택
- Redshift 연결 정보 입력
- Host: Redshift 클러스터 주소
- Port: 5439
- Database: DEV
- ID 및 Password 입력
Docker를 이용한 Superset 설치
- 개인 컴퓨터의 사양이 충분하고 Docker에 익숙하다면 추천
- Superset의 오픈소스 버전을 그대로 활용
Docker란 무엇인가?
2025.01.14 - [Docker & K8S] - Windows11에서 Docker설치 및 설정
Docker는 특정 프로그램과 해당 프로그램이 실행되는 데 필요한 환경을 하나의 패키지로 만들어 제공하는 오픈소스 플랫폼입니다.
주요 개념
- Docker Image: 실행 가능한 소프트웨어 패키지(필요한 환경 포함)
- Docker Container: Docker Image를 실행한 환경
- Docker Registry: Docker Image를 공유하는 저장소(Docker Hub 등)
Docker를 사용하면 OS나 버전에 상관없이 동일한 환경을 쉽게 구축할 수 있습니다.
(1) Docker Engine 설치
- Docker 공식 사이트에서 다운로드 후 설치
- Windows: AMD64 또는 ARM64 중 AMD64 선택
(2) Docker Engine 실행 및 리소스 확인
- Docker 실행 후 Settings → Resources에서 메모리 할당 확인
- Mac: 최소 6GB
- Windows: 최소 8GB
(3) Docker Desktop 오류 해결 (Windows)
Docker Desktop - Unexpected WSL error 발생 시
- 관리자 권한으로 PowerShell 실행 후 WSL 설치
- wsl --install
- Windows 기능 활성화 (제어판 → 프로그램 및 기능 → Windows 기능 켜기/끄기)
- Linux용 Windows 하위 시스템
- Windows 하이퍼바이저 플랫폼(Hyper-V)
- 가상 머신 플랫폼
- BIOS에서 가상화 활성화
- 컴퓨터 재부팅 후 F2 또는 DEL 키로 BIOS 진입
- Intel CPU: Intel VT-x 또는 VMX 활성화
- AMD CPU: AMD SVM 또는 SVM Mode 활성화
- 일부 시스템: BIOS - Advanced - CPU Features - SVM Mode Enabled
(4) Docker 기반 Superset 실행
# 터미널에서 실행
mkdir superset && cd superset
# Superset 저장소 클론
git clone https://github.com/apache/superset.git
cd superset
git checkout 2.1.0
# Superset 실행
docker-compose -f docker-compose-non-dev.yml pull
docker-compose -f docker-compose-non-dev.yml up
- 웹 브라우저에서 http://localhost:8088 접속
- 기본 로그인 정보: admin / admin
'데이터 시각화' 카테고리의 다른 글
Superset 실습 - MAU, Cohort (0) | 2025.03.06 |
---|---|
대시보드 시각화 툴 (0) | 2025.03.05 |
Seaborn & Wordcloud (0) | 2025.03.05 |