최근 포스트

[Data Engineering] TICK Stack이란

최대 1 분 소요

 안녕하세요 마개입니다. 데이터를 효과적으로 수집하고 저장하면서 시각화까지 제공해주는 솔루션들은 여러가지가 있습니다. 기존에는 ELK(Elasticsearch + Logstash + Kibana) Stack을 이용해보았는데 이번에는 TICK Stack을 살펴보겠습니다.

[Data Engineering] InfluxDB 소개

1 분 소요

 안녕하세요 마개입니다. 기존에는 관계형 데이터베이스인 RDB만을 많이 이용하였는데 요즘에는 그 외에 다양한 NoSQL 데이터베이스도 이용을 하면서 빅데이터 시대를 준비하고 있습니다. 이 중에 시계열 데이터를 다루는 데이터베이스, 그 중에서도 가장 많이 이용하는 InfluxDB에 ...

[Data Engineering] Druid - Superset 연동하기

1 분 소요

 안녕하세요 마개입니다. 앞에서 설치한 Druid와 Superset을 연동하는 방법에 대해 알아보겠습니다. 앞에서는 virtualenv를 이용해서 Superset을 시작했었는데 중지시키고 진행합니다.

[BI] Apache Superset 설치

1 분 소요

 안녕하세요 마개입니다. BI 툴 중 오픈소스인 Apache Superset에 대한 설치 작업을 진행해보겠습니다. 공식 홈페이지의 문서에 따라 설치를 진행하였습니다. 설치 OS 환경은 Ubuntu 20.04에서 진행했습니다.

[Data Engineering] Apache Druid 설치

최대 1 분 소요

 안녕하세요 마개입니다. Ubuntu 환경에서 Apache Druid를 설치해보겠습니다. 공식 홈페이지의 Quickstart를 참고하였습니다. Docker를 이용하는 방법과 Docker를 이용하지 않는 방법이 있는데 Docker를 이용하지 않고 진행해보았습니다. OS는 Ubuntu...

[Data Engineering] Apache Druid 설치 (Docker 버전)

최대 1 분 소요

 안녕하세요 마개입니다. 이번에는 Docker를 이용하여 설치해보겠습니다. OS는 마찬가지로 Ubuntu에서 진행하고 Docker가 설치되어 있다는 가정하에 진행합니다. 마찬가지로 공식 홈페이지를 보고 참고하였습니다. Docker 중에서 docker-compose를 이용하여 진행할...

[Data Engineering] Apache Druid는..

1 분 소요

 안녕하세요 마개입니다. 데이터 분석을 위해 여러 종류의 데이터베이스를 이용할 수 있는데 이번에는 OLAP 용도로 사용하는 Apache Druid에 대해 알아보겠습니다.

[BI] Apache Superset은..

최대 1 분 소요

 안녕하세요 마개입니다. BI 툴에는 여러 가지가 존재하는데 그 중 하나인 아파치 재단에서 제공하는 Apache Superset에 대해 알아봅니다.

[Python] Jupyter Notebook 서비스 생성

최대 1 분 소요

 안녕하세요 마개입니다. Jupyter Notebook을 설치 완료하고 백그라운드 실행을 완료하였다면 서비스를 등록하여 서버가 재가동되더라도 실행되도록 해봅니다.

[BigQuery] 구글 빅쿼리 (2) - 시작하기

최대 1 분 소요

 안녕하세요 마개입니다. 이전 글에서 BigQuery에 대해 알아보았고 이번에는 BigQuery를 이용해보도록 하겠습니다. GCP에 가입하는 부분은 생략하였습니다.