1 분 소요

 안녕하세요 마개입니다.
이번에 소개해 드릴 책은 “SQL로 시작하는 데이터 분석”입니다. 해당 책에 대해 알아보도록 하겠습니다.



한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.



도서 소개

image

도서명 : SQL로 시작하는 데이터 분석
지은이 : 캐시 타니무라
옮긴이 : 박상근
출판사 : 한빛미디어
출간 일자 : 2022-08-10
페이지 : 436쪽
가격 : 정가 30,000원


많은 기업들이 데이터 분석을 통해 인사이트를 도출하고 이를 서비스에 적용하여 매출을 증대시키고 있습니다. 많은 데이터 분석가들이 데이터 분석을 하기 위해 R, 파이썬 등의 프로그래밍 언어를 이용하고 있습니다. 데이터 분석가들도 마찬가지이지만 많은 현업분들은 SQL을 이용하여 데이터 분석을 진행합니다. 이 책은 그렇게 SQL을 이용하여 데이터를 분석하시는 분들에게 추천하는 책입니다.


이 책은 5가지 주제로 데이터 분석을 다룹니다.

  • 시계열 분석
  • 코호트 분석
  • 텍스트 분석
  • 이상 탐지
  • 실험 분석


책에서는 각 분석마다 준비된 데이터 셋을 이용하고 분석 주제를 가지고 SQL로 풀어나가는 방식으로 진행합니다. 결과는 그래프로 보여줘서 보기 쉽게 제공하고 있습니다. 참고로 파이썬을 이용해서 데이터 분석을 할 때에도 그래프를 많이 이용합니다.

이 책에서는 데이터 분석을 다루는데 끝나는 것이 아니라 SQL 문법이나 포매팅 요령, 쿼리 실행 순서 등 SQL에 대한 정보들도 제공하여 더욱 효과적으로 SQL을 사용할 수 있도록 가이드하고 있습니다. 많은 데이터를 다뤄야 하는 데이터 분석에서는 이러한 부분도 매우 중요하게 생각합니다.


총평

평소에 데이터를 다룰 때 SQL은 데이터 추출용으로 이용하고 파이썬을 이용해서 데이터를 가공하고 분석하는 방식으로 하고 있습니다. 이 책을 보면서 SQL로도 이렇게까지 할 수 있구나라는 새로운 사실들이 많았고 실제로 분석할 때 이용해 보고자 합니다.

이 책에서 나오는 SQL들은 모든 관계형 데이터베이스의 SQL을 다루는 것이 아니기 때문에 본인이 사용하고 있는 데이터베이스에서는 되지 않을 수도 있습니다. 그렇기 때문에 사용 중인 데이터베이스에 맞는 함수를 찾는 과정이 필요합니다.