1 분 소요

 안녕하세요 마개입니다.
이번 달에 소개해 드릴 책은 “데이터 품질의 비밀”입니다. 해당 책에 대해 알아봅시다.



한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.



도서 소개

image

도서명 : 데이터 품질의 비밀
지은이 : 바 모세스, 라이어 개비쉬, 몰리 보르웨르크
옮긴이 : 데이터야놀자
출판사 : 디코딩
출간 일자 : 2023-04-10
페이지 : 376쪽
가격 : 정가 28,000원


빅데이터 시대에 둘러봐야할 책


image

image

image

빅데이터 시대에 여러 종류의 데이터들이 쌓이고 사용되고 있으면서 여러 문제가 생기고 있습니다. 데이터를 이용해서 여러 작업을 진행하는데 데이터 자체에 잘못된 정보가 있다거나 누락 또는 중복이 되어 그릇된 의사 결정을 나타낼 수 있습니다. 여기서는 데이터 다운타임이라는 용어를 이용해 해당 내용을 나타내고 있습니다. 이러한 데이터 다운타임에 대한 내용과 원인 및 예방할 수 있는 방법들에 대한 내용들을 이 책에서 다루고 있습니다. 이 책에서는 아래와 같은 목록으로 다루고 있습니다.


  1. 지금 데이터 품질에 주목해야 하는 이유
  2. 신뢰할 수 있는 데이터 시스템 구축을 위한 블록 조립
  3. 데이터 수집/정제/변환/테스트
  4. 데이터 파이프라인 모니터링 및 이상 탐지
  5. 데이터 신뢰성을 위한 아키텍처
  6. 대규모 데이터 품질 문제 해결
  7. 엔드 투 엔드 데이터 계보 구축
  8. 데이터 품질 민주화
  9. 현실에서의 데이터 품질 : 전문가 대담과 사례 연구
  10. 신뢰할 수 있는 데이터 시스템의 미래 개척


​목록을 보면 알 수 있듯이 데이터 품질이 화두가 되는 배경부터 시작해서 데이터 테스트뿐만 아니라 모니터링하는 방법, 그리고 설계하는 방법까지 데이터를 다루는데 있어 필요한 전체적인 프로세스에 대해 다룹니다.
여러 회사들에서 성장에 초점을 맞춰서 데이터를 쌓는 것이 주로 이루어지고 쌓인 데이터들에 대한 품질은 생각하지 못한 경우가 많이 있습니다. 이 책은 이러한 품질에 신경을 쓸 수 있게 해주고 그로 인해 기업도 더욱 성장할 수 있도록 해주는 책입니다.