책리뷰

대격변 AI시대, 데이터로 사고하고 데이터로 리드하라

Yuniverse. 2025. 3. 30. 11:14

 

  • 책 제목: 대격변 AI 시대, 데이터로 사고하고 데이터로 리드하라
  • 저자: 알렉스 거트맨, 조던 골드마이어

기록해두고 싶은 문장

1장 무엇이 문제일까 데이터는 복잡하다. 데이터에 관한 문제는 대부분 근본적으로 어렵다. 설사 가장 명석한 분석가가 방대한 데이터를 확보해서 적절한 도구와 분석 기법으로 작업하더라도 실수를 피하기 어렵다.
3장 통계적 사고를 위한 준비를 갖추자 오늘날 데이터 과학의 혜택은 실재하며 그 어느 때보다도 중요하다. 예측이 점점 정확해짐에 따라 데이터 과학 결과물의 가치는 더욱 높아질 것이며 이 분야에 대한 관심도 커질 것이다. 하지만 간혹 이런 발전은 우리를 안주하게 하고 결함을 감춰버리기도 한다. 확률적 추론과 증거에 대한 평가를 더 깊이 이해하는 것은 데이터 리드가 갖춰야 할 기본 소양이다.
4장 데이터와 논쟁하자 조직이나 사람은 누구나 실수할 수 있으며 실제로도 실수를 저지른다. 그렇기에 팀원들과 질문을 공유하고 의견을 조율하는 일은 반드시 필요하다. 데이터 리드는 어렵고 까다로운 질문을 끊임없이 제기하면서 데이터에 얽힌 문제를 해결하는 능력을 스스로 입증해야 한다.
5장 데이터를 탐색하자 데이터 리드는 탐색적 데이터 분석 과정을 수행해야 한다. EDA에서 다음과 같은 일이 가능하다.
  • 문제를 해결하기 위한 명확한 과정 도출
  • 데이터에서 확인한 제한 조건에 따라 비즈니스 문제 재정의
  • 데이터를 이용해 해결해야 할 새로운 문제 식별
  • 프로젝트 중단. 해결할 수 없는 문제에 시간과 돈을 낭비하지 않게 됐다면 썩 만족스럽지는 않지만 그것만으로도 탐색적 분석은 성공한 셈이다.
6장 확률이란 무엇인가 데이터 리드로 성장하는 과정에서 확률과 불확실성에 대해 적극적으로 토론하려는 자세는 정말 중요하다.
14장 조직 구성원의 다양한 성향을 파악하자 데이터 리드는 뼛속부터 ‘회의론자’다. 남들에게 불편을 유발하기 위해 회의적인 태도를 취하는 것이 아니라 데이터에 대한 비판적 사고 기법을 활용한다는 뜻이다. 데이터 리드의 건전한 회의론은 기술 지식과 분야 전문성에 근거하므로 공감대를 형성하며 전달된다. 데이터 리드가 된다는 것은 팀 전체의 의견을 경청하는 것에서 시작된다.

 


느낀 점

어릴 때부터 답이 명확하게 존재한다는 점이 좋아 수학을 선택했다. 실생활과 밀접하게 연관되었다는 점이 좋아 통계를 선택했다. 그리고 실제 사람들의 행동을 수치로 환산하고, 이를 통해 의미를 도출할 수 있다는 점이 좋아 데이터를 선택했다. 내가 가진 ‘통계’라는 Theory에 ‘데이터’라는 Practical을 결합하면, 복잡한 문제에도 논리적인 Solution을 찾을 수 있으리라 믿어 의심치 않았다.

 

하지만 현실은 달랐다. 문제의 답은 생각보다 쉽사리 찾아지지 않았고, 오히려 어렵게 답을 찾아낸 이후에도 그것이 정말 ‘옳은 정답’인지 확신할 수 없었다. 데이터가 말해주는 답이 명확할 것이라 기대했지만, 수집 방식에 따라, 분석 기법에 따라, 해석하는 사람에 따라 결과는 달라졌고, 그러다 보니 ‘이게 과연 진실일까?’라는 의문이 끊임없이 따라다녔다.

 

그러던 중 우연히 책 <대격변 AI 시대, 데이터로 사고하고 데이터로 리드하라>를 추천하는 글을 보게 되었다. 답을 찾는 방법, 그리고 내가 찾은 답이 정답인지 검증하는 방법이 담겨있길 바랐던 나는 망설임 없이 책을 구매했다. 하지만 책은 여러 번에 걸쳐 반복적으로 "그런 건 없다"라고 말해주었다. 처음에는 다소 실망스러웠다. 내가 원했던 정답을 주는 대신, 오히려 지금까지 가졌던 확신을 흔들어 놓았으니까. 하지만 모순적이게도 그 점이 만족스러웠다.

 

책을 통해 얻은 가장 큰 배움은 데이터 분석에서 절대적인 정답은 존재하지 않는다는 사실을 받아들이는 것이었다. 데이터란 우리가 의사결정을 내리기 위한 도구이며, 그 도구를 어떻게 활용하느냐에 따라 전혀 다른 인사이트를 도출할 수도 있다. 또한, 책은 통계와 데이터 관련 개념들을 쉽게 설명해 주어 잊고 있던 지식들을 되살릴 수 있도록 도와주었다. 무엇보다 나뿐만 아니라 모든 데이터 종사자들이 비슷한 고민을 하며 시행착오를 겪고 있다는 점에서 위로를 받았다.

 

마지막으로, 책에서 제시한 ‘좋은 데이터 리드’의 개념은 앞으로 내가 어떤 방향으로 성장해야 할지를 고민하게 만들었다. 내가 처음 데이터 분석가를 시작했을 때는 단순히 분석을 잘하는 사람이 되고 싶었지, '리드'가 되는 것에 대한 고민은 하지 않았다. 하지만 연차가 조금씩 쌓이고, '리드'에 대한 생각과 꿈을 갖게 되었다. 책에서 말하는 ‘좋은 데이터 리드’란 단순히 데이터를 잘 해석하는 것을 넘어, 불확실성 속에서도 최선의 결정을 내릴 수 있도록 방향을 제시하는 사람이다. 점점 더 많은 데이터를 다루고, 더 나은 분석을 고민할수록 단순히 숫자를 뽑아내는 것이 아니라 ‘어떤 방향으로 분석할 것인가’, ‘어떤 질문을 던질 것인가’가 더 중요하다는 걸 알게 되었다. 이 책을 읽기 전까지는 답을 찾는 것만이 중요하다고 생각했지만, 이제는 ‘어떤 답을 찾을 것인가’, 그리고 ‘그 답을 어떻게 활용할 것인가’가 더 중요하다는 사실을 배웠다.