Culture & Book/내가 읽은 그 책

수학은 어렵지만 확률·통계는 알고 싶어_책 리뷰_데이터 분석을 위한 수학 기본

쿵야085 2021. 9. 16. 23:19
반응형

수학은 어렵지만 확률·통계는 알고 싶어

책 리뷰_데이터 분석을 위한 수학 기본

 

도서명 ㅣ수학은 어렵지만 확률·통계는 알고 싶어
부   제 ㅣ1시간 만에 마스터하는 데이터 보는 법·이용하는 방법!
저   자 ㅣ요비노리 다쿠미
역   자 ㅣ이지호
출판사 ㅣ한스미디어
출판일 ㅣ2021.08.17
페이지 ㅣ188

 

 

 

저자 소개

요비노리 다쿠미
저자 : 요비노리 다쿠미
도쿄대학교 대학원을 졸업했다. 박사과정에 진학하면서 6년 동안 계속했던 입시 학원 강사를 그만둔 뒤, 많은 사람에게 과학을 알리기 위한 활동의 일환으로 유튜브 채널 ‘요비노리’를 개설하기로 결심했다. 학창 시절에는 이론 물리학을 전공했으며, 학부에서는 ‘물리화학’, 대학원에서는 ‘생물물리’를 연구했다. 대학교 수준의 수학과 물리학을 중심으로 한 이과 과목 동영상을 올리는 유튜브 채널 ‘입시 학원 분위기로 공부하는 대학교 수학·물리학(약칭 요비노리)’은 58만 명 이상이 구독하고 있으며, 조회수도 누계 8,500만 회를 돌파했다. 저서로는 수학은 어렵지만 미적분은 알고 싶어, 과학은 어렵지만 상대성 이론은 알고 싶어, 입시 학원의 분위기로 공부하는 대학교 수학, 입시 학원의 분위기로 공부하는 선형대수 등이 있다.

역자 : 이지호
대학에서는 번역과 관계가 없는 학과를 전공했으나 졸업 후 잠시 동안 일본에서 생활하다 번역에 흥미를 느껴 번역가를 지망하게 되었다. 스포츠뿐만 아니라 과학이나 기계, 서브컬처에도 관심이 많다. 원서의 내용과 저자의 의도를 충실히 전달하면서도 한국 독자가 읽기에 어색하지 않은 번역을 하는 번역가, 혹시 원서에 오류가 있다면 그것을 놓치지 않고 바로잡을 수 있는 번역가가 되고자 노력하고 있다. 옮긴 책으로 《과학은 어렵지만 상대성 이론은 알고 싶어》, 《수학은 어렵지만 미적분은 알고 싶어》, 《축구의 멈추기 차기 절대 기술》, 《방 배치 도감》, 《유럽 명문 클럽의 뼈 때리는 축구 철학》, 《초록의 집》, 《원자핵에서 핵무기까지》, 《슬로 트레이닝 플러스》 등이 있다.

 

목 차

감수의 글
머리말

HOME ROOM 1 확률·통계는 비즈니스맨의 필수과목!
HOME ROOM 2 확률·통계를 공부하면 ‘좋은 의사결정’을 할 수 있다
HOME ROOM 3 확률·통계를 공부하면 ‘세상의 거짓말’을 꿰뚫어 볼 수 있다
HOME ROOM 4 통계를 사용하면 ‘설득력’이 크게 높아진다!
HOME ROOM 5 통계를 공부하면 ‘데이터를 활용하는 방법’을 마스터할 수 있다!

제1장 확률이란 무엇일까?
LESSON 1 확률이란 ‘어떤 사건이 일어나기 쉬운 정도’를 뜻한다
LESSON 2 확률을 계산해 보자!
LESSON 3 확률의 포인트는 ‘동등하게 가능한가’ 그렇지 않은가
LESSON 4 ‘동등하게 가능하지 않은’ 경우는 어떻게 해야 할까?
LESSON 5 ‘제비뽑기’를 먼저 뽑는 것과 나중에 뽑는 것은 어느 쪽이 더 유리할까?
LESSON 6 ‘순서대로 제비를 뽑으면’ 왜 확률이 ‘똑같아지는’ 것일까?
LESSON 7 ‘선택해서 나열하는 문제’의 경우의 수를 계산하는 방법
LESSON 8 이렇게 하면 ‘nPr’의 계산도 두렵지 않다!
LESSON 9 계승을 이용해서 ‘자리 바꾸기’를 빠르게 계산해 보자!
LESSON 10 ‘조합 문제’를 계산하는 방법
LESSON 11 ‘조합 문제’를 활용하는 방법

제2장 통계란 무엇일까?
LESSON 1 ‘통계학’을 익혀서 비즈니스에 강해지자!
LESSON 2 통계학의 기본인 ‘대푯값’이란?
LESSON 3 대푯값의 첫걸음 ? ‘평균값’
LESSON 4 평균 점수보다 더 참고가 된다? ? ‘중앙값’
LESSON 5 가장 빈번하게 출현하는 ‘최빈값’
LESSON 6 ‘대푯값’에 따라 데이터를 바라보는 시각이 달라진다!
LESSON 7 ‘데이터의 들쭉날쭉함’은 ‘표준편차’로 살펴본다
LESSON 8 ‘편찻값’이란 무엇일까?
LESSON 9 ‘상관관계’란 무엇일까?
LESSON 10 ‘상관관계’를 사용할 때는 이 점에 주의하자!
LESSON 11 ‘상관관계’의 함정이란?
LESSON 12 ‘허위상관관계’를 간파하는 방법
LESSON 13 ‘상관관계를 이용한 거짓말’에 속지 말자!
LESSON 14 확률ㆍ통계를 이용하면 ‘신의 기적’의 정체도 꿰뚫어 볼 수 있다?

ㅣ 데이터 이해를 위한 기본 수학을 배우자.

지금은 IT 기술의 발전으로 방대한 정보를 손쉽게 얻을 수 있습니다. 이 방대한 데이터를 활용해서 의사결정에 도움을 주거나, 다른 사람들을 설득할 때 활용하거나, 큰 리스크를 미리 예측하는데도 활용하고 있습니다.  반면 방대한 데이터를 어떻게 활용하느냐에 따라서 거짓된 정보를 만들어내기도 하고, 과장된 정보를 만들어 내기도 하는 거 같습니다. 

데이터를 다루는 사람에 따라서 때로는 인류에게 도움을 주기도, 때로는 인류에게 해악을 끼치는 것입니다. 

 

그리고 본래 데이터의 양은 점점 더 늘고 있었지만, 코로나라는 유례없는 사태로 인해서 어쩔 수 없이 인터넷 세상은 강제적으로 그 속도가 더 빨라지고 더 양은 훨씬 더 많아진 거 같습니다. 그래서 많은 기업들이 더 복잡해지고 풍부해진 데이터를 어떻게 활용해야 할지 고민을 하고 있다고 느껴집니다. 

 

이런 때일수록 우리는 확률, 통계를 제대로 공부해야 된다는 생각이 듭니다. 많이 데이터를 보면서 성공할 가능 성이 높은 의사결정을 하거나, 유익한 정보를 빠르게 감지해내거나, 그릇된 데이터를 비판적으로 보고 제대로 판단도 하게 됩니다. 


 

또 이번 '수학은 어렵지만 확률·통계는 알고 싶어' 책의 서론을 읽으면서 조금 놀랬던 것은 나이팅게일이 통계학을 이용해서 세상을 바꿔 놓았다는 것입니다.

 

간호사의 발언권이 약했던 시대에 나이팅게일은 부임한 병원에서 방대한 데이터를 분석해 '병사의 사망 원인 중 대부분은 병원의 비위생적인 환경 때문이었다'라는 사실을 통계 자료의 숫자로 제시를 했다고 합니다. 이렇게 숫자로 증명을 하게 되다 보니 간호사의 말에 귀를 기울이지 않았던 높으신 분들도 대응할 수밖에 없었다고 합니다. 

 

당시의 영국에서 여성이나 간호사의 지위는 그리 높지 않았을 텐데, 이를 극복한 것이 바로 통계학을 바탕으로 한 '숫자의 힘'이라고 하니, 통계학이 얼마나 강학 설득력을 지니고 있는지 알 수 있는 대목입니다. 

 

ㅣ 확률을 알면 판단이 쉬워진다.

사회의 직장 생활을 하면서 많이 쓰게 되는 말 중에 하나가 A의 경우 혹은 B의 경우를 선택할 경우에는 결과적으로 C가 될 '확률'이 높다고 합니다. 여기에서 확률은 수학적으로 정확하게 계산되거나, 정확한 의미에서 이야기를 하지는 않았던 거 같습니다. 하지만 '확률'이라는 단어가 가장 잘 어울리는 단어라고 생각되어서 자연스럽게 쓰고는 했습니다. 

 

그런데, 이 책을 보면서 정말 맞는 말을 잘 쓰고 있었구나라고 생각했습니다. 

책에서 말하는 확률이란 정의는 아래와 같습니다. 

 

'어떤 사건이 일어나기 쉬운 정도'를 '확률'이라고 부른다.

 

모든 경우의 수가 있다면 그중에서 그 경우의 수 중에 하나가 선택되어서 어떤 사건이 어느 만큼 일어날 것인가를 숫자로 표현했다는 것입니다. 

 

이 책을 읽으면서 확률에서 가장 중요한 것을 하나 알게 된 것이 있는데요. 바로 확률은 '동등하게 가능한 경우의 수를 센다'라는 것입니다. '동등하게 가능하지 않은 경우'의 경우에는 그대로 세어 버리면 확률을 잘못 계산할 수 있기 때문에 확률에 오류를 만들어 낼 수 있습니다. 

 

책에 나온 예를 들면 '인기 연예인이 될 수 있을까? 될 수 없을까?'라는 문제에 관해서 생각을 해봅니다. 언뜻 보면 인기 연예인이 될 확률이 1/2처럼 보이지만, 실제로는 그렇지 않다는 것입니다. 비율을 비교하면 '인기 없는 연예인'의 수가 압도적으로 많다는 것입니다. '인기 연예인이 될 수 있을까?'와 '될 수 없을까?'는 동등하게 가능하지 않다고 할 수 있는 것입니다. 

 

결론적으로 비율이 다른 것을 같은 경우로 놓는다면 동등하게 가능하지 않은 경우의 수를 세게 되는 것입니다. 그래서 확률을 생각할 때는 '각각의 비율이 전부 같은지'를 반드시 확인하고 생각해야 합니다. 

 

ㅣ 뉴스, 신문에서 가장 많이 발견되는 통계

통계는 평범한 사회인에게도 엄청나게 도움이 되는 학문이라고 강하게 저자는 이야기하는데요. 통계학을 한마디로 설명하면 '집단을 수치적, 수량적으로 이해하는 학문'이라고 합니다. 

 

예전에 팩트폴니스를 읽으면서 통계의 허점을 이용해서 잘못된 정보를 전달하거나, 잘못된 판단을 하게 만드는 경우가 많다는 것을 알게 된 적이 있습니다. '수학은 어렵지만 확률·통계는 알고 싶어' 책에서도 '통계학'을 제대로 이해하지 못했을 경우에 수치에 관해서 과대, 과소평가를 내릴 수 있다는 이야기가 있었는데요. 통계학을 어렴풋이 알고 제대로 이해하지 못해서 생기는 것이라고 생각이 됩니다. 

 

특히 '평균적으로'라는 단어는 신문과 뉴스에서 너무 많이 표현되고, 일상을 살아가면서도 대화하면서 많이 쓰이는 단어 중에 하나입니다. 하지만 이 평균이라는 단어에 관해서 비판적으로 보지 않고 있는 그대로 받아들이게 되면 잘못된 정보로 생각할 수 있는 것입니다. 

 

예를 들어서 사회생활을 하면서 가장 예민하고도 신경 쓰이는 게 '평균 연봉'이라는 단어인데요. 항상 뉴스, 신문을 통해서 보는 '평균 연봉'을 내가 생각하는 것보다도 훨씬 높다고만 느껴집니다. '평균 연봉 = 평범한 사람들의 연봉'이라고 인식하면 다들 이렇게 돈을 많이 받고 있는 거야?라고 생각이 듭니다. 

 

하지만 생각보다 높은 평균 연봉은 정말 엄청나게 높은 연봉을 받는 일부 사람들의 존재가 평균값을 크게 높인 결과일 수 있습니다. 평균값은 이렇게 '수는 적지만 값이 큰'것의 영향을 강하게 받기 때문입니다. 그래서 통계 데이터를 볼 때는 평균값이나, 중앙값, 최빈값으로 데이터의 특징을 잘 살펴보아야 합니다. 

 


통계 파트를 읽으면서 재미있고 흥미로웠던 부분은 '상관관계'였습니다. 일상생활에서도 상관관계에 관해서 이야기를 많이 하는데요. 다만 이 상관관계가 착각하기 쉽다는 위험성을 내포하고 있다고 합니다. 상관관계가 반드시 인과관계를 의미하는 않는다는 것입니다. 

 

그리고 보통 상관관계가 있으면 인과관계까지 있다고 생각을 해버리는데요. 저도 이 책을 읽기 전까지는 상관관계가 인과관계와 동일한 의미라고 생각을 했었습니다. 예를 들면 '학습 시간과 학교 성적'의 경우가 그럴 수 있는데요. 공부를 많이 할수록 그것이 원인 되어서 학교 성적이 좋아진다라는 인과 관계가 만들어질 수 있는데요. 그렇지 않은 경우도 있기 때문에 상관관계는 있을 수 있지만, 인과 관계라고 말할 수는 없는 것입니다. 

 

이것 말고도 '허위 상관관계'라는 것도 있었는데요. 예를 들어서 '어떤 지역의 아이스크림 매출액'과'그 지역의 익사자 수'라는 것이 있는데요. 아이스크림 매출액과 익사자 수 사이에는 양의 상관관계가 존재합니다. 하지만 이것 인과관계는 아니라는 것입니다. 

 

① 기온이 높은 날에는 아이스크림이 많이 팔린다. 

② 기온이 높은 날에는 물놀이를 하는 사람이 늘어나기 때문에 익사하는 사람도 증가한다. 

 

둘의 관계는 양의 상관관계를 가지지만, '별도의 공통 요인'이었던 기온이 높은 날이라는 것이 공통 요인이 인과관계가 없는 허위 상관관계를 만들어 낸 것입니다. 

 

ㅣ 정말 1시간이면 이해되는 확률·통계

 '수학은 어렵지만 확률·통계는 알고 싶어' 책을 보았을 때 1시간이면 충분히 확률·통계를 이해할 수 있다는 말을 보고 거짓말이라고 생각을 했었는데요. 막상 책을 읽다 보니 정말 1시간 만에 이 책을 다 읽고 확률·통계에 관해서 이해를 하게 되었습니다. 

물론 이 책을 다 완독 하였다고 해서 확률·통계 수학 문제를 모두 100점 맞거나 할 수는 없겠지만, 확률·통계에 관해서 기본적인 개념을 제대로 잡지 못하고 있었다면 제대로 된 개념을 잡는데 도움이 많이 될 거 같다는 생각이 들었습니다. 

특히 급하게 확률·통계에 관해서 개념을 잡기 원하는 사람이라면 이 책을 통해서 빠르게 잡을 수 있을 거라고 생각이 됩니다. 고등학교 때 수학이 어려워서 수포자의 생활을 살았는데요. 이런 책이 있었다면 수포자가 되지 않았을 거라는 생각이 드네요!

 

#수학  #수학은어렵지만확률통계는알고싶어

리뷰어스 클럽의 소개로 출판사로부터 책을 제공받아 주관적으로 작성한 글입니다.

 

 

 

반응형