Culture & Book/내가 읽은 그 책

[IT/데이터] 최소한의 데이터 리터러시 (송석리, 황수빈, 이정윤, 정유진) _ 책 리뷰 _ 데이터를 활용할 수 있는 능력

쿵야085 2024. 3. 8. 21:25
반응형

[IT/데이터] 최소한의 데이터 리터러시 (송석리, 황수빈, 이정윤, 정유진)

책 리뷰 _ 데이터를 활용할 수 있는 능력

 

 

도서명ㅣ최소한의 데이터 리터러시
부제ㅣ인공지능 시대를 살아갈 모든 사람을 위한 교양서
저자ㅣ송석리, 황수빈, 이정윤, 정유진
출판사ㅣ길벗
페이지ㅣ228쪽
출판일ㅣ2024년 02월 15일

 

 

 

 

저자 소개

저자 : 송석리

서울고 교사. 2005년부터 선린인터넷고등학교에서 학생들을 가르치다가 존경하는 제자들로부터 파이썬의 세계를 안내받고 2014년부터 파이썬에 입문했다. 2016년부터는 한성과학고등학교에서 파이썬 기반의 다양한 프로젝트 수업을 진행하였다. 디지털 세상을 이루는 기본 요소인 코드와 데이터를 기반으로 문제를 해결하는 프로젝트 형태의 수업에 관심이 많다. 인공지능 시대를 관통하는 새로운 교육의 흐름을 찾기 위해 노력 중이다.

저자 : 황수빈

서울 대청중 교사. 수학에서 통계를 가르치다 데이터와 인공지능의 매력에 빠지게 되었다. 교육에서 인공지능을 활용하기 위해 서울대학교 수학교육과 박사 과정에서 공부하고 있으며 끊임없이 연구하여 미래 교육이 올바른 방향으로 전진하는 데 기여하고 싶다.

저자 : 이정윤


서울 세화여고 교사. 수학과 정보를 가르치며 교과 융합 및 데이터 교육에 관심을 가지게 되었고, 다양한 수업 연구를 진행하고 있다. 학생들이 더 넓은 세상을 볼 수 있도록 이끌어주는 역할을 하고 싶다.

저자 : 정유진

서울 강동초 교사. 어린 학습자도 데이터 기반 융합 수업을 통해 인사이트를 찾을 수 있도록 초등수학교육을 연구하고 있다. 더 많은 아이들이 주도적으로 협력하며 희망찬 미래를 그려나갈 수 있기를 소망한다.

목차

 

1부 데이터 리터러시를 시작하는 시간

1장 들어가는 글
21세기 미래 역량, 4C
컴퓨터와 문제 해결의 역사

2장 21세기에 가장 인기있는 분야, 데이터 과학
구글 검색량으로 데이터 분야 트렌드 분석하기
데이터 과학에 대한 다양한 정의와 벤 다이어그램

3장 생활 속 데이터에 질문하기
기온 데이터 수집하기
기온 데이터에 질문하기
출퇴근 시간에 사람들이 가장 많이 타고 내리는 역
대중교통 데이터 수집하기
대중교통 데이터에 질문하고 답 찾기

4장 미래를 가장 정확하게 예측하는 방법
인구 데이터 수집하기
인구 데이터에 질문하기
데이터를 읽고 쓰는 데이터 리터러시 키우기

2부 데이터 리터러시를 기르는 시간

5장 데이터 시대에 현명한 미디어 프로슈머로 살아남기
평점 데이터 자세히 살펴보기
여론조사 결과에 휘둘리지 않기
여론조사 너머의 무언가를 보기

6장 영화가 추천되는 과정
추천시스템의 역사와 다양한 알고리즘
추천 시스템을 현명하게 이용하기
확증 편향을 줄이기 위한 실천 방안

7장 아는 만큼 보인다! 데이터를 읽는 통계의 힘
평균의 함정 조심하기
상자그림을 활용한 데이터 시각화

8장 데이터 속에 숨어 있는 관계 찾기
산점도로 두 과목 사이의 관계 파악하기
상관관계 올바르게 해석하기

9장 제작비가 많이 들어간 영화일수록 흥행할까?
두 변수 사이의 경향성 나타내기
머신러닝으로 관객 수 예측하기

10장 데이터를 깊게 보고 오해에서 벗어나기
잘못된 오해, 모자이크 플롯과 조건부확률로 풀기
두 집단으로 나누니 정반대 결과가 나오는 역설

11장 코로나19 검사 결과, 믿어도 될까?
검사의 정확성을 높이는 열쇠: 민감도와 특이도
코로나19 검사 정확도 99%의 맹점
가설 검정의 미묘한 밸런스: 1종 오류와 2종 오류

12장 편견도 데이터로 수정이 될까?
머신러닝의 기반이 되는 베이즈 법칙 이해하기
경험을 통해 믿음을 업데이트하는 과정

3부 데이터 리터러시를 활용하는 시간

13장 이 그래프에서 무슨 일이 일어나고 있을까?
시각화를 통한 데이터 탐색
뉴욕타임스로 데이터 리터러시를 기르는 방법

14장 생활 속에서 활용하는 데이터 리터러시
데이터 리터러시 활용 가이드
생활 속 데이터 리터러시 활용 사례

15장 질문부터 통찰까지 꿰뚫는 설문 조사 만들기
설문지 만들고 응답 데이터 받기
코답(CODAP)을 활용한 설문 응답 데이터 분석

16장 데이터 패턴을 분석해 2050년 서울 기온 예측하기
기온 데이터 패턴 분석하기
머신러닝으로 2050년 기온 예측하기

17장 데이터 윤리가 필요한 시간
데이터와 인공지능의 연결고리
데이터 편향의 위험성
인공지능 발전의 그늘, 윤리와 책임

 

 

ㅣ 최소한 우리가 알아야 할 데이터 리터러시

 

특히 '데이터'라는 하나의 매개체를 통해서 다양한 관점들이
어떻게 서로 연결되고 융합되면서 새로운 관점으로 발전해 나가는지 경험하게 될 것입니다.  

 

이번에 읽고 소개하고 싶은 책은 <최소한의 데이터 리터러시>라는 책입니다. 제가 이번 책을 고르고 읽게 된 이유는 아무래도 직업적인 연관성이 가장 높은데요. PM/PO/서비스기획자라는 직무들을 경험하면서 가장 많이 들었던 질문 중에 하나가 '데이터는 어떤데?' , '데이터로 증명된 내용이야?', '데이터로 설득해 봐'와 같은 질문들이었습니다. 이렇게 된 이유는 지금 우리가 살아가는 시대는 데이터가 너무 많이도 넘쳐나는 시대이기 때문인 거 같습니다. 데이터 수집이 쉬워졌을 뿐만 아니라, 데이터 수집이 안 되는 경우가 있다면 어떻게든 데이터를 수집할 수 있는 방법을 강구해서 데이터를 수집하고는 합니다. 또한 과거에는 수집하기 힘들 거라고 생각했던 유형들의 데이터도 수집하고 있습니다. 뿐만 아니라 인공지능이 발전하면서 인공지능이 새로운 형태의 데이터를 생성하기도 합니다. 

 

지금과 같이 데이터가 넘쳐나는 시대에 있으면서 데이터를 읽고 해석할 수 있는 능력, 즉 데이터 리터러시 부족하다면 눈앞에 있는 데이터가 있어도 데이터가 담고 있는 어떤 정보도 얻을 수 없습니다. 또한 책에서는 데이터는 마치 광산과 같아서 올바르게 해석하고 활용할 수 있는 능력을 기른다면 남들이 발견하지 못한 멋진 보석을 발굴할 수 있지만, 그 반대일 수도 있다는 것입니다. 그래서 이번 <데이터 리터러시>의 집필진은 모두에게 필요한 기본 소양 중 하나가 바로 '데이터 리터러시'라고 생각해서 인공지능 및 데이터 시대를 현명하게 살아갈 수 있도록 돕는 책을 집필하게 되었다고 합니다. 

 

 

우리가 데이터를 보는 가장 큰 이유는 무엇일까요? 아마도 바로 어떤 특정한 문제를 해결하기 위한 방법 중에 하나이지 않을까라고 생각합니다. 사람은 태초부터 지금까지 살아가면서 매번 문제와 함께 살아갔는데요. 이 문제는 과거에도 존재했지만 미래에도 계속 존재하고 있을 것입니다. 그래서 인류는 이 문제들을 어떻게 하면 더 쉽게 해결할 수 있을까라고 고민을 해왔고 그 방법 중에 하나가 컴퓨터라는 도구를 통해서 해결하는 것입니다. 인류는 이 강력한 컴퓨터라는 도구를 활용해 수많은 데이터를 계산하고 분석하면서 인류의 문제들을 해결해 왔습니다. 

 

사람들은 당장 경험하고 있는 문제들만을 해결하려는 것이 아니라, 미래에 발생 가능한 문제들도 미리 예측하기를 원했고 그런 문제들을 미리 예측해서 예방하거나 미리 해결하려는 시도들도 하게 됩니다. 그럼 이런 문제들은 어떻게 미리 예측하고 해결할 수 있는 것일까요? 

 

우선 <최소한의 데이터 리터러시> 책에서는 미래를 가장 정확하게 예측할 수 있는 데이터는 바로 인구 통계의 변화와 관련된 것이라고 합니다. 인구 통계는 올해 태어나 아이들이 몇 명인지를 알면, 이 아이들이 커서 몇 년 후 초등학생이 되고, 성인이 되고, 노인이 될 것인지에 대한 예측이 가능하기 때문입니다. 전 세계적으로 엄청나게 큰 재앙이 생기지 않는 한 일정한 오차 범위 안에서 예측할 수 있는 것이죠. 이런 인구 데이터가 아니라면 반복적인 패턴이 보이는 데이터의 경우에도 일정 부분 예측이 가능할 수 있다고 예측을 하는데요. 예를 들어서 기온의 변화 같은 부분을 일정 부분 예측을 해 볼 수 있습니다. 반복적인 패턴에 의해서 기온이 변화하고 상승하고 있다는 분석을 통해서 앞으로 어느 정도 상승할지도 예측하는 것입니다. 그래서 지금의 지구 온난화도 과거의 가온 상승 패턴에 따라서 앞으로 어느 정도 상승할지 예측하고 있는 것입니다. 

 

 

저는 데이터에 있어서 가장 함정에 빠지기 쉬운 것이 바로 평균의 함정이라고 생각하는데요. 우리가 일상생활에서 가장 많이 접하는 데이터 중에 하나가 바로 평균인데요. 사실 이 평균이라는 것이 가장 높은 값과 가장 낮은 값이 차이가 크다면 실질적인 숫자 하나하나를 봤을 때는 평균대비 차이가 클 수 있다는 점입니다. 예를 들어서 5,000만 원이라고 평균 연봉이 동일한 기업이 두 군데가 있지만, 그 두 기업의 실질적인 연봉은 차이가 있을 수 있다는 것입니다. A라는 기업은 초봉은 2,500만 원인데, 부장은 7,500만 원이라서 평균 연봉이 5,000만 원 일수도 있으며 B기업은 모두가 동일하게 연봉이 5,000만 원이라서 평균이 5,000만 원 일 수도 있습니다. 단순히 평균만 보고 A기업을 택했다면 신입 사원의 경우에는 적지 않아 당황할 수도 있는 것입니다. 

 

위와 같이 우리가 데이터 리터러시를 알아야 하는 이유는 위와 같이 자료의 값 중에서 매우 크거나 매우 작은 값, 즉 한쪽에 극단적으로 치우친 자료가 있는 경우에는 평균이 자료 집단을 대표하기 적절하지 않기 때문입니다. 여기서 우리는 평균 이외에 다른 대푯값이 필요하다는 것을 알 수 있습니다. 우리의 일상 중 TV뉴스, 신문에서는 평균을 이용한 숫자를 볼 때가 많은데요. 이런 상황에서는 항상 데이터 리터러시 관점으로 데이터를 바라보고 데이터에 관해서 스스로 질문하는 습관을 키워야 합니다. 

 

 

우리는 가끔씩 99%의 확률이라는 단어를 접할 때가 있습니다. 그런데 이 99%라는 숫자를 정말 믿을 수 있을까요? 책에서는 이 정확도 99%에도 함정이 있을 수 있다고 합니다. 왜냐하면 예를 들어 코로나 19 검사 정확도 99%라고 했을 때, 유병률에 따라서도 이 99%가 차이가 날 수 있기 때문입니다. 유병률이 0.1%인 상황에서 진단 키트를 가지고 양성 또는 음성인지 판단을 해야 본다는 민감도와 특이도가 모두 99%이므로 병에 걸렸든 걸리지 않았던 이 진단 키트는 99%의 정확성을 가진다는 것입니다. 

 

위와 같이 우리는 당연히 확실할 거라고 생각되는 숫자도 정확한 의미를 모른다면 그냥 겉으로만 보이는 숫자에 쉽게 속아버리는 것입니다. 그래서 저는 책에 나오는 것과 같이 데이터 시대에 살아가기 위한 최소한의 소양으로 데이터 리터러시가 필요하고 생각을 합니다. 

 

저는 이번 책 <최소한의 데이터 리터러시>가 데이터 과학의 입문로서 너무나도 훌륭한 책이라고 생각되는데요. 확실히 이 책은 데이터가 어떻게 삶의 모든 영역에 스며들어 있는지, 데이터를 이해하고 활용하기 위해 어떤 능력이 필요한지, 데이터를 다루는 과정에서 어떤 도구와 원리를 사용하는지 등을 알기 쉽게 설명하고 있습니다. 특히 저자분들이 모두 학교 선생님이기 때문인지 개념을 이해하는 데 있어서 정말 이해하기 쉽게 다양한 사례들을 가지고 설명하고 있어서 좋았답니다. 혹시라도 데이터 리터러시에 평소 관심을 많이 있었지만, 너무 어렵다고 생각해서 공부를 시작하지 못하고 있었다면 이번 책이 입문하려는 분들에게 큰 도움이 될 거라고 생각합니다. 

 

출판사로부터 책을 제공받아 주관적으로 작성한 글입니다.

 

 
최소한의 데이터 리터러시
생성형 인공지능이 등장해 업무에 활용되는 오늘날은 바야흐로 데이터의 시대라 해도 과언이 아니다. 오늘 먹을 점심 메뉴를 고르기 위해 맛집 평점을 찾아본 일, 쇼핑 앱에서 때마침 추천해준 생필품을 바로 주문한 일, 심지어 소개팅 상대와 치열한 밀당을 하며 주고받은 메시지에도 수많은 데이터가 들어 있다. 하지만 “낫 놓고 기역자 모른다”라는 말처럼 데이터를 읽고 해석할 수 있는 능력인 데이터 리터러시가 부족하다면 눈앞에 보물 같은 데이터가 있어도 그 데이터에 담긴 어떤 정보도 얻을 수 없다. 현직 교사이자 데이터 교육 전문가들이 집필한 《최소한의 데이터 리터러시》는 비전공자와 중고등학생들도 아주 쉽게 데이터 과학에 다가갈 수 있도록 돕는 입문서이다. 맛집 평점과 추천 시스템의 비밀부터 통계와 데이터 과학, 아주 간단한 머신러닝까지 체험해보며 일상생활은 물론 업무에서 어떻게 데이터를 활용해 효율적인 데이터 기반의 의사결정을 할 수 있는지 친절하게 알려준다.
저자
송석리, 정유진, 이정윤, 황수빈
출판
길벗
출판일
2024.02.15

 

 

2022.11.06 - [기타/생활정보] - [넷플릭스/유튜브] 넷플릭스 가격 부담 없이 겜스고에서 저렴하게 이용하는 팁

 

[넷플릭스/유튜브] 넷플릭스 가격 부담 없이 겜스고에서 저렴하게 이용하는 팁

[넷플릭스/유튜브] 넷플릭스 가격 부담 없이 겜스고에서 저렴하게 이용하는 팁 OTT 서비스를 처음 접한 것이 넷플릭스였던거 같은데요. 넷플릭스 이외에도 국내에서 만날 수 있는 OTT 서비스들이

ilsang2.tistory.com

 

반응형