Culture & Book/내가 읽은 그 책

데이터 천재들은 어떻게 기획하고 분석할까?_책 리뷰_데이터가 비즈니스의 가치를 창출한다

쿵야085 2022. 4. 20. 23:26
반응형

데이터 천재들은 어떻게 기획하고 분석할까?

책 리뷰_데이터가 비즈니스의 가치를 창출한다

 

도서명ㅣ데이터 천재들은 어떻게 기획하고 분석할까?
부  제 ㅣ직관을 넘어 핵심을 꿰뚫는 데이터 분석의 절대 법칙
저  자 ㅣ조성준, 조재희, 김성범, 이성임, 조성배
출판사ㅣ21세기북스 
출판일ㅣ2022.03.30
페이지ㅣ272

 

 

 

저자 소개

저자 : 조성준
서울대학교 산업공학과 교수로 서울대 데이터마이닝센터 센터장을 겸하고 있다. 현재 국무총리 산하 공공데이터전략위원회 공동위원장을 맡고 있다. 워싱턴대학교에서 인공지능 연구로 석사학위를, 메릴랜드대학교에서 신경망과 기계학습 연구로 박사학위를 받았다. 삼성전자, 현대자동차, 포스코, SK텔레콤, LG전자 등 기업 및 공공기관에 초청되어 활발한 자문 및 강연 활동을 하고 있으며, 대중강연을 통해 대한민국 최고 빅데이터 권위자이자 멘토로도 주목받고 있다. 『세상을 읽는 새로운 언어, 빅데이터』와 『빅데이터 커리어 가이드북』(공저)을 썼다.

저자 : 조재희
광운대학교 정보융합학부 교수로 창업지원센터장, 입학처장, 국제처장을 역임했다. 네브래스카대학교에서 의사결정지원시스템 연구로 박사학위를 취득했고, 데이터 자산의 전략적 활용, 시공간 데이터분석, 다차원 모델링 연구로 주목받고 있다. 한국BI데이터마이닝학회장과 정부3.0 추진위원회 빅데이터분과 전문위원을 지냈으며, 다수의 논문을 발표하는 등 국내 데이터 발전을 위해 활발한 활동을 하고 있다.

저자 : 김성범
고려대학교 산업경영공학부 교수. 조지아공과대학교에서 산업시스템공학과 석·박사학위를 취득하고 미국 텍사스주립대학교 산업공학과 교수를 역임했다. 데이터 마이닝/인공지능 이론과 응용 분야에 200여 편의 논문을 발표했으며, 국내외 학회 및 포럼에서 300여 회 연구 결과를 발표했다. 고려대학교 인공지능공학연구소장 및 INFORMS 국제학회 데이터 마이닝 부분 회장을 역임하는 등 국내외 인공지능 및 빅데이터 분석 분야에서 활발한 활동을 하고 있다.

저자 : 이성임
단국대학교 정보통계학과 교수. 서울대학교 통계학과에서 생존 분석을 주제로 박사학위를 취득하고 고려대학교 의과학연구원에서 연구교수를 지냈으며, 연세대학교 환경공해연구소, 서울대학교 복잡계통계연구소에서 연구원으로 활동했다. 의보건학, 검찰청, 산업 등 다양한 분야의 실제 데이터를 기반으로 한 다수의 프로젝트와 교육 프로그램을 진행했다. 현재 차세대 통계학 전문가 교육 활동과 한국데이터마이닝학회 이사, 한국품질경영학회 이사, 사회적책임경영품질원 이사로 활발한 활동을 이어가고 있다.

저자 : 조성배
연세대학교 컴퓨터과학과 교수이자 연세대 AI대학원 원장이다. 패턴인식과 인공지능 분야에서 1000편 이상의 논문을 발표했다. 다수의 국내외 논문지의 편집위원을 맡고 있으며, IEEE 주관의 여러 학술대회 위원장을 역임했다. 인간의 추론학습 기능을 모방한 정보 마이닝 기술에 기반하여 모바일 환경에서의 상황인식 및 개인화 서비스 개발에 관심이 있다. KAIST에서 신경망의 현실적인 적용방안 연구로 박사학위를 받고, 일본 ATR 인간정보통신연구소 등의 연구원으로 재임했다.

 

목차

추천사
프롤로그

1부 데이터 문맹 탈출, 반드시 알아야 할 데이터 상식

더 나은 의사결정을 위한 빅데이터
좋은 기획이 빅데이터의 가치를 결정한다
어떻게 빅데이터를 분석할 것인가
비전공자가 데이터 전문가로 성장하는 방법
기획과 분석, 핵심 원리만 이해하면 성공한다

2부 데이터 시각화로 트렌드를 읽어라

복잡한 정보를 시각적으로 탐색하면 생기는 변화
데이터에 숨어 있는 본질을 발견하다
데이터 마이닝과 비즈니스 인텔리전스가 만나면
결국 다양한 데이터 경험이 중요하다

3부 분류와 예측, 미래를 읽는 가장 확실한 방법

인공지능과 머신러닝을 움직이는 기본 원리
데이터 활용은 분류와 예측에서 시작한다
함수를 찾으면 미래가 보인다
무한한 가능성의 인공지능

4부 데이터를 끼리끼리 뭉쳐 보는 군집분석의 힘

데이터의 특징을 파악해야 하는 이유
군집분석, 어디에 어떻게 쓰일 것인가
데이터 간 거리를 읽으면 결과가 명확해진다
중요한 의사결정일수록 반복적으로 분석하라

5부 인공지능, 더 빠르고 능숙하게 이미지를 분석하다

기계가 인간처럼 스스로 학습하고 분석하는 세상
단순한 원리로 극강의 성과를 내는 딥러닝
알파고 이후 인공지능이 만든 놀라운 성과들
앞으로 10년, 빅데이터로 준비하는 미래

부록빅데이터 직업 제대로 알기
데이터 전문가를 키우는 대학들
Q/A 묻고 답하기

 

 

ㅣ 데이터를 어떻게 해야 할까?!

 

데이터 기반의 의사결정이라는 말을 요즘 회사에서 너무 많이 듣고 있는 거 같습니다. 단순히 감으로 결정하는 것이 아니라, 숫자라는 객관적인 지표에 의해서 정확한 의사결정을 하려는 의도입니다. 물론 과거에도 숫자를 통해서 의사결정을 하는 사례는 있었습니다. 하지만, 지금처럼 더 많은 데이터, 더 시시각각 변화되는 데이터를 통해서 의사결정을 하기 시작한 지는 얼마 되지 않은 거 같습니다. 그렇지만 이 데이터를 무작정 모으기만 하고 있지 제대로 의사결정에 활용하기 위해서 사용하는 회사는 일부에 불과한 거 같습니다. 

 

저도 서비스 기획자로 회사에서 데이터 활용에 대한 압박감을 많이 받고 있는 만큼, 데이터는 어떻게 기획하고 분석해야 하는지에 관한 스터디에 필요해졌고, 이번에 21세기북스에서 나온 <데이터 천재들은 어떻게 기획하고 분석할까?> 책을 찾아서 보게 되었습니다. 

 

이 책의 집필진들이 오랜 경험을 가진 데이터 전문가들인 만큼 오래도록 데이터를 어떻게 활용할 것인가에 대해서 고민했었던 경험담을 들을 수 있을 거라고 기대가 되었습니다. 또한 데이터 사이의 맥락을 파악해 어떤 목적으로 어떻게 데이터를 분석해야 하는지, 생활 속에 데이터가 어떻게 활용되고 있는지 혹은 실제 기업의 사례를 알게 될 것이라고 생각이 되었습니다. 

 

책의 구성은 총 6부로 되어있습니다. 1부에서는 데이터란 무엇인지에 관한 개론적인 설명이 되어있습니다. 그리고 2부는 데이터를 어떻게 시각적으로 탐색하고 설명한 것인지에 관한 이야기가 있습니다. 3부부터는 조금 더 전문적인 이야기들이 나옵니다. 예측에 대한 중요성과 그 방법론에 대한 이야기입니다. 4부에서는 3부와는 다르게 분류 또는 예측하는 정보가 알려지지 않았을 때 의미 있는 정보를 추출하는 데이터 분석 방법을 알려줍니다. 5부는 데이터 과학과 인공지능의 관계에 대한 이야기를 통해서 이미지/동영상을 분석하는 방법에 관한 이야기입니다. 마지막 5부는 일상에서 가장 빈번하게 접하는 텍스트 데이터 분석이 왜 중요한지, 그리고 다른 데이터와는 어떤 차이가 있는지에 관해서 설명하고 있습니다. 

 

목차만을 봤을 때는 내용이 꽤 어렵다고 느껴질 수 있지만, 그럼에도 불구하고 저는 읽으면서 어렵다는 생각보다는 흥미 있는 사례들과 내용들이 더 많아서 꽤 재밌게 읽었던 책이기에 데이터라는 말만 보고 읽기를 포기하지 않으면 좋을 거 같습니다. 

 

ㅣ 좋은 기획이 빅데이터의 가치를 결정!

 

지금 이 순간에도 세계 곳곳의 수많은 데이터 사이언티스트들은 빅데이터로 어떤 가치를 만들어낼 수 있을지 골몰하고, 잘 짜인 기획에 따라 데이터를 수집하여 분석한다고 합니다. 책에서는 빅데이터를 활용하여 어떤 비즈니스 가치를 창출했는지에 관한 사례들이 나오는데요. 이 사례들을 보고 나면 데이터를 활용해서 어떻게 비즈니스 가치를 창출할 수 있는 실마리를 찾을 수 있을 거 같습니다. 

 

자라는 세계적으로 유명한 패스트 패션 브랜드인데요. 기존에는 대량 생산하고 남은 것은 모두 폐기했으며 어떤 옷은 만든 수량의 10%도 팔리지 않았다고 합니다. 이는 회사에게도 엄청난 손실로 이어지고 결국 가격에 반영되어 소비자에게도 전가될 수 있는데요. 이런 이유로 패스트 패션 산업에서는 한꺼번에 대량으로 만드는 대신, 1차로 소량만 제조하여 소비자에게 공급한다고 합니다. 리테일의 끝단인 매장에서 고객의 구매내역을 데이터로 실시간으로 모니터링하는 것입니다. 이를 토대로 시장 수요에 맞추어서 2차 생산에서는 잘 판매되지 않는 디자인과 컬러, 사이즈만 더 제작하고 나머지는 만들지 않는다고 합니다. 

 

우리에게 너무나도 유명한 넷플릭스의 경우에도 데이터를 잘 활용하는 기업으로 알려져 있는데요. 특히 가입자의 콘텐츠 시청 지점까지 데이터화하여 이를 토대로 유사한 콘텐츠를 추천한다는 건 너무나도 유명해서 잘 알려진 사실인 거 같습니다. 여기에 더해서 넷플릭스가 제작해서 전 세계적으로 선풍적인 인기를 끌었던 막장 정치 드라마 <하우스 오브 카드>는 빅데이터를 활용해 훌륭한 기획을 펴낸 사례입니다. 보통은 3~4개 에피소드를 제작해서 시청자들의 반응을 본 후에 첫 시즌 제작 방영을 결정하고, 첫 시즌 성적을 본 뒤에야 두 번째 시즌 제작을 결정합니다. 그런데 넷플릭스는 이 과정을 모두 생략하고 1200억 원(약 1억 달러) 이상을 투자하여 곧바로 2개 시즌 분량의 드라마를 제작했습니다. 어쩌면 무모한 도박으로 보이지만 넷플릭스는 이미 가입자들의 시청 데이터를 분석하여 그들이 어떤 유형의 콘텐츠를 원하는지 잘 알고 있었기 때문에 곧바로 의사결정을 할 수 있었습니다 

 

위의 사례를 보고 있으면 데이터를 알고 이것을 활용한다는 것만으로도 기존에 진행되었던 비즈니스 패턴을 바꿀 수 있다는 것을 알 수 있습니다. 이것이 바로 좋은 기획이 빅데이터를 가치를 결정한 사례인 것입니다. 

 

ㅣ 시각화된 데이터를 통해서 본질을 발견

 

데이터를 단순히 숫자로만 보는 것이 아니라, 보기 쉽게 시각화 사례를 본적이 많이 있을 것입니다. "백문이 불여일견"과 "보는 것이 믿는 것이다"라는 속담은 데이터 시각화의 필요성을 잘 설명해주고 있는데요. 왜냐하면 데이터 시각화의 핵심은 눈앞의 데이터를 생생하게 드러나도록 보여주는 것이기 때문입니다. 그래서 데이터 시각화는 개인이 분석을 수행하고 주요 동향이나 이벤트를 식별해 좀 더 신속하게 의사결정을 내릴 수 있게 도와주는 기술입니다. 

 

데이터는 정보 또는 숫자를 의미하고, 시각화는 정보를 눈에 보이게 표시하는 일입니다. 데이터 시각화를 활용할 때 핵심은 복잡한 것을 간단하게 보여주는 것인데요. 대부분의 사람들은 워크시트나 스프레드시트 또는 보고서를 분석하는 것보다 차트나 그래프를 보는 것이 훨씬 쉽다고 느낄 것입니다. 또한 데이터를 차트로 표현했을 때 더 많은 양의 데이터를 일목요연하게 파악할 수 있을 것입니다. 

 

정말 유명한 간호 나이팅게일이 1858년에 장미 다이어그램을 만들었다는 사실이 뒤늦게 알려져 유명해진 사건이 있는데요. 크림전쟁 당시 야전병원에서 근무하던 나이팅게일은 부상 치료를 받다가 사망하는 병사보다 비위생적인 환경 때문에 2차 감염으로 죽는 병사가 더 많다는 것을 목격하였습니다. 그래서 이 문제의 심각성을 군당국에 알리기 위해 장미 다이어그램을 제작했고, 이 장미 다이어그램을 본 군 사령관이 야전병원의 환경개선을 위해 자금을 투입하기로 결심하고, 이로써 부상자의 사망률이 60%에서 2%로 크게 감소할 수 있었다고 합니다. 이 나이팅게일의 다이어그램은 19세기 최고의 통계 그래픽 중 하나로 꼽힌다고 합니다. 

 

ㅣ 데이터의 미래, 기계가 스스로 학습하고 분석하는 세상

 

미래의 데이터는 어떻게 변화할까요? 책에서는 기계가 인간처럼 스스로 학습하고 분석하는 세상에 관해서 이야기를 하는데요. 21세기 이후로 정말 빠른 속도로 과학기술이 발전하고 있습니다. 그리고 발전한 기술에 힘입어 현재 과학기술은 이제까지 상상할 수 없었던 새로운 차원의 발전을 도모하고 있습니다. 그 지렛대 역할은 다름 아닌 인공지능과 데이터 과학이라고 할 수 있습니다. 그 인공지능과 데이터를 통해서 인간은 지금까지 살아보지 못한 새로운 신세계에서 살아가게 될 것입니다.

 

인공지능 시대를 살아가기 위해서 우리는 무엇을 준비해야 할까요? 단기적으로는 본능적으로 인간이 못하는 문제, 즉 많은 데이터를 분석해 결론을 내리거나 판단하는 문제에 지치지 않고 편견이 없는 인공지능 기능을 적극적으로 활용하는 것입니다. 의약 분야의 치료, 법률상담, 기후예측, 교통제어, 금융투자 등입니다. 그리고 중기적으로는 출산율 저하와 고령화에 따른 생산가능 인구의 감소 문제를 해결하는 생산성 향상의 도구로 활용하는 것입니다. 새로운 일자리를 창출하기 위한 기존 인력의 재교육과 더불어 부족한 노동력을 인공지능의 자동화로 해결할 가능성에 주목할 필요가 있는 것입니다.

 

일본이나 유럽과 미국의 선진국에서는 실버세대의 심리적 안정을 위해 인공지능이 탑재된 로봇을 개발하고 있다고 합니다. 효율성이나 생산성을 넘어서 인간과 교감하면서 인류에게 도움을 주는 방향으로 활용하게 된다는 것입니다. 

 

데이터를 통한 비즈니스 가치 창출부터 데이터가 가져올 미래까지, 데이터를 통해서 실제 우리 주변에서 많은 것들이 변화하고 있다는 것을 <데이터 천재들은 어떻게 기획하고 분석할까?>를 통해서 알게 되었습니다. 그리고는 데이터는 절대 멀리 있지 않다는 것입니다. 우리 주변에 있고, 지금도 우리는 알게 모르게 데이터를 통해서 의사결정을 하고 있을 수 있습니다. 

 

출판사로부터 책을 제공받아 주관적으로 작성한 글입니다.

 

반응형