최근 4차 산업혁명의 영향으로 데이터 경제가 본격화되자 데이터를 다루는 직업에 대한 인기가 높아졌다. 각 대학은 빅데이터 관련 학과를 신설하고 있고, 기업도 데이터 관련 직군에 대한 채용 규모를 늘리고 있다. 데이터 관련 직업은 여러 가지로 나뉘지만, 그 중에서도 ‘데이터 과학자’는 ‘21세기 가장 섹시한 직업(하버드 비즈니스 리뷰)’이라고 불리며 사람들의 관심을 모으고 있다. 이에 따라 코딩을 해본 적 없는 인문계열 비전공자들도 빅데이터 관련 대학원에 진학하거나 부트캠프(특정 기관이나 기업이 인재 양성을 목적으로 만드는 단기 교육 프로그램)를 통해 ‘데이터 과학자’ 취업에 도전하는 등의 현상이 나타나고 있다.
하지만 인기가 늘어난 만큼, 소문이 무성해져 직업에 대한 거짓된 정보에 현혹되기 쉬운 상황. 지난 6월 출간된 책 『데이터 과학자 실전 노트』는 현직 종사자인 저자가 데이터 과학자의 실제 업무를 소개하고, 유능한 데이터 과학자가 될 수 있는 방법을 전달하고 있다. 그는 대학 시절 컴퓨터 공학이나 통계에 관련한 전공을 공부하지 않았으나, 현재는 토론토에서 데이터 과학자로 일하고 있다.
<독서신문>은 지난 10일 화상으로 그를 만나 데이터 과학자의 개념부터 올바른 포트폴리오를 쌓는 법까지 다양한 이야기를 들어보았다. 다음은 일문일답.
Q. 우선, 독자들에게 자기소개 부탁한다.
“안녕하세요. 『데이터 과학자 실전 노트』 저자 이지영입니다. 저는 한국에서 언론정보학을 전공하고, 외국계 홍보회사에 취업해 홍보 담당자로 일했었는데요. 유학 준비 과정에서 통계학을 공부하고 싶어 뒤늦게 캐나다에서 다시 응용통계학을 공부한 후 현재 캐나다에서 데이터 과학자로 일하고 있습니다. 통계학과 데이터 과학을 다루는 유튜브 채널을 운영하던 중, 집필 제안을 받아 책을 출간하게 되었습니다.”
Q. 데이터 과학자에 대한 말들이 많은데, 데이터 과학자는 정확히 어떤 직업인가.
“데이터 과학자는 데이터와 관련해서 여러 가지 일을 하는데요. 미가공된 데이터를 가공하고, 데이터에서 인사이트(정보)를 찾기도 하고, 데이터에서 필요한 값을 계산하기도 합니다. 그 값은 예측값일 수도 있고요. 여기서 말하는 예측값이란 기업(혹은 기관)이 어떤 의사결정을 하기 위해 사용되는 값이기도 합니다. 한마디로 데이터 과학자란 데이터에 관한 업무를 총체적으로 다루는 사람이라고 말할 수 있겠어요.”
Q. 데이터 과학자 일을 하게 된 계기는.
“원래는 홍보나 마케팅 쪽으로 유학을 준비했었습니다. 공부를 마치면 다시 이 일을 할 텐데, 그렇다면 지금 가지고 있는 내 역량에 비해서 무엇을 더 향상할 수 있을까란 생각을 했었어요. 그런데 잘 생각이 나지 않았습니다. 그래서 내가 했던 업무 중에서 무엇이 중요하고 흥미가 있었는지를 고민했습니다. 그러다가 제 업무 중 하나가 클라이언트 제품에 대해 사람들이 그 제품을 얼마나 검색했는지 모니터링 하는 작업이 있었는데, 인턴이 검색 관련 데이터를 수집하면 제가 확인 하고 클라이언트에게 보고를 했었어요. 이 작업을 매일 했는데요. 매일 하는 이유는 그만큼 중요하기 때문이라는 생각이 들었습니다. 그리고 이 중요한 부분을 구성하는 핵심요소는 결국 ‘데이터구나’라는 생각에 통계학에 관심을 갖게 되었습니다. 학교를 졸업하고, 데이터 분석가, 데이터 과학자 등 데이터 관련한 직종을 찾았고, 지금까지 이 분야로 일하게 되었습니다.”
Q. 대학에서 언론학을 전공한 비전공자 출신인데, 통계학 혹은 데이터 과학을 배우는 게 어렵지는 않았나.
“서른 살에 토론토 대학교 응용통계 학부 과정부터 다시 시작하게 되었는데요. 수능 수학을 마지막으로 10년 만에 수학을, 게다가 전 토종 한국인이라서 영어로 수학 공부하는 것이 당연히 쉽지 않았습니다. 과연 졸업할 수 있을까, 이번 학기를 끝낼 수 있을까, 난 이 과목을 끝까지 들을 수 있을까, 걱정이 앞섰습니다. 그럴 때마다 ‘난 왜 이걸 어려워할까’를 고민하곤 했는데요, 결국, ‘익숙하지 않기 때문이다!’ 라고 저만의 결론을 내렸어요. 그러니까 내가 교수님의 영어를 못 알아듣는 이유는 교수님의 영어 억양에 익숙하지 않아서고, 수학을 어려워하는 이유는 문제를 덜 풀어봐서라고 생각했던거죠. 잘 해야 한다라는 목표 대신, 익숙해지자는 목표로 공부하다 보니 무사히 졸업할 수 있었습니다.”
Q. 새로운 도전을 하는 데 어려움은 없었는지.
“나이도 30대였고, 기혼이었기 때문에 마음가짐만으로는 쉽지 않았습니다. 학비, 생활비, 자녀 계획, 졸업 후 취업까지 현실적인 질문과 대안을 많이 생각해봐야 했습니다. 특히 취업에 대한 걱정이 컸었는데요. 다행히 제가 거주하고 있는 캐나다에서 나이, 종교, 결혼 유무와 같은 질문은 이력서나 면접 과정에서 질문을 못 하게 되어 있었기 때문에, 취업에 있어서 외부 요인보다 제 능력에 따른 내부 요인이 중요하다는 걸 알고 나서 도전하기로 결심했습니다.”
Q. 실제 업무 환경에서 데이터 과학자에게 어떤 역량이 가장 중요한가.
“업무에 있어서 여러 역량이 필요하고 중요하지만 그 중 문제 해결 능력이 중요하다고 생각합니다. 데이터 과학자의 일 특성상 똑같은 일을 반복하는 경우가 흔하지 않거든요. 같은 프로젝트처럼 보일지라도 기존의 데이터가 달라지거나, 업무 목적이 달라지기도 하고요. 그래서 새로운 일을 하다 보면, 사소한 것부터 중대한 것까지 크고 작은 문제를 마주할 수밖에 없습니다. 그런데 그 문제를 매번 동료나 상사와 의논할 수 없죠. 결국 스스로 문제를 해결해야할 때가 오고, 설령 문제를 해결하지 못하더라도, 이 문제를 어떻게 이해하고, 어떻게 접근했는가, 등을 생각할 수 있어야 합니다.”
Q. 일을 잘 하는 데이터 과학자들은 대체로 어떤 사람들인가.
“데이터 과학은 다양한 업무가 포함됩니다. 그런데 한 개인이 이 모든 것을 잘한다는 게 쉽지 않다고 생각해요. 그렇다면 이렇게 다양한 업무에서, 나는 특히 무엇을 잘하는지 ‘나만의 강점’을 가지는 것이 중요해요. 결국 나만의 강점이 있는 사람이 일을 잘 하는 사람의 특징이라고 생각합니다. 어떤 지식이 될 수도 있고요, 노하우가 될 수도 있습니다. 그게 아니라면 꼼꼼함, 창의적인 접근과 같은 태도도 강점으로 꼽을 수 있습니다.”
Q. 이번 출간한 책에서 사람들이 데이터 과학자에 대해 오해하고 있는 게 있다고 했다.
“데이터를 다루는 직업 중, 데이터 분석가와 데이터 과학자를 구별하다 보면 데이터 과학자는 예측 모델을 만든다는 점이 가장 큰 특징이라 볼 수 있는데요. 그렇다 보니 이 점이 부각돼 데이터 과학자는 예측 모델을 만드는 사람으로 이해하는 경우가 있습니다.
하지만 예측 모델을 통해 특정 예측값을 얻기까지 매우 많은 과정이 필요합니다. 예측값을 계산하기 까지, 필요한 데이터를 가져오고, 그 데이터를 원하는 형태로 바꾸고, 사용할 예측 모델을 선택하고, 예측 모델을 사용했을 때 예측값이 얼마나 실제 값과 가까운지 성능을 평가해야 하고요.
또 이 과정은 개인 컴퓨터에서 이뤄지는 것이 아니라, 클라우드 환경(작업자들이 실시간으로 작업하는 온라인상의 업무 환경)에서 이뤄지기 때문에 어떤 흐름으로, 어떤 클라우드 서비스를 사용해서 구축하고, 자동화를 하고, 또 자동화된 것을 어떻게 수익화할 건지에 대해 매우 많은 논의작업이 필요합니다. 다시 말해, 데이터 과학자를 예측 모델로 예측값을 계산하는 사람이라고 정의하는 것보다, ‘총체적으로 데이터를 과학적으로 다루는 사람’이라는 정의가 더 정확할 듯합니다.”
Q. 최근 데이터 과학자가 미래의 유망 직업으로 부상하면서, 컴퓨터 공학을 전공하지 않은 사람들이 관련 학과에 진학하거나 관련 회사로 이직하는 사람들이 늘었다. 하지만 이 직업에 관해 사람들이 꿈꾸는 것과 실제는 조금 다르다는 얘기도 있다. 이와 관련해 조언 한 마디를 하자면.
“컴퓨터 공학을 전공해야 데이터 과학자가 되는 것은 아니에요. 저희 팀만 해도 수학과, 물리학과, 화학과, 통계학과 등 다양한 전공을 가진 팀원으로 구성되어 있고요. 데이터 과학 업무가 다양하기 때문에 컴퓨터 공학 출신이 잘하는 분야가 있지만, 수학이나 통계학 출신이 잘하는 분야가 있을 수 있어요. 꿈꾸는 것과 실상이 다르다는 것은 업무에 대한 오해가 있어서 그런 게 아닐까 생각합니다.
업계마다, 혹은 회사마다 데이터 과학 업무의 범위가 다를 수 있어요. 데이터 과학자로 취업했다면 내가 무엇에 실망했는지, 그래서 이 상황을 내가 바꿀 수 있는지 없는지를 쪼개가며 정리해보면 어떨까 합니다.”
Q. 대학원에서 깊이 배우는 것도 좋겠지만, 최근 데이터 과학자가 되고 싶은 사람들을 위한 부트 캠프도 생겨나고 있다.
“IT 관련 부트캠프가 많습니다. 그런데 데이터 과학자 직업만 놓고 보았을 때, 데이터 사이언스 관련한 전공을 하지 않고, 데이터 관련 경력이 전혀 없는 상태에서 부트캠프를 통해 취업할 확률은 낮습니다. 부트캠프 경험으로 취업하고자 한다면, 취업 과정에서 관련 전공자만큼 지식을 갖췄는지, 데이터 분석 및 예측 모델링에 관해 문제 해결 능력을 갖췄는지 입증해야 할 텐데요. 경쟁률이 높기 때문에 본인의 실력을 취업 과정에서 입증하는 게 쉽지 않을 수 있습니다.”
Q. 데이터 과학자가 되고 싶다면 포트폴리오는 어떻게 만드는 게 좋을까.
“포트폴리오에 대해서는 제가 책에서 다뤘는데요. 제가 책에서 강조하고 싶었던 것은, 과연 포트폴리오의 목적이 무엇인지 생각해봤으면 좋겠다는 것이었어요. 과연 내가 준비하는 포트폴리오가 취업 목적인지, 아니면 연습용인지 생각해봐야 하는데요. 개인 공부 목적으로 만든 포트폴리오를 취업 목적으로 제출할 경우, 오히려 그 포트폴리오가 함정이 될 수 있거든요. 그렇다면 취업 목적으로 하는 포트폴리오가 무엇인가를 생각해봐야 할 텐데 내가 선택한 주제에 대해 어떤 문제가 있었고, 이 문제를 해결하고자 어떻게 접근했는가, 이 부분이 꼭 들어가야 합니다.”
[독서신문 안지섭 기자]