기본 콘텐츠로 건너뛰기

빅 데이터 시대와 데이터 과학자(Data Scientist)


IT는 기술의 발전에 따라 혁신과 변화를 거듭해 왔다.
70년대 메인 프레임에 기만한 최초의 컴퓨터 시대가 출범한 이후 메모리, CPU, 하드 디스크 등의 제조 기술이 급속도로 발전하면서 80년대에 개인용 컴퓨터시대가 시작되었다. 인터넷이 확산되면서 모든 컴퓨터가 네트워크에 연결되고 90년대 들어서 기업용 애플리케이션이 본격적으로 확산되었다.
최근에는 애플의 아이폰 등장 이후 스마트폰이 폭발적으로 확산되고 네트워크 접속 비용과 하드웨어 제조 단가가 비약적으로 낮아지면서 자동차, 가전 등 모든 기기에 인터넷이 연결되어 정보 시스템이 일상의 모든 환경에 적용되고 있는 유비쿼터스 시대에 진입했다. 스마트폰, 센서 등이 일상화되면서 정보의 종류와 양이 과거와는 비교조차 할 수 없을 정도로 급격하게 늘고 있다.
이러한 IT의 확산에 따라 급격하게 늘어나는 데이터를 일명 빅데이터라고 한다. 물론 빅데이터에 대한 정의는 여러 측면에서 할수 있겠다. 그러면 이러한 빅데이터는 정말 큰 이슈일까?
구글 트렌드 분석에 의하면 빅데이터는 2011년 이후 급속하게 검색이 증가하고 있다. 그리고 사회에서 빅데이터가 이슈가 되고 있는 지역은 인도, 한국, 미국 순이다.
미국은 소프트웨어 강국이니 말할것도 없지만 그 외 국가의 경우 인도와 한국에서 큰 이슈가 되고 있는 것은 흥미로운 사실이다.조금 오버하자면 필자 개인적으로는 이제는 듣기 싫을 정도로 너무 많이 들어서 Big 소리만 들어도 질릴 지경이다. 한국의 경제연구소와 대학 논문, 정부 기관에서 빅데이터에 대해서 하루가 멀다하고 리포트와 보고서를 쏟아내고 있으니 말이다.
그렇다면 정말 빅데이터를 기업 입장에서는 어떻게 해야 할까?
경험상 먼저 두가지만 이야기하고 싶다. 우선 요즘 기업 중에 빅데이터가 중요하다고 IT 벤더를 불러다 놓고 빅데이터 솔루션으로 시스템을 구축해달라고 이야기하는 사람은 없을 것이다. 정말 중요한 것은 새 집을 짓는 것이 아니고 내가 이미 갖고 있는 것을 잘 돌아보는 일이다.
기존에 갖고 있는 데이터를 돌아보자. 정보화 사회로 진입한 이후 기업은 고객에 대한 데이터를 오랫동안 쌓아두고 있었다. 이제는 이 데이터를 새로운 시각으로 재해석하는 것이 필요한 시점이다. 기술의 발달로 저렴한 비용으로 대용량의 데이터에 대한 처리와 분석 기술이 가능해졌다.
기존의 데이터를 분석하고 재해석하는 것은 기업이 생각지도 못했던 새로운 사실이나 흥미를 끄는 고객에 대한 의미 있는 정보를 만들어 낼 수 있다. 예를 들어 미국의 대표적인 유통점인 Target(사)는 핵심 고객을 발굴하고 유지하는 것이 기업의 생존과 직결되는 것을 인지하고 출산을 앞둔 부모를 고객으로 확보하기 위해 자사의 데이터를 새롭게 분석하였다.
자사의 매출 데이터를 통하여 신생아를 갖은 부모들의 구매 패턴을 분석한 결과 고객의 구매 행태의 변화를 추적하여 ‘임신의 신호’를 포착하는 것이 가능하다는 것을 확인하였다.
예를 들어 임신 초기 20주에는 칼슘과 마그네슘이 많은 영양 보조제를 다량으로 구매하는 경향이 있으며, 임신 중기에 무향 로션을 다량 구매하며, 출산일이 다가오면 평소와 다르게 많은 무향 비누와 손 세정제, 신생아 소독용 코튼볼을 구매하는 등 구매 패턴에 따른 약 25개의 ‘신호 상품’을 발견하였다. 결과적으로 예비 부모의 구매 패턴을 파악하여 신생아의 출산 시기까지도 높은 확률로 예측이 가능하다는 것을 확인하였고, 임신 초기의 예비 부모들을 대상으로 캠페인 활동이 가능해졌다.
그래서 엄마도 모르는 딸의 임신 소식을 Target(사)는 알고 있다는 이야기까지 나돌았다.
-데이터 전문 인력의 중요성(Data Scientist) 
잠간 소개한 Target(사)의 사례와 같이 빅데이터의 핵심은 IT 솔루션이 아니라 방대한 데이터를 이해하고 분석하고 데이터 가운데서 의미 있는 정보를 가져올 수 있는 사람이다.
나중에 기회가 되면 소개하겠지만, 사실 요즘 뜨는 이 데이터 과학자(Data Scientist)만큼 노가다도 없다. 엄청난 데이터를 가지고 이리저리 뜯어보고 생각해보면서 그 정보에서 새로운 의미있는 가치를 빼내는 작업은 광산에서 금캐는 노동과 필적할 만한 지식 노동이라고 할 수 있을 것이다.
아무튼 기업 입장에서는 이러한 인력이 꼭 필요할 것이다. 과거 PC시대에는 하드웨어 제조 경쟁력이 경쟁 우위의 원천이었고, 현재 스마트 시대에는 소프트웨어가 경쟁력의 핵심이지만 그 다음은 Data 라고 말할 수 있다. 후기 정보화 시대에는 데이터를 소유하고 있고 제대로 분석할 수 있는 역량을 갖는 것은 새로운 핵심 역량으로 떠오를 것이다.
개인적으로는 데이터 분석 전문 인력이 기업 내에서 큰 각광을 받을 것으로 예상된다. 기업에서는 이런 인력을 키워야 할 것이다. 알고보면 그 인력이 하는 일은 고도의 지식 노동 이겠지만 말이다.

댓글

이 블로그의 인기 게시물

한우물 정수기 사용기 - 단점

일전에 정수기에 대해서 조사하고 포스팅한 적이 있는데, 계획과는 달리 여러 이유로 한우물 정수기를 쓰게 되었다. 한우물 정수기는 오래전부터 들었던 제품인데 중공사막식 필터를 사용하며, 전기 분해로 약알칼리수를 만드는 제품이다. 이런 종류는 대표적으로 암웨이의 이스프링 정수기나 한우물 등이 시중에서 유일하게 유통되는 것으로 알고 있다. 한우물 정수기를 쓰는 지인들도 있고, 최근 실험결과에서도 약 알칼리수가 몸에 좋다는 것은 방송에서도 익히 알려져 있어서 주저함 없이 사용하기로 하였다. 심지어 모 소주회사도 약알칼리수를 사용해서 술맛이 좋다고 선전하기도 한다. 그만큼 믿음도 갔다. 하지만 의외로 문제가 발생했다. 우리 집은 서울에서도 많은 인구가 모여사는 곳으로, 지금 있는 아파트만도 가구수가 천가구가 넘는다. 시음용으로 한우물을 신청해보고 가족이 동의하여서 설치하여 사용하였다. 그런데 시음했던 물맛과는 정수기에서 나오는 물맛이 전혀 달랐다. 그리고 약 일주일간 물을 마시면 비릿한 맛과 넘길때 느껴지는 껄끄러움이 있었고 며칠간 가족들이 공통적으로 배가 아팠다. 때문에 한우물에 전화로 몇번 이야기도 했지만 돌아오는 답은 시음수와 실제 물 맛은 다를수 있다는 답 뿐이었다. 약간 황당했다. 시음수와 다른 물맛이라면 시음수를 보내는 이유가 무엇이란 말인가? 어째든 다시 부탁드려서 한우물 직원분이 직접와서 정수기 물을 채취하여 가서 조사하기로 하였다. 그리고 약 일주일 후 받은 답은 내가 사는 아파트의 수도물이 특이하게도 칼슘 성분이 보통 수돗물보다 배나 많아서 정수기에서 그런 성분때문에 문제가 되었다는 답이다. 즉 원수인 수도물에 칼슘이 과다한데 정수기에서는 칼슘이 과다하거나 한 경우에 거르지 못한다는 말이었다. 이를 해결하기 위해서 추가로 양이온수지라는 필터를 추가로 달라고 권하였다. 이후 몇번의 이야기 끝에 원하면 환불을 받기로 하였다. 하지만 수천가구가 밀집해 있

영화 로보캅 2014에서

로보캅은 예전에 참 재미있게 보았던 영화이다. 특히 대학시절에 영화 평론에 대한 특강에서 영화 보는 법에 대해서 강의를 들은 적이 있었다. 그 당시 로보캅 I, II, III 까지 나왔는데 시리즈를 거듭할 수록 로보캅의 적이 달라지는데 일본의 사무라이 무사 로봇이 나와서 로보캅을 곤경에 빠트리는 것이 3편에 나온걸로 기억한다. 이러한 배경에는 미국인들이 당시 소니를 중심으로 거세게 미국 시장을 점령하고 있던 강해만 가는 일본에 대한 두려움이 깔려 있다는 교수님의 해설을 들은 기억이 지금도 생생하다. 이번 로보캅 2014는 인기를 끄는데는 실패했고, 더군다가 막판에는 겨울왕국에 묻혀서 존재감도 거의 없었다. 스토리 뼈대도 변한것이 없다. 어떻게 보면 전작의 리메이크 작품이라고 할 수 있겠다. 하지만 거의 죽다가 기계인간으로 되 살아난 경찰 알렉스 머피가 자신이 여전히 인간이라고 주장하다가, 데넷 박사가 그의 남아 있는 모습을 수트를 하나하나 분해하면서 보여주자 머피는 눈물을 흘리는데 이 대목에서 감독이 전하고자 하는 영화는 액션이 아니라 어떻게 보면 철학문제라고 생각한다. 자신의 인간으로서 남아 있는 모습을 보면서 닭똥같은 눈물을 흘리는 머피의 모습이 보이는가? 확실히 로보캅은 액션영화이긴 하지만 사실은 다른 문제를 건드리고 있다. 인간 정체성의 문제이다. 이제 웨어러블 컴퓨팅이다 모다 하면서 이제 인간이 스스로 기계를 입는 시대가 오고 있다. 한편에서는 인공 신장 등 장기를 만들고 있고, 또 한편에서는 뇌와 인터페이스가 가능한 새로운 기기들 개발에 한창이다. 십년 이십년 후에 머피와 같은 사람이 탄생하지 않으리라는 법이 없다. 영화는 항상 시대를 한발 앞서 가니까. 나의 정체성은 내가 갖고 있는 육체에서 비롯될 것인가? 아니면 나의 기억에서 비롯될 것인가? 아니면 보이지 않는 나의 영혼인가?

일명 노인학대 - 윈도우 8, 윈도우 10과 NC110 넷북으로 잘 살아보기

요새 나에게 소소하게 즐거움을 주는게 있다. 바로 4년이 넘게 쓰고 있는 넷북이다. NC110 이라고 이젠 보이지도 않는 넷북인데 아톰 CPU에 하드는 200기가로 구매 당시 30만원이 안되는 가격에 산것 같다. 한때는 팔려고 했지만 중고나라에서도 팔리지가 않아 그냥 방치했다가 다시써보니 만족감이 상당하다. 왜 이런일이 벌어질까? 원래 PC는 시간이 지날수록 성능이 떨어지기 마련이다. 과거 마이크로소프트와 인텔 그리고 PC 제조사들은 소위 말하는 스펙 장사로 떼돈을 벌었다. 윈도우 버전이 올라갈수록 특히 윈도우 95부터 심했다. 98, 2000, XP 윈도우 버전이 올라갈수록 CPU와 램 요구는 높아져갔고 사실 윈도우 95나 윈도우 10이나 일반인들이 하는 일은 인터넷과 오피스 문서 작성이 대부분인데도 업그레이드를 위해서 수백만원을 써야했다. 그런데 아이폰을 시작으로 스마트폰이 세상을 휩쓸면서 데이터는 클라우드에 저장되는 것이 대세가 되면서 PC나 스마트폰은 인터넷으로 연결만되 있으면 되는 세상이 오자 PC는 데이터의 저장소라기 보다는 어찌보면 인터넷을 연결하는 단말기의 역할만 남게 되었다. 그러다보니 마이크로소프트도 어쩔수 없는지 윈도우 8부터 모바일 운영체제로도 통합되면서 윈도우가 확실하게 가벼워졌다. 덕택에 이 오래된 넷북에 윈도우 8, 혹은 윈도우 10을 깔아도 날아간다. 책쓰거나 문서 작업에 아무 불편함이 없는 정도가 된 것이다. 물론 여기서 약간의 팁이 있다. 브라우저는 가벼운 불여우(파이어팍스)를 쓰고, 불필요한 프로그램들은 쓰지 않는다. 드랍박스에 문서를 담아 다니니 오래된 놋북도 다시 사용을 생각해 볼만한 시대가 온 것 같다. 도난의 걱정도 적고, 가볍고, 아톰 CPU라 배터리도 하루종일간다. 이만하면 여행갈때 가볍게 까페에서 친구를 기다릴 때 책 한권 들고가는 기분으로 아주 쓸만하다. 이 넷북은 2년전엔 45일간의 유럽 여행에서 사진의 든든한 백업 역할도 했다. 그러고보니