기본 콘텐츠로 건너뛰기

데이터 과학자(Data Scientist) 김대리의 예

바로 전 칼럼에서 말했듯이 데이터 과학자는 정보의 홍수 속에서 의미있는 데이터를 발견해 내는 것이 주요 업무일 것이다. 이번에는 데이터 과학자가 비즈니스에서 옥석을 발견하는 예를 하나 소개한다.
중소업체인 A사에서 획기적인 새로운 스마트폰을 개발하였다고 치자. 해외 바이어들에게서 수출요청이 쇄도하였고 스마트폰은 날개돋힌 듯이 팔려 나갔다. 전 세계 주요 국가들에게 판매되면서 매출은 1000억원을 넘게 되었다. 여기서 A 기업의 고민이 시작되었다. A 기업은 해당 전자제품에 대한 해외 서비스를 위해서, 해외 서비스 대행 업체들과 계약을 맺었다.
일반적으로 전자제품을 구매하게되면 지불하게 되는 소비자가에는 서비스 보증에 대한 비용-워런티 (Warranty)가 포함되어 있다. 즉 통상 6개월 또는 1년 등 지정된 기간동안 소비자 과실을 제외한 제품의 불량에 대해서는 무상으로 수리 해주는 것이다. A 기업은 신제품에 대한 워런티 비용을 매출액의 약 5%(대략 50억)로 추산하고 비용을 충당해 놓았다.
그런데, 해외 서비스 대행 업체들에게서 제품 불량에 따른 무상교환 요청이 쏟아져 들어오기 시작했다. 스마트폰의 주요 부품인 LCD, 메인보드 등의 불량과 외부 케이스의 흠집 등의 제품 불량이 쏟아졌다. 이 추세라면 당초 예상했던 5%가 아닌 10% 그 이상의 비용이 발생하여 남는게 없는 장사를 하게 될 판이었다.
제조부서에는 해당 제품의 품질 불량이 그렇게 높을리가 없다고 반박하고 있다. 이에 문제를 해결하기 위해 김 대리는 밤새 사무실에서 고민하고 있었다. 우선 김대리가 가지고 있는 정보는 다음과 같다.
생산부서에서 제공한 제품에 대한 품질 정보가 있고, 해당 국가별 스마트폰의 판매 정보, 마지막으로 해외 서비스 대행 업체에서 보내온 스마트폰의 품질 불량 내역서였다. 이 품질 불량 정보에는 불량 부위와 교환 요청 원인 등에 대한 텍스트와 사진이 첨부 되어 있다. 생산부서에서 제공한 품질 정보를 바탕으로 하여 데이터를 분석해보니 아무리 보아도 품질 불량이 5%이 상으로 발생할 확률이 거의 없었다.
그래서 김 대리는 이 문제의 주요 원인으로 해외 서비스 대행 업체를 의심하게 되었다. 서비스 대행 업체가 보낸 수리 내역서를 분석해본 결과, 스마트폰 LCD와 배터리, 메인 보드 등이 한꺼번에 고장난 사례가 많았다. 생산 부서에 문의한 결과 이런 3가지 품질 불량이 동시에 한 스마트폰에서 발생할 확율은 0.001%도 되지 않는다는 답변을 받았다.
이에 김 대리는 서비스 대행 업체의 수리 내역서를 다시 한번 분석해 보았다. 서비스 센터에서는 고장 나지 않은 부품- 예를 들면 배터리-에 대해서도 허위로 청구한 다음에, 해당 부품을 시장에서 재 판매하는 것으로 추정되었다. 문제는 서비스 센터에 있는 것이 확실해 보였지만, 그렇다고 해외 서비스를 위해서 직접 사무실을 세우고 인력을 파견할 수도 없는 노릇이었다.
이에 김 대리는 다음과 같은 시스템을 제안하였다. 우선 생산부서와 판매부서, 그리고 서비스 센터에서 온 생산, 판매, 서비스 데이터를 연결하는 작업을 하였다. 그리고 서비스 센터에서 품질 보증 기간 중 제품 하자로 교환 등을 요청할 때에, 해당 제품 불량율과 판매 기록 등을 추적 가능하도록 하였다.
생산 과정에서 하자가 없던 제품이 판매된 지역에서 동일 제퓸에 대해 LCD와 메인보드 등 주요 부품에 대해 동시에 무상 교환하는 요청이 들어오면, 자동으로 해당 요청은 담당자에게 경고가 뜨게 만들어 놓고 해당 제품의 사진을 찍어 전송하고, 불량 제품을 반드시 한국에 보내도록 하였다. 또한 공장에서 제시한 제품 불량율보다 현저하게 높은 불량을 갖고 있는 서비스 센터에는 현지의 영업 주 재원이 직접 서비스 센터를 방문하여 불량 제품에 대해서 수거하도록 하였다.
이를 통해 서비스 계약을 맺은 서비스 센터의 품질 불량에 따른 수리 요청이 획기적으로 줄어들게 되었으며, 서비스 청구 비용이 30억원 정도 절감되는 효과를 볼 수 있었다. 이 모든 것이 김 대리가 제안한 3억도 되지 않는 데이터 분석 시스템으로 가능하게 되었다. 김 대리는 사장님의 총애를 받고 다음해 승진한 것은 물론이다.
사례에서 소개한 김대리의 예와 같이 기업의 데이터들은 과거와 달리 내부와 외부(협력 업체 등)에 산재해 있고, 데이터의 종류도 정형 데이터 뿐 아니라, 텍스트나 사진 등과 같은 비정형 데이터도 많이 발생하고 있다. 이러한 비정형 데이터를 효과적으로 정형 데이터와 결합하여 의사 결정을 하는 것이 중요하며, 무엇보다 해당 업무를 전체적인 관점에서 파악하고 데이터를 정제하고 결합하여 그 중에 의미있는 옥석을 가려내 어 의사 결정에 활용하는 것이 데이터 과학자의 핵심 역량이라고 말할 수 있겠다.

댓글

이 블로그의 인기 게시물

한우물 정수기 사용기 - 단점

일전에 정수기에 대해서 조사하고 포스팅한 적이 있는데, 계획과는 달리 여러 이유로 한우물 정수기를 쓰게 되었다. 한우물 정수기는 오래전부터 들었던 제품인데 중공사막식 필터를 사용하며, 전기 분해로 약알칼리수를 만드는 제품이다. 이런 종류는 대표적으로 암웨이의 이스프링 정수기나 한우물 등이 시중에서 유일하게 유통되는 것으로 알고 있다. 한우물 정수기를 쓰는 지인들도 있고, 최근 실험결과에서도 약 알칼리수가 몸에 좋다는 것은 방송에서도 익히 알려져 있어서 주저함 없이 사용하기로 하였다. 심지어 모 소주회사도 약알칼리수를 사용해서 술맛이 좋다고 선전하기도 한다. 그만큼 믿음도 갔다. 하지만 의외로 문제가 발생했다. 우리 집은 서울에서도 많은 인구가 모여사는 곳으로, 지금 있는 아파트만도 가구수가 천가구가 넘는다. 시음용으로 한우물을 신청해보고 가족이 동의하여서 설치하여 사용하였다. 그런데 시음했던 물맛과는 정수기에서 나오는 물맛이 전혀 달랐다. 그리고 약 일주일간 물을 마시면 비릿한 맛과 넘길때 느껴지는 껄끄러움이 있었고 며칠간 가족들이 공통적으로 배가 아팠다. 때문에 한우물에 전화로 몇번 이야기도 했지만 돌아오는 답은 시음수와 실제 물 맛은 다를수 있다는 답 뿐이었다. 약간 황당했다. 시음수와 다른 물맛이라면 시음수를 보내는 이유가 무엇이란 말인가? 어째든 다시 부탁드려서 한우물 직원분이 직접와서 정수기 물을 채취하여 가서 조사하기로 하였다. 그리고 약 일주일 후 받은 답은 내가 사는 아파트의 수도물이 특이하게도 칼슘 성분이 보통 수돗물보다 배나 많아서 정수기에서 그런 성분때문에 문제가 되었다는 답이다. 즉 원수인 수도물에 칼슘이 과다한데 정수기에서는 칼슘이 과다하거나 한 경우에 거르지 못한다는 말이었다. 이를 해결하기 위해서 추가로 양이온수지라는 필터를 추가로 달라고 권하였다. 이후 몇번의 이야기 끝에 원하면 환불을 받기로 하였다. 하지만 수천가구가 밀집해 있

영화 로보캅 2014에서

로보캅은 예전에 참 재미있게 보았던 영화이다. 특히 대학시절에 영화 평론에 대한 특강에서 영화 보는 법에 대해서 강의를 들은 적이 있었다. 그 당시 로보캅 I, II, III 까지 나왔는데 시리즈를 거듭할 수록 로보캅의 적이 달라지는데 일본의 사무라이 무사 로봇이 나와서 로보캅을 곤경에 빠트리는 것이 3편에 나온걸로 기억한다. 이러한 배경에는 미국인들이 당시 소니를 중심으로 거세게 미국 시장을 점령하고 있던 강해만 가는 일본에 대한 두려움이 깔려 있다는 교수님의 해설을 들은 기억이 지금도 생생하다. 이번 로보캅 2014는 인기를 끄는데는 실패했고, 더군다가 막판에는 겨울왕국에 묻혀서 존재감도 거의 없었다. 스토리 뼈대도 변한것이 없다. 어떻게 보면 전작의 리메이크 작품이라고 할 수 있겠다. 하지만 거의 죽다가 기계인간으로 되 살아난 경찰 알렉스 머피가 자신이 여전히 인간이라고 주장하다가, 데넷 박사가 그의 남아 있는 모습을 수트를 하나하나 분해하면서 보여주자 머피는 눈물을 흘리는데 이 대목에서 감독이 전하고자 하는 영화는 액션이 아니라 어떻게 보면 철학문제라고 생각한다. 자신의 인간으로서 남아 있는 모습을 보면서 닭똥같은 눈물을 흘리는 머피의 모습이 보이는가? 확실히 로보캅은 액션영화이긴 하지만 사실은 다른 문제를 건드리고 있다. 인간 정체성의 문제이다. 이제 웨어러블 컴퓨팅이다 모다 하면서 이제 인간이 스스로 기계를 입는 시대가 오고 있다. 한편에서는 인공 신장 등 장기를 만들고 있고, 또 한편에서는 뇌와 인터페이스가 가능한 새로운 기기들 개발에 한창이다. 십년 이십년 후에 머피와 같은 사람이 탄생하지 않으리라는 법이 없다. 영화는 항상 시대를 한발 앞서 가니까. 나의 정체성은 내가 갖고 있는 육체에서 비롯될 것인가? 아니면 나의 기억에서 비롯될 것인가? 아니면 보이지 않는 나의 영혼인가?

일명 노인학대 - 윈도우 8, 윈도우 10과 NC110 넷북으로 잘 살아보기

요새 나에게 소소하게 즐거움을 주는게 있다. 바로 4년이 넘게 쓰고 있는 넷북이다. NC110 이라고 이젠 보이지도 않는 넷북인데 아톰 CPU에 하드는 200기가로 구매 당시 30만원이 안되는 가격에 산것 같다. 한때는 팔려고 했지만 중고나라에서도 팔리지가 않아 그냥 방치했다가 다시써보니 만족감이 상당하다. 왜 이런일이 벌어질까? 원래 PC는 시간이 지날수록 성능이 떨어지기 마련이다. 과거 마이크로소프트와 인텔 그리고 PC 제조사들은 소위 말하는 스펙 장사로 떼돈을 벌었다. 윈도우 버전이 올라갈수록 특히 윈도우 95부터 심했다. 98, 2000, XP 윈도우 버전이 올라갈수록 CPU와 램 요구는 높아져갔고 사실 윈도우 95나 윈도우 10이나 일반인들이 하는 일은 인터넷과 오피스 문서 작성이 대부분인데도 업그레이드를 위해서 수백만원을 써야했다. 그런데 아이폰을 시작으로 스마트폰이 세상을 휩쓸면서 데이터는 클라우드에 저장되는 것이 대세가 되면서 PC나 스마트폰은 인터넷으로 연결만되 있으면 되는 세상이 오자 PC는 데이터의 저장소라기 보다는 어찌보면 인터넷을 연결하는 단말기의 역할만 남게 되었다. 그러다보니 마이크로소프트도 어쩔수 없는지 윈도우 8부터 모바일 운영체제로도 통합되면서 윈도우가 확실하게 가벼워졌다. 덕택에 이 오래된 넷북에 윈도우 8, 혹은 윈도우 10을 깔아도 날아간다. 책쓰거나 문서 작업에 아무 불편함이 없는 정도가 된 것이다. 물론 여기서 약간의 팁이 있다. 브라우저는 가벼운 불여우(파이어팍스)를 쓰고, 불필요한 프로그램들은 쓰지 않는다. 드랍박스에 문서를 담아 다니니 오래된 놋북도 다시 사용을 생각해 볼만한 시대가 온 것 같다. 도난의 걱정도 적고, 가볍고, 아톰 CPU라 배터리도 하루종일간다. 이만하면 여행갈때 가볍게 까페에서 친구를 기다릴 때 책 한권 들고가는 기분으로 아주 쓸만하다. 이 넷북은 2년전엔 45일간의 유럽 여행에서 사진의 든든한 백업 역할도 했다. 그러고보니