빅데이터 실제 활용 사례

0

빅데이터를 잘 활용하면 실제 비즈니스 환경에서 고객 대응 및 새로운 시장 창출과 지속가능한 경영에도 큰 도움을 받을 수 있다. 빅데이터는 단순히 수집 분석 툴에 의지해 그 결과만 놓고 문맥을 파악할 수는 없다. 정성적 데이터를 정량적 데이터를 해석해 반영하는 노하우가 필요하다. 이에 빅데이터 실제 활용 사례를 통해 어떻게 문제점에 대처하고 해결할 수 있었는지 알아보고자 한다.

뉴욕시의 회색 정글 도시에서 일어난 일

뉴욕은 콘크리트와 유리로 이뤄진 도시 정글이다. 그런데 같은 정글이라고 하더라도 뉴욕 시민들은 녹색 나무를 좋아한다. 회색 건물 안에 오아시스처럼 자리 잡은 공원은, 그러한 이유로 뉴욕 시민들의 사랑을 한 몸에 받고 있다.

뉴욕에는 전부 250만 그루의 나무가 있다. 뉴욕 시민은 나무를 사랑하지만, 반대로 뉴욕 시 공원관리소 입장에서는 나무가 큰 골칫거리였다. 종종 나무로 인해 사고가 발생했기 때문이다. 2009년에서 2010년 사이에 센터럴파크에서만 4명의 행인이 떨어지는 나무에 부딪쳐 사고를 당했다. 그중에는 2010년 6월 나뭇가지에 깔려 목숨을 잃은 생후 6개월 가량의 어린 아이도 있었다.

이런 사고가 이어지자 수목전문가들은 “나뭇가지에 기타 작업을 해주는 것이 나무를 더욱 건강하게 하고 악천후를 잘 견딜 것”이라며 “이것이 결국 나무로 인한 부상이나 재산 피해 등을 막을 수 있는 방법”이라고 설명했다 그러나 이것은 잘 알려진 상식일 뿐이었다. 이를 뒷받침할 연구 결과나 데이터는 아직 전무한 상황이었다.

마침내 뉴욕시는 기계학습 레버리징에서 인과관계에 착안한 해법을 찾았다. 단순히 나무에 가지치기를 해주면 나무로 인한 피해 횟수가 줄어들까? 우선 도시의 한 블록을 기본 단위로 설정했다. 또 나무 가지치기를 위해 관련 부처에서 비상시에 직원을 보내야 하는 횟수가 22% 가량 줄어든다는 사실도 확인했다. 즉, 가지치기를 한 블록 진행한 경우 이듬해 위험 사고가 22% 낮은 것으로 나타났다. 이런 구체적인 정보가 나온 것은 처음이었다. 어느 블록을 먼저 가지치기할 것인지도 정해졌다.

공원관리소 관계자와 상의해 어느 정도 자원투입이 가능한지 결정했다. 가지치기 단계에서는 구체적으로 애널리틱스를 사용해 1단계에서는 한 블록의 리스크 프로파일을 만들었다. 나무의 개체 수와 종류, 그 블록이 홍수 위험지역인지, 폭풍 위험지역인지 등의 정보를 파악했다. 그리고 전부 답을 구했다.

넘쳐 흐를 정도의 데이터 관리는 어떻게?

2010년 에픽 어드버타이징(Epic Advertising )과 코넥서스(Connexus)는 인수합병을 통해 에픽 미디어 그룹(Epic Media Group)으로 탈바꿈했다. 당시 이 두 기업은 합병으로 인한 방대한 데이터로 골치를 썩고 있었다. 이들 기업의 인프라는 구식이었으며, 어떤 조치를 취해야 할지 고민하고 있었다. 수많은 데이터가 임원들의 책상에 쌓여만 가고 있었다. 애널리스트들이 어떤 광고 캠페인을 계획해야 할 경우 그들은 IT팀에 이를 확인해줄 것을 거듭 요청했다. 또 광고 관련 소비자 행동 세부사항을 파악하는 작업이 완벽히 이뤄지지 않았다.

이와 같은 문제는 이 기업의 운용에 많은 어려움을 끼쳤다. 그래서 이 기업의 한 임원은 애널리틱스 툴을 이용해 어떤 데이터가 효과적이고, 어떤 데이터가 제 기능을 제대로 발휘할 수 없는지 확인하기 시작했다. 결국 이들은 새로운 인프라 테크놀로지 평가 작업에 착수했다. 이 과정에서 확장성(네트워크 퍼포먼스를 최대한 발휘하면서 훼손하지 않고 서브와 스토리지를 추가하는 것)을 우선 고려했다.

질문과 응답이 신속하게 이뤄질 수 있도록 했다. 데이터가 두 배 증가했을 경우 이를 처리하는 데 소요되는 시간은 역시 두 배로 증가한다. 그러나 하드웨어도 두 배로 늘린다면 시간은 결코 늘지 않을 것이라 자신했다.

에픽 미디어가 추진한 코넥서스 프라이빗 클라우드 인프라(Connexus private cloud infrastructure) 개발 계획에는 버티카(Vertica)의 데이터 웨어하우스(data warehouse )와 마이크로스트레티지(Microstrategy)의 비즈니스 인텔리전스 소프트웨어, 그리고 조이엔트(Joyent)의 네트워크와 컴퓨팅, 스토리지 플랫폼이 사용됐다. 이들 기업은 버티카에 기반해 가동되는 전용 예측 모델링(predictive modeling) 애플리케이션을 구축하기도 했다.

확보된 프로세싱 파워(processing power)와 전용 툴을 통해 에픽 미디어는 고객에게 캠페인 개발에 활용할 수 있는 각종 정보나 광고를 보는 고객들에 대한 분석 정보들을 제공할 수 있게 됐다.

그럼에도 빅데이터를 기업이 잘 활용하기 어려운 이유

흔히 기업은 데이터의 중요성은 강조하지만 이에 대한 활용 범위는 극히 제한적이다. 활용하고자 하는 목적 역시도 마찬가지다. 실제로 어렵게 수집한 데이터를 어떻게, 어느 부서에서 활용해야 하는지 잘 아는 곳은 드물다.

최근 미국 현지에서 250명 이상의 직원을 둔 중견기업과 2,500명 이상의 직원을 둔 기업 등 1,800여곳을 대상으로 빅데이터 활용에 대한 설문을 진행했다. 최종 결론은 이랬다. 효과적으로 빅데이터를 활용하지 못한다는 우려가 현실이었음이 확인된 것이다. 데이터는 디지털 경제의 혈액과 같다. 데이터는 기업에 있어 디지털 비즈니스의 통찰을 주고, 결정을 돕고, 관계를 강화한다. 데이터는 또한 살 수도, 팔 수도, 심지어 도난도 당할 수 있다 이 모든 상황은 데이터에 가치가 있을 때 일어날 수 있는 상황이다.

그런 데이터를 잘 활용하지 못하는 이유는 다음과 같다. 첫 째, 데이터 전략의 부재다. 조사 결과 참여 기업의 3/4가 경쟁우위를 점하기 위해 데이터 활용 기술과 능력이 전무한 것으로 나타났다. 게다가 4곳 중 3곳에서는 데이터 분석가조차 없었다. 이 문제는 IT업계에서만 일어나는 일은 아니다. 데이터 이해부족 현상은 제조와 엔지니어랑, 제약분야, 금융, 법률, 보험, 에너지, 하물며 의료분야까지 걸쳐서 나타났다.

데이터에 대한 기업의 일반적인 의식과 데이터 중요도에 대한 이해, 기업이 데이터 주도 목표에 얼마나 부합하는지, 데이터로부터 가치를 얻는 데 필요한 능력과 도구 등 종합적으로 부족한 것으로 분석됐다.

데이터의 중요성은 대부분의 기업이 인지했지만, 이를 당연시 여기거나 혹은 부산물 정도로 여기는 경우가 많았다. 그런 생각은 재난이 닥치면 알게 된다. 일부 기업은 데이터를 회사 전체에 적용해야 할 중요한 자원이 아닌, IT와 데이터 아키텍트의 책임으로만 보는 경우도 있었다.

데이터 분석전문가, 꼭 필요할까?

데이터 분석전문가를 채용하거나, 혹은 애널리틱스 전담 부서를 꼭 신설해야만 하는 것일까. 그 전에 먼저 검토해야 할 일이 있다. 바로 애널리틱스를 통해 무엇을 달성하고자 하는지 파악하는 것이다. 기업마다 데이터 분석을 통해 기대하는 바가 다를뿐더러 최고의 데이터 전략은 전체 미션과 사업 목표에 달렸기 때문이다. 이는 모든 회사에 데이터 전담 부서가 필요한 것은 아니고, 대산 현재 직원들의 능력을 최대한 활용할 수 있음을 시사한다. 바로 애널리틱스 교육과정과 야간 수업 등 관련 교육 이수 방법 등을 통한다.

또한 최고 디지털 전문가가 만병통치약이라는 사실도 버려야 한다. 수요와 공급 딜레마도 있겠지만, 모든 조직에는 그에 맞는 유능한 인력이 충분하지 않기 때문이다. 충분히 만들어 질 수 있는 사항이다.

이제 시대가 변화하고 있다. 기업이 생존할 수 있는 툴과 환경도 변화하고 있다. 진보적인 기업이 되고, 시대의 변화에 능동적으로 대처하기 위해서는 그에 맞는 자원을 잘 활용하는 것이 중요하다. 데이터 분석과 전문가 양성도 마찬가지다.

 

페이스북으로 댓글을 달아주세요!

About Author

국내 모바일 산업과 창업 생태계를 응원합니다. 모바일 트렌드에 대한 전문 컬럼을 기고하거나 유망한 스타트업을 소개하고 싶으시면 연락바랍니다. 적극 수용하겠습니다~♥

댓글 남기기