[여러가지 시도]/빅데이터

산업분야의 빅데이터 활용은?? (경영 빅데이터 분석사 공부 中)

시간 확보러 2017. 12. 23. 07:58
728x90

안녕하세요. 아프락사쓰입니다.

 

빅데이터는 정치, 사회, 의료, 물류등 많은 분야에서 유용하게 사용되어지고 있습니다.

이번 포스팅에서는 빅데이터는 과연 산업분야에서 어떤 방식으로 활용이 되고 있는지 알아 보도록 하겠습니다.

 

1. 빅데이터 애널리틱스

 

빅데이터라는 단어도 아직 적절한 번역이 없듯이 애널리틱스 역시 적당한 우리말이 없는 단어이다. 애널리틱스는 "기업이나 조직의 문제를 컴퓨터 기술, OR(Operational Research) 또는 통계학을 이용하여 문제를 해결하는 응용"이라고 정의하며 분석과학으로 설명하기도 한다. 빅데이터 분석을 통하여 전에는 알지 못하던 새로운 사실을 발견하거나 새로운 통찰력을 제공한다는 것이 큰 의미를 갖는다.

 

빅데이터가 아니라도 우리 주위에서 애널리틱스의 사례를 찾아볼 수 있다. 대부분의 기업은 상품이나 서비스를 제공하는 웹 방문자의 특성을 분석한다. 비교적 쉽게 얻을 수 있는 정보는 시간별, 날짜별 방문자 수, 지역별 방문자 정보, 방문자가 머문 페이지 정보, 방문에 사용한 기기, 사용한 브라우저 등의 정보이다. 구글의 경우 웹 페이지에 구글 사이트와 연결되는 코드를 추가하면 해당 웹 페이지 접속정보를 시계열, 지역별, 페이지 간 연결 구조 등을 시각화하여 제공하는 구글 애널리틱스라는 서비스를 제공하고 있다.

 

 

2. 구글 트렌드 분석 사례

 

구글이 제공하는 서비스로 구글 트렌드가 있다. 구글의 검색 시스템을 사용하여 검색에 등장하는 단어를 지역별, 시계열별로 분석하여 보여주며 예를 들어 독감을 의미하는 "Flu"라는 단어가 검색된 빈도를 그래프로 그린 것은 실제 독감환자의수와 거의 일치한다. 일반적인 검색어 사용이 가능하기에 소비자의 관심을파악할 수 있어 이러한 기능을 확장할 경우 소비자의 기호 변화를 쉽게 파악할 수 있음을 보여준다.

 

국내의 경우 국회의원의 본회의 투표기록에 기반하여 국회의원의 토표성향을 분석하고 그 결과를 인터랙티브 비쥬얼라이제이션 기법을 사용한 폴리티즈라는 웹사이트가 있다 사용된 데이터의 크기는 빅데이터 수준은 아니지만 새로운 마이닝 기법을 사용하고 인터랙션 기능을 추가한 차세해 애널리틱스의 예로 볼 수 있다

 

 

3. 빅데이터를 활용한 비즈니스 의사결정 및 고객맞춤 서비스

 

온라인이 사람들이 정보를 생산하고 교류하는 주된 공간이 됨에 따라 소비자들의 온라인상에서의 활동에 대한 기업들의 관심이 커지고 있다. 인터넷 사용자의 대부분은 제품이나 서비스를 구매하기 전에 온라인에서 관련 정보를 찾아보고 비교하는 과정을 거친다. 빅데이터 분석은 비즈니스 의사결정과 고객맞춤 서비스 제공에 큰 기여를 하고 있다.

 

1) 쉽고 편한 소비자 분석의 원천, 검색 데이터

온라인 활동으로부터 생성되는 수많은 데이터를 통해 소비자를 이해하려는 노력이 다양한 방법으로 시도되고 있다. 온라인 뉴스 클릭 수를 분석하거나 트위터, 페이스북 등 SNS에서 소비자들이 주고 받는 이야기들을 분석하는 텍스트 마이닝 방법 등이 그것이다. 뉴스 클릭 데이터 분석, SNS 텍스트 분석은 소비자의 관심사를 파악하는 데 중요한 소스가 되고 있다.

하지만 이와 같이 방대한 SNS 빅데이터를 획득하고 분석하는 데는 많은 제약이 따른다. 대부분의 경우 데이터를 생산하는 포털, 검색 업체들만 접근과 분석이 가능하기 때문이다. 또한 SNS 텍스트 분석의 경우 데이터를 획득, 저장, 관리하는 서버 구축에 상당히 큰 비용이 요구될 수 있으며 대부분 자연어로 되어 있는 SNS 빅데이터를 분석하는 기술은 아직 미흡한 실정이다. 따라서 SNS분석의 필요성에도 불구하고 기업 실무자들은 높은 진입 장벽을 경험하곤 한다.

반면, 검색 데이터는 누구나 자유롭게 접속하여 분석하는 것이 가능하다. 현재 구글 트레늗와 네이버 트렌드에서 검색어를 입력하면 원하는 분석 기간 동안의 상대적 검색 값이 제공된다. 따라서 사람들의 관심사 변화 추이나 여러 검색어 간 관계를 파악할 수 있다. 그리고 구글과 네이버에 입력되는 검색어가 키워드 중심이기 때문에 비정형인 SNS 빅데이터보다 오류가 적다. 또한 검색 데이터는 소비자가 필요에 의해 자발적으로 온라인상에 남긴 흔적이다. 즉, 기업의 의도나 목적에 의해 좌우될 여지가 적다.

검색 데이터를 소비자 통찰력의 원천으로 삼고자 하는 시도가 다양하게 이루어지고 있다. 구글 데이터로 독감 레벨과 전파경로를 예측한 사례, 미국 시장에서 자동차 검색량과 매출간의 관계를 분석한 사례, 스트레스,자살 등의 검색과 OECD 자살률의 관계를 분석한 사례 등 다양한 시도가 있어 왔고 그 활용성도 인정받고 있다. 지난 미국 대선 투표일 수개월 전에 오바마가 대통령이 될 것이라는 것을 구글은 먼저 알고 있었다는 재미있는 연구 결과도 있다.

 

2) 현재 또는 가까운 미래의 매출 예측하기

소비자들이 온라인상에서 자발적으로 남긴 검색 정보를 통해 얼마나 소비자를 잘 이해할 수 있을까? 소비자의 관심은 구매 행동으로 이어질 가능성이 높다. 따라서 검색 데이터 분석은 소비자의 관심의 결과물인 검색 데이터와 매출 등 실물 데이터의 연관성을 찾는 데 집중되는 경향을 보인다. 검색 데이터는 개인 소비를 예측하는 지표가 될 수 있고 가까운 미래의 경제 지표를 예측할 수도 있다.

할 배리언 등은 '구글 트렌드로 현재 예측하기'에서 구글 검색량으로 자동차 판매 추세를 어느 정도 파악할 수 있는 지에 대해 분석했다 소비자가 검색을 많이 하는 제품은 실제로도 잘 팔릴까? 분석 결과 소비자가 어떤 브랜드의 자동차에 대해 검색을 많이하면 실제 판매량도 증가한다는 점을 입증하였다. 전년도/전월 판매량 데이터와 해당 구글 검색량 데이터만 있다면, 이번 달 브랜드별 장동차 판매량이 집계되기 전에 미리 판매량을 어느 정도 예측하는 것이 가능하다는 것이다.

 

 

산업분야에서는 소비자의 니즈 및 성향을 분석하는데 초점을 맞추었다.

다른 분야에서는 어떤 방식으로 사용되는지 계속적으로 알아 보겠습니다.

728x90