728x90

시각화 3

빅데이터 분석 대표 프로그램 (하둡 & R)

안녕하세요. 아프락사쓰입니다. 빅데이터 분석할 때 대표적으로 사용되는 하둡 과 R프로그램에 대해 알아 보도록 하겠습니다. (다음 내용들은 위키백과에서 발췌했습니다.) 1. 아파치 하둡 (Apache HaDoop, High-Availability Distributed Object-Oriented Platform) 아파치 하둡은 대량의 자료를 처리할 수 있는 큰 컴퓨터 클러스터에서 동작하는 분산 응용 프로그램을 지원하는 프리웨어 자바 소프트웨어 프레임워크이다. 원래 너치의 분산 처리를 지원하기 위해 개발된 것으로, 아파치 루씬의 하부 프로젝트이다. 분산처리 시스템인 구글 파일 시스템을 대체할 수 있는 하둡 분산 파일 시스템(HDFS : Hadoop Distributed File System)과 맵리듀스를 구..

비전공자가 바라 본 빅데이터

안녕하세요. 아프락사쓰입니다. 뉴스, 인터넷 등 실생활에서 "빅데이터"라는 단어를 많이 접할 수 있었을 것입니다. 또한 많은 기업들도 빅데이터 관련 분야에 투자도 많이하고 있습니다. 비전공자인 제가 바라 본 빅데이터는 기업 측면에서는 데이터 홍수에서 소비자들의 행동 및 선택을 파악함으로써, 성향 등을 확인하여 의사결정 등에 활용하는 것이라고 생각 되어집니다. 점점 개인화되고 언택트기술이 발전함에 따라, 소비자들은 만남 자체를 꺼려하는 경향이 증가하고 있습니다. 이때, 기업에서 소비자의 성향을 파악하여 추천 등을 하는 것은 소비자 입장에서도 좋고, 기업입장에서도 판매량이 증가하기에 좋을 것이라고 생각되어 집니다. 이런 이유로, 빅데이터 분석은 미래 사회에 가장 중요할 것이라고 생각되어 졌습니다. 그래서 "..

빅데이터 시각화란??

안녕하세요. 아프락사쓰입니다. 의사결정에 빅데이터가 사용되기 위해서는, 보는 모든 이가 이해하기 쉽게 만들어져야 합니다. 그 중 가장 효과적인 방법이 시각화입니다. 이번 포스팅에서는 데이터 시각화에 대해 자세히 알아보도록 하겠습니다. 1. 데이터 시각화의 개념 빅데이터는 데이터의 풍부함을 드러내기 위한 새로운 방식으로 방대한 양의 데이터를 탐색하거나 이해할 때 가장 좋은 방법으로 시각화를 활용한다. 우리가 시각화에 관심을 갖는 이유는 인간의 시각체계가 거대한 힘과 미묘함을 가지고 있기 때문이다. 여기서 정보를 보는 것과 이해하는 것이 같다고 말하는 선행연구자들은 어려운 정보를 이해하는 과정과 인식의 과정이 많은 관련이 있다고 본다. 러셀의 연구에 따르면, 인간 사고의 내용을 서술하는 체계는 자료, 정보,..

반응형