728x90

통계 3

빅데이터 분석 대표 프로그램 (하둡 & R)

안녕하세요. 아프락사쓰입니다. 빅데이터 분석할 때 대표적으로 사용되는 하둡 과 R프로그램에 대해 알아 보도록 하겠습니다. (다음 내용들은 위키백과에서 발췌했습니다.) 1. 아파치 하둡 (Apache HaDoop, High-Availability Distributed Object-Oriented Platform) 아파치 하둡은 대량의 자료를 처리할 수 있는 큰 컴퓨터 클러스터에서 동작하는 분산 응용 프로그램을 지원하는 프리웨어 자바 소프트웨어 프레임워크이다. 원래 너치의 분산 처리를 지원하기 위해 개발된 것으로, 아파치 루씬의 하부 프로젝트이다. 분산처리 시스템인 구글 파일 시스템을 대체할 수 있는 하둡 분산 파일 시스템(HDFS : Hadoop Distributed File System)과 맵리듀스를 구..

빅데이터의 핵심과목 통계!!

안녕하세요. 아프락사쓰입니다. 빅데이터를 이해하기 위해서는 최소한 기초적인 통계지식이 있어야 합니다. 이번 포스팅에서는 통계의 이해/기술통계/추측통계에 대해 알아 보도록 하겠습니다. 1. 통계의 이해 정보화 시대에 살고 있는 우리는 예전과는 비교할 수 없을 정도로 수많은 정보를 맹리 접하면서 살고 있다. 정보화 시대에 있어서 정보의 중요성이 강조되고 있으나 정보의 홍수 속에서 양질의 정보를 얻는 것은 갈수록 더 어려워지고 있다. 또한 더욱 복잡하고 다양한 사회구조는 미래에 대한 불확실성의 증가로 이어져 주어진 상황에서 적절한 의사결정을 하는 것 또한 어렵게 되었다. 이러한 상황 하에서 타당하고 신뢰성 있는 의사결정을 위해서는 과학적인 미래 예측이 필요하다. 과학적인 미래 예측은 주어진 자료에 의해서 이루..

빅데이터의 분석이란?? (경영 빅데이터 분석사 공부 中)

안녕하세요 아프락사쓰입니다. 엄청난 데이터가 있지만, 그속에서 가치있는 데이터를 뽑아내지 못하면 과연 그 데이터의 가치는 좋을까요? 이런 이유로, 빅데이터의 가장 중요한 부분은 분석이라고 생각 되어집니다. 이번 포스팅에서는 "빅데이터의 분석이란"에 대해 알아 보는 시간을 가지도록 하겠습니다. "경영 빅데이터 분석사" 를 공부하던 중, 해당 내용이 도움이 될것 같아서 분석에 대한 내용을 교재에서 발췌하였습니다. 1. 분석의 중요성 방대한 양의 데이터가 쏟아져 나오면서 빅데이터가 최대 화두가 되었다. 빅데이터는 대량의 테이터를 포함하여 다양한 유형의 데이터와 실시간성 데이터를 표함하는 의미이다. 그러나 더 정확한 의미로는 데이터 그 자체 뿐 아니라 데이터에 대한 분석을 포함하고 있다. 즉 빅데이터의 부상은 ..

반응형