728x90

[여러가지 시도]/빅데이터 24

R 프로그래밍 공부방법에 회의감이 들면..

안녕하세요. 아프락사쓰입니다. 저는 빅데이터 분석 도구인 R을 이용하여 여러 데이터를 분석하여, 세상을 읽고 싶은 마음으로 공부를 시작하였습니다. 공부를 시작한지 얼마되지 않았지만, “R을 이용한 데이터 처리 & 분석 실무”란 교재를 가지고 공부를 하고 있는데 점차 회의감이 들기 시작했습니다. "내가 왜 이것을 공부하고 있는 걸일까?" "나는 정말 데이터 분석 하는 것을 좋아하는 것일까?" 만약 데이터 분석에 흥미가 있으면, 어떤 점에서 좋은 것일까? 공부가 잘 안되면 안될수록, 많은 의문들이 제 머릿속에서 튀어 나왔습니다. 현재까지 고민을 했을 때, 저는 순수하게 데이터 분석을 좋아해서 공부하는 건 아닌 것 같습니다. 처음에도 언급했듯이, 저는 특정 데이터를 받으면, 어떤 식으로 활용을 하는지? 즉, ..

R 프로그래밍 관련 좋은 기사! (비전공자도 할수 있다!!)

안녕하세요. 아프락사쓰입니다. R 프로그래밍 관련 자료를 찾다가 알고 있으면 좋을 자료를 가져왔습니다. 자료 출처 정보는 하단에 기재되어 있습니다. ----------------------------------------------------------------------------------------------------------------------------------------------------------------------- "왜 R인가?" R의 장점 및 단점 R 프로그래밍 언어는 수치 분석, 기계 학습 분야 개발에서 중요한 도구다. 데이터 생성기로서 기계의 중요성이 커질수록 R 언어의 인기도 함께 높아질 수밖에 없다. 그러나 R에는 개발자가 알아야 할 장점과 단점이 있다. Tlobe..

R 프로그래밍 공부 정리 (변수/함수호출시인자지정/스칼라/벡터)

안녕하세요. 아프락사쓰입니다. 비전공자로써, 빅데이터 분석 분야에 도전하고 있는 청년입니다. 어제 R 프로그래밍을 개인 노트북에 설치하고, 금일부터 R 프로그래밍 공부를 시작하였습니다. 첫 시간에는 기초중에 기초인 변수/함수 호출 시 인자 지정/스칼라/벡터를 공부하였습니다. 포스팅은 개인적으로 중요하거나 헷갈리는 부분을 중심으로 작성 할 예정이오니, 빅데이터 공부하시는 분들에게 도움이 되었으면 합니다. (공부하고 있는 교재는 ["R을 이용한 데이터 처리 & 분석 실무" 서민구 지음] 입니다.) 1. 변수 이름 규칙 R의 변수명은 알파벳, 숫자, _(언더스코어), .(마침표)로 ㅜ성되며, -(하이픈)은 사용할 수 없다. 첫 글자는 알파벳 또는 .으로 시작해야 한다. 만약 .으로 시작한다면 .뒤에는 숫자가 ..

빅데이터 분석 대표 프로그램 (하둡 & R)

안녕하세요. 아프락사쓰입니다. 빅데이터 분석할 때 대표적으로 사용되는 하둡 과 R프로그램에 대해 알아 보도록 하겠습니다. (다음 내용들은 위키백과에서 발췌했습니다.) 1. 아파치 하둡 (Apache HaDoop, High-Availability Distributed Object-Oriented Platform) 아파치 하둡은 대량의 자료를 처리할 수 있는 큰 컴퓨터 클러스터에서 동작하는 분산 응용 프로그램을 지원하는 프리웨어 자바 소프트웨어 프레임워크이다. 원래 너치의 분산 처리를 지원하기 위해 개발된 것으로, 아파치 루씬의 하부 프로젝트이다. 분산처리 시스템인 구글 파일 시스템을 대체할 수 있는 하둡 분산 파일 시스템(HDFS : Hadoop Distributed File System)과 맵리듀스를 구..

비전공자가 바라 본 빅데이터

안녕하세요. 아프락사쓰입니다. 뉴스, 인터넷 등 실생활에서 "빅데이터"라는 단어를 많이 접할 수 있었을 것입니다. 또한 많은 기업들도 빅데이터 관련 분야에 투자도 많이하고 있습니다. 비전공자인 제가 바라 본 빅데이터는 기업 측면에서는 데이터 홍수에서 소비자들의 행동 및 선택을 파악함으로써, 성향 등을 확인하여 의사결정 등에 활용하는 것이라고 생각 되어집니다. 점점 개인화되고 언택트기술이 발전함에 따라, 소비자들은 만남 자체를 꺼려하는 경향이 증가하고 있습니다. 이때, 기업에서 소비자의 성향을 파악하여 추천 등을 하는 것은 소비자 입장에서도 좋고, 기업입장에서도 판매량이 증가하기에 좋을 것이라고 생각되어 집니다. 이런 이유로, 빅데이터 분석은 미래 사회에 가장 중요할 것이라고 생각되어 졌습니다. 그래서 "..

빅데이터 분석도구에는 무엇이 있을까??

안녕하세요. 아프락사쓰입니다. 이번 포스팅에서는 빅데이터 분석도구에 대해 알아 보도록 하겠습니다. 1. 빅데이터 분석도구 개요 현대는 수많은 데이터들의 사회이다. 매년 홍수처럼 불어나는 정보들 때문에 그 상당한 양을 다루는 기술의 필요성이 대두되고 있다. 빅데이터의 특징 중 하나인 가치를 창출해 내기 위해서는 대용량 데이터와 다양한 데이터를 핸들링하고 이를 분석 할 수 있는 통계적 방법이 필요하고, 이러한 통계적 방법을 뒷받침 할 수 있는 통계 분석 툴이 필수적으로 요구된다. 기초적인 분석 도구로는 엑셀이 있고, 중급 통계 분석용으로는 SPSS, 전문가들이 주로 사용하는 SAS 등이 일반적으로 널리 사용되고 있다. 2.1 엑셀의 개요 엑셀은 마이크로소프트사에서 개발한 윈도 환경의 스프레드시트 프로그램으로..

빅데이터 시각화란??

안녕하세요. 아프락사쓰입니다. 의사결정에 빅데이터가 사용되기 위해서는, 보는 모든 이가 이해하기 쉽게 만들어져야 합니다. 그 중 가장 효과적인 방법이 시각화입니다. 이번 포스팅에서는 데이터 시각화에 대해 자세히 알아보도록 하겠습니다. 1. 데이터 시각화의 개념 빅데이터는 데이터의 풍부함을 드러내기 위한 새로운 방식으로 방대한 양의 데이터를 탐색하거나 이해할 때 가장 좋은 방법으로 시각화를 활용한다. 우리가 시각화에 관심을 갖는 이유는 인간의 시각체계가 거대한 힘과 미묘함을 가지고 있기 때문이다. 여기서 정보를 보는 것과 이해하는 것이 같다고 말하는 선행연구자들은 어려운 정보를 이해하는 과정과 인식의 과정이 많은 관련이 있다고 본다. 러셀의 연구에 따르면, 인간 사고의 내용을 서술하는 체계는 자료, 정보,..

빅데이터의 비정형 데이터마이닝이란??

안녕하세요. 아프락사쓰입니다. 소셜 미디어에서 얻는 데이터는 대부분이 비정형 데이터마이닝이기에, 언급되고 있는 빅데이터 분석은 주로 비정형 데이터를 분석해야 합니다. 이번 포스팅에서는 비정형 데이터의 정의 등에 대해 알아보도록 하겠습니다. 1. 비정형 데이터 비정형 데이터란 글자 그대로 정형화 되지 않은 데이터로서, 구체적으로 미리 정의된 데이터 모델을 가지고 있지 않은 데이터를 말한다. 대표적인 비정형 데이터의 예로는 아주 많은 양의 데이터를 가지고 있으면서 구조와 형태가 다르고 정형화 되지 않는 문서, 영상, 음석 등을 들 수 있다. 문서의 경우만 살펴봐도 텍스트가 대부분이나 그 속에는 다른 그림이나 표 등이 들어 있어서 구분하기 힘들게 하는 불규칙성이 있는 의미를 파악하기 애매하기 때문에 기존의 일..

빅데이터의 데이터마이닝이란??

안녕하세요. 아프락사쓰입니다. 이번 포스팅에서는 데이터마이닝에 대해 알아 보도록 하겠습니다. 1. 데이터마이닝 개념 데이터마이닝은 대용량의 데이터로부터 자동 또는 반자동적인 방법을 통하여 의미 있는 패턴, 규칙, 관계를 찾아내는 것이다. 데이터마이닝은 또한 많은 데이터베이스로부터 지금까지 잘 알려지지 않고 유용하며 활용이 가능한 정보를 추출하는 과정으로 정의가 되기도 한다. 기업이나 정부는 일반적인 업무 활동을 통해 대용량의 데이터를 축적해 왔다. 그러나 빈번하게 발생되는 많은 양의 데이터들은 수치화가 되지 않았을 뿐만 아니라, 수리적 형태보다는 질적인 형태로 저장이 되어 일반적인 통계 방법에 의해 잘 분석과 활용이 될 수 없었다. 이로 인해 그동안 데이터베이스에 포함되어 있는 많은 정보들이 제대로 활용..

빅데이터의 핵심과목 통계!!

안녕하세요. 아프락사쓰입니다. 빅데이터를 이해하기 위해서는 최소한 기초적인 통계지식이 있어야 합니다. 이번 포스팅에서는 통계의 이해/기술통계/추측통계에 대해 알아 보도록 하겠습니다. 1. 통계의 이해 정보화 시대에 살고 있는 우리는 예전과는 비교할 수 없을 정도로 수많은 정보를 맹리 접하면서 살고 있다. 정보화 시대에 있어서 정보의 중요성이 강조되고 있으나 정보의 홍수 속에서 양질의 정보를 얻는 것은 갈수록 더 어려워지고 있다. 또한 더욱 복잡하고 다양한 사회구조는 미래에 대한 불확실성의 증가로 이어져 주어진 상황에서 적절한 의사결정을 하는 것 또한 어렵게 되었다. 이러한 상황 하에서 타당하고 신뢰성 있는 의사결정을 위해서는 과학적인 미래 예측이 필요하다. 과학적인 미래 예측은 주어진 자료에 의해서 이루..

반응형