[여러가지 시도]/빅데이터

R 프로그래밍 공부방법에 회의감이 들면..

시간 확보러 2018. 1. 7. 15:16
728x90

안녕하세요. 아프락사쓰입니다.

 

저는 빅데이터 분석 도구인 R을 이용하여 여러 데이터를 분석하여, 세상을 읽고 싶은 마음으로 공부를 시작하였습니다.

공부를 시작한지 얼마되지 않았지만, “R을 이용한 데이터 처리 & 분석 실무란 교재를 가지고 공부를 하고 있는데 점차 회의감이 들기 시작했습니다.

"내가 왜 이것을 공부하고 있는 걸일까?"

"나는 정말 데이터 분석 하는 것을 좋아하는 것일까?"

만약 데이터 분석에 흥미가 있으면, 어떤 점에서 좋은 것일까?

공부가 잘 안되면 안될수록, 많은 의문들이 제 머릿속에서 튀어 나왔습니다.

 

현재까지 고민을 했을 때, 저는 순수하게 데이터 분석을 좋아해서 공부하는 건 아닌 것 같습니다.

처음에도 언급했듯이, 저는 특정 데이터를 받으면, 어떤 식으로 활용을 하는지?

, 데이터 분석 활용 쪽에 관심이 많은 것 같습니다.

물론 데이터 분석 활용을 위해서 기초지식이 필요한 건 당연합니다. 기초가 모여서 데이터 분석 활용을 하니까 기초는 정말 중요한 내용입니다.

 

이 문제점은 저의 공부 타입에 따른 문제인 것 같습니다.

예를 들어, 학창시절 수학공부를 어떻게 했는지 언급하겠습니다.

모두들 고등학교의 수학 생각하시면, 정석이란 수학 교재가 떠오를 것입니다.

저는 일단 책을 사면, 목차를 보면서 대략적으로 이런 내용을 공부하겠구나 하면서 한장 한장 끝까지 다 넘겨 봅니다.

그리고 어떤 식으로 공부할지 (학교 진도에 맞춰서, 약한 부분 위주로 등등) 생각을 합니다.

마지막으로, 공부할때 꼭 문제풀이를 함으로써 개념을 확실히 익힙니다.

그래서 학창시절 공부 타입을 간단히 정리하면 다음과 같습니다.

1.     전체적으로 어떤 내용을 공부하는지 확인하기

2.     어떤 방식으로 공부할지 대략적으로 생각하기

3.     중간중간 문제를 풀면서, 개념 익히기

이와 같이, 저는 실전 및 문제 풀이를 하면서 개념 및 내용을 배우는 타입입니다.

 

이런 저의 공부 타입을 무시하고, 하나도 모르기에 앞에서부터 하나하나 공부를 하려니 지루함과 회의감이 몰려 왔습니다. 이로 인하여 약 1주일 정도 앞에서부터 차근차근 배웠으나, 솔직히 많은 부분이 머릿속에 남아 있지 않습니다.

그래서 교재를 전체적으로 확인하던 중, 교재의 11장은 타이타닉 데이터를 사용한 기계 학습 실습을 알게 되었습니다. 제가 원하는 실습!

그래서 11장을 통해, 데이터의 대략적인 모습을 살펴보고, 여러 알고리즘을 적용해 생존자 예측을 수행해 봄으로써 개념도 익히면서 공부를 다시 시작을 해볼까 합니다.

 

또한 www.kaggle.com이라는 사이트를 알게 되었습니다.

다음은 위키백과에서 캐글(Kaggle)”의 정의입니다.

------------------------------------------------------------------------------------------------------------------------------------------------------------------------

캐글(Kaggle) 2010년 설립된 예측모델 및 분석 대회 플랫폼이다. 기업 및 단체에서 데이터와 해결과제를 등록하면, 데이터 과학자들이 이를 해결하는 모델을 개발하고 경쟁한다. 2017 3월 구글에 인수되었다.

------------------------------------------------------------------------------------------------------------------------------------------------------------------------

그곳에서는 직접 자신의 알고리즘으로 다른 사람들과 경쟁해볼수 있는 곳이기도 하고, 다른 사람들을 통해 많은 곳을 배울수 있는 곳이기도 합니다. 저와 같은 공부타입을 가지고 있는 사람들이면 정말 고마운 사이트라고 생각 됩니다.

 

그래서 저의 공부타입에 맞춰서 다음과 같이 공부를 실시하고자 합니다.

1.     11장을 통해 기계 학습을 실습해 본다.

2.     공부를 하면서 필요한 개념은 찾아보기를 통해서, 그때그떄 익히기

3.     Kaggle 사이트에 들어가서, 여러 알고리즘을 사용하면서 생존자 예측률을 높이기

4.     타이타닉 생존자 예측률이 약 90%정도 도달하면, 여러가지 데이터를 통해서 계속적으로 분석하기

    

오랜만에 공부를 할려다 보니, 저의 공부 타입을 까먹었던 것 같습니다.

지금이라도 저의 문제점을 확인하고, 공부를 할려고 하니 더욱더 의지가 생기는 것 같습니다.

저는 언제가 데이터 전문가분들의 조언을 기다리고 있습니다.

Kaggle과 같은 좋은 사이트 및 조언을 댓글로 공유해주시면 정말 감사하겠습니다.

 

728x90