Books/Programs

<Do it! 쉽게 배우는 R 데이터 분석 - 데이터 분석 프로젝트 전 과정 수록>, 김영우

green_rain 2018. 2. 21. 16:04
728x90
반응형


  'R'이라는 프로그램을 공부하고 있다.

  경제학을 공부하고 있다. 석사과정 중에 가장 힘든 일은 졸업 논문을 작성하는 일이었다. 논문에서 가장 힘든 일은 주제를 정하는 것이다. 팬시한 주제라고 생각해서 검색을 해보면, 이미 누군가가 논문으로 작성해 둔 경우가 많았다. 아니 거의 대부분이다. 내 생각은 전혀 새롭지 않은 생각들이라는 생각에 좌절하기 일쑤였다. 'connecting the dots'라는 말이 있다. 나는 스티브 잡스의 말이라고 생각하는데, 그도 어디선가 인용한 것일 지도 모르겠다. 여튼. 전혀 새로운 것을 만드는 것은 불가능한 사회일지도 모른다. 이미 나와 있는 것들을 연결하여 조금 다른 것을 만드는 것일 뿐일지도 모른다. 그렇게 생각하면 논문 주제 정하는 것도, 쓰는 일도 마음이 가벼워졌다.

  경제학에서 새로운 이론을 만들어 내는 것은 위에서 말한 전혀 새로운 것을 만들어 내는 것과 같다. 어려운 일이다. 그래서 많은 사람들도 그렇지만, 나도 실증분석을 졸업 논문에 이용했다. 그런데 새로운 문제에 봉착했다. 실증분석을 위해서는 통계 프로그램을 사용해야 한다는 것이었다. 교수님과 함께 GAUSS라는 프로그램을 공부했다. 진도가 나가지 않는다. 교수님의 도움이 절대적이었다. 한 달 넘게 고생해서 간신히 졸업 논문을 작성했다. 다시 보기도 싫고, 제대로 된 것인지도 확신이 들지 않았지만, 완성했고, 졸업했다. 다시 한번 교수님께 감사드린다.

  사회에 나와보니 GAUSS라는 프로그램 보다는 다른 프로그램들이 더 인기가 많았다. E-views, STATA, MATLAB 등을 많이 사용하고 있었다. E-views와 STATA는 GAUSS나 MATLAB보다는 처음 사용하기가 쉬었다. 그래서 요즘도 많은 사람들이 애용하고 있는지 모르겠다. 각 프로그램들 마다 특성이 있으니, 분석하고자 하는 데이터와 모형에 따라 선별해서 배우고 이용하면 좋을 것 같았다. 석사 졸업과 관련해서 GAUSS라는 프로그램에 너무 질려서 그런지, STATA가 비교적 쉽고 간편했다. 꽤 오랫동안 STATA를 사용했다. 그렇다고 전문가 수준으로 다루는 것은 아니지만 말이다. 같이 일하는 선배 중에 정말 프로그램을 잘 다루는 선배가 있다. 그는 상기한 프로그램들을 상급 수준으로 다루고 있으며, STATA는 전문가 수준에 이르렀다고 본다. 곁에서 많이 부러웠지만, 나는 내가 다루는 수준에 만족하며, 부족한 부분은 배워나갈 생각이다.

  그런데, 문제는 앞서 말한 프로그램들이 모두 유료 소프트웨어라는 것이다. 그러다 'R'이라는 프로그램을 알게 되었다. 오픈 소스로 되어 있어 무료라는 것이 가장 마음에 들었다. GAUSS나 MATLAB 처럼 코딩을 해야 해서 처음 접근하기가 망설여 졌지만, 지금은 재미있게 배우고 있는 중이다. 이 책은 그런 중에 만나게 되었다. 우선 두께가 두껍지 않았다. 많은 프로그램 관련 서적들이 방대한 양을 자랑하며 꽤 두꺼운 편이다. 지치기 쉽다. 그런데 이 책은 얇다. 그렇다고 내용이 가벼운 것도 아니다. 이론적인 부분들을 많이 삭제하고 실물적인 부분들을 실습 위주로 설명하고 있다. 내가 원하던 좋은 책이다. 'R'에서 많이 사용하고 있는 패키지들을 주로 설명하고 있어 좋았다. 

  예전보다는 'R'과 관련된 서적들이 많이 나와 있다. 처음 통계 프로그램을 배울때 이런 책들이 많이 있었다면, 조금 더 빠리 친해지지 않았을까, 싶다. 하지만 늦지는 않았을 것이다. 사회에 처음 나와서 많은 프로그램들을 배우고 싶었었다. 이제는 그런 욕심도 없다. 그러니 이제 'R'을 천천히 열심히 공부해 볼 수 있을 것 같다.

728x90
반응형