<STATA 이론과 함께하는 계량경제 데이터분석>, 신우철
데이터 분석 작업에는 통계 프로그램으로 불리는 프로그램이 필요하다. 요즘은 오픈소스로 이용할 수 있는 R이나 Python(두 프로그램 모두 통계만을 위한 프로그램은 아니지만) 등도 있지만, 예전에는 이용할 수 있는 프로그램이 많지 않았다.
가장 처음 만난 건 EXCEL이다. 데이터 처리부터 그래프, 간단한 회귀분석 등 다양하게 이용할 수 있는 프로그램이면서 접근하기도 배우기도 쉬웠다. 문제는 데이터다. 데이터 용량이 커질수록 처리하는 데 시간이 무척 많이 소요되었다(가끔 컴퓨터가 다운되기도...). 그러다 대학원에서 E-views와 STATA를 알게 되었다. 와, 이런 프로그램들이 있었구나 싶었다.
그런데 문제는 지도 교수님이 사용하는 프로그램이 GAUSS라는 프로그램이라는 것이었다. STATA를 쓰다 GAUSS를 쓰려니, 너무 힘들었다. 어찌저찌 논문 작업에는 이용할 정도로 배우긴 했지만, 그 힘들었던 기억은 GAUSS와 영영 이별을 하게 만들었다. 최애 프로그램은 STATA가 되었고 말이다. STATA라는 프로그램의 등장 이전과 이후가 데이터 분석 작업의 속도를 가르는 기준이 되었다고 할 만 했다.
사회에 나와서는 내가 알고 쓰는 STATA 능력이 미천한 수준이라는 것을 알게 되었다. 그리고 STATA 외에 많은 프로그램들이 활용되고 있음도 말이다. 그래서 계속 배워가는 중이다. 이 책이 새로 도서관에 들어 왔는데, 눈길이 간 것도 더 나은 프로그램 활용 능력을 갖추기 위함이었다. 그렇다고 큰 기대를 한 것은 아니다. 지금까지 많은 도움들을 책을 통해 받긴 했지만, 어느 하나 딱 찝어 좋았던 책은 없었기 때문이다.
이 책은 그런면에서 최근 본 프로그램 관련 책들과 많이 달랐다. 우선 얇다. 그렇다고 수록하고 있는 컨텐트가 적은 것은 아니다. 책 제목처럼 이론과 실습 과정이 함께 수록되어 있다. 이론만 보는 것보다 실습을 통해 확인하며 배우는 것이 확실히 이해가 잘 된다. 그런데, 이론의 설명은 어렵고, 실습은 짧다. 그래서 이론도 실습도 모두 부족하게만 느껴진다.
특히 실습 과정이 따라하기 불편한 부분들이 많은데, 크게는 만들어 사용한 Food 데이터와 받아서 사용한 sp500 데이터가 있다. 설명하는 부분에 더 적합한 데이터를 사용하기 위함인지는 몰라도 이 책을 초보자들이 본다면 헷갈릴 것 같다는 생각이다. 코드를 따라하면 같은 결과가 나오긴 한다. 코드를 설명하는 부분도 조금은 가독성 있게 표현되면 좋았을 것 같다는 아쉬움이 있다. 같은 출판사에서 나온 STATA 시리즈 책이 아마도 한글로 된 STATA 책 중에서 가장 유명할 것 같다. 그 책들도 그렇게 가독성이 좋았던 기억은 없는데, 그런 면에서 가독성 부분은 편집의 몫인지도 모르겠다.
최근에는 다양한 통계 프로그램들이 많이 나오고 유저들도 사용하는 프로그램들을 확장시키는 것 같다. 그런 면에서 STATA 관련 책들이 많아지기는 힘들 수도 있을 것 같다. 반가운 마음으로 이 책을 만나기는 했는데, 기쁨보다는 아쉬움이 많았던 책 같다. 그래도 STATA는 여전히 내가 좋아하는 프로그램이다.