데이터 분석 업무를 하다 보면 프로그램을 다루는 일이 자연스럽게 이어진다. 데이터 분석하는 일도 재미있지만, 데이터를 분석하기 위해 배우는 프로그램들도 재미있다. 석사 논문을 쓰면서 GAUSS라는 프로그램을 사용했는데, 너무 어려웠다. 그때 이미 STATA가 대세 프로그램을 자리잡기 시작할 무렵이었는데, STATA를 사용하다 GAUSS를 배울 때의 그 갑갑함이란... 하얀색은 바탕이요 검은색은 글자일 때의 그 느낌과 같았다. 지금도 GAUSS를 함께 해 주신 교수님께 감사드린다.
최근에는 정말 프로그램이 다양해졌다. 사용해 본 프로그램들을 순서대로 열거하자면, E-views와 STATA를 시작으로 Matlab, R, Python 까지... 다양하다. 물론 이 프로그램들을 사용해 봤다고 해서 모두 다 잘 다루는 것은 아니다. 업무에서 가장 많이 사용하는 것은 E-Views인데, 가장 잘 사용해서 그런건 아니고 선배님들께 물려 받은 파일들이 E-Views 프로그램 파일들이라서 그랬다. 다른 프로그램들로 바꾸고 싶은데, 귀차니즘은 언제나 승자다. 그러다 비교적 정말 쉽게 배울 수 있었던 STATA를 많이 사용했었다. 단점은 유료라는 것. 회사에서 사줘서 업무에는 잘 사용했지만 집에서가 문제였다. 개인이 구매하기에는... 그러다 R을 만났다. 예전 GAUSS의 느낌처럼 코딩을 해야 했는데, 뭐랄까, 쉽다고 할 수 없지만, 어려지도 않은, 뭔가 편안하면서도 재밌었다. 요즘에는 R보다는 Python을 더 많이 사용하는 것 같은데, 나는 R을 더 먼저 사용하고 있어서 그런가, Python보다는 아직 R이 더 편하게 느껴진다.
위의 글들만 읽어보면 뭔가 다양한 프로그램을 자유롭게 잘 사용할 것 같지만, 그렇지 않다. 내가 어느 정도의 유저인지는 모르겠지만, 그저 아직은 배워가는 단계의 초보 유저라고 보는 게 맞을 것 같다. 이 책을 선택한 이유는 데이터 분석 때문이다. 내가 프로그램을 배우는 주 목적이 데이터 분석이기 때문이다. 가장 많이 사용하는 시계열자료나 패널자료들을 분석하는 방법들을 조금 더 체계적으로 공부해 보고자 R로 설명되어 있는 책들을 구입해서 읽어 나가고 있다. 이게 그 첫번째 책이다.
제목처럼 혼자 따라 해보면서 공부할 수 있게 구성되어 있다. R과 R 스튜디오 설치부터 환경 설정, 데이터의 구조와 정리, 그리고 마지막으로 분석까지 말이다. 기초책 다음으로 보면 좋을 것 같은 구성이다. 기본적인 내용들이 간단간단하고 쉽게 잘 설명되어 있어 따라하기만 해도 기본적인 내용들을 충분히 습득할 수 있다. 마지막에 예제를 통해서 간단한 데이터 분석을 해 볼 수 있으며, R마크다운과 샤이니를 이용해서 R을 이용한 분석과 함께 보고서도 만들어 볼 수 있다. 논문이나 보고서 작성에 활용해도 좋을 것 같다. 기초 다음의 기본 단계에 적합한 책이라고 생각한다.
'Books > Programs' 카테고리의 다른 글
<챗GPT와 파이썬으로 주식 자동매매 앱 및 웹 투자 리포트 만들기>, 박찬의 (61) | 2024.07.16 |
---|---|
<누구나 쉽게 따라 하며 배우는 웹 해킹 첫걸음>, 권현준 (0) | 2022.08.30 |
<모두의 파이썬>, 이승찬 (0) | 2022.04.14 |
<헬로! 인공지능 생활코딩 머신러닝: 이론편>, 이고잉, 이숙번, 오픈튜토리얼스 (0) | 2021.10.26 |
<일잘러의 비밀, 구글 스프레드시트 제대로 파헤치기>, 강남석 (0) | 2021.06.09 |