코딩/R

R 시작하기에 앞선 이런저런 잡담.

kaki_ss 2021. 11. 22. 15:41
728x90
반응형

R은 통계프로그램 중에서 제일 가벼우면서도 많이 사용하는 프로그램이다.

 

프리웨어로 초급자부터 전문가까지 다양한 사람들이 함께 사용한다.

 

대학에서도 널리 사용되어서 통계학과는 물론 타 과들도 많이 사용하는 프로그램이지만 

기본적으로 코드를 입력해서 수행을 하기 때문에 

SPSS나 다른 프로그램 대비해서 공부해야할 것이 있다.

 

예를 들어서 회귀분석 같은 경우 SPSS는 클릭 몇 번이면 회귀분석에 맞는 종속변수, 독립변수를 넣고 

결과를 나타내는 표까지 얻을 수 있지만 

R 같은 경우는 install.packages() 부터 시작해서  로지스틱일 경우 lm, 일반 회귀분석일 경우 reg 등의 코드를 사용해서 

사용자가 직접 입력을 시켜줘야 한다. 

(이런 코드를 매번 검색해서 할 수는 없기에 외워야 한다...!)

반응형
300x250

그래도 직접 데이터를 다룰 수 있는 범위가 넓어지고 

프로그램에서 정해진 분석 방법만 하는 것이 아닌 내가 원하는 대로 분석하는 것이 가능하기 때문에 

많이 사용하고 있는 것 역시 사실이다.

 

물론 최근에는 파이썬(python)에 데이터 정제, 분석, 평가와 관련된 패키지들이 많이 추가가 되고 

머신러닝에서 많은 활약을 하면서 R보다 파이썬을 선호하는 사람들이 늘고 있지만 

아직까지 시각화 등의 부분에서는 R이 우세라고 생각한다.

 

아직 학부를 졸업한 수준의 역량이지만......

그래도 좀 더 발전을 하고 그 기록을 작성하기 위해서 먼저 R과 관련된 코드를 정리할 것이다.

 

매우 부족한 수준이지만 그래도 읽고 도움이 됬으면 좋겠고

잘못된 부분이 있으면 알려주시면 발전하는데 도움이 될 것 같습니다.

 

일단 티스토리 블로그가 처음이여서 이렇게 작성하는 게 맞는지 잘 몰라서 헤매고 있는 상태에서 쓰는 글이지만

그래도 모쪼록 잘 운영되었으면 좋겠다.

 

일단 R을 설치하는 방법, 편리하게 사용하기 위한 Rstudio 설치, 그리고 기본적인 코딩 방법이랑

데이터 정제 및 전처리, 데이터 분석, 데이터 평가하는 방법까지로 할 예정인데.....

 

과연 잘 할 수 있을 것인가.......두둥 

약간 걱정이 되지만 이렇게 정리를 하지 않으면 나도 찾기 어렵고 매번 정리 안 된 파일만 클라우드를 점령할 것 같으니 

일단 파일 정리한다 생각할 겸 해봐야 겠다.

 

그럼 일단 글 올리는 거나 연습 삼아서 올려보고

열심히 준비해서 글 쓰기부터 시작해야겠다.

 

그럼 오늘 글 끝!

 

728x90
반응형