RStudio GUI에서 데이터 로드

2932 단어 RRStudio
이 기사는 RStudio Advent Calendar 2016의 첫 번째 기사입니다.

R로 데이터 로드



R로 데이터를 읽는 방법에는 여러 가지가 있습니다. 일반적으로 자주 사용되는 것이 CSV 파일에 대해 read.csv()를 실행하는 것이 있습니다.

최근에는 로딩을 위한 패키지도 여러가지 개발되고 있어, 고속으로 CSV 파일을 읽어들인다 readr readxl 패키지 등을 이용하여 로드할 수도 있습니다.

RStudio GUI로 로드



RStudio에는 GUI에 의한 데이터 읽기 기능이 붙어 있습니다. 지금까지는 .csv 정도밖에 읽을 수 없었습니다만, RStudio v1.0에서는 haven 패키지· readr 패키지, readxl 패키지를 이용해 각종 데이터 세트를 읽어들일 수 있게 되었습니다. 이번에는 이것을 소개합니다.

Import Dataset 버튼



RStudio의 Environment 탭을 클릭하고 ImportDataset을 클릭합니다.



펼쳐진 메뉴에서 가져올 파일 형식을 선택하십시오. 이 때 haven · readr · readxl 패키지 중 하나가 설치되어 있지 않으면 패키지를 설치할지 묻습니다. 문제가 없으면 그대로 설치하십시오.

From CSV



CSV 파일을 읽을 때 haven 패키지가 사용됩니다.

"From CSV ..."를 선택하면 대화 상자 창이 열리므로 먼저 읽을 파일을 지정합니다. 그러면 다음과 같은 화면이됩니다.



파일을 지정하면 데이터 미리보기에 데이터가 표시됩니다. 이 미리보기에서 열 이름을 클릭하면 다음과 같이 데이터 유형을 변경하거나 제외 할 수 있습니다.



이 데이터 미리보기 아래에있는 가져 오기 옵션을 사용하면 저장할 객체 이름 (Name :)과 같은 다양한 설정이 가능합니다. 대부분의 것은 이것으로 커버 할 수 있어야합니다.

그리고 가장 큰 특징은 Code Preview의 부분입니다. 이것은 읽기 설정한 내용을 실행하는 코드를 표시합니다. 자주 “GUI라면 읽는 코드가 남지 않아 불편함이 많다. 그래서 안 된다. 하지만 이것이라면 그다지 익숙하지 않은 사용자라도 로드를 위한 코드를 생성할 수 있습니다. 꼭 활용하고 싶습니다.

From Excel



Excel 파일을 읽을 때 readr 패키지가 사용됩니다.

"From Excel ..."을 선택하면 대화 상자 창이 열리므로 먼저 읽을 파일을 지정합니다. 그러면 다음과 같은 화면이됩니다.



기본적인 견해와 사고방식은 사고방식은 동일하며, 여기에도 Code Preview가 표시됩니다. readxl 패키지는 "어떤 Sheet에서 읽을 것인가"를 지정하는 것이 가능하고, 이것에 대한 옵션도 붙어 있습니다. 수수하게 편리합니다.

SAS, SPSS, Stata 파일 정보



SAS, SPSS, Stata를 선택하면 readxl 패키지를 사용하여로드됩니다. 예를 들어, "From SPSS ..."를 선택하면 다음과 같은 대화 상자가 나타납니다.



사용법은 지금까지의 패턴과 같습니다.

이상입니다. 모처럼의 기능이므로, 시험에 사용해 보세요. Enjoy!

좋은 웹페이지 즐겨찾기