학생들에게 R의 인터넷 스캔을 가르치는 이야기

5002 단어 R
정말 싫다.
어제 우리 집에 사는 학생이 인터넷 스캔을 하려고 했는데 그렇다면 R을 사용하는 것이 좋겠다고 해서 R의 도입을 가르쳤다.
이번 설명도 OS는 Mac OS X입니다.

뭐 공부 해요?


여기 읽으세요.
한 마디로 하면 통계, 분석에 쓰이는 언어다.

R 배치


Brew를 사용하여 쉽게 설치할 수 있습니다.
gfortran이 필요할 수 있습니다. 다음을 수행하십시오.
%> brew install gfortran
    :
 インストールログ
    :

%> brew install R
이로써 R의 배치는 이미 완성되었을 것이다.
다음 명령으로 확인하세요.
%> R
R version 2.15.2 (2012-10-26) -- "Trick or Treat"
Copyright (C) 2012 The R Foundation for Statistical Computing
ISBN 3-900051-07-0
Platform: x86_64-apple-darwin11.4.2 (64-bit)

Rは、自由なソフトウェアであり、「完全に無保証」です。 
一定の条件に従えば、自由にこれを再配布することができます。 
配布条件の詳細に関しては、'license()'あるいは'licence()'と入力してください。 

Rは多くの貢献者による共同プロジェクトです。 
詳しくは'contributors()'と入力してください。 
また、RやRのパッケージを出版物で引用する際の形式については 
'citation()'と入力してください。 

'demo()'と入力すればデモをみることができます。 
'help()'とすればオンラインヘルプが出ます。 
'help.start()'でHTMLブラウザによるヘルプがみられます。 
'q()'と入力すればRを終了します。 

> |
위에서 설명한 대로 R을 시작하면 됩니다.

프레젠테이션 보기


우리 시범을 봅시다.
R을 시작한 상태에서 demo(graphics)를 입력합니다.
> demo(graphics)


    demo(graphics)
    ---- ~~~~~~~~

Type  <Return>   to start : 
Enter 키를 누르면 GUI 창이 열립니다.

이후 리턴 키를 눌렀을 때마다 도표를 그립니다.

웹 그리기 구현에 필요한 소프트웨어 패키지


X11 배포


Unix 호환 GUI 환경 X11이 필요할 때가 있으므로 미리 설치하십시오.Mac OS X용 X11은 여기 에서 다운로드할 수 있습니다.

CRAN 정보


R에는 CRAN이라는 패키지 관리 기구가 있습니다.
CRAN에서 관리하는 패키지는 install입니다.packages () 를 사용하여 쉽게 배포할 수 있습니다.
다음과 같은 소프트웨어 패키지를 웹 사이트 축소 이미지에서 검색하고 탐색할 수 있습니다.

XML 패키지 배포


XML은 웹 스캔에 편리한 기능을 제공하는 패키지입니다. 예를 들어 웹 사이트 테이블을 분석하는 함수입니다.
다음 명령을 사용하여 가져오십시오.
> install.packages("XML")
다음과 같이 CRAN의 미러 사이트 일람 창이 상승합니다.(CUI에 목록이 표시되고 번호가 지정된 경우도 있음) 적절한 CRAN의 미러 사이트를 선택하고 OK 버튼을 누릅니다.

XML 패키지 사용 시도


library()를 사용하여 설치된 XML 패키지를 읽습니다.
library('XML')
XML 패키지에 포함된 함수의 readHTMLTable()을 사용해 보십시오.이 함수는 지정된 HTML 문서의 테이블 태그를 해석하여 데이터로 읽어들이는 데 사용됩니다.
URI를 사용하여 HTML 문서를 지정할 수 있습니다.
기상청 홈페이지에 공개된 HTML 테이블에서 데이터를 꺼내보세요.
> readHTMLTable('http://www.data.jma.go.jp/obd/stats/data/mdrr/rank_daily/data01.html')
$日最高気温の高い方から
   順位 都道府県   観測所 観測値 昨日までの観測史上1位の値
1    ℃     時分       ℃ 年月日                        ℃
2     1   沖縄県   波照間   26.6                     12:29
3     2   沖縄県     仲筋   26.3                     13:06
4     3   沖縄県  石垣島*   26.1                     14:28
5    〃   沖縄県  西表島*   26.1                     11:54
6     5   沖縄県 志多阿原   25.9                     12:52
7    〃   沖縄県   伊原間   25.9                     13:14
8     7   沖縄県   真栄里   25.8                     12:13
9     8   沖縄県     大原   25.7                     13:29
10    9   沖縄県     下地   25.6                     14:13
11   10   沖縄県     鏡原   25.5                     13:56
   昨日までの2月の1位の値 統計開始年 備考         NA     NA   NA
1                  年月日       <NA> <NA>       <NA>   <NA> <NA>
2                    35.7 2009/08/05 27.7 2010/02/27 1979年     
3                    35.4 2009/08/02 27.8 2010/02/27 2003年     
4                    35.4 1899/09/15 29.1 1898/02/16 1896年     
5                    35.2 2010/07/14 27.8 2009/02/26 1954年     
6                    35.0 2006/07/07 28.1 2010/02/11 2003年     
7                    36.1 2012/07/08 28.2 2012/02/15 1977年     
8                    35.0 2009/08/05 28.1 2010/02/11 2003年     
9                    35.7 2003/07/24 28.5 2010/02/27 1978年     
10                   34.8 2009/08/03 27.3 2010/02/27 2003年     
11                   35.2 2003/07/22 28.4 2010/02/27 2003年  
    :
    :
  以下略
이렇게
파라미터를 추가하면 간단하게 특정한 정보만 축소해서 얻을 수 있다.

패키지 선택 정보


CRAN은 포장이 많아서 어떤 것을 가져와야 할지 망설입니다.
그때 유용한 것은 여기 이다.이 사이트는 각 분야에서 자주 사용하는 포장을 총괄적으로 소개하였다.
패키지를 함께 설치하는 방법도 소개되어 있기 때문에 사용해 보면 행복해질 수 있다.

Let's 통계


프로그래머라면 어느 정도 통계의 힘이 필요하다.
정확한 견적은 정확한 데이터에 근거하여 경험과 직감에 따라 수정된다.
이때 R을 기억해라. 자신의 래플로그부터 효과적인 작업 방법으로 자신의 진정한 생산성 등 통계 데이터를 밝히는 것도 재미있다.
안 했어요.(ノ´∀‘*)

좋은 웹페이지 즐겨찾기