【R】 산포도에 상관 계수를 매입하여 그리는 방법

6142 단어 R통계
산포도는 2개의 변수의 상관관계를 표현할 때에 사용되므로, 산포도에 상관수를 붙여 그리는 방법을 생각해 보았습니다.

분석에 사용되는 데이터


  • 다음 데이터는 한 산의 동쪽(east)과 서쪽(west)의 다양한 표고에서 측정한 수고(m)입니다.
  • direction 열: 사면의 방위각(east/west)
  • altitude 열 : 측정 지점의 고도
  • tree_height 열: 측정된 수고


  • tree_height.csv
    direction,altitude,tree_height
    east,260,12.1
    east,320,12.3
    east,390,8.2
    east,430,9.8
    east,470,7.9
    east,500,6
    west,280,15.3
    west,330,11.9
    west,380,11.2
    west,410,9.3
    west,440,7.9
    west,500,6.8
    

    산점도 그리기


  • 여기서는 mtext 함수를 사용하여 그래프에 문자열을 삽입합니다.
  • line : 기입하는 캐릭터 라인을 도형 영역으로부터 몇 행을 할까를 지정합니다. 0 이상을 지정하면 도형 영역의 외측, 마이너스치를 지정하면 도형 영역의 안쪽에 캐릭터 라인이 기입해집니다.
  • side: 문자열을 표시할 위치를 {1=아래, 2=왼쪽, 3=위, 4=오른쪽}으로 지정합니다.
  • adj : 문자열의 배치를 0~1의 수치로 지정합니다. 0=왼쪽 정렬, 0.5=중앙 정렬, 1=오른쪽 정렬.


  • R 콘솔
    > # CSVファイルを読み込む
    > tree_height <- read.table("C:\\tree_height.csv", header=TRUE, encoding="CP932", sep=",")
    > # 相関係数を求めて、変数corrに代入する。この時、round関数で小数第3位以下を丸めている。
    > corr <- round( cor(tree_height$altitude, tree_height$tree_height, method="pearson"), 2)
    > corr
    [1] -0.92
    > # 散布図を描画する。
    > plot(tree_height$altitude, tree_height$tree_height, main="標高と樹高との関係", xlab="標高(m)", ylab="樹高(m)")
    > # 相関係数の値を「r={相関係数}」という文字列に直す。
    > corr_text <- paste("r=", corr, sep="")
    > corr_text
    [1] "r=-0.92"
    > # 相関係数の文字列をグラフの右上から少し隙間を空けて表示する。
    > mtext(corr_text, line=-1.2, side=3, adj=0.98)
    



    요약


  • 문자열을 삽입 할 때 text 함수와 mtext 함수를 사용해야하는지 처음에는 상당히 고민했습니다.
  • 지금까지는 text 함수 밖에 사용한 적이 없었기 때문에, 원래 mtext 함수를 이해하고 있지 않았습니다.

  • help로 조사하면, 양자의 차이를 왠지 알았습니다.
  • text 함수 : Add Text to a Plot (플롯에 텍스트 추가)
  • mtext 함수 : Write Text into the Margins of a Plot (플롯의 여백에 텍스트 쓰기)

  • 이번은 「그래프의 상측에, 오른쪽 정렬로 캐릭터 라인을 삽입한다」라고 하는 것과 같이, 상대적인 위치 지정을 할 수 있는 mtext 함수를 채용했습니다.
  • mtext 함수의 line 파라미터나 adj 파라미터에 소수치를 지정하면, 플롯 에리어의 가장자리로부터 조금만 틈(마진)을 붙여 캐릭터 라인을 삽입할 수 있는 것을 알 수 있는 것이 제일의 수확이었습니다.

  • 좋은 웹페이지 즐겨찾기