독서노트

5655 단어 ggplot2

Welcome to ggplot2


무엇이 도형의 문법입니까?


ggplot은 통계 도형을 그리는 데 사용되는 R 패키지로 그 뒤에 있는 문법이 지원한다.
도형의 문법은 한 장의 도형이 데이터(data)에서 기하학적 대상까지의 도형 속성의 매핑(mapping)이라는 것을 알려준다.도형에는 데이터의 통계 변환도 포함되어 있으며 최종적으로 특정한 좌표계에 그려진다.또한 분면은 데이터의 서로 다른 서브집합을 생성하는 도형에 사용할 수 있다.총괄적으로 말하면 통계 도형은 상술한 독립된 도형 부품으로 구성된 것이다.
몇 가지 개념을 이해해야 한다. - 기하학적 대상(Geometric, 줄임말 geom)은 그림에서 실제적으로 보이는 도형 요소를 대표한다. 점, 선, 다각형 등을 포함한다. - 도형 속성(Aesthetic, 약칭 aes)은 색깔, 형상 등을 포함한다. - 통계 변환(Statistical transformation, 줄임말stats)은 원시 데이터에 대해 어떤 계산과 정리를 하는 것을 말한다.예를 들어 이원 산점도와 회귀선-도층(Layer)이 기하학적 대상과 통계적 변환으로 구성된 표도(scale)는 데이터의 값을 도형 공간에 비추는 것이다. 예를 들어 색깔, 크기와 모양이 서로 다른 수치를 나타낸다.표도를 나타내는 흔히 볼 수 있는 방법은 도례와 좌표축-좌표계(Coordinate, 줄임말은coord)를 그리는 것이다. 주로 좌표축과 격자선을 제어하고 데이터가 도형이 있는 평면에 어떻게 비치는지 설명한다.일반적으로 피리칼 좌표계-분면(facet)도 조건으로 그림을 그린다고 하는데, 그룹을 나누는 방법과 배열을 제어하고, 데이터를 각 서브집합으로 분해하는 방법, 그리고 서브집합에 대해 그림을 그리는 방법을 설명한다.

설치하다.


Rstudio에는 웹 및 소프트웨어 버전이 있습니다.
홈페이지판 등록 후 직접 사용 가능;소프트웨어 버전에서는 설치 ggplot2 패키지를 다운로드하여 다음 명령을 실행해야 합니다.
> install.packages("ggplot2")

ggplot2 패키지에 포함된 데이터 (폭스바겐 자동차 연료의 경제성) 는 학습에 사용할 수 있다
> library(ggplot2)
> mpg
# A tibble: 234 x 11
   manufacturer model      displ  year   cyl trans    drv     cty   hwy fl    class 
   <chr>        <chr>       <int> <int> <chr>    <chr> <int> <int> <chr> <chr> 
 1 audi         a4          1.80  1999     4 auto(l5) f        18    29 p     compa…
 2 audi         a4          1.80  1999     4 manual(… f        21    29 p     compa…
 3 audi         a4          2.00  2008     4 manual(… f        20    31 p     compa…
 4 audi         a4          2.00  2008     4 auto(av) f        21    30 p     compa…
 5 audi         a4          2.80  1999     6 auto(l5) f        16    26 p     compa…
 6 audi         a4          2.80  1999     6 manual(… f        18    26 p     compa…
 7 audi         a4          3.10  2008     6 auto(av) f        18    27 p     compa…
 8 audi         a4 quattro  1.80  1999     4 manual(… 4        18    26 p     compa…
 9 audi         a4 quattro  1.80  1999     4 auto(l5) 4        16    25 p     compa…
10 audi         a4 quattro  2.00  2008     4 manual(… 4        20    28 p     compa…
# ... with 224 more rows
> 

이 데이터 세트에 대한 설명:
cty와 hwy: 도시와 고속도로의 주행 기록은 갤런당 주행 마일(miles per gallon, mpg)
displ: 엔진 배출량 (L)
drv:동력전동시스템(전륜f,후륜r,사륜4)
모델: 자동차 모델(1999년부터 2008년까지 매년 새로운 버전이 나오기 때문에 38종을 선택했다)
class(표시되지 않음): 자동차 종류를 설명하는 변수(더블 좌석, SUV, 콤팩트 등)
이 데이터 집합은 엔진 사이즈와 연료의 경제성의 상관성이 어떠한지 등 일련의 흥미로운 문제를 불러일으킬 수 있다.어떤 제조업체들이 연료의 경제성에 더욱 관심을 가지고 있습니까?지난 10년 동안 연료의 경제성은 개선되었습니까?우리는 ggplot2를 사용하여 데이터 분석과 그림을 만들어서 이 문제들에 대답할 수 있다.
참조 자료:
  • Hadley Wickham(2016). ggplot2. Springer International Publishing. doi: 10.1007/978-3-319-24277-4
  • 좋은 웹페이지 즐겨찾기