독서노트
5655 단어 ggplot2
Welcome to ggplot2
무엇이 도형의 문법입니까?
ggplot은 통계 도형을 그리는 데 사용되는 R 패키지로 그 뒤에 있는 문법이 지원한다.
도형의 문법은 한 장의 도형이 데이터(data)에서 기하학적 대상까지의 도형 속성의 매핑(mapping)이라는 것을 알려준다.도형에는 데이터의 통계 변환도 포함되어 있으며 최종적으로 특정한 좌표계에 그려진다.또한 분면은 데이터의 서로 다른 서브집합을 생성하는 도형에 사용할 수 있다.총괄적으로 말하면 통계 도형은 상술한 독립된 도형 부품으로 구성된 것이다.
몇 가지 개념을 이해해야 한다. - 기하학적 대상(Geometric, 줄임말 geom)은 그림에서 실제적으로 보이는 도형 요소를 대표한다. 점, 선, 다각형 등을 포함한다. - 도형 속성(Aesthetic, 약칭 aes)은 색깔, 형상 등을 포함한다. - 통계 변환(Statistical transformation, 줄임말stats)은 원시 데이터에 대해 어떤 계산과 정리를 하는 것을 말한다.예를 들어 이원 산점도와 회귀선-도층(Layer)이 기하학적 대상과 통계적 변환으로 구성된 표도(scale)는 데이터의 값을 도형 공간에 비추는 것이다. 예를 들어 색깔, 크기와 모양이 서로 다른 수치를 나타낸다.표도를 나타내는 흔히 볼 수 있는 방법은 도례와 좌표축-좌표계(Coordinate, 줄임말은coord)를 그리는 것이다. 주로 좌표축과 격자선을 제어하고 데이터가 도형이 있는 평면에 어떻게 비치는지 설명한다.일반적으로 피리칼 좌표계-분면(facet)도 조건으로 그림을 그린다고 하는데, 그룹을 나누는 방법과 배열을 제어하고, 데이터를 각 서브집합으로 분해하는 방법, 그리고 서브집합에 대해 그림을 그리는 방법을 설명한다.
설치하다.
Rstudio에는 웹 및 소프트웨어 버전이 있습니다.
홈페이지판 등록 후 직접 사용 가능;소프트웨어 버전에서는 설치 ggplot2 패키지를 다운로드하여 다음 명령을 실행해야 합니다.
> install.packages("ggplot2")
ggplot2 패키지에 포함된 데이터 (폭스바겐 자동차 연료의 경제성) 는 학습에 사용할 수 있다
> library(ggplot2)
> mpg
# A tibble: 234 x 11
manufacturer model displ year cyl trans drv cty hwy fl class
<chr> <chr> <int> <int> <chr> <chr> <int> <int> <chr> <chr>
1 audi a4 1.80 1999 4 auto(l5) f 18 29 p compa…
2 audi a4 1.80 1999 4 manual(… f 21 29 p compa…
3 audi a4 2.00 2008 4 manual(… f 20 31 p compa…
4 audi a4 2.00 2008 4 auto(av) f 21 30 p compa…
5 audi a4 2.80 1999 6 auto(l5) f 16 26 p compa…
6 audi a4 2.80 1999 6 manual(… f 18 26 p compa…
7 audi a4 3.10 2008 6 auto(av) f 18 27 p compa…
8 audi a4 quattro 1.80 1999 4 manual(… 4 18 26 p compa…
9 audi a4 quattro 1.80 1999 4 auto(l5) 4 16 25 p compa…
10 audi a4 quattro 2.00 2008 4 manual(… 4 20 28 p compa…
# ... with 224 more rows
>
이 데이터 세트에 대한 설명:
cty와 hwy: 도시와 고속도로의 주행 기록은 갤런당 주행 마일(miles per gallon, mpg)
displ: 엔진 배출량 (L)
drv:동력전동시스템(전륜f,후륜r,사륜4)
모델: 자동차 모델(1999년부터 2008년까지 매년 새로운 버전이 나오기 때문에 38종을 선택했다)
class(표시되지 않음): 자동차 종류를 설명하는 변수(더블 좌석, SUV, 콤팩트 등)
이 데이터 집합은 엔진 사이즈와 연료의 경제성의 상관성이 어떠한지 등 일련의 흥미로운 문제를 불러일으킬 수 있다.어떤 제조업체들이 연료의 경제성에 더욱 관심을 가지고 있습니까?지난 10년 동안 연료의 경제성은 개선되었습니까?우리는 ggplot2를 사용하여 데이터 분석과 그림을 만들어서 이 문제들에 대답할 수 있다.
참조 자료:
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
Jupyter R kernel에서 ggplot 그래프에 일본어가 표시되지 않는 문제를 해결합니다.Jupyter notebook에서 다음 R 코드를 실행하면, 자신의 우분투 18.04 환경에서는 다음 출력이 되었다. 다음 중 어느 것도 작동하지 않았다. theme(text=element_text(family="f...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.