Learning R 노트 Chapter 14 Explore and Visualize

1678 단어
Explore
연속형 데이터를 탐색할 때 sd, var,range 등은 모두 상용 함수이다.먼저cut, 그리고table은 연속을 이산으로 바꾸어 관찰할 수 있다.두 개의 더 많은 등장의numeric vector를 비교할 때, pmin () 과 pmax () 는 모든 위치의 최소/최대 값을 출력할 수 있습니다.
> (x=sample(10,10));(y=sample(10,10));(z=sample(10,10))
 [1]  5  8  2  4  6  9  1  3  7 10
 [1]  4  5  8  7 10  2  6  3  9  1
 [1] 10  9  2  1  7  8  3  4  6  5
> pmin(x,y,z)
 [1] 4 5 2 1 6 2 1 3 6 1

cummin과cummax는vector를 받아들여서 이vector의 최소/최대 sofar의 값을 입력하십시오.
> cummax(x)
 [1]  5  8  8  8  8  9  9  9  9 10

quantile () 함수는 vector의 xx% 분위를 제공합니다.
> (x=rnorm(20))
 [1] -0.97392547 -2.68243940 -0.03796838 -0.65249979 -0.28756329  0.38868737  0.68847986         -0.43226118
 [9]  1.55034408  1.30703724  0.01662464 -0.46428297 -0.12325135  1.20905396 -1.03437545  1.26728394
[17] -0.42276944  0.10972380  2.16093479 -0.54529102
> quantile(x)
         0%         25%         50%         75%        100% 
-2.68243940 -0.48453498 -0.08060986  0.81862339  2.16093479 
> quantile(x,c(.1,.3,.5,.7,.9))
        10%         30%         50%         70%         90% 
-0.97997047 -0.44186772 -0.08060986  0.47862511  1.33136792 

fivenum()은quantile의 속도 최적화 버전으로 특정 출력 5개 분위(최소, 최대, 중치, 25%, 75%)의 값을 출력합니다.
> fivenum(x)
[1] -2.68243940 -0.50478700 -0.08060986  0.94876691  2.16093479

Plotting
ggplot2는 barplot을 그릴 때 bar가 쌓이지 않도록 합니다. (기본 설정 'stack') 은 다음과 같습니다.position의 다른 매개 변수는'fill'도 있어요.
geom_bar(stat = 'identity' , position = 'dodge')

전체 이미지를 전환하려면 다음 명령을 사용합니다.
coord_flip()

좋은 웹페이지 즐겨찾기