빅데이터분석기사 [R, 빅분기] 혼동행렬을 통한 모형 평가 혼동 행렬은 분류 모형을 평가하는 지표입니다. 혼동 행렬은 분석 모델에서 구한 분류의 예측 범주와 데이터의 실제 분류 범주를 교차표 형태로 정리한 행렬 또는 평가지표입니다. 여기서는 R의 Ionosphere데이터를 사용해서 예측값을 만들어보고 혼동행렬을 사용해서 둘을 비교해보았습니다. 데이터 나누기 ConfusionMatrix(혼동행렬)은 caret패키지에 포함되어 있습니다. p = 0.7은... R빅데이터분석기사빅분기R [R, 빅분기] 이상치 출력 및 제거하기 TIL R에서 데이터분석을 하기전에 전처리과정이 필요한데, 그 중 깔끔한 데이터 셋을 만들기 위해서는 이상치를 제거하는 과정이 필요하다. 먼저 저장되어 있는 CSV파일을 출력해보자. getwd() 함수를 사용하면 현재 내가 작업하고 있는 경로나 입력되있는 경로를 알 수 있다. 그리고 경로를 수정할 때는 setwd()를 사용해서 ()안에 불러올 csv파일이 있는 경로를 넣어주면 된다. list.fil... R빅데이터분석기사빅분기R
[R, 빅분기] 혼동행렬을 통한 모형 평가 혼동 행렬은 분류 모형을 평가하는 지표입니다. 혼동 행렬은 분석 모델에서 구한 분류의 예측 범주와 데이터의 실제 분류 범주를 교차표 형태로 정리한 행렬 또는 평가지표입니다. 여기서는 R의 Ionosphere데이터를 사용해서 예측값을 만들어보고 혼동행렬을 사용해서 둘을 비교해보았습니다. 데이터 나누기 ConfusionMatrix(혼동행렬)은 caret패키지에 포함되어 있습니다. p = 0.7은... R빅데이터분석기사빅분기R [R, 빅분기] 이상치 출력 및 제거하기 TIL R에서 데이터분석을 하기전에 전처리과정이 필요한데, 그 중 깔끔한 데이터 셋을 만들기 위해서는 이상치를 제거하는 과정이 필요하다. 먼저 저장되어 있는 CSV파일을 출력해보자. getwd() 함수를 사용하면 현재 내가 작업하고 있는 경로나 입력되있는 경로를 알 수 있다. 그리고 경로를 수정할 때는 setwd()를 사용해서 ()안에 불러올 csv파일이 있는 경로를 넣어주면 된다. list.fil... R빅데이터분석기사빅분기R