R 언어 | 데이터 규범화, 귀일화
1. 최소-최대 규범화
이차 표준화라고도 하는데 원시 데이터에 대한 선형 변환으로 데이터를 [0,1] 사이에 비추어 효능 계수법과 같다.
# -
b1=(data[,1]-min(data[,1]))/(max(data[,1])-min(data[,1]))
b2=(data[,2]-min(data[,2]))/(max(data[,2])-min(data[,2]))
b3=(data[,3]-min(data[,3]))/(max(data[,3])-min(data[,3]))
b4=(data[,4]-min(data[,4]))/(max(data[,4])-min(data[,4]))
data_scatter=cbind(b1,b2,b3,b4)
2. 균일치 표준화법
표준차 표준화, 제로 균일치 규범화 등 방법은 처리된 데이터의 균일치는 0이고 표준차는 1이다.공식은 다음과 같습니다.
x*=(x-균일치)/표준차
균일치는 이군치의 영향이 비교적 크기 때문에 균일치를 변수의 중위수로 바꿀 수도 있다.
# -
data_zscore=scale(data)
3. 소수정표 규범화
변수의 소수점 위치를 이동하여 변수를 [-1,1]에 비추다
#
i1=ceiling(log(max(abs(data[,1])),10))#
c1=data[,1]/10^i1
i2=ceiling(log(max(abs(data[,2])),10))
c2=data[,2]/10^i2
i3=ceiling(log(max(abs(data[,3])),10))
c3=data[,3]/10^i3
i4=ceiling(log(max(abs(data[,4])),10))
c4=data[,4]/10^i4
data_dot=cbind(c1,c2,c3,c4)
#
options(digits = 4)#
data_dot
코드에서log(x,10)는 ln(x)과 같다.
options는 네 자릿수 소수점 보존을 제어할 수 있습니다
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
다양한 언어의 JSONJSON은 Javascript 표기법을 사용하여 데이터 구조를 레이아웃하는 데이터 형식입니다. 그러나 Javascript가 코드에서 이러한 구조를 나타낼 수 있는 유일한 언어는 아닙니다. 저는 일반적으로 '객체'{}...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.