Python 데이터 예비 처리 데이터 규범화(정규 화)예제
데이터 규범화
지표 간 의 양 강 과 수치 범위 차이의 영향 을 없 애기 위해 표준화(귀 일화)처 리 를 하고 데 이 터 를 비례 에 따라 축소 하여 특정한 구역 에 떨 어 뜨 려 종합 분석 에 편리 하도록 해 야 한다.
데이터 규범화 방법 은 주로 다음 과 같다.
-최소-최대 규범화
-0-평균치 규범화
데이터 예시
코드 구현
#-*- coding: utf-8 -*-
#
import pandas as pd
import numpy as np
datafile = 'normalization_data.xls' #
data = pd.read_excel(datafile, header = None) #
(data - data.min())/(data.max() - data.min()) # -
(data - data.mean())/data.std() # -
명령 행 에서 아래 출력 을 볼 수 있 습 니 다:>>> (data-data.min())/(data.max()-data.min(
0 1 2 3
0 0.074380 0.937291 0.923520 1.000000
1 0.619835 0.000000 0.000000 0.850941
2 0.214876 0.119565 0.813322 0.000000
3 0.000000 1.000000 1.000000 0.563676
4 1.000000 0.942308 0.996711 0.804149
5 0.264463 0.838629 0.814967 0.909310
6 0.636364 0.846990 0.786184 0.929571
>>> (data-data.mean())/data.std()
0 1 2 3
0 -0.905383 0.635863 0.464531 0.798149
1 0.604678 -1.587675 -2.193167 0.369390
2 -0.516428 -1.304030 0.147406 -2.078279
3 -1.111301 0.784628 0.684625 -0.456906
4 1.657146 0.647765 0.675159 0.234796
5 -0.379150 0.401807 0.152139 0.537286
6 0.650438 0.421642 0.069308 0.595564
상기 코드 는
print
문 구 를 사용 하여 인쇄 하 는 것 으로 바 뀌 었 습 니 다.다음 과 같 습 니 다.
#-*- coding: utf-8 -*-
#
import pandas as pd
import numpy as np
datafile = 'normalization_data.xls' #
data = pd.read_excel(datafile, header = None) #
print((data - data.min())/(data.max() - data.min())) # -
print((data - data.mean())/data.std()) # -
다음 인쇄 결 과 를 출력 할 수 있 습 니 다:0 1 2 3
0 0.074380 0.937291 0.923520 1.000000
1 0.619835 0.000000 0.000000 0.850941
2 0.214876 0.119565 0.813322 0.000000
3 0.000000 1.000000 1.000000 0.563676
4 1.000000 0.942308 0.996711 0.804149
5 0.264463 0.838629 0.814967 0.909310
6 0.636364 0.846990 0.786184 0.929571
0 1 2 3
0 -0.905383 0.635863 0.464531 0.798149
1 0.604678 -1.587675 -2.193167 0.369390
2 -0.516428 -1.304030 0.147406 -2.078279
3 -1.111301 0.784628 0.684625 -0.456906
4 1.657146 0.647765 0.675159 0.234796
5 -0.379150 0.401807 0.152139 0.537286
6 0.650438 0.421642 0.069308 0.595564
첨부:코드 에 사용 되 는 normalizationdata.xls 여 기 를 클릭 하 십시오 본 사이트 다운로드.
더 많은 파 이 썬 관련 내용 에 관심 이 있 는 독자 들 은 본 사이트 의 주 제 를 볼 수 있다.
본 논문 에서 말 한 것 이 여러분 의 Python 프로 그래 밍 에 도움 이 되 기 를 바 랍 니 다.
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
Python의 None과 NULL의 차이점 상세 정보그래서 대상 = 속성 + 방법 (사실 방법도 하나의 속성, 데이터 속성과 구별되는 호출 가능한 속성 같은 속성과 방법을 가진 대상을 클래스, 즉 Classl로 분류할 수 있다.클래스는 하나의 청사진과 같아서 하나의 ...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.