판다스 랜덤 배열과 랜덤 표본 추출 분석
무작위 배열
numpy를 이용하다.random.permutation () 함수, 서열의 무작위 배열을 되돌려줍니다.이 랜덤 배열을 take () 함수의 매개 변수로 하고, take () 함수를 응용하면 이 랜덤 배열에 따라 Series 대상이나 DataFrame 대상의 각 줄의 순서를 조정할 수 있습니다.
그 예시 코드 example1.py는 다음과 같습니다.
import numpy as np
import pandas as pd
# DataFrame
df = pd.DataFrame(np.arange(12).reshape(4,3))
print(df)
0 1 2
0 0 1 2
1 3 4 5
2 6 7 8
3 9 10 11
#
order = np.random.permutation(4)
# DataFrame
newDf = df.take(order)
print(newDf)
0 1 2
2 6 7 8
3 9 10 11
0 0 1 2
1 3 4 5
무작위 표본 추출
무작위 표본 추출은 무작위로 데이터에서 일정한 행수나 비례에 따라 데이터를 추출하는 것을 말한다.무작위 표본 추출의 함수는 다음과 같다.
numpy.random.randint(start,end,size)
함수의 매개변수는 다음과 같습니다.
import numpy as np
import pandas as pd
# DataFrame
df = pd.DataFrame(np.arange(12).reshape(4,3))
print(df)
0 1 2
0 0 1 2
1 3 4 5
2 6 7 8
3 9 10 11
#
order = np.random.randint(0,len(df),size=3)
# DataFrame
newDf = df.take(order)
print(newDf)
0 1 2
0 0 1 2
1 3 4 5
1 3 4 5
이상은 판다스 랜덤 배열과 랜덤 샘플링에 대한 상세한 내용입니다. 판다스 랜덤 배열과 랜덤 샘플링에 대한 더 많은 자료는 저희 다른 관련 글에 주목하세요!
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
【Pandas】DatetimeIndex란? no.29안녕하세요, 마유미입니다. Pandas에 대한 기사를 시리즈로 작성하고 있습니다. 이번은 제29회의 기사가 됩니다. 에서 Pandas의 시간에 대한 모듈에 대해 씁니다. 이번 기사에서는, 「DatetimeIndex」...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.