판다스 랜덤 배열과 랜덤 표본 추출 분석

무작위 배열


numpy를 이용하다.random.permutation () 함수, 서열의 무작위 배열을 되돌려줍니다.이 랜덤 배열을 take () 함수의 매개 변수로 하고, take () 함수를 응용하면 이 랜덤 배열에 따라 Series 대상이나 DataFrame 대상의 각 줄의 순서를 조정할 수 있습니다.
그 예시 코드 example1.py는 다음과 같습니다.

import numpy as np
import pandas as pd
# DataFrame
df = pd.DataFrame(np.arange(12).reshape(4,3))
print(df)
 0 1 2
0 0 1 2
1 3 4 5
2 6 7 8
3 9 10 11

# 
order = np.random.permutation(4)
# DataFrame 
newDf = df.take(order)
print(newDf)
 0 1 2
2 6 7 8
3 9 10 11
0 0 1 2
1 3 4 5

무작위 표본 추출


무작위 표본 추출은 무작위로 데이터에서 일정한 행수나 비례에 따라 데이터를 추출하는 것을 말한다.무작위 표본 추출의 함수는 다음과 같다.
numpy.random.randint(start,end,size)
함수의 매개변수는 다음과 같습니다.
  • start: 무작위 수의 시작값;
  • end: 무작위 수의 종료값;
  • size: 표본 추출 개수.
  • numpy를 통해.random.randint () 함수는 무작위 추출 데이터를 생성하고take () 함수를 응용하면 무작위 추출 시리즈 대상이나 DataFrame 대상의 데이터를 실현할 수 있습니다.그 예시 코드 example2.py는 다음과 같습니다.
    
    import numpy as np
    import pandas as pd
    # DataFrame
    df = pd.DataFrame(np.arange(12).reshape(4,3))
    print(df)
    0 1 2
    0 0 1 2
    1 3 4 5
    2 6 7 8
    3 9 10 11
    
    # 
    order = np.random.randint(0,len(df),size=3)
    # DataFrame 
    newDf = df.take(order)
    print(newDf)
    0 1 2
    0 0 1 2
    1 3 4 5
    1 3 4 5
    이상은 판다스 랜덤 배열과 랜덤 샘플링에 대한 상세한 내용입니다. 판다스 랜덤 배열과 랜덤 샘플링에 대한 더 많은 자료는 저희 다른 관련 글에 주목하세요!

    좋은 웹페이지 즐겨찾기