데이터 지우기 연습을 위해 일부러 데이터를 잃어버린 파이썬.

2554 단어 Pythontech

라이브러리 작업

  • numpy
  • pandas
  • 절차.


    데이터 가져오기 및 데이터 세트 정의


    샘플이기 때문에 numby로 무작위 수를 적절하게 정의하고 데이터 프레임으로 사용합니다
    import numpy as np
    import pandas as pd
    
    sample_data = np.random.rand(100, 10)
    sample_dataset = pd.DataFrame(sample_data)
    

    함수 정의


    문자열을 통해 데이터 프레임과 부족한 값을 표시할 열 이름을 전달하는 함수입니다.
    8행에서 객체의 행 인덱스를 지정하고 9행에서 None으로 바꿉니다.
    def random_missing(target_df,column):
      """
      Input   target_df : Dataframe, 
              column : Number  Column that you'd like to missing randomly
      
      Output  Dataframe that missing randomly
      """
      target_index = np.random.choice(target_df.index)
      target_df.loc[target_index, column] = None
      return target_df
    

    실행 결과


    나은이가 보이네.

    .info 실행 결과


    97non-null 확인 가능합니다.

    좋은 웹페이지 즐겨찾기