kaggle~pandas편~

데이터 로드





형식 확인





데이터 표시



처음 5행 표시


누락 값 확인



각 요소가 누락되지 않으면 False


isany()는 하나라도 결손값이 있으면 TRUE가 된다.


연결



concat에서 2개의 데이터 프레임을 결합할 수 있다.
axis=1로 횡방향으로 결합.
keys로 명칭을 지정할 수 있다.


데이터 수



qiita.rb
#それぞれのランドマーク数をカウント
landmark_id_count = pd.DataFrame(train.groupby(['landmark_id'])['landmark_id'].count())
print(landmark_id_count)



이름 바꾸기 rename()



landmark_id를 각 라운드 마크의 총 수로 변경

qiita.rb
#Trueだと元のDataFrameが変更される.Flaseだと変更されない
landmark_id_count.rename(columns={'landmark_id': 'Count_Images'}, inplace=True)
print(landmark_id_count)



데이터 정렬



많은 랜드마크 순서로 정렬

qiita.rb
landmark_id_count.sort_values(by=['Count_Images'],ascending=False, inplace=True)
print(landmark_id_count)



색인 다시 붙이기



많은 랜드마크 순서로 정렬

qiita.rb
#indexをつけなおす。drop=Trueにすると元のindexは削除される
landmark_id_count.reset_index(drop=True, inplace=True)
print(landmark_id_count)

좋은 웹페이지 즐겨찾기