kaggle~pandas편~

데이터 로드

형식 확인

처음 5행 표시

각 요소가 누락되지 않으면 False

isany()는 하나라도 결손값이 있으면 TRUE가 된다.

concat에서 2개의 데이터 프레임을 결합할 수 있다.
axis=1로 횡방향으로 결합.
keys로 명칭을 지정할 수 있다.

qiita.rb

#それぞれのランドマーク数をカウント
landmark_id_count = pd.DataFrame(train.groupby(['landmark_id'])['landmark_id'].count())
print(landmark_id_count)

landmark_id를 각 라운드 마크의 총 수로 변경

qiita.rb

#Trueだと元のDataFrameが変更される.Flaseだと変更されない
landmark_id_count.rename(columns={'landmark_id': 'Count_Images'}, inplace=True)
print(landmark_id_count)

많은 랜드마크 순서로 정렬

qiita.rb

landmark_id_count.sort_values(by=['Count_Images'],ascending=False, inplace=True)
print(landmark_id_count)

많은 랜드마크 순서로 정렬

qiita.rb

#indexをつけなおす。drop=Trueにすると元のindexは削除される
landmark_id_count.reset_index(drop=True, inplace=True)
print(landmark_id_count)

이 문제에 관하여(kaggle~pandas편~), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/asparagasu/items/dfb472fddc9278980661

텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.

우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)

개발자 우수 사이트 수집

개발자가 알아야 할 필수 사이트 100선 추천 우리는 당신을 위해 100개의 자주 사용하는 개발자 학습 사이트를 정리했습니다