kaggle~pandas편~
데이터 로드

형식 확인

데이터 표시
처음 5행 표시

누락 값 확인
각 요소가 누락되지 않으면 False

isany()는 하나라도 결손값이 있으면 TRUE가 된다.

연결
concat에서 2개의 데이터 프레임을 결합할 수 있다.
axis=1로 횡방향으로 결합.
keys로 명칭을 지정할 수 있다.

데이터 수
qiita.rb#それぞれのランドマーク数をカウント
landmark_id_count = pd.DataFrame(train.groupby(['landmark_id'])['landmark_id'].count())
print(landmark_id_count)

이름 바꾸기 rename()
landmark_id를 각 라운드 마크의 총 수로 변경
qiita.rb#Trueだと元のDataFrameが変更される.Flaseだと変更されない
landmark_id_count.rename(columns={'landmark_id': 'Count_Images'}, inplace=True)
print(landmark_id_count)

데이터 정렬
많은 랜드마크 순서로 정렬
qiita.rblandmark_id_count.sort_values(by=['Count_Images'],ascending=False, inplace=True)
print(landmark_id_count)

색인 다시 붙이기
많은 랜드마크 순서로 정렬
qiita.rb#indexをつけなおす。drop=Trueにすると元のindexは削除される
landmark_id_count.reset_index(drop=True, inplace=True)
print(landmark_id_count)
Reference
이 문제에 관하여(kaggle~pandas편~), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다
https://qiita.com/asparagasu/items/dfb472fddc9278980661
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념
(Collection and Share based on the CC Protocol.)

데이터 표시
처음 5행 표시

누락 값 확인
각 요소가 누락되지 않으면 False

isany()는 하나라도 결손값이 있으면 TRUE가 된다.

연결
concat에서 2개의 데이터 프레임을 결합할 수 있다.
axis=1로 횡방향으로 결합.
keys로 명칭을 지정할 수 있다.

데이터 수
qiita.rb#それぞれのランドマーク数をカウント
landmark_id_count = pd.DataFrame(train.groupby(['landmark_id'])['landmark_id'].count())
print(landmark_id_count)

이름 바꾸기 rename()
landmark_id를 각 라운드 마크의 총 수로 변경
qiita.rb#Trueだと元のDataFrameが変更される.Flaseだと変更されない
landmark_id_count.rename(columns={'landmark_id': 'Count_Images'}, inplace=True)
print(landmark_id_count)

데이터 정렬
많은 랜드마크 순서로 정렬
qiita.rblandmark_id_count.sort_values(by=['Count_Images'],ascending=False, inplace=True)
print(landmark_id_count)

색인 다시 붙이기
많은 랜드마크 순서로 정렬
qiita.rb#indexをつけなおす。drop=Trueにすると元のindexは削除される
landmark_id_count.reset_index(drop=True, inplace=True)
print(landmark_id_count)
Reference
이 문제에 관하여(kaggle~pandas편~), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다
https://qiita.com/asparagasu/items/dfb472fddc9278980661
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념
(Collection and Share based on the CC Protocol.)
각 요소가 누락되지 않으면 False

isany()는 하나라도 결손값이 있으면 TRUE가 된다.

연결
concat에서 2개의 데이터 프레임을 결합할 수 있다.
axis=1로 횡방향으로 결합.
keys로 명칭을 지정할 수 있다.

데이터 수
qiita.rb#それぞれのランドマーク数をカウント
landmark_id_count = pd.DataFrame(train.groupby(['landmark_id'])['landmark_id'].count())
print(landmark_id_count)

이름 바꾸기 rename()
landmark_id를 각 라운드 마크의 총 수로 변경
qiita.rb#Trueだと元のDataFrameが変更される.Flaseだと変更されない
landmark_id_count.rename(columns={'landmark_id': 'Count_Images'}, inplace=True)
print(landmark_id_count)

데이터 정렬
많은 랜드마크 순서로 정렬
qiita.rblandmark_id_count.sort_values(by=['Count_Images'],ascending=False, inplace=True)
print(landmark_id_count)

색인 다시 붙이기
많은 랜드마크 순서로 정렬
qiita.rb#indexをつけなおす。drop=Trueにすると元のindexは削除される
landmark_id_count.reset_index(drop=True, inplace=True)
print(landmark_id_count)
Reference
이 문제에 관하여(kaggle~pandas편~), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다
https://qiita.com/asparagasu/items/dfb472fddc9278980661
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념
(Collection and Share based on the CC Protocol.)
qiita.rb
#それぞれのランドマーク数をカウント
landmark_id_count = pd.DataFrame(train.groupby(['landmark_id'])['landmark_id'].count())
print(landmark_id_count)

이름 바꾸기 rename()
landmark_id를 각 라운드 마크의 총 수로 변경
qiita.rb#Trueだと元のDataFrameが変更される.Flaseだと変更されない
landmark_id_count.rename(columns={'landmark_id': 'Count_Images'}, inplace=True)
print(landmark_id_count)

데이터 정렬
많은 랜드마크 순서로 정렬
qiita.rblandmark_id_count.sort_values(by=['Count_Images'],ascending=False, inplace=True)
print(landmark_id_count)

색인 다시 붙이기
많은 랜드마크 순서로 정렬
qiita.rb#indexをつけなおす。drop=Trueにすると元のindexは削除される
landmark_id_count.reset_index(drop=True, inplace=True)
print(landmark_id_count)
Reference
이 문제에 관하여(kaggle~pandas편~), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다
https://qiita.com/asparagasu/items/dfb472fddc9278980661
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념
(Collection and Share based on the CC Protocol.)
#Trueだと元のDataFrameが変更される.Flaseだと変更されない
landmark_id_count.rename(columns={'landmark_id': 'Count_Images'}, inplace=True)
print(landmark_id_count)
많은 랜드마크 순서로 정렬
qiita.rb
landmark_id_count.sort_values(by=['Count_Images'],ascending=False, inplace=True)
print(landmark_id_count)

색인 다시 붙이기
많은 랜드마크 순서로 정렬
qiita.rb#indexをつけなおす。drop=Trueにすると元のindexは削除される
landmark_id_count.reset_index(drop=True, inplace=True)
print(landmark_id_count)
Reference
이 문제에 관하여(kaggle~pandas편~), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다
https://qiita.com/asparagasu/items/dfb472fddc9278980661
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념
(Collection and Share based on the CC Protocol.)
#indexをつけなおす。drop=Trueにすると元のindexは削除される
landmark_id_count.reset_index(drop=True, inplace=True)
print(landmark_id_count)
Reference
이 문제에 관하여(kaggle~pandas편~), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/asparagasu/items/dfb472fddc9278980661텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념
(Collection and Share based on the CC Protocol.)