파 이 썬 으로 618 당일 한 동 인기 상품 의 판 매 량 데 이 터 를 올 라 가서 여러분 이 무엇 을 좋아 하 는 지 보 세 요!

머리말
본 고의 구 조 는 다음 과 같다.
1.모 동 에서 잘 팔 리 는 상품 데 이 터 를 얻 기
2.데 이 터 를 세척 하고 간단 한 분석 을 한다.
3.데 이 터 를 시각 적 으로 보 여 줍 니 다.
데이터 필드 는 다음 과 같 습 니 다.

모두 243 개의 모 동 베스트셀러 데 이 터 를 얻 었 다.
1.데이터 가 져 오기
1.웹 페이지 분석
코드 를 작성 하기 전에 먼저 웹 페이지 를 분석 합 니 다.

위 는 한 동의 베스트셀러 상품 이다.천 고 분석 을 통 해 이 페이지 는 비동기 로 딩(앞의 10 개 상품 은 정적 으로 로드 되 고 나머지 는 동적 비동기 로 딩)이 있 기 때문에 우 리 는 데 이 터 를 얻 기 위해 요청 을 써 야 한다.
2.정적 웹 페이지 상품 링크 가 져 오기
상품 의 판매,평론 등 데 이 터 는 상품 상세 페이지 에 있 는데,여기 서 먼저 상품 상세 페이지 링크 를 얻 습 니 다.

결 과 는 다음 과 같다.

3.동적 웹 페이지 상품 링크 가 져 오기
스냅 백 을 통 해 동적 로 딩 링크 를 얻 을 수 있 고 상품 제목 과 상품 id 를 얻 을 수 있 습 니 다.(이곳 의 상품 id 는 상품 상세 페이지 링크 를 연결 하 는 데 사용 할 수 있 습 니 다)


제 이 슨 데이터 획득 후 상품 제목 및 상품 ID 추출

4.할인,원가,초 할인 받 기
상품 ID 를 통 해 상품 할인,원가,초 할인 을 받 을 수 있 습 니 다.

여기 서 이 기능 을 함수 로 포장 하여 상품 ID 를 입력 하면 이 상품 의 상품 할인,원가,초 할인 을 받 을 수 있 습 니 다.
결 과 는 다음 과 같다.

5.평 점 수,호평 수,중 평 수,차 평 수,호평 율 획득
상품 ID 를 통 해 댓 글 수,호평 수,중간 평가 수,평가 수,호평 율 을 얻 을 수 있 습 니 다.(똑 같이 여기 인터페이스 가 있 고 인 터 페 이 스 는 스냅 백 을 통 해 얻 을 수 있 습 니 다.관심 있 는 것 은 직접 시도 할 수 있 습 니 다.모 르 는 것 은 직접 사용 할 수 있 습 니 다)

결 과 는 다음 과 같다.

6.엑셀 에 저장
이 어 상품 을 옮 겨 다 니 며 ID 를 통 해 상품 의 판매 상황(절차 4 와 절차 5 의 함수)을 얻 고 마지막 으로 execl 에 데 이 터 를 저장 합 니 다.
정의 헤더

데이터 기록

그 중의 getprice 와 CommentCount 는 절차 4 와 절차 5 의 함수 입 니 다.count 는 excel 의 줄 수 이기 때문에 순환 중 count+1 을 순서대로 다음 줄 에 기록 합 니 다.
최종 저장 결과

모두 243 개의 모 동 베스트셀러 데 이 터 를 얻 었 다.
2.데이터 분석&시각 화
1.데이터 세척

세척 해 야 할 내용 은 주로 그림 속 이 세 열(제목,할인,호평 수)이 있다.
세척 목표:
제목 이 너무 길 어서(길 이 를 10 내 로 조절)뒤의 그림 그리 기 가 불편 합 니 다.
할인 필드 에는 접 힌 글자 가 포함 되 어 있어 정렬 할 때 수치 형 을 직접 바 꿀 수 없습니다.
호평 수 중 만 명 은 1 만 2000 명 에서 12000 명 으로 구체 적 인 수치 로 바 뀌 었 다.

세척 결과:

2.가시 화-상품 할인 강도
세탁 후 데이터 에서 꺼 내기:상품 이름과 할인 두 열 을 진행[정렬]할인 최대 부터 할인 최소 까지.마지막 으로 15 등 을 꺼 내 시각 화 합 니 다.
핵심 코드***아래 와 같 음:

시각 화 효과:

3.가시 화-호 평 률 통계
데이터 에서 추출:호평 율 이라는 열 을 통 해 서로 다른 호평 율 을 통계 했다.예 를 들 어 호평 율 은 100%(1)의 상품 몇 건,호평 율 99%(0.99)의 상품 몇 건 등 이다.

핵심 코드***아래 와 같 음:

시각 화 효과:

3.가시 화-베스트셀러 판 매 량 순위
데이터 에서 꺼 내기:상품 이름과 댓 글 수 라 는 두 열 은 댓 글 수 에 따라 판매 근거 로 상품 의 판 매 량 을 정렬(높 은 것 에서 낮은 것)하고 15 위 권 을 꺼 내 시각 화 한다.
핵심 코드***아래 와 같 음:

시각 화 효과:

4.가시 화-베스트셀러 상위 15 위 원가 와 초 할인 대비
위의 분석 에서 잘 팔 리 는 상품 의 판 매 량 상위 15 위 를 알 수 있 는데 여기 서 이 15 개 상품 의 원가 와 초 할인 가 를 시각 적 으로 비교 할 수 있다.
핵심 코드***아래 와 같 음:

시각 화 효과:

파 이 썬 으로 618 당일 한 동 인기 상품 의 판 매 량 데 이 터 를 올 라 가 무엇 을 좋아 하 는 지 살 펴 보 자!의 글 은 여기까지 소개 되 었 습 니 다.더 많은 관련 Python 이 상품 판 매 량 데 이 터 를 기어 오 르 는 내용 은 우리 의 이전 글 을 검색 하거나 아래 의 관련 글 을 계속 조회 하 시기 바 랍 니 다.앞으로 많은 응원 바 랍 니 다!

좋은 웹페이지 즐겨찾기