파 이 썬 으로 618 당일 한 동 인기 상품 의 판 매 량 데 이 터 를 올 라 가서 여러분 이 무엇 을 좋아 하 는 지 보 세 요!
본 고의 구 조 는 다음 과 같다.
1.모 동 에서 잘 팔 리 는 상품 데 이 터 를 얻 기
2.데 이 터 를 세척 하고 간단 한 분석 을 한다.
3.데 이 터 를 시각 적 으로 보 여 줍 니 다.
데이터 필드 는 다음 과 같 습 니 다.
모두 243 개의 모 동 베스트셀러 데 이 터 를 얻 었 다.
1.데이터 가 져 오기
1.웹 페이지 분석
코드 를 작성 하기 전에 먼저 웹 페이지 를 분석 합 니 다.
위 는 한 동의 베스트셀러 상품 이다.천 고 분석 을 통 해 이 페이지 는 비동기 로 딩(앞의 10 개 상품 은 정적 으로 로드 되 고 나머지 는 동적 비동기 로 딩)이 있 기 때문에 우 리 는 데 이 터 를 얻 기 위해 요청 을 써 야 한다.
2.정적 웹 페이지 상품 링크 가 져 오기
상품 의 판매,평론 등 데 이 터 는 상품 상세 페이지 에 있 는데,여기 서 먼저 상품 상세 페이지 링크 를 얻 습 니 다.
결 과 는 다음 과 같다.
3.동적 웹 페이지 상품 링크 가 져 오기
스냅 백 을 통 해 동적 로 딩 링크 를 얻 을 수 있 고 상품 제목 과 상품 id 를 얻 을 수 있 습 니 다.(이곳 의 상품 id 는 상품 상세 페이지 링크 를 연결 하 는 데 사용 할 수 있 습 니 다)
제 이 슨 데이터 획득 후 상품 제목 및 상품 ID 추출
4.할인,원가,초 할인 받 기
상품 ID 를 통 해 상품 할인,원가,초 할인 을 받 을 수 있 습 니 다.
여기 서 이 기능 을 함수 로 포장 하여 상품 ID 를 입력 하면 이 상품 의 상품 할인,원가,초 할인 을 받 을 수 있 습 니 다.
결 과 는 다음 과 같다.
5.평 점 수,호평 수,중 평 수,차 평 수,호평 율 획득
상품 ID 를 통 해 댓 글 수,호평 수,중간 평가 수,평가 수,호평 율 을 얻 을 수 있 습 니 다.(똑 같이 여기 인터페이스 가 있 고 인 터 페 이 스 는 스냅 백 을 통 해 얻 을 수 있 습 니 다.관심 있 는 것 은 직접 시도 할 수 있 습 니 다.모 르 는 것 은 직접 사용 할 수 있 습 니 다)
결 과 는 다음 과 같다.
6.엑셀 에 저장
이 어 상품 을 옮 겨 다 니 며 ID 를 통 해 상품 의 판매 상황(절차 4 와 절차 5 의 함수)을 얻 고 마지막 으로 execl 에 데 이 터 를 저장 합 니 다.
정의 헤더
데이터 기록
그 중의 getprice 와 CommentCount 는 절차 4 와 절차 5 의 함수 입 니 다.count 는 excel 의 줄 수 이기 때문에 순환 중 count+1 을 순서대로 다음 줄 에 기록 합 니 다.
최종 저장 결과
모두 243 개의 모 동 베스트셀러 데 이 터 를 얻 었 다.
2.데이터 분석&시각 화
1.데이터 세척
세척 해 야 할 내용 은 주로 그림 속 이 세 열(제목,할인,호평 수)이 있다.
세척 목표:
제목 이 너무 길 어서(길 이 를 10 내 로 조절)뒤의 그림 그리 기 가 불편 합 니 다.
할인 필드 에는 접 힌 글자 가 포함 되 어 있어 정렬 할 때 수치 형 을 직접 바 꿀 수 없습니다.
호평 수 중 만 명 은 1 만 2000 명 에서 12000 명 으로 구체 적 인 수치 로 바 뀌 었 다.
세척 결과:
2.가시 화-상품 할인 강도
세탁 후 데이터 에서 꺼 내기:상품 이름과 할인 두 열 을 진행[정렬]할인 최대 부터 할인 최소 까지.마지막 으로 15 등 을 꺼 내 시각 화 합 니 다.
핵심 코드***아래 와 같 음:
시각 화 효과:
3.가시 화-호 평 률 통계
데이터 에서 추출:호평 율 이라는 열 을 통 해 서로 다른 호평 율 을 통계 했다.예 를 들 어 호평 율 은 100%(1)의 상품 몇 건,호평 율 99%(0.99)의 상품 몇 건 등 이다.
핵심 코드***아래 와 같 음:
시각 화 효과:
3.가시 화-베스트셀러 판 매 량 순위
데이터 에서 꺼 내기:상품 이름과 댓 글 수 라 는 두 열 은 댓 글 수 에 따라 판매 근거 로 상품 의 판 매 량 을 정렬(높 은 것 에서 낮은 것)하고 15 위 권 을 꺼 내 시각 화 한다.
핵심 코드***아래 와 같 음:
시각 화 효과:
4.가시 화-베스트셀러 상위 15 위 원가 와 초 할인 대비
위의 분석 에서 잘 팔 리 는 상품 의 판 매 량 상위 15 위 를 알 수 있 는데 여기 서 이 15 개 상품 의 원가 와 초 할인 가 를 시각 적 으로 비교 할 수 있다.
핵심 코드***아래 와 같 음:
시각 화 효과:
파 이 썬 으로 618 당일 한 동 인기 상품 의 판 매 량 데 이 터 를 올 라 가 무엇 을 좋아 하 는 지 살 펴 보 자!의 글 은 여기까지 소개 되 었 습 니 다.더 많은 관련 Python 이 상품 판 매 량 데 이 터 를 기어 오 르 는 내용 은 우리 의 이전 글 을 검색 하거나 아래 의 관련 글 을 계속 조회 하 시기 바 랍 니 다.앞으로 많은 응원 바 랍 니 다!
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
Python의 None과 NULL의 차이점 상세 정보그래서 대상 = 속성 + 방법 (사실 방법도 하나의 속성, 데이터 속성과 구별되는 호출 가능한 속성 같은 속성과 방법을 가진 대상을 클래스, 즉 Classl로 분류할 수 있다.클래스는 하나의 청사진과 같아서 하나의 ...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.