Youtube-Watch-History-Scraper를 사용하여 YouTube의 전체 열람 이력(2년분)을 출력해 보았다.

3390 단어 파이썬YouTube
iTunes 라든지 재생 횟수라는 기능이 있죠?
저는 음악을 자주 듣기 때문에 이 항목을 보고 "이 곡 100회 정도 듣고 있을까~"라고 생각하는 것을 좋아합니다.
그렇지만 최근에는 apple music라든지 보다 닮은 youtube로 음악을 듣는 횟수가 많기 때문에, 본 횟수(≒재생 횟수)로 랭킹을 작성하고 싶다고.
라고 하는 것으로, 우선 아래의 기사를 참고로 해, youtube의 전체 열람 이력을 출력해 보았습니다.

참고 자료



환경


  • mac OS (High Sierra)
  • google chrome
  • pyenv 1.2.4
  • python 3.6.5

  • 절차



    Youtube-Watch-History-Scraper 다운로드



    다음 저장소를 복제합니다. (혹은 zip 파일로 다운로드해, ​​해동한다.)
    htps : // 기주 b. 이 m / z ゔ ぉ d / 요츠 베와 tch - 히 s와 ry - Sc 등 ぺr

    EditThisCookie 다운로드



    아래 사이트 (chrome store)에서 확장 기능을 다운로드합니다.
    htps // ch 로메. 오, ぇ. 코 m / ぇ bs 잡아라 / 싶다 l / 에 에 와 ぃ s 코오 키에 / ff gmh 흠 lph

    YouTube 쿠키를 저장합니다.



    YouTube 톱 페이지 로 이동하여 확장 프로그램 아이콘을 클릭하세요.


    내보내기 버튼을 클릭하여 클립보드에 쿠키를 저장합니다.


    텍스트 편집기를 열고 붙여넣고 youtube_cookies.json라는 이름으로 ./Youtube-Watch-History-Scraper의 디렉토리 바로 아래에 저장합니다.



    이제 아래 준비는 k.

    pip에서 필요한 파일 설치 (이하 터미널 조작)


  • scrapy (스크래핑을위한 파이썬 프레임 워크)
  • lxml (HTML을 다루는 라이브러리)
  • sqlalchemy (python에서 sql을 다루는 라이브러리)

  • 디렉토리 바로 아래로 이동 한 후 위의 3 개를 pip를 통해 설치.
    $ cd ./Youtube-Watch-History-Scraper-master
    $ pip install scrapy lxml sqlalchemy
    

    막상 실행


    $ scrapy crawl yth_spider
    

    실행하면 대단한 기세로 열람 이력이 로그 출력되어 가므로,

    "우와, 1년 전 이런 동영상 보고 있었구나..."

    등 정서에 빠지면서 뽀뽀 봐 둔다.

    처리 종료


    $ 2018-05-27 14:54:21 [scrapy.core.engine] INFO: Spider closed (finished)
    

    5분 정도 방치하고 있으면 처리가 끝난다.

    출력 결과





    디렉토리를 살펴보면 youtube_history.db라는 파일이 생성되어 거기에 저장됩니다.
    컬럼은 다음과 같다.


    id
    vid
    author_id
    title
    description
    시간



    이것을 sqlite 등으로 해석합니다.

    여기 졸려서 일단이 기사는 이것에서 ...

    좋은 웹페이지 즐겨찾기