단 2개의 명령으로 1000장의 이미지 다운로드

기계 학습을 위한 학습 데이터 세트로서는, 또 관상용으로서, 많은 화상을 원할 때가 있다고 생각합니다.
그럴 때 편리한 Python 패키지를 GitHub에서 발견했으므로 소개합니다.

결론



모처럼 방법을 위해, 우선은 결론으로부터.
터미널을 열고 다음 두 명령을 순서대로 입력하면 고양이 이미지가 1000장 다운로드됩니다.

pip install google_images_download
googleimagesdownload -ri -cd "chromedriver.exe" -l 1000  -k "猫"

그러나 준비하지 않으면 두 번째 명령으로 오류가 발생합니다.

준비


  • Google 크롬 설치

  • 설명 불필요하다고 생각합니다.
  • Python 설치

  • 이것도 설명은 생략합니다. 필자는 공식 설치 프로그램에서 설치했습니다.
  • chromedriver 다운로드

  • 사용하는 Python 패키지의 동작에 필요한 것입니다. 아래 링크에서 다운로드 가능합니다.
    h tp // ch 로메 d리ゔぇr. ch 로미우 m. 오 rg / w w ぉ 아 ds
    다운로드 후에는 현재 디렉토리 (터미널이 열려있는 디렉토리)에 압축을 풉니 다.
  • 명령 입력

  • 준비가 완료되었습니다. 두 개의 명령을 입력합니다.
    pip install google_images_download
    googleimagesdownload -ri -cd "chromedriver.exe" -l 1000  -k "猫"
    

    해설


  • 명령 그 1
  • pip install google_images_download
    

    google_images_download Python 패키지를 Python 환경에 설치하고 있습니다.

    이 패키지를 사용하면 Google 이미지 검색을 사용하여 이미지를 다운로드할 수 있습니다.

    Python-2.x와 3.x 버전 모두 호환되는 것 같습니다.
  • 명령 2
  • googleimagesdownload -ri -cd "chromedriver.exe" -l 1000  -k "猫"
    

    google_images_download를 사용하면 선택적으로 이미지를 다운로드하는 방법을 지정할 수 있습니다.

    옵션은 -ri와 같이 -와 함께 패키지에 전달되는 인수입니다.

    -ri
    related_images의 약자로, 대량의 이미지(100장~)를 다운로드하는 경우에 필요한 것 같습니다.

    -cd "chromedriver.exe"
    chromedriver의 약자로 -ri 옵션을 사용할 때 필요한 것 같습니다. -cd에 이어 준비로 다운로드한 chromedriver.exe의 경로(위치)를 입력해야 합니다. 이 패스는, 절대 패스도 상대 패스라도 좋은 것 같고, 이번은 상대 패스로 입력하고 있습니다.

    -l 1000
    limit의 약자로 다운로드할 이미지의 매수 상한을 설정할 수 있습니다. 이번에는 상한을 1000장으로 설정하고 있습니다.

    -k "고양이"
    키워드의 약자로 Google 이미지 검색에 사용할 키워드를 설정할 수 있습니다. 이번에는 고양이로 설정하고 있습니다.

    이것 이외에도 많은 옵션이 준비되어 있으므로, 다른 사용법을 하고 싶은 분은 README(영어) 를 보고 시험해 보면 좋다고 생각합니다.

    감상



    검색 관계의 API나 유명한 스크래핑 관계의 Python 패키지에서는, 지금까지 간단하게, 대량의 이미지를 입수하는 것은 어렵다고 생각하므로, google_images_download를 작성해 주신 분에게는 감사하고 싶습니다.

    저자는 이제 학습 데이터를 수집하고 Google Cloud Auto ML에서 분류 모델을 만들고 사용자가 입력한 이미지를 분류할 수 있는 웹 앱을 만들려고 합니다.

    좋은 웹페이지 즐겨찾기