【최신】Google 이미지 검색을 저장하는 Python 라이브러리의 사용법&ChromeDriver를ubuntu로 사용

새해 복 많이 받으세요.

상당히 알고 있는 사람이 많다고는 생각합니다만 제가 몇번이나 헤매기 때문에 적어 둡니다.
기계 학습시 학습 데이터에 이용하십시오.

2020년 8월경? 에 검색 결과의 제공 방법이 크게 바뀐 것 같고, Windows용 소프트의 「ImageSpider」를 사용할 수 없게 되었습니다. (상당히 편리했지만...)
그래서 이제부터는 파이썬 라이브러리의 google_images_download를 사용하기로 결정했습니다.

설치



【주의】 pip에서는 설치하지 마십시오!


pip3 install google_images_download

PIP에 있는 버전에서는 Google 측 변경을 지원하지 않으므로 설치해도 사용할 수 없습니다.
그래서 직접 설치합니다.
git clone https://github.com/Joeclinton1/google-images-download.git
cd google-images-download && sudo python setup.py install

이것으로 설치가 끝납니다.

사용법



여기에서는 대표적인 사용법으로서 커맨드 라인상에서의 이용 방법을 실어 둡니다.
 googleimagesdownload --keywords "apple" --limit 20

위의 예라면 "apple"의 검색 결과를 20건, 현재 디렉토리에 저장합니다.
파이썬에서의 사용법이나 그 외의 조건 설정등은 공식 문서 를 봐 주세요.

100건 이상을 취득하는 경우



검색하려는 이미지가 100개를 초과하는 경우 chromedriver를 설치해야 합니다.
※Ubuntu20.04 LTS에서의 조작 방법입니다. Windows의 경우는 각자 조사해 주세요 m(_ _)m

먼저 드라이버의 최신 버전을 확인
아래 사이트로 이동하여 최신 버전의 "chromedriver_linux64.zip"의 URL을 복사하십시오.
htps : // / s. 오, ぇ. 코 m/아/ch 로미우 m. 오 rg / ch rome dri ゔ ぇ r / w

덧붙여서 2021년 1월 6일 현재는 htps : // ch로메 d리ゔぇr. s 가시. ㅇㅜㅜㅜㅜ 이 m / 88.0.4324. 지 p 였습니다.

그런 다음 다음 명령을 계속 입력합니다. ( 여기 의 기사를 참고로 했습니다.)
sudo apt install unzip
cd /tmp/
curl -O <<<<<ここにさっき確認したURLを入れる>>>>>
unzip chromedriver_linux64.zip
mv chromedriver /usr/local/bin/
rm chromedriver_linux64.zip

이제 설치는 이상입니다.

100건 이상 취득할 때의 커맨드
googleimagesdownload --keywords "apple" --limit 120 --chromedriver /usr/local/bin/chromedriver

방금 소개한 사람에게 --chromedriver 옵션으로 설치 대상을 선택하기만 하면 됩니다.

↓ 취득 결과


제대로 얻을 수 있어요.

좋은 웹페이지 즐겨찾기