【최신】Google 이미지 검색을 저장하는 Python 라이브러리의 사용법&ChromeDriver를ubuntu로 사용
상당히 알고 있는 사람이 많다고는 생각합니다만 제가 몇번이나 헤매기 때문에 적어 둡니다.
기계 학습시 학습 데이터에 이용하십시오.
2020년 8월경? 에 검색 결과의 제공 방법이 크게 바뀐 것 같고, Windows용 소프트의 「ImageSpider」를 사용할 수 없게 되었습니다. (상당히 편리했지만...)
그래서 이제부터는 파이썬 라이브러리의 google_images_download를 사용하기로 결정했습니다.
설치
【주의】 pip에서는 설치하지 마십시오!
pip3 install google_images_download
PIP에 있는 버전에서는 Google 측 변경을 지원하지 않으므로 설치해도 사용할 수 없습니다.
그래서 직접 설치합니다.
git clone https://github.com/Joeclinton1/google-images-download.git
cd google-images-download && sudo python setup.py install
이것으로 설치가 끝납니다.
사용법
여기에서는 대표적인 사용법으로서 커맨드 라인상에서의 이용 방법을 실어 둡니다.
googleimagesdownload --keywords "apple" --limit 20
위의 예라면 "apple"의 검색 결과를 20건, 현재 디렉토리에 저장합니다.
파이썬에서의 사용법이나 그 외의 조건 설정등은 공식 문서 를 봐 주세요.
100건 이상을 취득하는 경우
검색하려는 이미지가 100개를 초과하는 경우 chromedriver를 설치해야 합니다.
※Ubuntu20.04 LTS에서의 조작 방법입니다. Windows의 경우는 각자 조사해 주세요 m(_ _)m
먼저 드라이버의 최신 버전을 확인
아래 사이트로 이동하여 최신 버전의 "chromedriver_linux64.zip"의 URL을 복사하십시오.
htps : // / s. 오, ぇ. 코 m/아/ch 로미우 m. 오 rg / ch rome dri ゔ ぇ r / w
덧붙여서 2021년 1월 6일 현재는 htps : // ch로메 d리ゔぇr. s 가시. ㅇㅜㅜㅜㅜ 이 m / 88.0.4324. 지 p 였습니다.
그런 다음 다음 명령을 계속 입력합니다. ( 여기 의 기사를 참고로 했습니다.)
sudo apt install unzip
cd /tmp/
curl -O <<<<<ここにさっき確認したURLを入れる>>>>>
unzip chromedriver_linux64.zip
mv chromedriver /usr/local/bin/
rm chromedriver_linux64.zip
이제 설치는 이상입니다.
100건 이상 취득할 때의 커맨드
googleimagesdownload --keywords "apple" --limit 120 --chromedriver /usr/local/bin/chromedriver
방금 소개한 사람에게 --chromedriver 옵션으로 설치 대상을 선택하기만 하면 됩니다.
↓ 취득 결과
제대로 얻을 수 있어요.
Reference
이 문제에 관하여(【최신】Google 이미지 검색을 저장하는 Python 라이브러리의 사용법&ChromeDriver를ubuntu로 사용), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/ichii731/items/d55c53a49fb3b63670e9텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)