[귀찮은 것은 파이썬으로! ] 인터넷에서 이미지 자동 수집

소개



안녕하세요.
이번 기사에서는 인터넷에서 필요한 이미지를 자동으로 수집하는 방법을 소개하겠습니다.

지금까지의 기사로 쓴 것 같은 화상 분류를 하는 경우, 필요하게 되는 것이 화상 수집입니다. 게다가 이미지 분류가 되면 AI에 학습시키기 위해 가능한 한 많은 이미지가 필요하게 됩니다. 경우에 따라서는 1000장, 2000장이 되기도 하므로, 그것을 일일이 자신의 손으로 검색해 보존해 가는 것은 엉망입니다. . . 이번에 소개하는 방법을 알 때까지 나는 일일이 수동으로 하고 있었기 때문에 그 작업만으로 피곤해서 공부는 아니게 되었습니다(눈물)
여러분에게는 그런 고생을 맛보고 싶지 않으므로, 즐겁게 가능한 한 많은 이미지를 모아 버립시다!

필자의 개발 환경



· macOS Mojave 버전 10.14.3
・MacBook Air(11-inch, Early 2015)
· 프로세서 1.6GHz Intel Core i5
· 파이썬 3.7.1

이것으로 문제없이 움직였습니다!

절차



① 이번에 사용하는 사이트는 Flickr라는 사이트로 많은 이미지를 공유하는 사이트입니다.
먼저 Yahoo 계정을 받으세요. 이미 보유한 사용자는 귀하의 계정이 될 수 있습니다.
그런 다음 htps //w w. fぃckr. 코 m/세 rゔぃ세 s/아피/ 을 검색하여 다음과 같은 화면으로 갑니다.

이 화면의 회색 테두리 바로 아래에 있는 API Keys를 클릭하면 Yahoo 계정으로 로그인하라는 메시지가 표시되므로 그대로 로그인합니다.
성공적으로 로그인하면 이전 화면의 'The App Garden'이라는 문자 아래에 있는 'Create an App'을 클릭합니다.
그러면 이런 화면이 되기 때문에

Get Your API Key 바로 아래에서 Request an API Key를 클릭합니다.
그리고 다음 화면에서``APPLY FOR A NON-COMMERCIAL KEY ''를 클릭하면
이런 화면으로 이동하므로, What's the name of your app? 곳에 만들고 싶은 앱의 이름, What are you building? 곳에 목적을 써 봅시다.

이미지 분류 앱을 만들고 싶었기 때문에 'Image Classifier', 'To Classify Some Images'를 입력했습니다. 내용은 뭐든지 괜찮기 때문에 각자 자유롭게 입력합시다.
입력하고 SUBMIT를 클릭하고 이러한 화면이되면 성공입니다. 축하합니다!

이 화면에 있는 Key와 Secret을 사진에 찍게 되어 어쩐지 잊지 않게 해 주세요! 나중에 사용!

②다음에 뭐든지 좋기 때문에 텍스트 에디터를 사용해 이하와 같은 코드를 씁니다.
from flickrapi import FlickrAPI
from urllib.request import urlretrieve
from pprint import pprint
import os, time, sys
#この辺りのモジュールは各自インストールしておいてください。
pip install 〜でインストールするのが一番簡単です。

# APIキーの情報

key = "先ほどの画面で表示されたKey"
secret = "先ほどの画面で表示されたSecret"
wait_time = 1

#保存フォルダの指定
imagename = sys.argv[1]
savedir = "./" + imagename

flickr = FlickrAPI(key, secret, format='parsed-json')
result = flickr.photos.search(
    text = imagename,
    per_page = 400,#400枚保存するという意味
    media = 'photos',
    sort = 'relevance',
    safe_search = 1,
    extras = 'url_q, licence'
)

photos = result['photos']
# 返り値を表示する
# pprint(photos)

for i, photo in enumerate(photos['photo']):
    url_q = photo['url_q']
    filepath = savedir + '/' + photo['id'] + '.jpg'
    if os.path.exists(filepath): continue
    urlretrieve(url_q,filepath)
    time.sleep(wait_time)

이 코드를 download.py라는 이름으로 저장합니다.
그리고 이 download.py가 포함된 폴더에 자신이 검색하고자 하는 키워드를 이름으로 설정한 폴더를 새로 만듭니다. 사자의 이미지를 검색하고 싶다면 "lion"이라는 폴더 이름으로 좋습니다. 예를 들면

Animal
|
|--download.py
|--lion

같은 느낌으로 괜찮습니다. 이 lion이라는 폴더에 지금부터 이미지가 저장되어 갑니다.
이 Animal 폴더를 바탕 화면에 놓습니다.

그리고 terminal.app를 열고,
'cd Desktop' → 'cd Animal'을 차례로 입력한 후 'python download.py lion'을 입력하면 Flickr에서 사자 이미지가 자동으로 저장됩니다! 확인하고 제대로 저장되어 있으면 성공입니다!

끝에



어땠습니까?
이런 느낌으로 번거로운 작업을 쉽게 할 수 있기 때문에, 이미지가 아무래도 많이 필요한 경우에는 꼭 사용해보십시오. 쓸데없는 노력을 사용하지 않아도 좋아요!

좋은 웹페이지 즐겨찾기