キーワードで画像大量ダウンロードgoogle images download
- Takeshi Suetani
- 2018年9月1日
- 読了時間: 1分
google images downloadというPythonスクリプトを使えば超手軽。
tensorflow用の訓練データをかき集めるのに最適ですな。
以下、メモ書き。
google images downloadの導入と活用
【インストール方法】
(anaconda等のpython系がインストールされている前提)
手順1 pip でインストール
コマンドラインで
pip install google_images_download
手順2 chromedriverをダウンロードして適当なフォルダに入れる
ダウンロード先
http://chromedriver.chromium.org/downloads
のwin32をダウンロードして中身を
C:\Program Files\Library\
等に入れる(フォルダ名適当)
【使い方】
コマンドラインで
googleimagesdownload --keywords "apple"
だとか
googleimagesdownload --keywords "りんご"
だとかを入力すると
downloadフォルダ(winの標準フォルダ)内にキーワード名のフォルダが生成されて
勝手に中に画像が入っていく

googleimagesdownload --keywords "りんご" --limit 10
とすると、ダウンロード数が10個に制限される。(指定なしは100個)
limitの指定をしなければ100個であるが、100個よりも多い数をダウンロードしようとすると、先の手順2でインストールしたchromedriverが必要となる。
keywordsとlimitの指定に加えて、chromedriver.exeのパスを指定する。
(インストール手順2でファイルを入れたフォルダおよびファイル名を指定)
googleimagesdownload --keywords "apple" --limit 120 --chromedriver "C:\Program Files\Library\chromedriver.exe"
(改行無し)

素晴らしく簡単!