世界が広がる?画像解析AI「Google Cloud Vision API」が便利そう

Pocket


こんにちわ、ジーニアスウェブの横山です。
AIブームの昨今ですが、Googleが提供するGoogle Cloud Platform(GCP)機械学習サービスの一種である、
「Google Cloud Vision API」がとても便利そうなので紹介します。

「Google Cloud Vision API」とは?

Google Cloud Vision API は、googleのとても優秀な画像解析機械学習モデルを使えるサービスのことです。
Googleの画像検索などにも使われているようですね。

わかりやすいところでいうと、
写真の画像情報 (色、人物等)を取得したり、画像内の文字情報を抽出したりすることが可能です。

Google Cloud Storage (GCP)との統合・連携も容易にできるので、
使い方次第ではいろんなことができそうですよね。

Google Cloud Vision API」主な機能

主な機能を紹介します。

機能1 ラベル検出
乗り物や動物など、画像に写っているさまざまなカテゴリの物体を検出

機能2 不適切なコンテンツの検出
アダルト コンテンツや暴力的コンテンツなど、画像に含まれる不適切なコンテンツを検出

機能3 ロゴ検出
画像に含まれる一般的な商品ロゴを検出

機能4 ランドマーク検出
画像に含まれる一般的な自然のランドマークや人工建造物を検出

機能5 光学式文字認識(OCR)
画像内のテキストを検出、抽出できます。幅広い言語がサポートされており、言語の種類も自動で判別

機能6 顔検出
画像に含まれる複数の人物の顔を検出。感情や帽子の着用といった主要な顔の属性についても識別

機能7 画像属性
画像のドミナントカラーや切り抜きのヒントなど、画像の一般的な属性を検出

機能8 ウェブ検出
類似の画像をインターネットで検索

機能9 統合された REST API
REST APIを通じてアクセスし、画像ごとにアノテーションタイプをリクエスト。リクエストで画像をアップロードすることも、Google Cloud Storage と統合することも可能。

このようなGoogle 謹製の優秀な機械学習モデルをだれでも簡単に格安で使用できるようになっているんですよね、
ありがたいことです。イチから作るととんでもないことですから。

ちなみに現在(2018.07.05時点)での料金体系は、

・1~1,000 ユニット/月 までなら無料
・1,001~から従量課金制

になっています。

光学式文字認識(OCR)を試してみた

名刺を写メし、Google Cloud Vision APIに食わせてみたところ、

1秒もかからない間に、

テキスト情報を解析、抽出してくれます。

テキストは誤字なしのパーフェクトでした。

これだけみてもすごいですね、

名刺アプリケーションなんかもつくれてしまいそうです。

いま流行りのレシート換金アプリもなんらかの画像解析AI使っているんだと思いますが、もしかしたらGoogle Cloud Vision APIかもしれませんね。

世界が広がるGoogle Cloud Vision API活用例

すでにいろいろな企業、個人の方が活用されています。
気になったものをいくつか紹介します。

■Refuel 4 というクリエイティブ生成ツールで使用しているようですね。

機械学習のその先に、初めの一歩を踏み出そう ~Refuel 4 編~
https://www.youtube.com/watch?v=_DrTiF-9_4c

■動画広告クリエイティブソリューション『VS』のタグ付を自動化しているようですね。

Google Cloud Vision API 導入事例 – 株式会社サイバーエージェント
https://www.youtube.com/watch?v=3Cr8nbQvd_U

■経費処理にGoogle Cloud Vision API

Google Cloud Vision APIとRaspberryPiを使って事務処理をサボろうとしている話
https://speakerdeck.com/asashiho/google-cloud-vision-apitoraspberrypiwoshi-tuteshi-wu-chu-li-wosaboroutositeiruhua?slide=21

■fswebcamで撮影した画像にGoogle Cloud Vision APIへPOSTしてサンタかどうかを判定

Raspberry PiとGoogle Cloud Vision APIでサンタの来訪検知システムを作ってみる
https://wp.tech-style.info/archives/1224

いかがでしたでしょうか?

活用例をみてもわかるように、アイデアしだいではいろんなことに使えそうですよね。
Webだけではなく、業務システムやそれこそIoT化などにも展開できそうです。
弊社では現在社内のシステム化を自社開発で進めていますが、Google Cloud Vision API、早速導入してみたいなと思います。