インターネッツ巡りをしていたらこんなニュースを見つけてしまいました。
Google、機械学習で向上していく画像認識Google Cloud Vision APIがβ版
内容はタイトル通り。googleから画像認識/分類APIである「Cloud Vision API」がβ版として公開され、利用者登録さえすれば誰でも使えるようになりました。
ここ数日でCloud Visionに関する日本語サイトがポンポン上がっておりエンジニアたちの関心の的になっているようです。
で、何故このブログで取り上げたかというとCloud Visionは現在開発中のアンドロイドアプリの上位互換になってしまうからです。
そもそも開発中のアプリでは、
①アンドロイド端末上で、写真撮影/ギャラリーから画像選択してサーバにアップロード
②サーバ側で画像分類ソフト「Caffe」を用いて画像を分類する
③結果をアンドロイド端末で表示する
を行おうと考えていました。
今日では様々な機械学習のライブラリや画像分類ツールがオープンソース化されています。しかしどれも専門的知識を要したり、導入が面倒だったり、動かせる環境が限られたりと何かしらの難点があるように思えます。
誰もがスマホで手軽に画像分類を試せるようになってほしい。沢山の人に機械学習の凄さを知ってほしい。あわよくば一儲けしたい。
そう思ってこの画像分類アプリの開発に着手しました。
ところが今述べたことは数日前に公開されたCloud Visionのサンプルプロジェクトで実現できてしまうんです。ダウンロードしたサンプルプロジェクトをAndroid Studioにインポートし、取得したAPIキーの名前をコード中に書き込むだけで画像分類可能。そのうちCloud Visionを用いたアプリがPlayストアに並ぶことでしょう。
このまま開発を進めてもGoogleのAPIに太刀打ち出来きるとは思えません。Cloud VisionはGoogleが提供する学習データを使うのに対しCaffeは自分でデータを用意する事ができるため、分野を限定してより精細な分類をすることができれば差別化出来るのでしょうが、果たして現実味があるかどうか。
とにかく今後の方針を考えなおさなければいけないですね。ここで開発を放り投げるのか突き進めるのか。それともCloud Visionを使ってまた別のことに挑戦するのか。
これは現実逃避してないで就活に専念しろってことですかね…。