画像検索について(特にContent-based image retrieval)(1)
banuです.初めまして.
現在はニートのような学生ですが,画像とか動画とかCV(Computer Vision)とかを研究しています.
さて,タイトルの通り今回は画像検索について考えてみようと思います.俺は画像検索について素人なので,まずはGoogleに聞いてみましょう.とりあえず”画像 検索”とすると
のような結果となりました.Googleの順位が低いのが気になりますが,俺がほしいのはコレジャナイ!!もっとこう,なんだ,画像を適当に入れるとそれっぽい画像を見つけてくれるサービスがほしいわけですよ(Content-based image retrieval).で,”類似 画像 検索”とぐぐると
http://written.4403.biz/archives/2008/09/gazopa.html
というサイトがトップにきました.このサイトによると,GazoPaという日本

発の革新的検索エンジンがあるそうです.(このサイトによると,gooも類似画像検索があるようですが,おそらくこれはただのキーワード(少なくとも画像の内容は見ていない)検索でしょう.でなければこのような結果にはならないはずです.もし画像の中身をみてこの結果を出しているのならNTTは残念ですね.)
上記サイトでも指摘されているように,TinEyeという検索エンジンが存在しており,それは画像の”内容”を見て,同じ画像(または,同じ画像を含んでいる画像)を見つけてくるというものです.昔使ったときの感じでは,これは割と性能がよく,WEBに存在する同一画像を見つけるのには使えそうです.ただ,類似画像を見つけてくれるわけではないので,日本発の革新的検索エンジンGazoPaとは比較できません.
さて,問題のGazoPaですが,TechCrunchの記事によると,
Gazopaで革新的なことは、画像検索を行う際にキーワードなどを入力する方法に変革を加えたことだ。検索語を入力するのではなく、Gazopaでは検索に利用する画像は自分でアップロードしたり、あるいはウェブで見かけた画像を右クリックして指定する。
え....と....これ翻訳間違ってるのかなあと思ったけど,この記事の下でも突っ込まれてるように,これはちっとも革新的じゃない.たとえGazoPaが超高精度で類似画像を見つけてくれるとしても,この態度はいただけない.だれもがこれを望むのに,だれもこれを考えなかったとでも思っているのでしょうか.このような平凡なアイデアはアイデアだけでは意味がないはずで,これを革新的と言ってしまうのは先人の業績に対してあまりに無関心すぎるように思えます(この記事を書いた人が勝手に言ってるだけかもしれませんが).
この時点ですでにGazoPaの実力が想像の範囲を超えないと予想できますが,試しに”鏡音リン”を検索してみましょう.入力として使用する画像は,Googleイメージ検索で最初に出てきた”鏡音リン”だけが描いてある絵,とします(今回な場合はこれでした).
まあ結果は予想通りというかなんというかなんですが.
まあこんなもんでしょう.colorやらshapeやらの設定があると言うことは,色と形で見ているのでしょうが,このリンは割と普通の色や形なので関係ない画像がたくさんでてきます.なので,この検索エンジンに優しいクエリを渡してあげましょう.
それでは,”初音ミク”はどうでしょう.これは割と変な色をしているのでそれなりにうまくいって
くれました.まあ関係ないのも混ざってますが.また,残念ながら同じ構図のミクしか見つかりませんでした.つまり,
このような結果は得られませんでした.”そんなの当たり前じゃないか,全然違う画像ばかりじゃないか”と思うかもしれませんが,我々人間はこれらの画像を見るだけで”初音ミク”と認識することができます.なぜ人間は”画像の内容だけ”で似たような画像を見つけることができるのに計算機ではできないのでしょうか.
仮に,”似たような画像”というのを,色の分布が近い画像と定義すればGazoPaの結果はそれなりに正しいです.しかし,そんなことは”できて当たり前”なわけで,しつこいですが,革新的ではありません.せめて,背景の色が違うけどミクはほとんど同じ画像とかを拾ってきてくれたら感心するのに.もちろんそれも難しいわけだけど.
あれれ,結局俺のほしい画像検索は無理??ってことなのかしら.
ということも含め,次回はもう少しまじめに考えてみようと思います.
それでは.


