Home > banu, 画像検索 > 画像検索について(特にContent-based image retrieval)(4)

画像検索について(特にContent-based image retrieval)(4)

2009年1月24日 banu

banuです.

さて画像検索について今回で終わりにしようと思いますが,最後は人間によるラベル付けについて考えます.

第一回

第二回

第三回

これまでの話で,計算機によって自動的に高次の概念を割り当てるのは難しそうな気がしてきました.ということにしてください.

人間が理解できる高次の概念を全て計算機に”理解”させておくのは困難です(尤も,計算機は実際に”理解”できる訳ではありませんが).つまり,学習によって”既に定まっている概念”について,特定の画像を評価するのは可能ですが,新しい概念をどのように獲得するかを考えなくてはならないと言うことです.

“既に定まっている概念”の学習については込み入った話になるので省略しますが,一般的な機械学習が用いられます(例えばSVMNaive BayesRelevance Feedbackなど).

新しい概念は,例えばフォークソノミーから獲得できます.Flickrなどはユーザーが自由にタグ付けできるので,ある画像につけられたタグから,その画像に関する概念を得ることができます.ただし,問題はいくつかあって,特に

  1. タグの正確さ,完全性
  2. タグの階層性

などが問題となります.人間は,ある画像を見たときに,その画像に存在する概念をたくさん列挙することができます.しかし,画像にタグをつけるときはより一般的な概念のタグをつけることが多くなります(なぜなら,タグを検索用に使うことが多いので,特殊な概念でタグをつけると検索性が落ちるから).例えば,渋谷駅のスクランブル交差点を写した写真に対して,”渋谷”とかタグをつける人はいても,”横断歩道”などとタグをつける人はあまりいないでしょう.ところが,そこには確かに”横断歩道”が存在しており,この世界を記述する概念としては必要な概念であると考えられます.

このような問題に対してESP gameというものが提案されています.これは,基本的に二人でやるゲームで,提示された画像に二人とも同じ言葉をつけると正解となります.例えば,髭が生えていて,帽子をかぶっているおじさんが写っている写真に対して,”MAN”という言葉を二人とも打ち込むと正解となります.ただし,多くのプレイヤーがその画像に対して”MAN”を入力すると,”MAN”は禁止ワードとなり,入力できなくなります.そこでプレイヤーは,”BREAD”や”HAT”などという言葉を入力することになります.このようにして,ある画像に対して,新しい概念を次々に割り当てることが可能となります.

このゲームを画像検索に利用しているのがGoogleで,Google Image Labelerというゲームを提供しています.これはESP gameと似ているゲームですがルールは少し違うようです.リンク先にある鳥の画像に対しては,

sky (50 points), bird (60 points), soaring (120 points), or frigate bird (150 points)

のように,より説明的な言葉だと点数が高くなるようです.このゲームの結果をぐーぐる画像検索に反映させているようです.

このように,ゲームを用いて人間にラベル付けをさせるというのは,近年の流行のようで,ほかにもいくつかプロジェクトが存在しているようです.もちろんこれで全ての問題が解決するわけではありませんが,少しでも検索精度が良くなるといいですね.

残っている問題としては,人間によってタグ付けされていない画像に対して自動的にタグ付けするという問題があります.前回までに,画像から特徴を抽出するという話をしましたが,ゲームによって同じタグをつけられた画像に共通する特徴量を求めるというのは容易なことではありません.結局のところそれができないと,この世界に存在する画像全てに人間がタグをつけなくてはならないので,現実的に不可能となります.多くの研究者がこの問題に取り組んでいますが,あまりうまくいっていないようです.10年後くらいにはそこそこの結果が出るようになってるいると期待して,話を終わりにしたいと思います.

次回は,うーんどうするかな.

banu, 画像検索

  1. No comments yet.
  1. No trackbacks yet.