Content based image retrieval
今日のplenary talkはTheo Palidis氏の "Limitations of Content-based Image Retrieval"。
検索語に対応する画像を検索してきたり、新しい画像に検索に適したタグを自動的に付したりすることが、現状でどの程度できていて、何が問題か、に関する講演。現状の技術レベルは満足のいくものではなくて、だからどうしたとか、だからどうすべき、とか、そういう話。
たくさんの画像+タグの組を与えて、学習アルゴリズムに任せたところで到底満足のいくレベルの(一般的な)image retrievalは実現できない、と確認することから開始。一方、アプリケーションというか画像の種類をある程度限定すれば実現できることも確認。
講演内容に目新しい話はなく、学習に利用できる画像の枚数が膨大になって、なおかつ学習アルゴリズムの性能が上がってきていて、そんな状況を踏まえて舞い上がってしまって一般的なimage retrievalが実現できるような気がしている人たちに「少し落ち着いてね」と諭すような講演であった。
昨今流行りのSIFT特徴量が現状では最も使える特徴量であり、学習に基づいて抽出すべき特徴量を決定する手法は破綻するだろうと指摘していたのが少しだけ新鮮というか、言い切っていいんだと感じた次第。
最初の検索性能は低くても、検索結果に対する利用者の評価のフィードバックを蓄積できる気もするけど、pattern recognitionの学会では、そういう結論しかありえないのであろうと思う。
« タクシー | トップページ | Information Projection »
この記事へのコメントは終了しました。
コメント