2020年1月
      1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31  

最近のトラックバック

無料ブログはココログ

« 画像特徴量など | トップページ | 軽井沢→東京 »

2008年7月30日 (水)

画像認識の最近15年

今から15年ほど前には、画像認識の研究は早晩廃れてくるであろうとマコトしやかに言われていたものだった。当時の主要な認識対象は手書き文字であって、要するに紙に書かれた文字をスキャナでとって、それを認識するための技術開発が盛んであった。そんな頃合に、「オフィスから紙をなくそう」というトレンドがやってきて、全ての文書がワープロとかパソコンとかで作成されて配布されてディスプレイで見られるようになるのだから、いまどき紙に書かれた文字とか文書を画像認識するなんてニッチで時代遅れだ、という論法であった。

民間の研究所で、文字認識とか画像認識の研究チームを率いるリーダーには、ミンスキー大好きな人たちが多くて、人工知能について考えていて認識の問題にたどり着いた人たちが少なからずいた。そういう人たちは、ペーパーレスになろうがなるまいが認識という問題を面白いと思っていたし研究は続いたけれども、でも世の中における立ち位置は中央から周辺へと、日なたから日陰へと移ろっていたように思う。

ところが、グーグルを代表とする検索の仕掛けの登場で事態が一変する。画像や音声は認識しなければ内容に踏み込んだ検索対象にならない。グーグルが目指す情報の構造化にとって、画像認識はキーテクノロジーのひとつである。画像認識の研究者にとっては天佑であった。本質的に面白い問題であったからこそビジネスとしても研究テーマとしても復活できたのだ、という見方もできるかもしれないけれども。

画像認識研究の重要さが増すことによって、研究者が多数参入した。単に人数が増えたのではなく、数学畑の応用よりの人たちや統計数理の人たちが、多数参入した。端的に言えば、優秀な人材がどっと押し寄せた。SVMとかRVMとかを含む多くの認識機械の研究は、画像認識の分野から観て若干離れたところに居た研究者たちの成果が、どっとの画像の分野にも流れ込んできたものである。また、学習用のデータが突然、文字通り桁違いに利用可能になったことも大きい。統計とか機械学習の分野も、情報構造化にとってのキーテクノロジーであったのだ。

近年の画像認識性能の格段の進歩と、その契機の多くが外部から来ていることの自覚は、昔からの画像認識研究者にある種の居心地の悪さを感じさせているかもしれない。画像処理や統計数理の分野が大いに関係あることには、もちろん昔から多くの人が気づいていた。でも、本格的に、本気で組み合うようになってからの日はまだ浅い。グーグル以前と以後とでは、研究者を巡る状況が随分違う。

異分野の研究者との人的コミュニケーションの能力と猛烈な勉強と、そして自分の立ち位置をふらつかせない強靭な足腰が、これまで以上に要求されている。

« 画像特徴量など | トップページ | 軽井沢→東京 »

コメント

この記事へのコメントは終了しました。

トラックバック


この記事へのトラックバック一覧です: 画像認識の最近15年:

« 画像特徴量など | トップページ | 軽井沢→東京 »