某解析の会

WWW2009論文一気読み大会.前日にTwitterで進行状況が刻々と入って来てあせるが,当日の朝7時頃,とりあえず読み終わる(ただし,一本は手抜き(爆)).
当日は各自が選んだ論文を55本短時間で紹介.今回の論文の傾向をほんとうにざっくり見ると次のような感じか.面白いのは最初のあたり.

  • 大規模データを手抜きで処理しても,質はそれほど落とさない方法を考えた(G社多し).
  • 個々の技術は既存のものだけど,それらをうまく統合することで面白いことができた.
  • 企業サービスの補完にWebデータを活用して利便性を上げた(企業システムは閉鎖的で使いにくいことが多い)
  • 画像検索サービスと地理情報サービス関係の面白いアイデア
  • 他の人が使えない企業の内部データを解析した(ただし,一部何も目新しくないものあり).
  • とにかく徹底的に評価・分析する傾向あり(ただし,中にはあまり意味のないものも…)
  • 学習でやってみたら性能が上がった(ただし,一部本当に基本的なベースラインと比較しているだけなので,真の有効性が?なものあり).
  • 企業の提供しているサービスを評価するために,お金をばらまいた(M社が多い)
  • 社会ネットワークor複雑ネットワーク分析である(会議の性質から査読者はよく知らないようで,「これで通るの?」というもの多し).

全体的に,ほとんどがG社,M社,Y社関係.情報処理分野の研究も,昔はアイデア勝負的な側面が強かったが,最近は限られた人しか使えない大規模データやそれを処理できるインフラを持っている会社関係が圧倒的に強い.T大のM尾先生のところは健闘していて立派だが,あそこも基本的には企業の内部データを使うという方針のように見える.最近のWeb系研究者の憂鬱は,アイデア一本で勝負できた時代から,力のあるグループの傘の下に入らないといけない,「The rich get richer」時代に移ってきたことによるものだと思う.
しかし,そういう場所では確実な成長はあっても,既存のデータやシステムによる暗黙の束縛を受けてしまいがちなので,革新的なものは生まれにくい.そもそも,革新的なものというのはそう頻繁には生まれないので,そうでない人たちには逆にどんどん革新的な研究を目指して欲しいもので,そういう人を支援する素地も必要なのだろう.
ちなみに,そろそろ統計的処理や機械学習を真面目に勉強する必要があることを痛切に感じた.とりあえず,現在の全体的な状況を把握できるような書籍はないものだろうか?