某フォーラム一日目
某フォーラムに参加.
特別セッションは,午前中はK大T中教授の,T大のK連川教授がWebに掲載している写真(助教授時代のものらしい)が現在の本人に全然似ていないことが「情報信憑性」に欠けるというネタ振りが特に印象的(笑…逆にそれで他のすべてが霞んでしまった気が…)午後は,M川氏の書き言葉と話し言葉の乖離の例を実際に言語コーパスから抜き出して,いろいろな興味深い例を示したのが印象的.たとえば,「NHK」は「エヌエチケイ」と発音する人が一番多いが,このように表記している辞典は存在しないとか.なお,著作権法が改訂されて,Webからデータベースやコーパスを作成することが認められるようになるらしい.?ICTのオープンハウスで,最大規模のコーパスをWebから作ると言っていた背景に著作権法改正があると聞いていたが,それを詳しく説明してくれた.ただし,その二次使用までは保護されず,もしかするとフェアユースが認められるようになるかもしれないとのこと(ただし,その場合は紛争が起きれば訴訟で解決することになるために,必ずしも利用者にとっては安全ではない).
研究発表では,ある発表で示していた例が,手法を検討すると,実際にそのような結果が得られるとはとても思えなかったので,あとからポスターで「本当にあの例の結果が得られるんですか?」と確認してみたら,あっけらかんと「できません」と言われる(爆)たぶん,昔目標としていた時の例を,いまだに使っているのだと思うのだが,研究者として最良の結果を強調するのはあたりまえだが,現在できないことがあきらかなことまでできると言ってしまうのは問題なので,実際にできる事例に変更するべきだろう.まあ,あの会場で彼の手法の問題点と,示した例が嘘であることを見抜いたのは私だけだったかもしれないが….
企業展示では,サイバーエージェントの2種類の自作サーバ機が個人的に面白かった.一つはGoogleとは正反対のかなり高価な(ただし彼らの主張では市販機よりも「少し」安い)サーバを設計していたのだが,これはMySQLを前提としているために,ハードウェアRAIDを搭載した高性能リソースを集中的に搭載したサーバになってしまうらしい(これに対してGoogleは非常に安価なハードウェアをソフトウェアでカバー).もう一つは分散並列計算性能重視のAtomを搭載したサーバで,ファンはCPUだけ,HDは40GB,ラックに相当密に詰め込めるらしい.HD容量が中途半端なので不思議に思って聞いてみたところ,単なる入手の容易さだったようで,OSとJavaプログラムしか搭載しないのでがら空きらしい.SSDモデルも試験しているそうだが,Linux側にSSDへのアクセスを分散させる機能がないために,安価なSSDを使った時の寿命が短くなり,まだ実用には使えないらしい.
自分の発表はとりあえずしたものの,反応は今一つ.T田准教授には「これからが大変だねえ…」と正直に言われる(泣)が,発表を聞きながら考えているうちに,一応次やるべきことの目処はかなりついてきた.実装して良い結果が出ればよいのだけれども….