某勉強会 - かふぇ・べいぶ別館

プライバシ保護データマイニングに関する勉強会．今日は，制御法，匿名性の評価法，アルゴリズムの定量化，k-匿名性に関する4章と招待講演．
発表者によると，この分野の研究はまだまだ発展している最中で，きっちり固まっていないし，穴が多いという感じだ．比較的理論がまとまっているように見えるk-匿名性に関しても，プライバシー保護の程度を示す目安としては重要だが，現実に適応するには厳しすぎて，現場導入されている例は稀だとか．K嶌氏が，今この本を日本語訳するのは早い，時間が掛かる書籍よりもタイムリーな情報提供をすべきだと言っていた理由がわかる気がした．
招待講演は，K大のセンシングウェブの話．これは，一言で言えば，画像が背景情報，雰囲気情報（日当りや日照の度合い，看板の有無），個人情報（人物など）から構成されるとしたら，個人情報だけを認識してシンボル化し，変換後画像とシンボルに関する情報（人数や移動とか）をWebで公開・共有するというもの．この方法ならGoogle ストリートビューが抱えるプライバシーの問題はなくなる．最初はシンボル化の過程で仮想世界で再現する情報は得られるはずだが？と思ったのだが，雰囲気的な情報は欠落してしまうらしい．ただ，お客にとっては便利なお店の混み具合を公開して欲しくないと言うなど，なかなか抵抗感があるようだ．たぶん，それは一時的な情報としてではなく，過去データや他店舗と比較された場合に新たに店側が困るような情報が生まれてしまうということだろう．写真のままで公開するのではなく，結果を「混んでます」，「空いてます」，「閉店」などのような，離散的な情報に置き換えればよいのかもしれない．
なお，音に関しても同様なアプローチをやってみたいということだが，人間の音声部分だけをシンポル的なものに置き換えるということが思いつかなくて実行できないらしい．R2D2のようなピポパ音とか音楽的なものに置換するという技術はないものだろうか？