2009-11-09から1日間の記事一覧

相互情報量(mutual information)についてのメモ2

テスト結果をつらつら書いてると長くなりそうなので記事を分けた. 情報量にidf値を用いてやってみた. 単語Aが出たら単語Bも出るっていう確率は分子で行っているので, 分母はidfってゆー,対極的重み付けのスコアを使ってみる. 相互情報量 = log( (全文書…

相互情報量(mutual information)についてのメモ

推薦の勉強の一環のメモです。 相互情報量とは、単語Aが出たら単語Bも文書Xに出るという 情報量の計算に使えそうな理論。 これをクラスタリングする際の指標に使えないかと模索中です。 数式は下記の通り。 数Aとか数Bが超苦手だったので、 解釈があっている…