テスト結果をつらつら書いてると長くなりそうなので記事を分けた. 情報量にidf値を用いてやってみた. 単語Aが出たら単語Bも出るっていう確率は分子で行っているので, 分母はidfってゆー,対極的重み付けのスコアを使ってみる. 相互情報量 = log( (全文書…
推薦の勉強の一環のメモです。 相互情報量とは、単語Aが出たら単語Bも文書Xに出るという 情報量の計算に使えそうな理論。 これをクラスタリングする際の指標に使えないかと模索中です。 数式は下記の通り。 数Aとか数Bが超苦手だったので、 解釈があっている…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。