Skip to content

Instantly share code, notes, and snippets.

@moaikids
Created March 22, 2013 02:19
Show Gist options
  • Save moaikids/5218458 to your computer and use it in GitHub Desktop.
Save moaikids/5218458 to your computer and use it in GitHub Desktop.
1.訓練用文章群(ドキュメント群)を用意
2.1.から単語の情報を抽出(docid / wordid / freq)
3.2.のデータをLDAを用いてあるワードがあるトピックである尤もらしさを算出(topicid - wordid - score)
4.3. を用いて判定用文章のトピック推定を行う
(判定用文章からワードを抽出→当該ワードがあるトピックに分類される確率を抽出→尤もらしいトピックを推定)
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment