SlideShare una empresa de Scribd logo
1 de 21
Descargar para leer sin conexión
Unigram Mixtures
の話
@fmkz___
教師あり学習とは?
教師なし学習とは?
教師あり学習でのラベルを潜在変
数として推定するのが
教師なし学習
•  教師あり学習: p(y¦x)
•  教師なし学習: p(x) = Σyp(x¦y)p(y)
K-means
h"p://tech.nitoyon.com/ja/blog/2009/04/09/kmeans-­‐visualise/
•  距離の中心を計算して
•  最も近いクラスに割り当てて
•  を繰り返す
EMアルゴリズム
•  EMアルゴリズムは観測データの対数尤度
を、E stepとM stepの繰り返しにより
最大化するアルゴリズム
スパムとハムの話に戻る
•  教師あり学習
–  事前にスパムとハムに分類していた

•  これをラベルを付与してない状態から2つ
のグループに分割できないか?
–  教師なし学習
Unigram Mixtures
アルゴリズム
•  このスライドが詳しい
–  http://www.ism.ac.jp/ daichi/
lectures/ISM-2012-TopicModelsdaichi.pdf
実装
•  R
–  https://github.com/ariddell/
mixture-of-unigrams

•  C
–  http://www.ism.ac.jp/ daichi/
lectures/H24-TopicModels.html
デモ
本当はいつものようにeしずおかのブログ
のデータを分類するつもりだったのだけど
読書が急がしくてやる暇なかったw
まとめ
•  入門機械学習のナイーブベイズの応用とし
てUnigram Mixturesの紹介とデモを
しました

Más contenido relacionado

Más de Kazufumi Ohkawa

pythonでオフィス快適化計画
pythonでオフィス快適化計画pythonでオフィス快適化計画
pythonでオフィス快適化計画
Kazufumi Ohkawa
 
入門機械学習読書会二回目
入門機械学習読書会二回目入門機械学習読書会二回目
入門機械学習読書会二回目
Kazufumi Ohkawa
 
入門機械学習1,2章
入門機械学習1,2章入門機械学習1,2章
入門機械学習1,2章
Kazufumi Ohkawa
 
Sphinxでドキュメントを書こう
Sphinxでドキュメントを書こうSphinxでドキュメントを書こう
Sphinxでドキュメントを書こう
Kazufumi Ohkawa
 
pythonでつくるiPhoneアプリ
pythonでつくるiPhoneアプリpythonでつくるiPhoneアプリ
pythonでつくるiPhoneアプリ
Kazufumi Ohkawa
 

Más de Kazufumi Ohkawa (20)

圏論walker
圏論walker圏論walker
圏論walker
 
ハッピーハッピー構造生成まつり’67
ハッピーハッピー構造生成まつり’67ハッピーハッピー構造生成まつり’67
ハッピーハッピー構造生成まつり’67
 
SAR精度70% その先へ
SAR精度70% その先へSAR精度70% その先へ
SAR精度70% その先へ
 
量子化学計算外伝 すごいよ!! FMO
量子化学計算外伝 すごいよ!! FMO量子化学計算外伝 すごいよ!! FMO
量子化学計算外伝 すごいよ!! FMO
 
あまり知られていない静岡の言語戦争の歴史
あまり知られていない静岡の言語戦争の歴史あまり知られていない静岡の言語戦争の歴史
あまり知られていない静岡の言語戦争の歴史
 
IPython notebookを使おう
IPython notebookを使おうIPython notebookを使おう
IPython notebookを使おう
 
実践コンピュータビジョン8章
実践コンピュータビジョン8章実践コンピュータビジョン8章
実践コンピュータビジョン8章
 
R -> Python
R -> PythonR -> Python
R -> Python
 
ChEMBLを使おう
ChEMBLを使おうChEMBLを使おう
ChEMBLを使おう
 
エンジョイ☆スクレイピング
エンジョイ☆スクレイピングエンジョイ☆スクレイピング
エンジョイ☆スクレイピング
 
Redmineでもめない会議☆
Redmineでもめない会議☆Redmineでもめない会議☆
Redmineでもめない会議☆
 
pythonでオフィス快適化計画
pythonでオフィス快適化計画pythonでオフィス快適化計画
pythonでオフィス快適化計画
 
入門機械学習読書会9章
入門機械学習読書会9章入門機械学習読書会9章
入門機械学習読書会9章
 
入門機械学習6章
入門機械学習6章入門機械学習6章
入門機械学習6章
 
Javascriptを書きたくないヒ トのためのPythonScript
Javascriptを書きたくないヒ トのためのPythonScriptJavascriptを書きたくないヒ トのためのPythonScript
Javascriptを書きたくないヒ トのためのPythonScript
 
入門機械学習読書会二回目
入門機械学習読書会二回目入門機械学習読書会二回目
入門機械学習読書会二回目
 
入門機械学習1,2章
入門機械学習1,2章入門機械学習1,2章
入門機械学習1,2章
 
Sphinxでドキュメントを書こう
Sphinxでドキュメントを書こうSphinxでドキュメントを書こう
Sphinxでドキュメントを書こう
 
pythonでつくるiPhoneアプリ
pythonでつくるiPhoneアプリpythonでつくるiPhoneアプリ
pythonでつくるiPhoneアプリ
 
Virthualenvwrapper
VirthualenvwrapperVirthualenvwrapper
Virthualenvwrapper
 

Unigram mixtures