めうの雑記

備忘録

pythonで形態素解析

janomeを用いて形態素解析を試してみた。

udemy.benesse.co.jp

 

janomeのインストール

$ sudo pip install janome

 

以下の文章が記述されたテキストファイルを読み込み、形態素解析にかける。

<はてなの最新情報を2001年からお届けしているメールマガジン
週刊はてな」のバックナンバーを、「週刊はてなブログ」に掲載します。
この一週間の「はてな」と「はてなブログ」では、こんなことがありました!>

 

f:id:umesann:20180627140911p:plain

今のところ指定できる品詞は名詞と動詞のみ。 

print(token)でそれぞれの単語の読み方や活用形を表示できる。

 

ひょっとするとリスト操作はいらないのかも。