スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

Tag:スポンサー広告 

【Ruby】mecab-rubyを入れてみる

今回はオープンソースの形態素解析エンジンMeCabのインストール、及びmecab-rubyのインストールの方法を紹介したいと思います。

環境はFedoraCore10、文字コードはUTF-8の環境とします。

(1)必要な物のダウンロード
■MeCab本体のダウンロード
wget 'http://jaist.dl.sourceforge.net/project/mecab/mecab/0.98/mecab-0.98.tar.gz'

■mecab-ipadicのダウンロード
wget 'http://jaist.dl.sourceforge.net/project/mecab/mecab-ipadic/2.7.0-20070801/mecab-ipadic-2.7.0-20070801.tar.gz'

■mecab-rubyのダウンロード
wget 'http://jaist.dl.sourceforge.net/project/mecab/mecab-ruby/0.98/mecab-ruby-0.98.tar.gz'

(2)インストール
■mecab
まずはmecabの解凍から

tar xvfz mecab-0.98.tar.gz

次にインストールをします

cd mecab-0.98

./configure --enable-utf8-only
(補足)
--enable-utf8-onlyオプションを加えることでバイナリのサイズを節約できるそうです。僕の環境はutf8なのでこのオプションをつけました。

make

sudo make install

■mecab-ipadict
次にmecab-ipadic-2.7.0-20070801.tar.gzの解凍をします

tar xvfz mecab-ipadic-2.7.0-20070801.tar.gz

そしてインストールをします

cd mecab-ipadic-2.7.0-20070801

./configure --with-charset=utf8

make

sudo make install

■mecab-ruby

ruby extconf.rb

make
 
sudo make install

!!注意!!
ここでインストール完了と思い動かしてみると

mecab: error while loading shared libraries: libmecab.so.1: cannot open shared object file: No such file or directory

libmecab.so.1がないなどといわれ動作しませんでした。

/etc/ld.so.conf

を見てみると

include ld.so.conf.d/*.conf

と記述されており

/etc/ld.so.conf.d/

以下には

mecabのライブラリ類が配置される

/usr/local/lib/

以下を読み込む設定が書かれていませんでした。

適当なファイル名で

/usr/local/lib/

と記述、保存し

sudo ldconfig

としてみてください。
そうするとこの問題は解決されるはずです。

(3)動作確認
■mecab単体
$mecab
明日は晴れるかな?
明日    名詞,副詞可能,*,*,*,*,明日,アシタ,アシタ
は      助詞,係助詞,*,*,*,*,は,ハ,ワ
晴れる  動詞,自立,*,*,一段,基本形,晴れる,ハレル,ハレル
か      助詞,副助詞/並立助詞/終助詞,*,*,*,*,か,カ,カ
な      助詞,終助詞,*,*,*,*,な,ナ,ナ
?      記号,一般,*,*,*,*,?,?,?
EOS

と出るはずです

■rubyからの動作確認
先ほどインストールの為に解凍したディレクトリの中に

test.rb

が入っているかと思いますのでそのスクリプトを実行してみてください。
結果はここでは書きませんが、きちんと形態素解析してくれるはずです。

以上FedoraCore10(UTF-8)環境でのMecabのインストール、動作確認方法の紹介でした。
スポンサーサイト
テーマ : プログラミング
ジャンル : コンピュータ

Tag:Ruby  Trackback:0 comment:0 

Comment

comment form
(編集・削除用):
管理者にだけ表示を許可
プロフィール

6rats

Author:6rats
こんにちは、ITベンチャーで働くエンジニアです
主に自分の周りで起きた技術的なことをメモとして書き残して行きます。
Android以外にもRuby/Ruby on RailsやFuelPHPなどなどたまにやります。基本的なスタンスとしては興味があるもしくは必要になったらいろんなことにチャレンジします。
最近はiOSアプリ開発を始めています。

購読
follow us in feedly
個人プロダクト

Androidアプリ

Twitterクライアント

Webアプリケーション

EcPriceWatch(Amazon価格の推移を計測、最安値を知らせるサービス)
Google AdSense
ブログ村
にほんブログ村 IT技術ブログへ
にほんブログ村
ブロとも申請フォーム

この人とブロともになる

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。