スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

Tag:スポンサー広告 

【mecab】mecabにnaist-jdic辞書を入れて単語を追加してみる

最近またMecabをいじっています

今回はmecabでnaist-jdicを使う方法と、辞書への単語の追加方法を紹介します

ダウンロード

mecab-naist-jdicのダウンロード
wget 'http://iij.dl.sourceforge.jp/naist-jdic/40117/mecab-naist-jdic-0.6.0-20090616pre3.tar.gz'

インストール

tar xvfz mecab-naist-jdic-0.6.0-20090616pre3.tar.gz
cd mecab-naist-jdic-0.6.0-20090616pre3
./configure --with-charset=utf8
make
make install

辞書のビルド

僕の環境はUTF-8で辞書ファイルなどがEUC-JPなので今回はyour_dict.csvをEUC-JPに変換してビルドします。
vim your_dict.csv
nkf -e your_dict.csv > your_dict.csv.euc
mv your_dict.csv.euc your_dict.csv
/usr/local/libexec/mecab/mecab-dict-index -f euc-jp -t utf-8

一度
/usr/local/libexec/mecab/mecab-dict-index -f euc-jp -t euc-jp
としてしまって文字化けしました。。

mecabrcの編集

mecabrcを調整することで使う辞書の変更ができます
vim /usr/local/etc/mecabrc

;dicdir = /usr/local/lib/mecab/dic/ipadic ;コメントアウト
dicdir = /usr/local/lib/mecab/dic/naist-jdic

ここまでくれば、naist-jdicを使いつつ自分で追加した辞書の単語が追加されています
ちなみに今回は速度を優先するためシステム辞書への追加を行いました
もう一つユーザ辞書への追加というのもできるのでこちらを参考にどうぞ

過去のエントリも参考にしていただければと思います
【Ruby】mecab-rubyを入れてみる
スポンサーサイト
テーマ : プログラミング
ジャンル : コンピュータ

Tag:mecab  Trackback:0 comment:0 

プロフィール

6rats

Author:6rats
こんにちは、ITベンチャーで働くエンジニアです
主に自分の周りで起きた技術的なことをメモとして書き残して行きます。
Android以外にもRuby/Ruby on RailsやFuelPHPなどなどたまにやります。基本的なスタンスとしては興味があるもしくは必要になったらいろんなことにチャレンジします。
最近はiOSアプリ開発を始めています。

購読
follow us in feedly
個人プロダクト

Androidアプリ

Twitterクライアント

Webアプリケーション

EcPriceWatch(Amazon価格の推移を計測、最安値を知らせるサービス)
Google AdSense
ブログ村
にほんブログ村 IT技術ブログへ
にほんブログ村
ブロとも申請フォーム

この人とブロともになる

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。