- このスレッドに結構いいものがあります ー 形態素解析に基づいた単語区切り
- MeCab: Yet Another Part-of-Speech and Morphological Analyzer
MeCabは 京都大学情報学研究科−日本電信電話株式会社コミュニケーション科学基礎研究所 共同研究ユニットプロジェクトを通じて開発されたオープンソース 形態素解析エンジンです. 言語, 辞書,コーパスに依存しない汎用的な設計を 基本方針としています. パラメータの推定に Conditional Random Fields (CRF) を用 いており, ChaSenが採用している 隠れマルコフモデルに比べ性能が向上しています。また、平均的に ChaSen, Juman, KAKASIより高速に動作します. ちなみに和布蕪(めかぶ)は, 作者の好物です. - L-BFGS
火曜日, 11月 25, 2008
Openofficeにおける形態素解析に基づいた単語区切り
基礎として、形態素解析の基礎 と連載 検索エンジンを作る
登録:
コメントの投稿 (Atom)
0 件のコメント:
コメントを投稿