日本語形態素解析「kuromoji」を使う

kuromoji Home Page
kuromoji GitHub

Gradle

build.gradle

dependencies {
    compile group: 'com.atilika.kuromoji', name: 'kuromoji-ipadic', version: '0.9.0'
}

「-ipadic」は辞書です。

対応している辞書

  • kuromoji-ipadic
  • kuromoji-ipadic-neologd:future version
  • kuromoji-jumandic
  • kuromoji-naist-jdic
  • kuromoji-unidic
  • kuromoji-unidic-kanaaccent
  • kuromoji-unidic-neologd

Example

String text = "吾輩は猫である。";
Tokenizer tokenizer = new Tokenizer();
List<Token> tokenList = tokenizer.tokenize(text);

Java

Posted by shi-n