日本語形態素解析「kuromoji」を使う
kuromoji Home Page
kuromoji GitHub
Gradle
build.gradle
dependencies { compile group: 'com.atilika.kuromoji', name: 'kuromoji-ipadic', version: '0.9.0' }
「-ipadic」は辞書です。
対応している辞書
- kuromoji-ipadic
- kuromoji-ipadic-neologd:future version
- kuromoji-jumandic
- kuromoji-naist-jdic
- kuromoji-unidic
- kuromoji-unidic-kanaaccent
- kuromoji-unidic-neologd
Example
String text = "吾輩は猫である。"; Tokenizer tokenizer = new Tokenizer(); List<Token> tokenList = tokenizer.tokenize(text);