コードジガー

色々と書くと思います

Java

Solr4.0のJapaneseTokenizerFactory ( kuromoji ) で記号や特殊文字が捨てられないようにする方法

Solr4.0 の schema.xml(sample) では 以下のようになっていて、このまま text_jaを使っても記号や特殊記号をインデックス化してくれない このまま使うと記号や特殊記号が消えてしまう ※ lucene-gosenはdefaultで記号を拾いますschema.xml <fieldType name="text_ja" class="solr.TextField" positionIncrementGap="100" autoGeneratePhraseQueries="false"> <analyzer> </analyzer></fieldtype>